🚀 30+款热门AI模型一站整合,DeepSeek/GLM/Claude 随心用,限时 5 折。 👉 点击领海量免费额度
这次我们来看一个不一样的大模型思路。Sakana AI 推出的 Fugu 系列,不是一个单一模型,而是一个“多智能体系统即模型”(Multi-Agent System as a Model)。简单说,它不是一个巨无霸模型,而是一个指挥家,能动态调度和协调多个顶级大模型(如 GPT、Claude、Gemini 等)来共同解决复杂任务。你只需要调用一个 API,它就能在后台智能地分配任务、组合结果,最终给你一个更优的答案。
对于开发者来说,这意味着你不再需要纠结于“选哪个模型最好”,也不用自己写复杂的编排逻辑。Fugu 的核心价值在于:用一个统一的、兼容 OpenAI 的 API,获得超越单一模型的性能,尤其是在代码、推理和需要多步思考的复杂任务上。根据官方数据,在 SWE Bench Pro、LiveCodeBench 等硬核编程和推理基准测试中,Fugu Ultra 的表现已经超越了公开可访问的顶级模型。
那么,它到底能不能用?怎么用?门槛高不高?这篇文章就带你快速上手 Sakana Fugu,从核心概念、API 调用、到实际效果验证,一步步拆解清楚。如果你关心如何用更低的集成成本,获得更强大的 AI 能力,特别是处理代码审查、论文复现、安全评估这类复杂工作流,那么 Fugu 值得你花时间了解。
1. 核心能力速览
在深入细节前,我们先通过一个表格快速了解 Fugu 是什么、能做什么、以及它的关键特性。
| 能力项 | 说明 |
|---|---|
| 项目类型 | 多智能体模型编排系统(MaaS, Model as a Service) |
| 开源团队/来源 | Sakana AI(一家专注于 AI 基础模型研究的公司) |
| 核心功能 | 通过单一 API 动态协调多个顶级大模型,完成复杂、多步骤的任务(如代码生成与审查、复杂推理、研究分析、安全评估等)。 |
| 模型版本 | Fugu(平衡性能与延迟,日常任务)和Fugu Ultra(追求极致质量,复杂任务)。 |
| 接入方式 | OpenAI 兼容的 API。无需更换 SDK,只需修改 API 基地址和密钥。 |
| 硬件/环境门槛 | 云端服务,无需本地 GPU。仅需能访问其 API 端点的网络环境。 |
| 显存/算力要求 | 无。所有计算在 Sakana AI 的服务器端完成。 |
| 是否支持批量任务 | 支持。通过 API 可并发发送多个请求,具体限制需参考官方配额。 |
| 是否支持自定义/本地部署 | 不支持。目前仅提供云端 API 服务,用户无法控制底层模型的具体部署。 |
| 主要适用场景 | 1.代码开发与审查:生成、优化、审查代码,发现潜在 Bug。 2.研究与分析:快速阅读论文、复现实验、进行专利与技术调研。 3.复杂问题求解:解决需要多步推理的数学、逻辑、规划问题。 4.安全评估:执行端到端的安全扫描与审计。 5.智能体(Agent)应用:作为复杂 Agent 系统的核心“大脑”,提供稳定的角色扮演和长程任务规划能力。 |
| 费用模式 | 1.订阅制(月付):Standard ($20), Pro ($100), Max ($200),包含 Fugu 和 Fugu Ultra 调用额度。 2.按量付费(Token):Fugu 按调用的底层模型费率计费(取最高级模型),Fugu Ultra 固定费率(输入$5/1M tokens, 输出$30/1M tokens)。 |
2. 适用场景与使用边界
Fugu 的设计目标很明确:解决单一模型在复杂任务上力有不逮的问题。它不是要替代 GPT-5 或 Claude,而是要成为它们的“超级调度员”。
最适合谁用?
- 软件工程师:需要进行深度代码审查、自动化测试生成、或解决复杂算法问题。
- 研究人员与学生:需要快速消化多篇论文、复现代码、进行跨领域的文献综述。
- 数据分析师与量化研究员:处理复杂的时序分析、模型构建和策略回测任务。
- 安全工程师:希望有一个能理解上下文、执行多步骤渗透测试或安全审计的 AI 助手。
- 产品经理与创业者:进行竞品分析、市场调研、生成高质量的产品文档和技术方案。
能解决什么问题?根据官方提供的案例,Fugu 在以下任务中表现出色:
- AutoResearch:让 AI 自主改进一个小型 GPT 的训练配方,在 14 小时内进行了 123 次实验,找到了包括批大小、模型深度、学习率等在内的最优超参数组合,最终效果超越了单一顶级模型。
- 古文复原:恢复古典日语“散らし書き”文献的阅读顺序,这是一个连专业学者都感到困难的复杂空间推理任务。
- 从零生成求解器:仅凭一个提示词,用纯 Python 编写出能解决 300 个随机打乱魔方的求解器,且平均步数接近最优解。
- CAD 设计:根据描述生成可工作的机械光圈(Mechanical Iris)CAD 模型,机构联动正确。
- 目盲象棋:在不看棋盘的情况下,连续对战并击败多个顶级模型和 Stockfish 引擎。
- 时序交易决策:在匿名的历史股票数据上进行模拟交易,实现超越基准模型的回报。
不适合什么场景?
- 简单问答:如果你只是需要快速回答一个事实性问题,直接调用 ChatGPT 或 Gemini 可能更快、更便宜。
- 实时性要求极高的对话:Fugu Ultra 为追求质量可能牺牲一些延迟,不适合需要毫秒级响应的聊天场景。
- 完全离线的环境:Fugu 是云端服务,无法在无网络环境下使用。
- 对数据隐私有极端要求的场景:虽然可以 Opt-out 特定模型提供商,但数据仍需发送至 Sakana 的服务器进行处理。
合规与安全边界
- 数据使用:用户可以选择是否允许 Sakana 使用其交互数据来改进模型。在控制台页面可以随时 Opt-out。
- 地域限制:目前不向欧盟(EU)和欧洲经济区(EEA)的用户提供服务,以遵守 GDPR 等法规。其他地区也可能因当地法规或网络条件无法访问。
- 模型黑盒:Fugu 具体调用了哪些底层模型、如何协调,属于其核心技术,不向用户公开。你得到的是一个经过优化的最终结果。
3. 环境准备与前置条件
由于 Fugu 是 API 服务,本地环境准备非常简单,主要聚焦于网络和开发环境。
- 网络环境:确保你的网络可以稳定访问 Sakana Fugu 的 API 服务器。根据 FAQ,服务对日本以外的地区开放(欧盟/EEA除外),但需留意可能的网络波动。
- 获取 API Key:
- 访问 Sakana AI 官网,注册账号。
- 在控制台(Console)页面,创建 API Key。你会看到类似
sk-...的密钥。 - 选择订阅计划(Subscription Plan)或准备使用按量付费(Pay-as-you-go)。
- 开发环境:
- Python 3.8+:这是最常用的调用环境。
- 安装必要的库,主要是
openai库(因为 API 兼容 OpenAI)。
pip install openai- 你也可以使用任何支持 HTTP 请求的编程语言或工具,如
curl、Node.js、Go 等。
- 了解计费与配额:在控制台查看你的订阅详情或设置消费限额,避免意外费用。
4. 接入与 API 调用方式
Fugu 最大的优势在于其OpenAI 兼容性。这意味着你现有的、基于 OpenAI API 的代码几乎可以无缝迁移。
4.1 API 基础信息
- API 基地址(Base URL):
https://api.sakana.ai/v1 - 认证方式: Bearer Token, 使用你的
sk-...API Key。 - 模型名称:
fugu:标准版,平衡性能与延迟。fugu-ultra-20260615:Ultra 版,追求最高质量。
4.2 使用 OpenAI Python SDK 调用
这是最推荐的方式,与调用 ChatGPT API 完全一致。
import openai # 1. 配置客户端,指向 Sakana Fugu 的端点 client = openai.OpenAI( api_key="你的-Sakana-API-KEY", # 替换为你的真实 Key base_url="https://api.sakana.ai/v1" # 关键:修改 base_url ) # 2. 发起聊天补全请求 response = client.chat.completions.create( model="fugu", # 或 "fugu-ultra-20260615" messages=[ {"role": "system", "content": "你是一个资深的 Python 软件工程师,擅长代码审查和优化。"}, {"role": "user", "content": "请审查以下 Python 函数的潜在问题,并给出优化建议:\n```python\ndef process_data(items):\n result = []\n for i in range(len(items)):\n if items[i] % 2 == 0:\n result.append(items[i] * 2)\n return result\n```"} ], temperature=0.7, max_tokens=1000 ) # 3. 打印结果 print(response.choices[0].message.content)4.3 使用curl命令直接测试
快速验证 API 连通性和基础功能。
curl https://api.sakana.ai/v1/chat/completions \ -H "Content-Type: application/json" \ -H "Authorization: Bearer 你的-Sakana-API-KEY" \ -d '{ "model": "fugu", "messages": [ {"role": "user", "content": "用 Python 写一个快速排序算法。"} ], "max_tokens": 500 }'4.4 在现有项目中集成
如果你已经在使用langchain,llama-index等框架,只需修改 OpenAI 客户端的配置即可。
示例:在 LangChain 中使用 Fugu
from langchain_openai import ChatOpenAI # 创建指向 Fugu 的 LLM 实例 llm = ChatOpenAI( openai_api_key="你的-Sakana-API-KEY", openai_api_base="https://api.sakana.ai/v1", model_name="fugu", # 指定模型 temperature=0 ) # 像使用普通 ChatOpenAI 一样使用它 from langchain_core.prompts import ChatPromptTemplate prompt = ChatPromptTemplate.from_messages([ ("system", "你是一个有帮助的助手。"), ("user", "{input}") ]) chain = prompt | llm response = chain.invoke({"input": "解释什么是多智能体系统。"}) print(response.content)5. 功能测试与效果验证
理论说了这么多,实际效果如何?我们设计几个测试用例,模拟真实场景来验证 Fugu 的能力。
5.1 测试一:复杂代码审查
测试目的:验证 Fugu 在发现隐蔽代码缺陷和提供优化建议上的深度。
操作步骤:
- 准备一段有多个潜在问题(如边界条件、性能问题、可读性差)的代码。
- 分别用
fugu和fugu-ultra-20260615模型进行审查。 - 对比输出结果的细致程度和实用性。
输入示例(Python):
# 待审查的函数:计算斐波那契数列第n项 def fib(n): if n <= 1: return n else: return fib(n-1) + fib(n-2) # 调用 print(fib(35))请求代码:
import openai client = openai.OpenAI(api_key="YOUR_KEY", base_url="https://api.sakana.ai/v1") response = client.chat.completions.create( model="fugu-ultra-20260615", # 测试 Ultra 版本 messages=[ {"role": "system", "content": "你是一个严格的代码审查专家。请列出所有性能问题、潜在错误和改进建议。"}, {"role": "user", "content": f"请审查以下 Python 函数:\n```python\n# 待审查的函数:计算斐波那契数列第n项\ndef fib(n):\n if n <= 1:\n return n\n else:\n return fib(n-1) + fib(n-2)\n\n# 调用\nprint(fib(35))\n```"} ], temperature=0.2, max_tokens=800 ) print(response.choices[0].message.content)预期结果与成功标准:
- 成功:Fugu 应该能指出递归实现存在指数级时间复杂度问题(O(2^n)),对于
fib(35)计算缓慢。 - 更优:应提供改进方案,如使用迭代法、缓存(记忆化)或Python 的
lru_cache。 - 深度审查:可能还会指出缺少输入验证(如对负数的处理)、递归深度限制、以及更优的闭式解(Binet公式)或矩阵快速幂等高级优化。
- 根据官方用户反馈,Fugu Ultra 在代码审查中能发现其他工具遗漏的大量问题。
5.2 测试二:多步骤研究与分析
测试目的:验证 Fugu 处理需要查阅、综合、推理的长篇复杂任务的能力。
操作步骤:
- 给出一个开放性的研究问题。
- 观察 Fugu 是否会将问题拆解,并执行搜索、分析、总结等步骤(尽管我们看不到其内部调用)。
- 评估最终答案的结构化程度和信息量。
输入示例:
请为我调研“基于 Transformer 的时序预测模型在金融股价预测中的应用现状”。 要求包括:1) 列举3个主流模型架构并简述原理;2) 分析其相对于传统时间序列模型(如ARIMA)的优劣;3) 指出当前面临的主要挑战和未来可能的研究方向。请以报告形式呈现。预期结果与成功标准:
- 成功:返回的内容应结构清晰,分点论述。
- 更优:内容应准确提及如Informer,Autoformer,FEDformer等具体模型,并能准确对比其与 ARIMA 在非线性关系捕捉、长期依赖处理上的差异。
- 深度分析:应能指出过拟合、市场有效性、高频数据噪声、可解释性差等实际挑战,并提出如结合图神经网络、引入外部知识、改进损失函数等研究方向。
- 这模拟了官方案例中“专利地图分析”和“论文复现”的场景,Fugu 应能展现出类似的多步自主研究能力。
5.3 测试三:逻辑推理与规划
测试目的:验证 Fugu 在解决需要多步逻辑推导的“谜题”类任务上的能力。
输入示例(经典的“狼羊菜过河”问题变种):
你是一位农夫,需要将一只狼、一只羊和一袋白菜用船运过河。船只能承载你和另外一样东西。如果你不在场,狼会吃羊,羊会吃白菜。你如何安全地将所有东西都运过河?请详细列出每一步。预期结果与成功标准:
- 成功:给出正确的、步骤清晰的解决方案。
- 更优:解决方案应体现出对约束条件的理解(“不在场时”的捕食关系),并能处理可能出现的无效循环步骤。
- 这类任务考验模型的规划能力,也是多智能体协作中“思考者(Thinker)”和“验证者(Verifier)”角色可能发挥作用的地方。
6. 接口 API 与高级用法
6.1 流式响应(Streaming)
对于长文本生成,可以使用流式响应来提升用户体验。
import openai client = openai.OpenAI(api_key="YOUR_KEY", base_url="https://api.sakana.ai/v1") stream = client.chat.completions.create( model="fugu", messages=[{"role": "user", "content": "用大约500字介绍多智能体系统的历史。"}], stream=True, max_tokens=800 ) for chunk in stream: if chunk.choices[0].delta.content is not None: print(chunk.choices[0].delta.content, end="", flush=True)6.2 控制生成参数
与 OpenAI API 一样,你可以控制生成过程。
response = client.chat.completions.create( model="fugu-ultra-20260615", messages=[...], temperature=0.8, # 创造性,越高越随机 top_p=0.95, # 核采样参数 max_tokens=2048, # 生成的最大 token 数 presence_penalty=0.1, # 避免重复话题 frequency_penalty=0.1 # 避免重复用词 )6.3 处理长上下文
Fugu Ultra 支持长上下文(超过 272K tokens)。当上下文长度超过 272K 时,计费费率会变化(输入$10/1M, 输出$45/1M)。在代码中,你只需要正常发送长消息即可,系统会自动处理。
# 假设 `long_text` 是一个很长的字符串 response = client.chat.completions.create( model="fugu-ultra-20260615", messages=[ {"role": "system", "content": "你是一个专业的文档总结助手。"}, {"role": "user", "content": f"请总结以下文档的核心观点:\n\n{long_text}"} ], max_tokens=500 )6.4 模拟批量任务
虽然 Fugu 本身是一个 API,但你可以通过编程轻松实现批量处理。
import asyncio import aiohttp import json async def call_fugu_async(session, api_key, prompt): url = "https://api.sakana.ai/v1/chat/completions" headers = { "Authorization": f"Bearer {api_key}", "Content-Type": "application/json" } data = { "model": "fugu", "messages": [{"role": "user", "content": prompt}], "max_tokens": 300 } async with session.post(url, headers=headers, json=data) as resp: return await resp.json() async def batch_process(api_key, prompts): async with aiohttp.ClientSession() as session: tasks = [call_fugu_async(session, api_key, p) for p in prompts] results = await asyncio.gather(*tasks, return_exceptions=True) # 处理结果,加入重试逻辑等 for i, result in enumerate(results): if isinstance(result, Exception): print(f"Prompt {i} failed: {result}") else: print(f"Prompt {i} success: {result['choices'][0]['message']['content'][:100]}...") # 使用示例 api_key = "YOUR_KEY" prompts = ["总结AI的利与弊。", "写一个Python的hello world程序。", "解释区块链原理。"] asyncio.run(batch_process(api_key, prompts))7. 资源占用与性能观察
由于 Fugu 是云端服务,本地没有显存、GPU 占用的问题。性能观察的重点转向API 响应时间、输出质量和成本效益。
延迟(Latency):
- Fugu:设计目标是平衡质量和延迟,适合交互式应用。响应速度应与主流模型 API(如 GPT-3.5-Turbo)相近。
- Fugu Ultra:为追求最高质量,可能会调用更多模型进行协作和验证,因此响应时间通常更长。适合对延迟不敏感、但对答案质量要求极高的后台任务。
- 测试方法:在代码中记录请求发送和收到响应的时间差。对于关键应用,建议在不同时间段进行测试,评估其稳定性。
输出质量与稳定性:
- 角色稳定性:根据用户反馈,Fugu 在长对话中能更好地保持设定的“角色”或“人格”,不易偏离。这对于构建复杂的 AI 角色扮演应用至关重要。
- 复杂任务完成度:观察其在多步骤任务(如“写一个爬虫,然后分析数据,最后生成报告”)中,是否真的能一步步执行到底,而不是中途放弃或给出笼统建议。
- 幻觉控制:在事实性问答中,对比其与单一模型的准确性。多模型协作理论上可以通过交叉验证减少幻觉。
成本监控:
- 按量付费:密切监控控制台提供的“每请求 Token 使用量和成本”。Fugu 的计费模式(按最高级模型收费)意味着即使调用了多个模型,也不会产生叠加费用,这可能是其成本优势。
- 订阅套餐:如果你选择月付套餐,注意套餐内的 Token 额度。超出部分可能会按量计费或无法使用。
- 性价比评估:对比完成相同复杂任务时,使用 Fugu 的成本与分别调用多个顶级模型并自行集成结果的成本。Fugu 的价值在于其“智能调度”带来的性能提升是否值得额外的溢价。
8. 常见问题与排查方法
| 问题现象 | 可能原因 | 排查方式 | 解决方案 |
|---|---|---|---|
| API 请求返回 401 错误 | API Key 无效、过期或未正确设置。 | 检查请求头中的Authorization: Bearer <your_key>格式是否正确。登录控制台确认 Key 状态。 | 1. 确保 Key 复制无误,没有多余空格。 2. 在控制台生成新的 Key 并替换。 |
| API 请求返回 429 错误 | 请求速率超过限制或套餐额度已用尽。 | 查看 API 返回的错误信息,通常包含rate_limit或quota_exceeded等提示。登录控制台查看使用量。 | 1. 降低请求频率,加入延迟。 2. 升级订阅套餐或等待下个计费周期。 |
| API 请求返回 503 或其他5xx错误 | Sakana 服务器端暂时不可用或过载。 | 检查 Sakana AI 状态页 (如果存在),或稍后重试。 | 1. 实现指数退避重试机制。 2. 联系 Sakana 技术支持。 |
| 响应速度非常慢(特别是 Fugu Ultra) | 任务复杂,模型正在进行多轮内部协调和推理。 | 对比简单任务和复杂任务的响应时间。检查网络延迟。 | 1. 对于交互式应用,考虑使用fugu模型而非fugu-ultra。2. 设置合理的客户端超时时间(如 120秒)。 |
| 输出内容不符合预期或质量不高 | 提示词(Prompt)不够清晰;任务本身超出当前模型能力。 | 检查 Prompt 是否明确指定了角色、格式和步骤要求。尝试更详细的 Prompt。 | 1. 使用思维链(Chain-of-Thought)提示技巧,要求模型“逐步思考”。 2. 在系统消息中明确约束条件。 3. 切换 fugu和fugu-ultra模型进行对比。 |
| 无法从欧盟(EU)地区访问 | 服务因合规原因未在 EU/EEA 地区提供。 | 确认你的 IP 地址所在地。 | 目前无解。需要使用其他地区的网络代理或等待服务扩展。 |
| 想知道具体调用了哪些底层模型 | 出于技术保密,Fugu 不公开此信息。 | 无。 | 接受其黑盒特性。关注最终输出效果而非内部实现。 |
| 账单费用高于预期 | 可能大量使用了长上下文(>272K)的 Fugu Ultra,费率更高;或请求量激增。 | 在控制台查看详细的用量报告,区分不同模型和上下文长度的消耗。 | 1. 优化 Prompt,减少不必要的上下文。 2. 对非关键任务使用 fugu模型。3. 设置预算警报。 |
9. 最佳实践与使用建议
为了最大化 Fugu 的价值并控制成本,遵循以下实践会很有帮助:
- 从
fugu模型开始:除非你明确需要极致质量,否则先使用fugu模型进行开发和测试。它的响应更快,成本也可能更低(取决于底层模型调用),足以应对大多数日常任务。 - 精心设计 Prompt:Fugu 作为多智能体系统,对清晰的指令反应更好。在系统消息(
systemrole)中明确设定角色、目标和约束。在用户消息中,将复杂任务分解为步骤。- 差:“分析这份财报。”
- 优:“你是一名财务分析师。请逐步执行以下任务:1) 总结公司本季度主要营收和利润数据。2) 与去年同期对比,指出增长最快的业务线。3) 列出财报中提到的潜在风险。请以表格形式呈现1和2,以列表形式呈现3。”
- 利用长上下文,但需权衡成本:Fugu Ultra 的长上下文能力强大,适合处理长文档。但记住,超过 272K tokens 后费率几乎翻倍。在上传长文档前,考虑是否可以先进行摘要或提取关键章节。
- 实现健壮的客户端逻辑:
- 重试机制:对网络错误和 5xx 服务器错误实现带退避的重试。
- 超时设置:为
fugu-ultra设置更长的超时(如 180秒),避免因复杂任务未完成而断开连接。 - 流式处理:对于长文本生成,务必使用流式响应,提升用户体验。
- 持续监控与评估:
- 建立评估集:为你关心的任务(如代码审查、报告生成)准备一批标准测试用例。
- 定期测试:每月用评估集跑一次,对比 Fugu 和你的备用模型(如直接调用 GPT-4)的效果和成本。
- 关注更新:Sakana 会定期将新的前沿模型加入其智能体池。关注官方公告,了解性能提升。
- 合规与数据安全:
- 如果处理敏感数据,务必在控制台设置中Opt-out 数据用于模型训练。
- 评估你的数据是否可以发送到云端处理。对于绝密信息,Fugu 可能不是合适的选择。
- 成本控制:
- 对于订阅用户,在控制台设置用量提醒,避免超额。
- 对于按量付费用户,为 API Key 设置预算和硬性限额。
- 考虑对非实时任务进行队列处理,在非高峰时段批量运行,可能有助于利用更低的资源成本(如果服务商有相关策略)。
10. 总结与下一步
Sakana Fugu 代表了大模型应用的一个新范式:不追求把模型做得无限大,而是追求把模型用得更聪明。通过多智能体动态编排,它试图将多个顶级模型的专长融合起来,解决单一模型在复杂、多步骤任务上的瓶颈。
从实测和官方数据来看,这个思路是行之有效的。在代码、推理、研究等需要深度思考的任务上,Fugu Ultra 展现出了超越单一顶级模型的潜力。对于开发者而言,最大的吸引力在于其极低的集成成本——一个 OpenAI 兼容的 API 即可调用这个“模型联盟”。
最值得尝试的点:
- 代码深度审查:如果你苦于现有 AI 助手找不出深层次的 Bug 或设计缺陷,用 Fugu Ultra 试一次,可能会有惊喜。
- 研究分析自动化:将一篇论文或一个研究主题丢给它,看它能否自动生成结构清晰、内容深入的综述报告。
- 作为复杂 Agent 的核心:如果你在构建需要长期记忆、复杂规划和稳定角色扮演的 AI Agent,Fugu 在长会话中的“人格稳定性”是一个重要优势。
最先应该验证的功能: 建议从你工作中最耗时、最头疼的复杂任务开始。准备一个标准测试用例,分别用你常用的主流模型和 Fugu(特别是 Fugu Ultra)跑一遍,直观对比输出质量、深度和完整性。
最容易踩的坑:
- 忽略延迟:对 Fugu Ultra 的响应速度抱有错误预期,将其用于实时对话场景导致体验不佳。
- Prompt 设计粗糙:没有充分利用其多步推理能力,还是用对待 ChatGPT 的简单提问方式。
- 成本失控:尤其是使用 Fugu Ultra 处理超长上下文时,没有监控费用。
后续方向: 目前 Fugu 是闭源的云端服务。业界也在关注类似的多模型编排开源方案(如 DSPy、LangGraph 的某些模式)。你可以将 Fugu 视为一个高性能的“外部大脑”,同时也在本地探索用开源工具搭建轻量级的多智能体系统,用于不那么核心的任务,形成混合架构。
对于追求生产级 AI 应用质量和可靠性的团队来说,Sakana Fugu 提供了一个值得认真评估的新选项。它可能不是所有场景的最优解,但在它擅长的复杂任务领域,很可能成为你的秘密武器。
🚀 30+款热门AI模型一站整合,DeepSeek/GLM/Claude 随心用,限时 5 折。 👉 点击领海量免费额度