Sakana Fugu 调度多款 AI 模型，挑战被下架的 Anthropic Mythos

东京初创公司 Sakana AI 推出 Fugu，这是一套通过可替换语言模型池来完成任务的系统，目标是对标 Anthropic 受限的 Fable 和 Mythos 模型。

要点概览：

Sakana AI 的 Fugu 以单一模型形式对外运行，却在背后通过一个 API 协调一整池系统。

Fugu Ultra 在 SWE-Bench Pro 编程测试中拿下 73.7 分，超过多款前沿对手。

该设计被包装成对冲手段，以应对类似封锁 Fable 和 Mythos 的出口管制风险。

Sakana Fugu 如何编排多个模型

这家东京实验室于 6 月 22 日推出了 Fugu 以及更重型的 Fugu Ultra 版本，两者都可通过一个兼容 OpenAI 的端点访问，该公司已确认。根据具体请求，它要么单独回答任务，要么拉来一组其他系统协同工作。

随后，该模型会自行完成检查和综合步骤。

Fugu 本身也是一个语言模型。

它被训练成可以从一池可替换代理中发起调用，甚至可以在单个任务需要“更多双手”时召唤自己的多个副本。基础档位主打低延迟，适用于日常编程、聊天以及 Codex 一类工具，并允许团队剔除特定代理以满足隐私合规。Fugu Ultra 则追求在长周期任务上的最高答案质量，例如论文复现与安全分析，过去几周约 500 名内测用户参与了测试。

延伸阅读：Anthropic 永续合约抛售是否在警示 Pre-IPO 加密押注风险？

Mollick 与 Levie 的看法

公司公布的测试数据显示，Fugu Ultra 在 SWE-Bench Pro 编程测试中取得 73.7 分，跑赢同批测试的 Opus 4.8、Gemini 3.1 Pro 和 GPT-5.5。

公司称，这一成绩与 Fable 5 和 Mythos Preview 处于同一档次，其自家对比表也显示，在已公开的 11 项测试中，Fugu 这套编排方案有 10 项名列前茅。

但并非所有测试者都买账。AI 研究者 Ethan Mollick 写道，Fugu Ultra 运行“极其缓慢”，常规编程测试可拖到 30 分钟，且在真实使用中输出逊于 Fable。Box CEO Aaron Levie 则态度更积极，认为通过单一 API 把每个任务路由给最合适模型，是“应用型 AI 架构向前迈出的一步”。

也有人指出价格问题：由于编排过程可能叠加多次调用，其 Token 成本很容易远高于直接调用某个单一前沿模型完成同类任务。Sakana 将这种池化设计描述为“保险机制”，以应对任一服务商突然“熄火”的风险，并强调对 Fable 和 Mythos 新近实施的出口限制就是这类“瞬间切断访问”的典型冲击。

Sakana AI 的来历

Sakana AI 成立于 2023 年，由 Llion Jones 创办，他是 Google 论文《Attention Is All You Need》的合著者之一。曾任 Stability AI 研究负责人的 David Ha 加入成为联合创始人。该实验室因“进化式模型融合”和 AI Scientist 自动化科研路线而受到关注，并长期主张：在最难、耗时最长的任务上，一个协调良好的模型池可以胜过任何单一系统。

下一篇：Mane City Mobile 登陆 iOS 与 Android，覆盖 100+ 国家