Sakana Fugu 協作多個 AI 模型，對標 Anthropic 遭禁的 Mythos

東京新創 Sakana AI 推出 Fugu，一套協調可替換語言模型池的系統，對標 Anthropic 受限的 Fable 與 Mythos 模型。

重點摘要：

Sakana AI 的 Fugu 對外看起來像一個模型，實際上在單一 API 背後協調一整個系統池。

Fugu Ultra 在 SWE-Bench Pro 程式測試中拿下 73.7 分，超越多個前沿對手。

此設計被視為針對封鎖 Fable 與 Mythos 的出口管制所做的風險對沖。

Sakana Fugu 如何協調模型

這家東京實驗室在 6 月 22 日推出 Fugu 與更重型的 Fugu Ultra 方案，兩者都可以透過一個相容 OpenAI 的端點存取，官方已證實。依照請求內容，它會單獨回答任務，或是拉攏其他系統組成團隊。

接著，模型會自行執行檢查與結果整合。

Fugu 本身就是一個語言模型。

它被訓練來從可替換的代理池中呼叫代理，甚至可以在單一工作需要「更多雙手」時召喚自己的多個副本。基礎方案鎖定日常程式開發、聊天和 Codex 類工具的低延遲場景，並允許團隊排除特定代理，以符合隱私規範。Fugu Ultra 則追求在論文重現、安全分析等長篇難題上提供最佳答案品質，約 500 名測試者在近幾週參與了測試。

延伸閱讀：Anthropic 永續合約拋售，是加密市場 Pre-IPO 風險警訊嗎？

Mollick 與 Levie 的看法

公司公布的基準數據顯示，Fugu Ultra 在 SWE-Bench Pro 程式測試中拿到 73.7 分，在同一輪測試中領先 Opus 4.8、Gemini 3.1 Pro 與 GPT-5.5。

公司表示，這些分數與 Fable 5 和 Mythos Preview 相當，而其自家表格也顯示，在已公布的 11 組測項中，Fugu Ultra 有 10 組名列前茅。

並非所有測試者都買單。AI 研究者 Ethan Mollick 表示，Fugu Ultra 「慢得驚人」，一般程式任務常常拖到 30 分鐘，實際使用中的表現也落後 Fable。Box 執行長 Aaron Levie 則較為肯定，稱讚透過單一 API 把任務導向最適合的模型，是應用型 AI 開發方式的進步。

也有人關注價格問題，因為協作機制可能讓代幣成本疊加到單獨呼叫一個前沿模型的數倍。Sakana 把這種池化設計包裝為對「服務斷供」的保險，並點名 Fable 與 Mythos 遭遇的新一輪出口管制，視之為可能讓存取一夜之間被切斷的典型衝擊。

Sakana AI 的起源

Sakana AI 成立於 2023 年，由 Llion Jones 創立，他是 Google 經典論文「Attention Is All You Need」的共同作者。曾任 Stability AI 研究主管的 David Ha 隨後加入成為共同創辦人。這家實驗室以演化式模型合併與 AI Scientist 自動化研究系列打響名號，並長期主張，在最困難、需要長時間運行的任務上，協調運作的模型池能勝過任何單一系統。

下一篇閱讀：Mane City Mobile 登陸超過 100 個國家的 iOS 與 Android