Sakana Fugu 調度多個 AI 模型,對抗 Anthropic 封禁的 Mythos

Sakana Fugu 調度多個 AI 模型,對抗 Anthropic 封禁的 Mythos

東京新創 Sakana AI 推出 Fugu 系統,以可替換的語言模型池進行調度,對抗 Anthropic 受管制的 Fable 與 Mythos 模型

重點整理:

  • Sakana AI 的 Fugu 對外運作成一個模型,實際上在單一 API 背後協調一整池其他系統。
  • Fugu Ultra 在 SWE-Bench Pro 程式測試中拿下 73.7 分,超越多個前沿對手。
  • 此設計被定位為對沖工具,因應讓 Fable 與 Mythos 被鎖住的出口管制風險。

Sakana Fugu 如何協調模型

這家東京實驗室在 6 月 22 日推出 Fugu 以及更重型的 Fugu Ultra 方案,兩者都可透過一個相容 OpenAI 的端點存取,正如其 證實 所述。依照請求內容,它有時會單獨回答任務,有時則會拉攏一組其他系統共同處理。

隨後,模型會自行執行檢查與整合。

Fugu 本身就是一個語言模型。

它被訓練成可從一個可替換的代理池中呼叫代理,甚至在單一任務需要超過一個模型才能負荷時,還能召喚多個自己的副本。基礎方案鎖定日常程式開發、聊天與類似 Codex 這類工具的低延遲場景,並允許團隊移除特定代理以符合隱私規範。Fugu Ultra 則轉而追求在論文重現、安全分析等長篇難題上取得最高答案品質,近幾週已由約 500 名測試者試用。

延伸閱讀:Anthropic 永續合約拋售是否在警示 Pre-IPO 加密押注風險?

Mollick 與 Levie 的看法

公司對外 公布 的評測數據顯示,Fugu Ultra 在 SWE-Bench Pro 程式測試中取得 73.7 分,在同一版測試中領先 Opus 4.8、Gemini 3.1 Pro 與 GPT-5.5。

公司表示,這些分數與 Fable 5 及 Mythos Preview 相當,而其公布的表格則顯示,在 11 個已公開項目中,這個調度模型在 10 項指標上拔得頭籌。

不過並非所有測試者都買單。AI 研究者 Ethan Mollick 寫道,Fugu Ultra 運行「極度緩慢」,一般程式測試就可能拖到 30 分鐘,而實際使用中產出的品質也落後 Fable。Box 執行長 Aaron Levie 則態度較為正面,認為以單一 API 將每個任務路由到最合適模型,是應用型 AI 建構方式的一大進步。

也有人對價格提出質疑,因為這種調度方式會將多個模型的 token 成本堆疊起來,在相同任務上可能遠高於直接呼叫單一前沿模型。Sakana 將這種模型池設計包裝成一種「保險」,強調如果任一供應商斷供,系統仍能運作,並 指出 Fable 與 Mythos 遭逢的新出口限制,就是那種會在一夜之間切斷存取權的衝擊。

Sakana AI 的起源

Sakana AI 成立於 2023 年,由 Llion Jones 創辦,他是 Google 「Attention Is All You Need」論文的共同作者之一。曾任 Stability AI 研究主管的 David Ha 也加入擔任共同創辦人。這家實驗室以演化式模型合併以及 AI Scientist 自動化科研系列打開知名度,並長期主張:在最困難、耗時最長的工作上,協同運作的模型池能勝過任何單一系統。

下一篇閱讀:Mane City Mobile 登陸超過 100 個國家的 iOS 與 Android

免責聲明與風險警告: 本文提供的資訊僅供教育與參考用途,並基於作者觀點,不構成財務、投資、法律或稅務建議。 加密貨幣資產具有高度波動性並伴隨高風險,包括可能損失全部或大部分投資金額。買賣或持有加密資產可能並不適合所有投資者。 本文中所表達的觀點僅代表作者立場,不代表 Yellow、其創辦人或管理層的官方政策或意見。 請務必自行進行充分研究(D.Y.O.R.),並在做出任何投資決策前諮詢持牌金融專業人士。