サカナAIのフグ、複数AIモデルを指揮し制限付きAnthropic「Mythos」に対抗

東京発のスタートアップ Sakana AI は、入れ替え可能な言語モデル群を指揮して、制限付きの Anthropic の FableおよびMythosモデルに対抗するシステム「Fugu（フグ）」を公開した。

重要ポイント:

サカナAIのFuguは、1つのモデルとして動作しつつ、背後では単一API越しに複数システムのプールを協調動作させる。

Fugu UltraはSWE-Bench Proのコーディングテストで73.7点を記録し、いくつかのフロンティアモデルのライバルを上回った。

この設計は、FableとMythosを締め出した輸出規制へのヘッジとして位置づけられている。

サカナ「Fugu」がモデル群をオーケストレーション

東京のラボは6月22日にFuguと、より重い「Fugu Ultra」ティアをローンチし、どちらもOpenAI互換の単一エンドポイントからアクセスできると確認した。リクエスト内容に応じて、単独でタスクに答えるか、他システムのチームを呼び集めて対応する。

モデル自身がチェックと統合を実行する。

Fugu自体も言語モデルだ。

入れ替え可能なプールからエージェントを呼び出すよう訓練されており、1つの仕事に1モデルでは手が足りないときには、自分自身のコピーを呼び出すことさえできる。ベースティアは、日常的なコーディングやチャット、Codexのようなツール向けに低レイテンシを狙っており、チームがプライバシー規制に合わせて特定エージェントを外せるようになっている。一方Fugu Ultraは、論文再現やセキュリティ分析のような長尺タスクでの回答品質を最優先しており、ここ数週間でおよそ500人のベータユーザーによるテストを受けてきた。

モリックとレヴィの評価

企業が公開したベンチマークによれば、Fugu UltraはSWE-Bench Proのコーディングテストで73.7点を記録し、同条件でのOpus 4.8、Gemini 3.1 Pro、GPT-5.5を上回った。

企業側は、このスコアはFable 5およびMythos Previewと同水準だとし、自社の表では、公開された11行中10行でFugu Ultraのオーケストレーターがトップフィニッシュになっていると示している。

とはいえ、すべてのテスターが納得したわけではない。AI研究者の Ethan Mollick は、Fugu Ultraは「信じられないほど遅い」とし、ルーチンなコーディングテストでも30分かかるケースがあり、実運用ではFableに劣る出力だったと記した。Box のCEO Aaron Levie はより好意的で、単一APIで各タスクを最適なモデルへルーティングする設計は、実用AIの構築方法として前進だと評価した。

さらに、オーケストレーションによってトークンコストが積み上がり、同等タスクで単一のフロンティアモデルを直接呼び出すよりも何倍も高くなり得るとの指摘も出ている。サカナ側は、このプール設計を「どのプロバイダーが突然使えなくなっても備えられる保険」と位置づけ、FableとMythosへの新たな輸出規制のようなショックが、一夜にしてアクセスを断ち切り得る例だと警鐘を鳴らしている。

サカナAIのルーツ

サカナAIは、Google の論文「Attention Is All You Need」の共著者である Llion Jones の下、2023年に立ち上がった。かつて Stability AI のリサーチリードだった David Ha が共同創業者として加わっている。同ラボは、進化的モデルマージや、自動研究システム「AI Scientist」系統の開発で名を上げており、長らく「協調動作するモデル群は、最難関で長時間のタスクでは、どんな単一システムよりも高い性能を発揮し得る」と主張してきた。

次に読む: Mane City MobileがiOSとAndroidで100カ国以上に上陸

サカナAIのフグ、複数AIモデルを指揮し 制限付きAnthropic「Mythos」に対抗

重要ポイント:

サカナ「Fugu」がモデル群をオーケストレーション

モリックとレヴィの評価

サカナAIのルーツ

サカナAIのフグ、複数AIモデルを指揮し制限付きAnthropic「Mythos」に対抗