米国命令で停止する前に、Fable 5 が GPT 5.5 を上回っていた

Anthropic’s Fable 5 は、6 月 12 日に出された U.S. export control directive took it offline によって停止されるまで、主要な AI ベンチマークの多くで OpenAI’s GPT 5.5 を一時的に上回っていた。

Key Points:

Fable 5 は Arena、SWE-Bench Pro、主要なコーディングテストで GPT 5.5 をリードしていた。

このモデルは、米政府が Anthropic に無効化を命じるまで、わずか 3 日間しか利用できなかった。

GPT 5.5 は Fable 5 を上回ったからではなく、Fable 5 が停止したため、現在「最強の利用可能モデル」となっている。

Fable 5 のシャットダウン

Fable 5 は、6 月 9 日のリリース後、became もっとも高性能な公開 AI モデルとなり、米政府が 3 日後に介入するまで、主要なベンチマークで GPT 5.5 を上回っていた。

このモデルは Arena で 1 位を獲得し、GPT 5.5 は 4 位だった。SWE-Bench Pro では、Fable 5 が 80.3% を記録し、GPT 5.5 の 58.6% と比べて約 22 ポイントの差がついた。これは実際のソフトウェア工学タスクにおいて大きな差である。

リードはコーディングテストでも明確だった。Fable 5 は Code Arena で 1,665 点を獲得し、GPT 5.5 より 98 Elo 高かった。また FrontierCode Diamond では 29.3% に到達し、5.7% にとどまった GPT 5.5 を大きく引き離した。

一方で、実務的なポジショニングでは GPT 5.5 にわずかな優位性があった。GPT 5.5 の価格は入力トークン 100 万あたり 5 ドル、出力トークン 100 万あたり 30 ドルであるのに対し、Fable 5 はそれぞれ 10 ドル、50 ドルだったため、大量利用においては OpenAI のモデルの方が割安だった。

Fable 5 は 100 万トークンのコンテキストウィンドウと 128,000 トークンの出力も提供していた。Anthropic は、6 月 22 日までは追加料金なしで Pro、Max、Team、Enterprise の加入者に提供する予定だったが、命令によりその期間は前倒しで終了した。

Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

GPT 5.5 が「王」に

シャットダウンは、Fable 5 およびより広い Mythos 5 モデルファミリーにおける脱獄（jailbreak）脆弱性を理由にした、6 月 12 日の輸出管理命令に続いて行われた。Anthropic はこの指摘に異議を唱え、問題は軽微で既知のものであり、特別なバイパス手法を用いなくても GPT 5.5 でも再現可能だと主張した。

この結果は、AI 市場としては異例だ。

開発者はベンチマークのトップに立っていたモデルへのアクセスを失い、GPT 5.5 は最も近いライバルが排除されたことで、結果的に「最良の選択肢」となった。

この違いは特にコーディングワークフローで大きな意味を持つ。SWE-Bench Pro で 22 ポイントの差があるということは、実在するコードベースの問題を「5 件中 4 件ほど解ける」モデルと、「5 件中 3 件程度しか解けない」モデルの差に相当する。

Fable 5 の短い活躍は、フロンティアがいかに速く動き得るかも示した。GPT 5.5 は内部コードネーム「Spud」の下で 4 月末にローンチされたが、そのリードは、Anthropic がより強力な Mythos クラスのシステムを 6 月に一般公開するまでしか続かなかった。