Anthropic’s Fable 5 は、6月12日の U.S. export control directive took it offline によって停止させられるまで、主要なAIベンチマークで OpenAI’s GPT 5.5 を一時的に上回っていた。
Key Points:
- Fable 5はChatbot Arena、SWE-Bench Pro、主要なコーディングテストでGPT 5.5をリードしていた。
- モデルは米政府がAnthropicに停止を命じるまでの3日間しか利用できなかった。
- GPT 5.5がFable 5を上回ったからではなく、Fable 5が停止された結果として、現在最強の利用可能モデルとなっている。
Fable 5のシャットダウン
Fable 5は6月9日の公開後、became すぐに最も高性能な公開AIモデルとなり、米政府が3日後に介入するまで、主要ベンチマークでGPT 5.5を上回っていた。
モデルはChatbot Arenaで1位を獲得し、GPT 5.5は4位だった。SWE-Bench Proでは、Fable 5が80.3%を記録し、GPT 5.5は58.6%にとどまり、実際のソフトウェア工学タスクで約22ポイントの差がついた。
リードはコーディングテストでも明確だった。Fable 5はCode Arenaで1,665点を記録し、GPT 5.5より98 Eloポイント高かった。さらにFrontierCode Diamondでは29.3%に達し、5.7%のGPT 5.5を大きく引き離した。
GPT 5.5は実務的な「使いやすさ」の面で、唯一の小さな優位を持っていた。入力100万トークンあたり5ドル、出力100万トークンあたり30ドルであるのに対し、Fable 5はそれぞれ10ドルと50ドルであり、大量利用ではOpenAIのモデルの方が安価だった。
Fable 5は100万トークンのコンテキストウィンドウと12万8,000トークンの出力も提供していた。Anthropicは6月22日まで、Pro、Max、Team、Enterpriseの各プランの加入者に追加料金なしで提供する予定だったが、命令によりその期間は前倒しで終了した。
Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5が「王」に
シャットダウンは、Fable 5およびより広いMythos 5モデルファミリーにおける脱獄(ジェイルブレイク)の脆弱性を理由にした、6月12日の輸出管理指令に続いて行われた。Anthropicはこの指摘に異議を唱え、問題は軽微で既知のものであり、特別な回避手法なしでもGPT 5.5で再現可能だと主張した。
この結果はAI市場としては異例だ。
開発者はベンチマークのトップに立っていたモデルへのアクセスを失い、最有力の競合が排除されたことで、GPT 5.5が最善の選択肢として残った。
この違いは、とりわけコーディングワークフローに大きな意味を持つ。SWE-Bench Proでの22ポイントの差は、「実際のコードベースの問題の約5件中4件を解決できるモデル」と「約5件中3件にとどまるモデル」の違いに相当する。
Fable 5の短い活躍期間は、最前線の動きの速さも示した。GPT 5.5は内部コードネーム「Spud」として4月下旬に公開されたが、その優位は、Anthropicがより強力なMythosクラスのシステムへの一般公開を始めるまでしか続かなかった。
Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





