米国命令で停止する前に、Fable 5 が GPT 5.5 を上回っていた

米国命令で停止する前に、Fable 5 が GPT 5.5 を上回っていた

Anthropic’s Fable 5 は、6 月 12 日に出された U.S. export control directive took it offline によって停止されるまで、主要な AI ベンチマークの多くで OpenAI’s GPT 5.5 を一時的に上回っていた。

Key Points:

  • Fable 5 は Arena、SWE-Bench Pro、主要なコーディングテストで GPT 5.5 をリードしていた。
  • このモデルは、米政府が Anthropic に無効化を命じるまで、わずか 3 日間しか利用できなかった。
  • GPT 5.5 は Fable 5 を上回ったからではなく、Fable 5 が停止したため、現在「最強の利用可能モデル」となっている。

Fable 5 のシャットダウン

Fable 5 は、6 月 9 日のリリース後、became もっとも高性能な公開 AI モデルとなり、米政府が 3 日後に介入するまで、主要なベンチマークで GPT 5.5 を上回っていた。

このモデルは Arena で 1 位を獲得し、GPT 5.5 は 4 位だった。SWE-Bench Pro では、Fable 5 が 80.3% を記録し、GPT 5.5 の 58.6% と比べて約 22 ポイントの差がついた。これは実際のソフトウェア工学タスクにおいて大きな差である。

リードはコーディングテストでも明確だった。Fable 5 は Code Arena で 1,665 点を獲得し、GPT 5.5 より 98 Elo 高かった。また FrontierCode Diamond では 29.3% に到達し、5.7% にとどまった GPT 5.5 を大きく引き離した。

一方で、実務的なポジショニングでは GPT 5.5 にわずかな優位性があった。GPT 5.5 の価格は入力トークン 100 万あたり 5 ドル、出力トークン 100 万あたり 30 ドルであるのに対し、Fable 5 はそれぞれ 10 ドル、50 ドルだったため、大量利用においては OpenAI のモデルの方が割安だった。

Fable 5 は 100 万トークンのコンテキストウィンドウと 128,000 トークンの出力も提供していた。Anthropic は、6 月 22 日までは追加料金なしで Pro、Max、Team、Enterprise の加入者に提供する予定だったが、命令によりその期間は前倒しで終了した。

Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

GPT 5.5 が「王」に

シャットダウンは、Fable 5 およびより広い Mythos 5 モデルファミリーにおける脱獄(jailbreak)脆弱性を理由にした、6 月 12 日の輸出管理命令に続いて行われた。Anthropic はこの指摘に異議を唱え、問題は軽微で既知のものであり、特別なバイパス手法を用いなくても GPT 5.5 でも再現可能だと主張した。

この結果は、AI 市場としては異例だ。

開発者はベンチマークのトップに立っていたモデルへのアクセスを失い、GPT 5.5 は最も近いライバルが排除されたことで、結果的に「最良の選択肢」となった。

この違いは特にコーディングワークフローで大きな意味を持つ。SWE-Bench Pro で 22 ポイントの差があるということは、実在するコードベースの問題を「5 件中 4 件ほど解ける」モデルと、「5 件中 3 件程度しか解けない」モデルの差に相当する。

Fable 5 の短い活躍は、フロンティアがいかに速く動き得るかも示した。GPT 5.5 は内部コードネーム「Spud」の下で 4 月末にローンチされたが、そのリードは、Anthropic がより強力な Mythos クラスのシステムを 6 月に一般公開するまでしか続かなかった。

Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says

免責事項とリスク警告: この記事で提供される情報は教育および情報提供のみを目的としており、著者の意見に基づいています。金融、投資、法的、または税務上のアドバイスを構成するものではありません。 暗号資産は非常に変動性が高く、投資の全部または相当な部分を失うリスクを含む高いリスクにさらされています。暗号資産の取引または保有は、すべての投資家に適しているとは限りません。 この記事で表明された見解は著者のものであり、Yellow、その創設者、または役員の公式な方針や立場を表すものではありません。 投資決定を行う前に、常にご自身で十分な調査(D.Y.O.R.)を行い、ライセンスを持つ金融専門家にご相談ください。
関連する研究記事
関連する学習記事
米国命令で停止する前に、Fable 5 が GPT 5.5 を上回っていた | Yellow.com