Anthropic’s Fable 5 在多項主流 AI 基準測試上短暫領先 OpenAI’s GPT 5.5,之後在 6 月 12 日被一項 U.S. export control directive took it offline 的美國出口管制指令勒令下線。
Key Points:
- Fable 5 在 Chatbot Arena、SWE-Bench Pro 以及多項大型程式測試中領先 GPT 5.5。
- 該模型僅上線三天便被美國政府下令要求 Anthropic 關閉。
- GPT 5.5 之所以成為預設最強可用模型,是因為 Fable 5 被移除,而不是在性能上超越對方。
Fable 5 Shut Down
Fable 5 在 6 月 9 日上線後,became 成為當時最強大的公開 AI 模型,在多項重要基準測試中壓過 GPT 5.5,直到美國政府三天後介入。
該模型在 Chatbot Arena 排名第一,而 GPT 5.5 排名第四。在 SWE-Bench Pro 上,Fable 5 拿下 80.3% 的成績,相較之下 GPT 5.5 僅為 58.6%,在真實軟體工程任務上拉開近 22 個百分點的差距。
在程式測試中領先同樣明顯。Fable 5 在 Code Arena 拿到 1,665 分,Elo 評分比 GPT 5.5 高出 98 分,並在 FrontierCode Diamond 取得 29.3% 的成績,而 GPT 5.5 僅有 5.7%。
GPT 5.5 只在實務定位上有一項較小優勢:其價格為每百萬輸入 token 5 美元、每百萬輸出 token 30 美元,而 Fable 5 則是 10 美元與 50 美元,使 OpenAI 的模型在大規模使用情境下更便宜。
Fable 5 同時提供一百萬 token 的上下文視窗,以及 128,000 個輸出 token。Anthropic 原本計畫在 6 月 22 日前,讓 Pro、Max、Team 與 Enterprise 訂閱用戶免費使用,結果因命令提前結束這段窗口期。
Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 Is The King
關停決定源於 6 月 12 日的一項出口管制指令,理由是 Fable 5 以及更大範圍的 Mythos 5 模型家族存在 jailbreak 式繞過風險。Anthropic 對此提出異議,表示該問題輕微、早已為人所知,且在 GPT 5.5 上同樣能在未使用特殊繞過手法的情況下重現。
對 AI 市場來說,這個結果顯得相當罕見。
開發者失去了當前基準榜首模型的使用權,而 GPT 5.5 之所以成為最佳可用選項,只是因為最接近的競爭者被移除。
這項差異在程式開發工作流程中特別關鍵。SWE-Bench Pro 22 個百分點的落差,代表一個模型能解決約五分之四的實際程式碼庫問題,而另一個則只能處理接近五分之三。
Fable 5 短暫的上線期同樣顯示了前沿進展的速度有多快。GPT 5.5 在 4 月下旬以內部代號「Spud」推出,但它的領先地位只維持到 Anthropic 在 6 月向公眾開放更強的 Mythos 級系統為止。
Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





