Anthropic’s Fable 5 在多項主要 AI 基準測試上短暫領先 OpenAI’s GPT 5.5,直到 6 月 12 日一項美國出口管制指令將其關停。
Key Points:
- Fable 5 在 Arena、SWE-Bench Pro 和多個大型程式測試中領先 GPT 5.5。
- 該模型上線僅三日,就被美國政府下令要求 Anthropic 關閉。
- GPT 5.5 之所以成為目前最強可用模型,是因為 Fable 5 被移除,而非技術上超越它。
Fable 5 被關停
Fable 5 在 6 月 9 日發佈後,成為 當時最強大的公開 AI 模型,在多項基準測試中壓過 GPT 5.5,直到美國政府三天後介入。
該模型在 Arena 排名第一,而 GPT 5.5 排名第四。在 SWE-Bench Pro 上,Fable 5 得分 80.3%,GPT 5.5 則為 58.6%,在真實軟體工程任務上拉開近 22 個百分點差距。
在程式測試中領先同樣明顯。Fable 5 在 Code Arena 取得 1,665 分,比 GPT 5.5 高出 98 Elo 點;在 FrontierCode Diamond 中達到 29.3%,而 GPT 5.5 僅有 5.7%。
GPT 5.5 在實際商業定位上則有一項較小優勢:它的價格為每百萬輸入 token 5 美元、每百萬輸出 token 30 美元;Fable 5 則為 10 美元與 50 美元,令 OpenAI 模型在高流量使用場景中更便宜。
Fable 5 也提供一百萬 token 的上下文視窗與 128,000 個輸出 token。Anthropic 原本計劃在 6 月 22 日前,對 Pro、Max、Team 和 Enterprise 訂閱用戶免費開放使用,這個窗口卻因指令提早結束。
Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 成為王者
關停起因於 6 月 12 日的一項出口管制指令,指稱 Fable 5 以及更廣泛的 Mythos 5 模型家族存在越獄(jailbreak)漏洞。Anthropic 對此提出異議,表示該問題輕微、早已知悉,而且在 GPT 5.5 上同樣可以在不使用特殊繞過手法的情況下重現。
這個結果對 AI 市場而言相當反常。
開發者失去了在基準表上領先的模型,而 GPT 5.5 則因為最接近的競爭對手被移除,而成為最好的可用選項。
這個差異在程式開發流程中尤為關鍵。SWE-Bench Pro 上 22 分的差距,意味著一個模型能解決約五分之四的真實程式庫問題,而另一個大約只能處理五分之三。
Fable 5 短暫的上線期,也顯示前沿能力進展之迅速。GPT 5.5 於 4 月下旬以內部代號「Spud」發佈,但其領先地位只維持到 Anthropic 在 6 月開放更強的 Mythos 等級系統供公眾使用為止。
Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





