Anthropic’s Fable 5 在多項主要 AI 基準測試中短暫擊敗 OpenAI’s GPT 5.5,其後在 6 月 12 日因 U.S. export control directive took it offline 而被迫下線。
Key Points:
- Fable 5 在 Chatbot Arena、SWE-Bench Pro 和多項重要程式測試中領先 GPT 5.5。
- 該模型自發佈起僅上線三天,美國政府便下令 Anthropic 將其停用。
- GPT 5.5 現時成為最強可用模型,並非因為超越了 Fable 5,而是因為對手被移除。
Fable 5 Shut Down
Fable 5 在 6 月 9 日發佈後,became 成為公開市場上性能最強的 AI 模型,在多項關鍵基準測試中壓過 GPT 5.5,直到三天後美國政府介入。
該模型在 Chatbot Arena 上排名第一,而 GPT 5.5 排名第四。在 SWE-Bench Pro 上,Fable 5 得分 80.3%,而 GPT 5.5 為 58.6%,在真實軟件工程任務中拉開近 22 個百分點的差距。
在程式測試中優勢同樣明顯。Fable 5 在 Code Arena 上取得 1,665 分,比 GPT 5.5 高出 98 個 Elo 分,並在 FrontierCode Diamond 上達到 29.3%,而 GPT 5.5 僅有 5.7%。
GPT 5.5 在實際商用定位上有一項較小優勢:其費用為每百萬輸入 token 5 美元、每百萬輸出 token 30 美元;Fable 5 則為 10 美元與 50 美元,令 OpenAI 模型在高流量使用情境下更具成本優勢。
Fable 5 亦提供一百萬 token 的上下文視窗,以及 128,000 token 的輸出長度。Anthropic 原本將其免費提供給 Pro、Max、Team 和 Enterprise 訂閱用戶使用至 6 月 22 日,但該命令令這個窗口被迫提前結束。
Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 Is The King
關停源於 6 月 12 日的一項出口管制指令,稱 Fable 5 及更廣泛的 Mythos 5 模型家族存在越獄漏洞。Anthropic 對此提出異議,指問題輕微、早已知悉,而且在 GPT 5.5 上亦能不經特殊繞過方式重現。
對 AI 市場而言,這個結果相當罕見。
開發者失去了在基準排行榜上領先的模型存取權,而 GPT 5.5 則因最接近的競爭對手被移除,順勢成為最佳可用選項。
這一差異在程式開發工作流程中特別關鍵。SWE-Bench Pro 上 22 個百分點的差距,實際上代表了一個模型大概能解決五個真實代碼庫問題中的四個,而另一個則僅能處理約五分之三。
Fable 5 短暫的上線期,同時展示了前沿性能躍進的速度。GPT 5.5 在 4 月下旬以內部代號「Spud」發佈,但它的領先優勢只維持到 Anthropic 在 6 月開放存取性能更強的 Mythos 級系統為止。
Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





