Yellow.com

Anthropic’s Fable 5 在主要 AI 基準測試上短暫領先 OpenAI’s GPT 5.5，隨後在 6 月 12 日因 U.S. export control directive took it offline 而被下線。

Key Points:

Fable 5 在 Arena、SWE-Bench Pro 和主要程式測試中領先 GPT 5.5。

該模型僅上線三天，就被美國政府下令要求 Anthropic 關閉。

GPT 5.5 之所以成為預設最強可用模型，是因為 Fable 5 被移除，而非自行超越 Fable 5。

Fable 5 Shut Down

Fable 5 在 6 月 9 日發佈後，became 成為最強大的公開 AI 模型，在多項基準測試上超越 GPT 5.5，直至三天後美國政府介入為止。

在 Arena 排名中，該模型位居第一，而 GPT 5.5 排名第四。在 SWE-Bench Pro 測試中，Fable 5 得分 80.3%，而 GPT 5.5 為 58.6%，在真實軟體工程任務上拉開近 22 個百分點的差距。

在程式測試中，Fable 5 的領先同樣明顯。它在 Code Arena 中取得 1,665 分，比 GPT 5.5 高出 98 Elo 分，並在 FrontierCode Diamond 上達到 29.3%，而 GPT 5.5 僅為 5.7%。

GPT 5.5 在實務定位上有一項較小的優勢：其收費為每百萬輸入 token 5 美元、每百萬輸出 token 30 美元；Fable 5 則為 10 美元與 50 美元，讓 OpenAI 的模型在高用量情境下更具成本優勢。

Fable 5 亦提供一百萬 token 的上下文視窗，以及 128,000 個輸出 token。Anthropic 原本計畫在 6 月 22 日前，向 Pro、Max、Team 與 Enterprise 訂閱用戶免費開放使用，但該命令提早終結了這個窗口。

Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

GPT 5.5 Is The King

關閉行動源於 6 月 12 日的一項出口管制指令，理由是 Fable 5 以及更大範圍的 Mythos 5 模型家族存在 jailbreak 漏洞。Anthropic 對此表示異議，稱問題影響輕微、早已知悉，且在 GPT 5.5 上也能在不使用特殊繞過手法的情況下重現。

這一結果在 AI 市場中相當罕見。

開發者失去了在基準榜單上領先的模型使用權，而 GPT 5.5 則因最接近的對手被移除，而成為最佳可用選項。

這個差異在程式開發流程中特別關鍵。SWE-Bench Pro 22 個百分點的落差，意味著一個模型能解決約五分之四的真實程式庫問題，而另一個只能處理接近五分之三。

Fable 5 短暫的上線期也顯示前沿進步的速度有多快。GPT 5.5 於 4 月底以內部代號「Spud」發佈，但它的領先僅維持到 Anthropic 在 6 月向公眾開放更強的 Mythos 級系統為止。

Mehjabeen Arsiwala

Mehjabeen Arsiwala 是一名記者，專門報導加密貨幣新聞、去中心化金融（DeFi）、交易所、交易以及市場分析。過去三年來，她專注於塑造數位資產市場的趨勢與敘事，內容涵蓋從價格走勢與預測，到交易所發展與鏈上訊號。她擅長以清晰易懂的報導，協助讀者了解市場上正在發生的事，以及這些事件為何重要。

在美國下令關閉前，Fable 5 曾擊敗 GPT 5.5

Key Points:

Fable 5 Shut Down

GPT 5.5 Is The King

Mehjabeen Arsiwala