Fable 5 在美國下令下線前曾擊敗 GPT 5.5

Fable 5 在美國下令下線前曾擊敗 GPT 5.5

Anthropic’s Fable 5 在多項主要 AI 基準測試中短暫擊敗 OpenAI’s GPT 5.5,其後在 6 月 12 日因 U.S. export control directive took it offline 而被迫下線。

Key Points:

  • Fable 5 在 Chatbot Arena、SWE-Bench Pro 和多項重要程式測試中領先 GPT 5.5。
  • 該模型自發佈起僅上線三天,美國政府便下令 Anthropic 將其停用。
  • GPT 5.5 現時成為最強可用模型,並非因為超越了 Fable 5,而是因為對手被移除。

Fable 5 Shut Down

Fable 5 在 6 月 9 日發佈後,became 成為公開市場上性能最強的 AI 模型,在多項關鍵基準測試中壓過 GPT 5.5,直到三天後美國政府介入。

該模型在 Chatbot Arena 上排名第一,而 GPT 5.5 排名第四。在 SWE-Bench Pro 上,Fable 5 得分 80.3%,而 GPT 5.5 為 58.6%,在真實軟件工程任務中拉開近 22 個百分點的差距。

在程式測試中優勢同樣明顯。Fable 5 在 Code Arena 上取得 1,665 分,比 GPT 5.5 高出 98 個 Elo 分,並在 FrontierCode Diamond 上達到 29.3%,而 GPT 5.5 僅有 5.7%。

GPT 5.5 在實際商用定位上有一項較小優勢:其費用為每百萬輸入 token 5 美元、每百萬輸出 token 30 美元;Fable 5 則為 10 美元與 50 美元,令 OpenAI 模型在高流量使用情境下更具成本優勢。

Fable 5 亦提供一百萬 token 的上下文視窗,以及 128,000 token 的輸出長度。Anthropic 原本將其免費提供給 Pro、Max、Team 和 Enterprise 訂閱用戶使用至 6 月 22 日,但該命令令這個窗口被迫提前結束。

Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

GPT 5.5 Is The King

關停源於 6 月 12 日的一項出口管制指令,稱 Fable 5 及更廣泛的 Mythos 5 模型家族存在越獄漏洞。Anthropic 對此提出異議,指問題輕微、早已知悉,而且在 GPT 5.5 上亦能不經特殊繞過方式重現。

對 AI 市場而言,這個結果相當罕見。

開發者失去了在基準排行榜上領先的模型存取權,而 GPT 5.5 則因最接近的競爭對手被移除,順勢成為最佳可用選項。

這一差異在程式開發工作流程中特別關鍵。SWE-Bench Pro 上 22 個百分點的差距,實際上代表了一個模型大概能解決五個真實代碼庫問題中的四個,而另一個則僅能處理約五分之三。

Fable 5 短暫的上線期,同時展示了前沿性能躍進的速度。GPT 5.5 在 4 月下旬以內部代號「Spud」發佈,但它的領先優勢只維持到 Anthropic 在 6 月開放存取性能更強的 Mythos 級系統為止。

Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says

免責聲明及風險提示: 本文資訊僅供教育與參考之用,並基於作者意見,並不構成金融、投資、法律或稅務建議。 加密貨幣資產具高度波動性並伴隨高風險,可能導致投資大幅虧損或全部損失,並非適合所有投資者。 文章內容僅代表作者觀點,不代表 Yellow、創辦人或管理層立場。 投資前請務必自行徹底研究(D.Y.O.R.),並諮詢持牌金融專業人士。
Fable 5 在美國下令下線前曾擊敗 GPT 5.5 | Yellow.com