Anthropic’s Fable 5 短暂地在主要 AI 基准测试中击败了 OpenAI’s GPT 5.5,但在 6 月 12 日一项 U.S. export control directive took it offline 之后被迫下线。
Key Points:
- Fable 5 在 Chatbot Arena、SWE-Bench Pro 和主要编程测试中领先 GPT 5.5。
- 该模型仅上线三天,美国政府便下令要求 Anthropic 将其关闭。
- GPT 5.5 之所以成为当前最强可用模型,并不是因为它击败了 Fable 5,而是因为 Fable 5 被移除。
Fable 5 Shut Down
Fable 5 在 6 月 9 日发布后,became 成为当时最强的公开 AI 模型,在美国政府三天后介入之前,在多项主要基准测试中超越了 GPT 5.5。
该模型在 Chatbot Arena 上排名第一,而 GPT 5.5 排名第四。在 SWE-Bench Pro 上,Fable 5 得分 80.3%,GPT 5.5 为 58.6%,在真实软件工程任务上差距接近 22 个百分点。
在编程测试中差距也非常明显。Fable 5 在 Code Arena 上得分 1665,比 GPT 5.5 高出 98 Elo 点数,并在 FrontierCode Diamond 上拿到 29.3%,而 GPT 5.5 仅为 5.7%。
GPT 5.5 在实用层面只在一个方面占有小幅优势:价格。它的输入费用是每百万 token 5 美元、输出 30 美元,而 Fable 5 分别是 10 美元和 50 美元,使 OpenAI 的模型在高调用量场景下更便宜。
Fable 5 还提供了一百万 token 的上下文窗口和 128,000 个输出 token。Anthropic 原计划在 6 月 22 日之前向 Pro、Max、Team 和 Enterprise 订阅用户免费开放该模型,但政府命令提前终止了这段窗口期。
Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 Is The King
此次关停源于 6 月 12 日的一项出口管制指令,理由是 Fable 5 以及更广泛的 Mythos 5 模型家族存在 jailbreak 漏洞。Anthropic 对此提出异议,认为问题轻微、早已为人所知,而且在 GPT 5.5 上同样可以在不使用特殊绕过方法的情况下复现。
这一结果在 AI 市场中颇为反常。
开发者失去了对基准榜首模型的访问权限,而 GPT 5.5 则因为最接近的竞争对手被移除,顺势成为最优可用选项。
这一区别在编码工作流中影响最大。SWE-Bench Pro 上 22 个百分点的差距,意味着一个模型可以解决约五分之四的真实代码库问题,而另一个则只能解决接近五分之三。
Fable 5 的短暂上线也展示了前沿能力演进的速度之快。GPT 5.5 在 4 月下旬以内部代号 “Spud” 发布,但它的领先优势仅持续到 Anthropic 在 6 月向公众开放更强的 Mythos 级系统为止。
Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





