在美国下令下线前,Fable 5 曾击败 GPT 5.5

在美国下令下线前,Fable 5 曾击败 GPT 5.5

Anthropic’s Fable 5 短暂地在主要 AI 基准测试中击败了 OpenAI’s GPT 5.5,但在 6 月 12 日一项 U.S. export control directive took it offline 之后被迫下线。

Key Points:

  • Fable 5 在 Chatbot Arena、SWE-Bench Pro 和主要编程测试中领先 GPT 5.5。
  • 该模型仅上线三天,美国政府便下令要求 Anthropic 将其关闭。
  • GPT 5.5 之所以成为当前最强可用模型,并不是因为它击败了 Fable 5,而是因为 Fable 5 被移除。

Fable 5 Shut Down

Fable 5 在 6 月 9 日发布后,became 成为当时最强的公开 AI 模型,在美国政府三天后介入之前,在多项主要基准测试中超越了 GPT 5.5。

该模型在 Chatbot Arena 上排名第一,而 GPT 5.5 排名第四。在 SWE-Bench Pro 上,Fable 5 得分 80.3%,GPT 5.5 为 58.6%,在真实软件工程任务上差距接近 22 个百分点。

在编程测试中差距也非常明显。Fable 5 在 Code Arena 上得分 1665,比 GPT 5.5 高出 98 Elo 点数,并在 FrontierCode Diamond 上拿到 29.3%,而 GPT 5.5 仅为 5.7%。

GPT 5.5 在实用层面只在一个方面占有小幅优势:价格。它的输入费用是每百万 token 5 美元、输出 30 美元,而 Fable 5 分别是 10 美元和 50 美元,使 OpenAI 的模型在高调用量场景下更便宜。

Fable 5 还提供了一百万 token 的上下文窗口和 128,000 个输出 token。Anthropic 原计划在 6 月 22 日之前向 Pro、Max、Team 和 Enterprise 订阅用户免费开放该模型,但政府命令提前终止了这段窗口期。

Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

GPT 5.5 Is The King

此次关停源于 6 月 12 日的一项出口管制指令,理由是 Fable 5 以及更广泛的 Mythos 5 模型家族存在 jailbreak 漏洞。Anthropic 对此提出异议,认为问题轻微、早已为人所知,而且在 GPT 5.5 上同样可以在不使用特殊绕过方法的情况下复现。

这一结果在 AI 市场中颇为反常。

开发者失去了对基准榜首模型的访问权限,而 GPT 5.5 则因为最接近的竞争对手被移除,顺势成为最优可用选项。

这一区别在编码工作流中影响最大。SWE-Bench Pro 上 22 个百分点的差距,意味着一个模型可以解决约五分之四的真实代码库问题,而另一个则只能解决接近五分之三。

Fable 5 的短暂上线也展示了前沿能力演进的速度之快。GPT 5.5 在 4 月下旬以内部代号 “Spud” 发布,但它的领先优势仅持续到 Anthropic 在 6 月向公众开放更强的 Mythos 级系统为止。

Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。