在被美国下令下线前,Fable 5 曾击败 GPT 5.5

在被美国下令下线前,Fable 5 曾击败 GPT 5.5

Anthropic’s Fable 5 短暂地在主要 AI 基准测试上超越了 OpenAI’s GPT 5.5,随后在 6 月 12 日被一项 U.S. export control directive took it offline 的美国出口管制指令要求下线。

要点:

  • 在 Arena、SWE-Bench Pro 和主要编码测试中,Fable 5 领先 GPT 5.5。
  • 该模型仅上线三天,美国政府就下令 Anthropic 将其禁用。
  • 现在 GPT 5.5 成为默认最强的可用模型,并不是因为它超越了 Fable 5。

Fable 5 被关停

Fable 5 在 6 月 9 日上线后became 成为最强的公开 AI 模型,在美国政府三天后介入之前,它在主要基准测试中都压过了 GPT 5.5。

该模型在 Arena 排名第一,而 GPT 5.5 排名第四。在 SWE-Bench Pro 上,Fable 5 得分 80.3%,而 GPT 5.5 为 58.6%,在真实软件工程任务中相差近 22 个百分点。

在编码测试中的领先同样明显。Fable 5 在 Code Arena 中得分 1,665,比 GPT 5.5 高出 98 Elo 点;在 FrontierCode Diamond 上达到 29.3%,而 GPT 5.5 仅为 5.7%。

GPT 5.5 在实际“性价比”定位上有一个更窄的优势。其费用为每百万输入 token 5 美元、每百万输出 token 30 美元,而 Fable 5 分别为 10 美元和 50 美元,使 OpenAI 的模型在大规模使用下更便宜。

Fable 5 还提供一百万 token 的上下文窗口和 128,000 输出 token。Anthropic 原计划在 6 月 22 日前向 Pro、Max、Team 和 Enterprise 订阅用户免费开放使用,但监管命令提前终止了这一窗口。

Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

GPT 5.5 成为“王者”

关停决定源于 6 月 12 日发布的一项出口管制指令,该指令援引了 Fable 5 及更广泛的 Mythos 5 模型家族存在越狱漏洞。Anthropic 对此表示异议,称问题较小、早已知晓,而且在 GPT 5.5 上同样可以在不使用特殊绕过方法的情况下复现。

这一结果对 AI 市场而言并不寻常。

开发者失去了对排行榜头名模型的访问权,而 GPT 5.5 则因为最接近的竞品被移除,而成为最佳可用选项。

这一差别在编码工作流中意义最大。SWE-Bench Pro 相差 22 个百分点,意味着一个模型能解决约五个真实代码库问题中的四个,而另一个则更接近五个中的三个。

Fable 5 的短暂上线也展示了前沿进展的速度。GPT 5.5 在 4 月下旬以内部代号“Spud”发布,但它的领先地位只维持到 Anthropic 在 6 月向公众开放性能更强的 Mythos 级系统为止。

Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。