在被美国下令下线前，Fable 5 曾击败 GPT 5.5

Anthropic’s Fable 5 短暂地在主要 AI 基准测试上超越了 OpenAI’s GPT 5.5，随后在 6 月 12 日被一项 U.S. export control directive took it offline 的美国出口管制指令要求下线。

要点：

在 Arena、SWE-Bench Pro 和主要编码测试中，Fable 5 领先 GPT 5.5。

该模型仅上线三天，美国政府就下令 Anthropic 将其禁用。

现在 GPT 5.5 成为默认最强的可用模型，并不是因为它超越了 Fable 5。

Fable 5 被关停

Fable 5 在 6 月 9 日上线后became 成为最强的公开 AI 模型，在美国政府三天后介入之前，它在主要基准测试中都压过了 GPT 5.5。

该模型在 Arena 排名第一，而 GPT 5.5 排名第四。在 SWE-Bench Pro 上，Fable 5 得分 80.3%，而 GPT 5.5 为 58.6%，在真实软件工程任务中相差近 22 个百分点。

在编码测试中的领先同样明显。Fable 5 在 Code Arena 中得分 1,665，比 GPT 5.5 高出 98 Elo 点；在 FrontierCode Diamond 上达到 29.3%，而 GPT 5.5 仅为 5.7%。

GPT 5.5 在实际“性价比”定位上有一个更窄的优势。其费用为每百万输入 token 5 美元、每百万输出 token 30 美元，而 Fable 5 分别为 10 美元和 50 美元，使 OpenAI 的模型在大规模使用下更便宜。

Fable 5 还提供一百万 token 的上下文窗口和 128,000 输出 token。Anthropic 原计划在 6 月 22 日前向 Pro、Max、Team 和 Enterprise 订阅用户免费开放使用，但监管命令提前终止了这一窗口。

Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

关停决定源于 6 月 12 日发布的一项出口管制指令，该指令援引了 Fable 5 及更广泛的 Mythos 5 模型家族存在越狱漏洞。Anthropic 对此表示异议，称问题较小、早已知晓，而且在 GPT 5.5 上同样可以在不使用特殊绕过方法的情况下复现。

这一结果对 AI 市场而言并不寻常。

开发者失去了对排行榜头名模型的访问权，而 GPT 5.5 则因为最接近的竞品被移除，而成为最佳可用选项。

这一差别在编码工作流中意义最大。SWE-Bench Pro 相差 22 个百分点，意味着一个模型能解决约五个真实代码库问题中的四个，而另一个则更接近五个中的三个。

Fable 5 的短暂上线也展示了前沿进展的速度。GPT 5.5 在 4 月下旬以内部代号“Spud”发布，但它的领先地位只维持到 Anthropic 在 6 月向公众开放性能更强的 Mythos 级系统为止。