Anthropic 恢复上线 Fable 5,自 7 月 1 日起在全球重新提供服务,能力基本完整,仅新增一个过滤器,可在超过 99% 的尝试中拦截被标记的黑客提示词。
要点概览:
- 美国商务部解除了出口管制,Fable 5 回到 Anthropic 主要产品的全球用户面前。
- 模型保留完整能力,但新增过滤器,会将一个被点名的黑客提示词重定向到更弱的模型处理。
- 测试显示,更便宜的模型同样能找出这些漏洞,削弱了“Fable 5 独特危险”的论点。
Fable 5 全球回归
美国商务部在 6 月 30 日解除紧急出口管制令,第二天,这一模型再次回到 Claude Platform、Claude.ai、Claude Code 和 Claude Cowork 等产品的用户手中。通过各大云平台的访问会随后恢复。
付费订阅用户可在 7 月 7 日前按周额度使用该模型,其后继续访问将转为按用量计费的额度体系。
该模型自 6 月 12 日起下线。监管机构禁止任何外国公民接触该模型,并只给公司约 90 分钟的合规时间,Anthropic 因此选择对所有用户下线模型,而不是尝试实时逐一筛查用户身份。
这一指令源于一份报告:Amazon 研究人员发现一个可以诱导模型标记出一组常见系统软件漏洞的提示词。在其中一次交互中,模型更进一步,生成了展示如何利用某个单一漏洞的可运行代码。真正触发警报的,正是这段可利用代码演示,而不仅仅是漏洞清单本身。
相关阅读:CrowdStrike 警告 Claude Mythos 或将加速零日攻击决策
测试给 Fable 5“解套”
Anthropic 与政府及提交报告的公司共同进行的内部审查证实,更弱的模型同样能暴露这些漏洞,包括 Opus 4.8、GPT-5.5 和 Kimi K2.7。在团队检查的所有其他模型中,也都可以复现那次单一漏洞利用的演示,这削弱了“只有 Fable 5 掌握独特网络武器”的说法。公司曾将这次禁令称为“过度延伸”。
修复措施非常窄。恢复上线后,模型携带了一个专门的分类器,用来捕捉被报告的那条提示词,并将其重定向到更弱的 Opus 4.8 处理。这样既保留了 Fable 5 的原始能力,又在普通编码请求上可能产生一些误报,并在每次拦截时向用户发出提示。
Mythos 5 仍受严格限制
Mythos 5 是同一底层模型的“少护栏”版本,目前仍被圈定在名为 Project Glasswing 的项目中,仅向约 100 家通过审查的美国机构开放。
公司同时开通了一个面向公众的“越狱”问题上报通道,并承诺未来在前沿模型发布前,向监管机构提供更早的测试访问。
Fable 5 于 6 月 9 日首次发布,作为 Anthropic 首款广泛开放的 Mythos 级模型,在多个行业基准测试中获得好评,却在上线数日内突然消失。本次中断持续时间不足三周。它的回归重新夺回了这段空窗期内被一家崛起迅速的中国实验室悄然占据的基准榜单优势。





