Claude Mythos 在 10 次尝试中 6 次破解 32 步 AISI 攻击演练

Anthropic 的 Claude Mythos 预览版新检查点，成为首个同时通过英国政府两大网络攻防模拟演练的 AI 模型，再次引发对自主黑客能力的担忧。

AISI 报告 Mythos 突破

英国 AI Security Institute（AI 安全研究所，AISI） 周三报告称，新版 Mythos 检查点在其 32 步企业网络攻击靶场“The Last Ones”中，10 次尝试里有 6 次完成任务；此前版本仅做到 3 次成功。

更新后的模型还攻破了工业控制系统靶场“Cooling Tower”。在这之前，没有任何模型通过该靶场，而 Mythos 在 10 次中完成了 3 次。

竞争对手 OpenAI 的 GPT-5.5 在同一套演练上也接受了测试。它在“The Last Ones”上取得 3 次成功，但未能完成“Cooling Tower”。

AISI 在每次尝试中为模型提供了 1 亿 token 的算力预算。该机构指出，在这一上限下，性能仍在持续随预算提升而提升，这表明如果给予更高预算，成功率还会被进一步推高。

延伸阅读： Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

能力翻倍时间持续缩短

AISI 使用“时间地平线”基准来追踪网络攻防进展，衡量模型在 80% 可靠性下能独立完成任务的时长。2025 年 11 月，该机构估算的能力翻倍时间约为 8 个月。到 2026 年 2 月，这一数字被压缩到 4.7 个月，而此后 Mythos 和 GPT-5.5 的表现都超出了这条更快的趋势线。

该机构也承认，目前尚不确定最新结果究竟意味着一次新的加速，还是单次的跳跃式提升。

研究非营利机构 METR 以软件任务而非网络靶场为评测对象，得出的大致结果也在 4.2 个月左右。AISI 表示，这种收敛增强了一个观点：当前趋势更可能反映真实能力的提升，而不是某一评测体系的偶然偏差。

AISI 强调，其靶场环境中不存在主动防御者，因此这些结果只能说明模型在防护薄弱网络上的攻击能力，而非在高度防护的企业系统中的表现。

为何能力跃升如此关键

此次表现突出的新版 Mythos 检查点，并不是伴随全新模型发布而来。AISI 使用的是 Anthropic 上个月在其安全合作项目 Project Glasswing 中部署的同一版本，只是收到了该模型的更新构建版本。

研究所写道：“显著的能力跃升，并不总是需要全新的模型发布。”这与一种常见假设相悖——即防守方可以按照模型发布周期来安排自身节奏。

Anthropic 在 4 月 7 日推出 Mythos 预览版时，将该模型定位为安全行业的转折点：在内部测试中，它在多个主流操作系统与浏览器上发现了多枚零日漏洞。公司表示，正是因为这些能力，它推迟了更大规模的公开上线。AISI 在 4 月早些时候的评估中，也将 Mythos 视作明显超越此前前沿系统的一次飞跃。

下一篇： Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO