Claude Mythos 在 10 次尝试中有 6 次破解 32 步 AISI 攻防演练

Claude Mythos 在 10 次尝试中有 6 次破解 32 步 AISI 攻防演练

AnthropicClaude Mythos 预览版 新检查点,成为首个同时攻破英国政府两套网络攻击模拟靶场的 AI 模型,再度引发对自主黑客的担忧。

AISI 报告 Mythos 突破进展

英国 AI 安全研究院(AI Security Institute, AISI) 周三表示,新版 Mythos 检查点在企业网络攻击靶场 “The Last Ones” 中,完成全部 32 步攻击流程,在 10 次尝试中成功 6 次;早期版本仅做到 10 次中的 3 次。

更新后的模型还攻破了 “Cooling Tower” 工业控制系统靶场——此前没有任何模型通过这一关——在 10 次尝试中成功 3 次。

竞争对手 OpenAI 的 GPT-5.5 在同一套测试中表现逊色。它在 “The Last Ones” 中 完成 了 10 次中的 3 次,但未能跑通 “Cooling Tower”。

AISI 为每次尝试提供 1 亿 token 的算力预算,并指出在这一上限下模型表现仍在持续随预算增长而提升,这表明更高预算可能进一步提高成功率。

延伸阅读: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

能力加倍时间持续缩短

AISI 通过“时间地平线”基准来追踪网络攻防能力进展,衡量模型在 80% 可靠性下能完成的自主任务时长。2025 年 11 月,AISI 估算 的能力加倍时间约为 8 个月;到 2026 年 2 月,这一数字已压缩到 4.7 个月,而 Mythos 和 GPT-5.5 目前的表现又超过了这一更快的趋势线。

该机构承认,目前尚不清楚这些最新结果意味着新一轮加速,还是一次性的跳跃。

研究非营利机构 METR 采用软件任务而非网络靶场来评估 AI,同样给出了约 4.2 个月的类似数字。AISI 表示,这种收敛强化了这样一种观点:趋势反映的是实际能力提升,而非某个单一评测体系的偶然结果。

研究院同时强调,其攻防靶场中不存在主动防御者,因此结果更接近展示模型在防护薄弱网络上的能力,而非对抗经过加固的企业级系统。

为何能力跳变值得警惕

新版 Mythos 检查点上线时并未伴随一次全新的模型发布。AISI 使用的是与上月 Anthropic 在其安全合作计划 Project Glasswing 中部署的同一版本,只是收到了这一模型的更新构建版本。

“显著的能力跃升并不总是需要新的模型发布,”研究院写道。这与一种假设相冲突:防御方可以按模型发布周期来调整节奏。

Anthropic 于 4 月 7 日 发布 Mythos 预览版,将该模型定位为安全行业的一个转折点——在内部测试中,它在主流操作系统和浏览器上发现了多枚零日漏洞。公司表示,正因这些能力,它推迟了更大范围的发布,而 AISI 在 4 月早些时候的评估就已指出,Mythos 相比此前的前沿系统有明显跃升。

下篇: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。
Claude Mythos 在 10 次尝试中有 6 次破解 32 步 AISI 攻防演练 | Yellow.com