Claude Mythos 在 10 次尝试中 6 次破解 32 步 AISI 攻击演练

Claude Mythos 在 10 次尝试中 6 次破解 32 步 AISI 攻击演练

AnthropicClaude Mythos 预览版新检查点,成为首个同时通过英国政府两大网络攻防模拟演练的 AI 模型,再次引发对自主黑客能力的担忧。

AISI 报告 Mythos 突破

英国 AI Security Institute(AI 安全研究所,AISI) 周三报告称,新版 Mythos 检查点在其 32 步企业网络攻击靶场“The Last Ones”中,10 次尝试里有 6 次完成任务;此前版本仅做到 3 次成功。

更新后的模型还攻破了工业控制系统靶场“Cooling Tower”。在这之前,没有任何模型通过该靶场,而 Mythos 在 10 次中完成了 3 次。

竞争对手 OpenAI 的 GPT-5.5 在同一套演练上也接受了测试。它在“The Last Ones”上取得 3 次成功,但未能完成“Cooling Tower”。

AISI 在每次尝试中为模型提供了 1 亿 token 的算力预算。该机构指出,在这一上限下,性能仍在持续随预算提升而提升,这表明如果给予更高预算,成功率还会被进一步推高。

延伸阅读: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

能力翻倍时间持续缩短

AISI 使用“时间地平线”基准来追踪网络攻防进展,衡量模型在 80% 可靠性下能独立完成任务的时长。2025 年 11 月,该机构估算的能力翻倍时间约为 8 个月。到 2026 年 2 月,这一数字被压缩到 4.7 个月,而此后 Mythos 和 GPT-5.5 的表现都超出了这条更快的趋势线。

该机构也承认,目前尚不确定最新结果究竟意味着一次新的加速,还是单次的跳跃式提升。

研究非营利机构 METR 以软件任务而非网络靶场为评测对象,得出的大致结果也在 4.2 个月左右。AISI 表示,这种收敛增强了一个观点:当前趋势更可能反映真实能力的提升,而不是某一评测体系的偶然偏差。

AISI 强调,其靶场环境中不存在主动防御者,因此这些结果只能说明模型在防护薄弱网络上的攻击能力,而非在高度防护的企业系统中的表现。

为何能力跃升如此关键

此次表现突出的新版 Mythos 检查点,并不是伴随全新模型发布而来。AISI 使用的是 Anthropic 上个月在其安全合作项目 Project Glasswing 中部署的同一版本,只是收到了该模型的更新构建版本。

研究所写道:“显著的能力跃升,并不总是需要全新的模型发布。”这与一种常见假设相悖——即防守方可以按照模型发布周期来安排自身节奏。

Anthropic 在 4 月 7 日推出 Mythos 预览版时,将该模型定位为安全行业的转折点:在内部测试中,它在多个主流操作系统与浏览器上发现了多枚零日漏洞。公司表示,正是因为这些能力,它推迟了更大规模的公开上线。AISI 在 4 月早些时候的评估中,也将 Mythos 视作明显超越此前前沿系统的一次飞跃。

下一篇: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。