Anthropic 的 Claude Mythos 预览版新检查点,成为首个同时通过英国政府两大网络攻防模拟演练的 AI 模型,再次引发对自主黑客能力的担忧。
AISI 报告 Mythos 突破
英国 AI Security Institute(AI 安全研究所,AISI) 周三报告称,新版 Mythos 检查点在其 32 步企业网络攻击靶场“The Last Ones”中,10 次尝试里有 6 次完成任务;此前版本仅做到 3 次成功。
更新后的模型还攻破了工业控制系统靶场“Cooling Tower”。在这之前,没有任何模型通过该靶场,而 Mythos 在 10 次中完成了 3 次。
竞争对手 OpenAI 的 GPT-5.5 在同一套演练上也接受了测试。它在“The Last Ones”上取得 3 次成功,但未能完成“Cooling Tower”。
AISI 在每次尝试中为模型提供了 1 亿 token 的算力预算。该机构指出,在这一上限下,性能仍在持续随预算提升而提升,这表明如果给予更高预算,成功率还会被进一步推高。
延伸阅读: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok
能力翻倍时间持续缩短
AISI 使用“时间地平线”基准来追踪网络攻防进展,衡量模型在 80% 可靠性下能独立完成任务的时长。2025 年 11 月,该机构估算的能力翻倍时间约为 8 个月。到 2026 年 2 月,这一数字被压缩到 4.7 个月,而此后 Mythos 和 GPT-5.5 的表现都超出了这条更快的趋势线。
该机构也承认,目前尚不确定最新结果究竟意味着一次新的加速,还是单次的跳跃式提升。
研究非营利机构 METR 以软件任务而非网络靶场为评测对象,得出的大致结果也在 4.2 个月左右。AISI 表示,这种收敛增强了一个观点:当前趋势更可能反映真实能力的提升,而不是某一评测体系的偶然偏差。
AISI 强调,其靶场环境中不存在主动防御者,因此这些结果只能说明模型在防护薄弱网络上的攻击能力,而非在高度防护的企业系统中的表现。
为何能力跃升如此关键
此次表现突出的新版 Mythos 检查点,并不是伴随全新模型发布而来。AISI 使用的是 Anthropic 上个月在其安全合作项目 Project Glasswing 中部署的同一版本,只是收到了该模型的更新构建版本。
研究所写道:“显著的能力跃升,并不总是需要全新的模型发布。”这与一种常见假设相悖——即防守方可以按照模型发布周期来安排自身节奏。
Anthropic 在 4 月 7 日推出 Mythos 预览版时,将该模型定位为安全行业的转折点:在内部测试中,它在多个主流操作系统与浏览器上发现了多枚零日漏洞。公司表示,正是因为这些能力,它推迟了更大规模的公开上线。AISI 在 4 月早些时候的评估中,也将 Mythos 视作明显超越此前前沿系统的一次飞跃。
下一篇: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO





