Anthropic 的 Claude Mythos Preview became the first AI model to complete a full simulated corporate network attack,根据 英国 AI 安全研究所(AISI)的数据,它解决了此前所有 AI 系统都无法攻破的 73% 专家级网络安全任务。
AISI 网络安全评估
隶属于英国政府科学、创新与技术部的研究机构 AISI,在 Anthropic 于 4 月 7 日宣布该模型后,ran 了两组测试。
公司选择不向公众广泛发布 Claude Mythos,而是granting 仅向安全研究公司提供有限访问。
在夺旗(CTF)评估中,Claude Mythos 在专家级任务上的成功率达到 73%。
在 2025 年 4 月之前,还没有任何模型解决过这些任务。AISI 还构建了一个名为“The Last Ones”的 32 步企业网络攻击模拟,设计上需要人类专业人士大约 20 小时完成。Claude Mythos 在 10 次尝试中有 3 次完成了整个模拟,平均完成 32 步中的 22 步,而下一最佳模型 Claude Opus 4.6 的平均成绩为 16 步。
AISI 表示:“Mythos 预览版在一个网络演练环境中的成功表明,它至少有能力在已经获得网络访问权的情况下,自主攻击规模较小、防御薄弱且存在漏洞的企业系统。”
延伸阅读: Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns
零日漏洞利用
Anthropic 自己的红队发现,当用户明确指示时,Claude Mythos 能够在所有主流操作系统和主流网页浏览器中发现并利用零日漏洞。公司表示,其发现的漏洞中超过 99% 仍未打补丁。
“我们在这里能披露的内容很有限。公布这些细节将是不负责任的。”Anthropic 表示。
该模型的能力已经reached 政策制定圈层。
据 路透社报道,美国财政部长 Scott Bessent 与 美联储主席 Jerome Powell held 了与多家大型银行 CEO 的紧急会议,讨论与该模型相关的潜在网络风险。
Anthropic 的安全应对
Anthropic 在宣布该模型的同时推出了 Project Glasswing,称其为利用 Claude Mythos 帮助保护关键软件的计划。公司将这一举措定位为为安全团队提前布局,迎接需要与 AI 驱动攻击者赛跑的时代。AISI 建议各组织优先落实基础网络安全措施,包括定期打补丁、严格的访问控制、配置加固以及全面日志记录。
4 月 7 日的公告出现在围绕 AI 在网络安全中角色的担忧不断升级数月之后。此前的前沿模型在进攻性能力方面表现有限,没有一个能够通过专家级 CTF 基准测试,或完成多步骤攻击模拟,而 Claude Mythos 打破了这一局面。






