Claude Mythos 成为首个完成模拟企业网络攻击的人工智能

Anthropic 的 Claude Mythos Preview became the first AI model to complete a full simulated corporate network attack，根据 英国 AI 安全研究所（AISI）的数据，它解决了此前所有 AI 系统都无法攻破的 73% 专家级网络安全任务。

AISI 网络安全评估

隶属于英国政府科学、创新与技术部的研究机构 AISI，在 Anthropic 于 4 月 7 日宣布该模型后，ran 了两组测试。

公司选择不向公众广泛发布 Claude Mythos，而是granting 仅向安全研究公司提供有限访问。

在夺旗（CTF）评估中，Claude Mythos 在专家级任务上的成功率达到 73%。

在 2025 年 4 月之前，还没有任何模型解决过这些任务。AISI 还构建了一个名为“The Last Ones”的 32 步企业网络攻击模拟，设计上需要人类专业人士大约 20 小时完成。Claude Mythos 在 10 次尝试中有 3 次完成了整个模拟，平均完成 32 步中的 22 步，而下一最佳模型 Claude Opus 4.6 的平均成绩为 16 步。

AISI 表示：“Mythos 预览版在一个网络演练环境中的成功表明，它至少有能力在已经获得网络访问权的情况下，自主攻击规模较小、防御薄弱且存在漏洞的企业系统。”

延伸阅读： Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns

零日漏洞利用

Anthropic 自己的红队发现，当用户明确指示时，Claude Mythos 能够在所有主流操作系统和主流网页浏览器中发现并利用零日漏洞。公司表示，其发现的漏洞中超过 99% 仍未打补丁。

“我们在这里能披露的内容很有限。公布这些细节将是不负责任的。”Anthropic 表示。

该模型的能力已经reached 政策制定圈层。

据 路透社报道，美国财政部长 Scott Bessent 与 美联储主席 Jerome Powell held 了与多家大型银行 CEO 的紧急会议，讨论与该模型相关的潜在网络风险。

Anthropic 的安全应对

Anthropic 在宣布该模型的同时推出了 Project Glasswing，称其为利用 Claude Mythos 帮助保护关键软件的计划。公司将这一举措定位为为安全团队提前布局，迎接需要与 AI 驱动攻击者赛跑的时代。AISI 建议各组织优先落实基础网络安全措施，包括定期打补丁、严格的访问控制、配置加固以及全面日志记录。

4 月 7 日的公告出现在围绕 AI 在网络安全中角色的担忧不断升级数月之后。此前的前沿模型在进攻性能力方面表现有限，没有一个能够通过专家级 CTF 基准测试，或完成多步骤攻击模拟，而 Claude Mythos 打破了这一局面。

下一篇： RaveDAO Just Exploded 1,194% In A Week — Here's The Real Story Behind The Crypto That Turns Raves Into Blockchain