GPT-5.5 在 32 步网络攻击测试中追平 Claude Mythos,英国 AISI 发布报告

GPT-5.5 在 32 步网络攻击测试中追平 Claude Mythos,英国 AISI 发布报告

OpenAI 最新模型 GPT-5.5 能够自主串联完成 32 步的企业网络入侵攻击链 corporate network breach,并在大约 10 分钟内破解原本需要 12 小时的逆向工程难题。

AISI 网络安全评估结果

英国科学、创新与技术部旗下研究机构——英国 AI 安全研究院(AI Security Institute,AISI)于周四 published 了这项评估结果。

研究人员发现,GPT-5.5 是仅有的第二个完全解出“The Last Ones”的模型。这是一项与 SpecterOps 合作构建的多阶段模拟。它在 10 次尝试中有 2 次 completed 成功完成整条攻击链。

首个通过该测试的是 Anthropic 的 Claude Mythos 预览版,在 10 次中成功 3 次。AISI 估计,人类网络安全专家要在 4 个子网、约 20 台主机上完成同样的“杀伤链”,大约需要 20 小时。

在“专家级”任务中,GPT-5.5 的通过率 scored 为 71.4%,略高于 Mythos 预览版的 68.6%,并远高于 GPT-5.4 的 52.4%。

Also Read: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning

越狱风险与政策回应

AISI 报告称,其发现了一种“通用越狱”方式,能够在所有测试的恶意网络攻击查询中绕过模型安全防护。这一利用方式由专家红队用 6 小时攻防对抗开发而成,但由于配置问题,未能验证 OpenAI 补丁的有效性。

该机构警告称,进攻性网络攻击能力似乎正作为推理与自主性整体提升的“副产品”自然涌现。

在今年 4 月,AISI 对 Mythos Preview marked the first time any frontier model finished the corporate attack 的评估,标志着首次有前沿模型端到端完成整套企业攻击范围。此次 GPT-5.5 的表现被视为这一趋势的再次印证,而非一次性的飞跃。

Read Next: Crypto VC Funding Crashes To $659M In April, A 2-Year Low

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。
GPT-5.5 在 32 步网络攻击测试中追平 Claude Mythos,英国 AISI 发布报告 | Yellow.com