OpenAI 最新模型 GPT-5.5 能够自主串联完成 32 步的企业网络入侵攻击链 corporate network breach,并在大约 10 分钟内破解原本需要 12 小时的逆向工程难题。
AISI 网络安全评估结果
英国科学、创新与技术部旗下研究机构——英国 AI 安全研究院(AI Security Institute,AISI)于周四 published 了这项评估结果。
研究人员发现,GPT-5.5 是仅有的第二个完全解出“The Last Ones”的模型。这是一项与 SpecterOps 合作构建的多阶段模拟。它在 10 次尝试中有 2 次 completed 成功完成整条攻击链。
首个通过该测试的是 Anthropic 的 Claude Mythos 预览版,在 10 次中成功 3 次。AISI 估计,人类网络安全专家要在 4 个子网、约 20 台主机上完成同样的“杀伤链”,大约需要 20 小时。
在“专家级”任务中,GPT-5.5 的通过率 scored 为 71.4%,略高于 Mythos 预览版的 68.6%,并远高于 GPT-5.4 的 52.4%。
Also Read: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
越狱风险与政策回应
AISI 报告称,其发现了一种“通用越狱”方式,能够在所有测试的恶意网络攻击查询中绕过模型安全防护。这一利用方式由专家红队用 6 小时攻防对抗开发而成,但由于配置问题,未能验证 OpenAI 补丁的有效性。
该机构警告称,进攻性网络攻击能力似乎正作为推理与自主性整体提升的“副产品”自然涌现。
在今年 4 月,AISI 对 Mythos Preview marked the first time any frontier model finished the corporate attack 的评估,标志着首次有前沿模型端到端完成整套企业攻击范围。此次 GPT-5.5 的表现被视为这一趋势的再次印证,而非一次性的飞跃。
Read Next: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





