OpenAI 最新模型 GPT-5.5 可以自主串联完成 32 步的 corporate network breach 攻击链,并在大约 10 分钟内破解原本需要 12 小时的逆向工程难题。
AISI 网络安全评估结果
英国科学、创新与技术部下属研究机构——英国 AI 安全研究所(U.K. AI Security Institute),在周四 published 了对该模型的评估结果。
研究人员发现,GPT-5.5 是第二个完整解决 “The Last Ones” 的模型,这是一项与 SpecterOps 合作构建的多阶段模拟测试。它在 10 次尝试中有 2 次 completed 了整条攻击链。
第一个通过该测试的是 Anthropic's Claude Mythos Preview,其在 10 次尝试中完成了 3 次。AISI 估算,人类专家完成同样跨越四个子网、约 20 台主机的杀伤链,大约需要 20 小时。
在专家级任务中,GPT-5.5 的通过率为 71.4%,略高于 Mythos Preview 的 68.6%,并且显著领先 GPT-5.4 的 52.4%。相关评分细节可在 scored 报告中查看。
Also Read: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
越狱风险与政策应对
AISI 指出,他们发现了一种通用越狱方式,能在所有被测试的恶意网络攻击请求上绕过模型的安全防护。该漏洞利用花费了红队专家约 6 小时才开发完成,而由于配置问题,AISI 未能验证 OpenAI 补丁的有效性。
该机构警告称,进攻性网络攻击能力似乎正在作为推理能力和自主性整体提升的副产品自然涌现。
今年 4 月,AISI 在对 Mythos Preview marked the first time any frontier model finished the corporate attack 的审查中指出,那是首次有前沿模型端到端完成企业攻击测试。而 GPT-5.5 的表现,则被视为这一趋势的延续和印证,而非一次性的飞跃。
Read Next: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





