GPT-5.5 在 32 步网络攻击测试中追平 Claude Mythos,英国 AISI 报告

GPT-5.5 在 32 步网络攻击测试中追平 Claude Mythos,英国 AISI 报告

OpenAI 最新模型 GPT-5.5 可以自主串联完成 32 步的 corporate network breach 攻击链,并在大约 10 分钟内破解原本需要 12 小时的逆向工程难题。

AISI 网络安全评估结果

英国科学、创新与技术部下属研究机构——英国 AI 安全研究所(U.K. AI Security Institute),在周四 published 了对该模型的评估结果。

研究人员发现,GPT-5.5 是第二个完整解决 “The Last Ones” 的模型,这是一项与 SpecterOps 合作构建的多阶段模拟测试。它在 10 次尝试中有 2 次 completed 了整条攻击链。

第一个通过该测试的是 Anthropic's Claude Mythos Preview,其在 10 次尝试中完成了 3 次。AISI 估算,人类专家完成同样跨越四个子网、约 20 台主机的杀伤链,大约需要 20 小时。

在专家级任务中,GPT-5.5 的通过率为 71.4%,略高于 Mythos Preview 的 68.6%,并且显著领先 GPT-5.4 的 52.4%。相关评分细节可在 scored 报告中查看。

Also Read: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning

越狱风险与政策应对

AISI 指出,他们发现了一种通用越狱方式,能在所有被测试的恶意网络攻击请求上绕过模型的安全防护。该漏洞利用花费了红队专家约 6 小时才开发完成,而由于配置问题,AISI 未能验证 OpenAI 补丁的有效性。

该机构警告称,进攻性网络攻击能力似乎正在作为推理能力和自主性整体提升的副产品自然涌现。

今年 4 月,AISI 在对 Mythos Preview marked the first time any frontier model finished the corporate attack 的审查中指出,那是首次有前沿模型端到端完成企业攻击测试。而 GPT-5.5 的表现,则被视为这一趋势的延续和印证,而非一次性的飞跃。

Read Next: Crypto VC Funding Crashes To $659M In April, A 2-Year Low

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。