英國 AISI 報告：GPT-5.5 在 32 步網絡攻擊模擬中表現追平 Claude Mythos

OpenAI 最新模型 GPT-5.5 能自主串連完成一個 32 步的企業網絡入侵，並在約 10 分鐘內破解原本需時 12 小時的逆向工程謎題。

AISI 網絡安全評估結果

英國科學、創新及科技部轄下的研究機構——英國 AI 安全研究所（AI Security Institute, AISI）於星期四公布了相關評估結果。

研究人員發現，GPT-5.5 是繼首個模型之後，第二個能完全解決「The Last Ones」的模型。這是一個與 SpecterOps 合作打造的多階段模擬。它在 10 次嘗試中有 2 次成功完成整個攻擊鏈。

第一個通過該測試的是 Anthropic 的 Claude Mythos 預覽版，在 10 次嘗試中完成了 3 次。AISI 估計，人類專家要在四個子網、約 20 部主機上完成同一條「kill chain」，大約需要 20 小時。

在專家級任務上，GPT-5.5 的通關率為 71.4%，略高於 Mythos 預覽版的 68.6%，並遠高於 GPT-5.4 的 52.4%。

AISI 指出，有一種「通用越獄」技巧，可以在所有受測的惡意網絡攻擊提問中繞過模型安全防護。這個攻擊方法花了紅隊專家六小時才開發出來，而一項設定問題則令機構未能驗證 OpenAI 的修補效果。

該機構警告，進攻性網絡技能如今似乎是模型在推理與自主能力全面提升下的「副產品」。

今年 4 月，AISI 在審視 Mythos 預覽版時，首次發現有前沿模型能完整完成企業攻擊模擬全流程，因此現時 GPT-5.5 的成績，更像是確認一項持續趨勢，而非單一飛躍。