OpenAI 最新模型 GPT-5.5 能自主串聯 32 步的 corporate network breach 攻擊流程,並在約 10 分鐘內解開原本設計為 12 小時的逆向工程謎題。
AISI 網路安全評估結果
英國科學、創新與科技部底下的研究機構——英國 AI 安全研究所(AI Security Institute, AISI)於週四 published 其評估結果。
研究人員發現,GPT-5.5 是僅次於另一模型、第二個能完整解出「The Last Ones」的模型。這是一個由 AISI 與 SpecterOps 共同打造的多階段模擬情境。GPT-5.5 在 10 次嘗試中,有 2 次 completed 完成整條攻擊鏈。
第一個通過測試的是 Anthropic 的 Claude Mythos Preview,在 10 次嘗試中完成 3 次。AISI 估計,一名人類專家要在四個子網路與約 20 台主機間完成同樣的「殺戮鏈」(kill chain),大約需要 20 小時。
在專家級(Expert-tier)任務上,GPT-5.5 的通過率為 71.4%,略高於 Mythos Preview 的 68.6%,且明顯超過 GPT-5.4 的 52.4%。相關統計 scored 也顯示出梯度式進步。
延伸閱讀: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
越獄風險與政策回應
AISI 指出,他們發現一個「通用越獄」(universal jailbreak),可以在所有測試的惡意網攻請求中繞過 GPT-5.5 的安全防護。這項攻擊技巧是經過約六小時的專家紅隊演練才開發出來,而一項設定問題則導致無法驗證 OpenAI 修補的有效性。
該機構警告,進攻型網路攻擊能力如今似乎正成為推進推理與自主性等廣泛能力時,難以避免的「副產品」。
在四月,AISI 對 Mythos Preview marked the first time any frontier model finished the corporate attack 測試範圍給出評估,當時是首次有前沿模型能端對端完成該企業攻擊情境。GPT-5.5 的表現,因而更像是在確認一個持續演進的趨勢,而非單一模型的偶然飛躍。
下一步閱讀: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





