OpenAI 最新的模型 GPT-5.5,可以自主串聯完成一個 32 步驟的 corporate network breach,並在約 10 分鐘內破解一個原本預計耗時 12 小時的逆向工程謎題。
AISI 網路攻防評估結果
英國科學、創新與技術部底下的研究機構——英國 AI 安全研究院(U.K. AI Security Institute,AISI),於週四 published 其評估結果。
研究人員發現,GPT-5.5 是第二個能完整解開「The Last Ones」的模型。這是一項與 SpecterOps 合作打造的多階段模擬測試。GPT-5.5 在 10 次嘗試中,有 2 次 completed 成功完成整個攻擊鏈。
第一個通過測試的是 Anthropic 的 Claude Mythos Preview,在 10 次嘗試中有 3 次成功。AISI 估計,一位人類專家要在四個子網路、約 20 台主機上完成同樣的「殺傷鏈」(kill chain),大約需要 20 小時。
在「專家等級」任務中,GPT-5.5 的通過率為 71.4%(scored),略高於 Mythos Preview 的 68.6%,且遠高於 GPT-5.4 的 52.4%。
延伸閱讀: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
越獄風險與政策回應
AISI 指出,有一種通用越獄手法,能在所有測試過的惡意網攻請求中,繞過 GPT-5.5 的安全防護。這個攻擊手法花了紅隊專家 6 小時才開發出來,而一項設定問題則導致無法驗證 OpenAI 修補是否奏效。
該機構警告,進攻型網路攻擊能力,如今似乎已成為推進推理與自主性能力時的「副產物」。
今年四月,AISI 在 Mythos Preview marked the first time any frontier model finished the corporate attack 的評估中指出,這是首度有前沿模型能端對端完成整套企業攻擊範圍。GPT-5.5 的表現被視為延續此一趨勢,而非單一的突破事件。
下一篇閱讀: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





