OpenAI 最新的模型 GPT-5.5 能自主串聯完成 32 步的企業網路入侵情境 corporate network breach,並在約 10 分鐘內破解原本設計為 12 小時的逆向工程謎題。
AISI 網路安全評估結果
英國科學、創新與技術部旗下的研究機構——英國 AI 安全研究院(AI Security Institute,AISI),於週四 published 了對 GPT-5.5 的評估結果。
研究人員發現,GPT-5.5 是第二個能完整解決「The Last Ones」情境的模型。這是一個與 SpecterOps 合作打造的多階段模擬測試。GPT-5.5 在 10 次嘗試中,有 2 次成功 completed 完成整條攻擊鏈。
第一個通過這項測試的是 Anthropic 的 Claude Mythos 預覽版,它在 10 次嘗試中完成了 3 次。AISI 估計,一名人類專家要在橫跨 4 個子網路、約 20 台主機的環境中完成同樣的 kill chain,大約需要 20 小時。
在「專家級」任務上,GPT-5.5 的通過率為 71.4%,略高於 Mythos Preview 的 68.6%,並遠高於 GPT-5.4 的 52.4% scored。
延伸閱讀: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
越獄風險與政策回應
AISI 指出,一種「通用越獄」技巧能在所有測試的惡意網攻請求中,繞過 GPT-5.5 的安全防護。此攻擊方法花費紅隊專家 6 小時開發,而設定上的技術問題則導致無法驗證 OpenAI 針對該問題所發布修補的有效性。
該機構警告,如今進攻型網路攻擊技能似乎正作為「推理能力與自主性提升」的副產品自然浮現。
早在四月,AISI 對 Mythos Preview 的評估首次紀錄有前沿模型能從頭到尾完成企業攻擊模擬;因此,GPT-5.5 的表現被視為既有趨勢的延伸,而非單一的飛躍。
下一篇: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





