OpenAI 最新模型 GPT-5.5 能自主串連完成一個 32 步的企業網絡入侵,並在約 10 分鐘內破解原本需時 12 小時的逆向工程謎題。
AISI 網絡安全評估結果
英國科學、創新及科技部轄下的研究機構——英國 AI 安全研究所(AI Security Institute, AISI)於星期四公布了相關評估結果。
研究人員發現,GPT-5.5 是繼首個模型之後,第二個能完全解決「The Last Ones」的模型。這是一個與 SpecterOps 合作打造的多階段模擬。它在 10 次嘗試中有 2 次成功完成整個攻擊鏈。
第一個通過該測試的是 Anthropic 的 Claude Mythos 預覽版,在 10 次嘗試中完成了 3 次。AISI 估計,人類專家要在四個子網、約 20 部主機上完成同一條「kill chain」,大約需要 20 小時。
在專家級任務上,GPT-5.5 的通關率為 71.4%,略高於 Mythos 預覽版的 68.6%,並遠高於 GPT-5.4 的 52.4%。
延伸閱讀:為何在 Coinbase 發出 Mythos 警示後,仍有 75% 機構持續看多比特幣
越獄風險與政策回應
AISI 指出,有一種「通用越獄」技巧,可以在所有受測的惡意網絡攻擊提問中繞過模型安全防護。這個攻擊方法花了紅隊專家六小時才開發出來,而一項設定問題則令機構未能驗證 OpenAI 的修補效果。
該機構警告,進攻性網絡技能如今似乎是模型在推理與自主能力全面提升下的「副產品」。
今年 4 月,AISI 在審視 Mythos 預覽版時,首次發現有前沿模型能完整完成企業攻擊模擬全流程,因此現時 GPT-5.5 的成績,更像是確認一項持續趨勢,而非單一飛躍。





