OpenAI 最新模型 GPT-5.5 能自主串連完成 32 步的 corporate network breach 攻擊鏈,並在約 10 分鐘內破解一個原本需 12 小時的逆向工程難題。
AISI 網路安全評估結果
英國科學、創新及科技部旗下研究機構——英國 AI 安全部(U.K. AI Security Institute,AISI)於週四 published 其評估結果。
研究人員發現,GPT-5.5 是第二個能完全解出「The Last Ones」的模型。這是一套與 SpecterOps 合作打造的多階段模擬測試。它在 10 次嘗試中有 2 次 completed 完成整條攻擊鏈。
第一個通過測試的是 Anthropic's Claude Mythos Preview,在 10 次嘗試中成功 3 次。AISI 估計,人類專家完成同一條橫跨 4 個子網、約 20 部主機的攻擊鏈,大約需要 20 小時。
在專家級任務上,GPT-5.5 的通過率為 71.4%,略高於 Mythos Preview 的 68.6%,並大幅領先 GPT-5.4 的 52.4%。相關報導可見 scored。
延伸閱讀: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
越獄風險與政策回應
AISI 指出,一種通用越獄方法可繞過模型在所有惡意網攻查詢上的防護。這個漏洞利用花了專家級紅隊約 6 小時才開發出來,而由於設定問題,AISI 未能完成對 OpenAI 修補措施的驗證。
該機構警告,如今進攻性網路攻擊技能似乎正成為推進推理與自主能力時的「副產品」。
今年 4 月,AISI 在其 Mythos Preview marked the first time any frontier model finished the corporate attack 評估中,首次記錄到有前沿模型能端對端完成整套企業攻擊範圍。GPT-5.5 現在被視為確認這一趨勢,而非一次性的飛躍。
下一篇: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





