英國 AISI 報告:GPT-5.5 在 32 步網絡攻擊模擬中表現追平 Claude Mythos

英國 AISI 報告:GPT-5.5 在 32 步網絡攻擊模擬中表現追平 Claude Mythos

OpenAI 最新模型 GPT-5.5 能自主串連完成一個 32 步的企業網絡入侵,並在約 10 分鐘內破解原本需時 12 小時的逆向工程謎題。

AISI 網絡安全評估結果

英國科學、創新及科技部轄下的研究機構——英國 AI 安全研究所(AI Security Institute, AISI)於星期四公布了相關評估結果。

研究人員發現,GPT-5.5 是繼首個模型之後,第二個能完全解決「The Last Ones」的模型。這是一個與 SpecterOps 合作打造的多階段模擬。它在 10 次嘗試中有 2 次成功完成整個攻擊鏈。

第一個通過該測試的是 Anthropic 的 Claude Mythos 預覽版,在 10 次嘗試中完成了 3 次。AISI 估計,人類專家要在四個子網、約 20 部主機上完成同一條「kill chain」,大約需要 20 小時。

在專家級任務上,GPT-5.5 的通關率為 71.4%,略高於 Mythos 預覽版的 68.6%,並遠高於 GPT-5.4 的 52.4%。

延伸閱讀:為何在 Coinbase 發出 Mythos 警示後,仍有 75% 機構持續看多比特幣

越獄風險與政策回應

AISI 指出,有一種「通用越獄」技巧,可以在所有受測的惡意網絡攻擊提問中繞過模型安全防護。這個攻擊方法花了紅隊專家六小時才開發出來,而一項設定問題則令機構未能驗證 OpenAI 的修補效果。

該機構警告,進攻性網絡技能如今似乎是模型在推理與自主能力全面提升下的「副產品」。

今年 4 月,AISI 在審視 Mythos 預覽版時,首次發現有前沿模型能完整完成企業攻擊模擬全流程,因此現時 GPT-5.5 的成績,更像是確認一項持續趨勢,而非單一飛躍。

下一篇閱讀:加密風險投資 4 月暴跌至 6.59 億美元,創兩年新低

免責聲明及風險提示: 本文資訊僅供教育與參考之用,並基於作者意見,並不構成金融、投資、法律或稅務建議。 加密貨幣資產具高度波動性並伴隨高風險,可能導致投資大幅虧損或全部損失,並非適合所有投資者。 文章內容僅代表作者觀點,不代表 Yellow、創辦人或管理層立場。 投資前請務必自行徹底研究(D.Y.O.R.),並諮詢持牌金融專業人士。
英國 AISI 報告:GPT-5.5 在 32 步網絡攻擊模擬中表現追平 Claude Mythos | Yellow.com