GPT-5.5 32 步網攻表現追上 Claude Mythos,英國 AISI 發報告指稱

GPT-5.5 32 步網攻表現追上 Claude Mythos,英國 AISI 發報告指稱

OpenAI 最新模型 GPT-5.5 能自主串連完成 32 步的 corporate network breach 攻擊鏈,並在約 10 分鐘內破解一個原本需 12 小時的逆向工程難題。

AISI 網路安全評估結果

英國科學、創新及科技部旗下研究機構——英國 AI 安全部(U.K. AI Security Institute,AISI)於週四 published 其評估結果。

研究人員發現,GPT-5.5 是第二個能完全解出「The Last Ones」的模型。這是一套與 SpecterOps 合作打造的多階段模擬測試。它在 10 次嘗試中有 2 次 completed 完成整條攻擊鏈。

第一個通過測試的是 Anthropic's Claude Mythos Preview,在 10 次嘗試中成功 3 次。AISI 估計,人類專家完成同一條橫跨 4 個子網、約 20 部主機的攻擊鏈,大約需要 20 小時。

在專家級任務上,GPT-5.5 的通過率為 71.4%,略高於 Mythos Preview 的 68.6%,並大幅領先 GPT-5.4 的 52.4%。相關報導可見 scored

延伸閱讀: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning

越獄風險與政策回應

AISI 指出,一種通用越獄方法可繞過模型在所有惡意網攻查詢上的防護。這個漏洞利用花了專家級紅隊約 6 小時才開發出來,而由於設定問題,AISI 未能完成對 OpenAI 修補措施的驗證。

該機構警告,如今進攻性網路攻擊技能似乎正成為推進推理與自主能力時的「副產品」。

今年 4 月,AISI 在其 Mythos Preview marked the first time any frontier model finished the corporate attack 評估中,首次記錄到有前沿模型能端對端完成整套企業攻擊範圍。GPT-5.5 現在被視為確認這一趨勢,而非一次性的飛躍。

下一篇: Crypto VC Funding Crashes To $659M In April, A 2-Year Low

免責聲明及風險提示: 本文資訊僅供教育與參考之用,並基於作者意見,並不構成金融、投資、法律或稅務建議。 加密貨幣資產具高度波動性並伴隨高風險,可能導致投資大幅虧損或全部損失,並非適合所有投資者。 文章內容僅代表作者觀點,不代表 Yellow、創辦人或管理層立場。 投資前請務必自行徹底研究(D.Y.O.R.),並諮詢持牌金融專業人士。
GPT-5.5 32 步網攻表現追上 Claude Mythos,英國 AISI 發報告指稱 | Yellow.com