Claude Mythos 在 10 次嘗試中 6 次解出 32 步 AISI 入侵演練

Claude Mythos 在 10 次嘗試中 6 次解出 32 步 AISI 入侵演練

一個新版的 Anthropic's Claude Mythos Preview checkpoint 成為首個解出英國政府兩個網絡攻擊模擬靶場的 AI 模型,引發對自主駭攻的新關注。

AISI 報告 Mythos 重大突破

英國 AI Security Institute(AISI)於周三表示,較新的 Mythos checkpoint 在名為「The Last Ones」的 32 步企業網絡攻擊靶場中,在 10 次嘗試裡成功 6 次;早期版本僅做到 3 次。

更新後的模型亦攻破了「Cooling Tower」工業控制系統靶場——此前從未有模型通過——在 10 次嘗試中成功 3 次。

競爭對手 OpenAI 的 GPT-5.5 也在同一演練中受測。它在 10 次嘗試中解出「The Last Ones」3 次,但未能完成「Cooling Tower」。

AISI 在每次嘗試中給予 1 億 token 的運算預算,並指出模型在該上限下的表現仍持續隨規模提升,顯示更高預算可能進一步推高成功率。

延伸閱讀: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

能力倍增時間持續縮短

AISI 透過「時間視野」基準追蹤網絡攻擊能力,以模型在 80% 可靠度下可完成的自主任務時長來衡量。2025 年 11 月,該機構估算倍增時間為 8 個月;到 2026 年 2 月,這個數字壓縮至 4.7 個月,而 Mythos 與 GPT-5.5 此後都超越了這個更快的趨勢。

該機構承認,目前仍不確定最新結果代表另一輪加速,還是一個一次性的跳躍。

研究非牟利機構 METR 以軟件任務而非網絡靶場評估 AI,得出約 4.2 個月的類似數值。AISI 表示,這種趨同強化了這個趨勢反映真實能力增長,而非單一評估套件偏差的論點。

該研究所強調,它的靶場並沒有主動防禦者,因此結果反映的是模型在防護薄弱網絡,而非高度加固企業系統上的能力。

為何能力躍升很重要

新的 Mythos checkpoint 並非伴隨全新模型發佈而來。AISI 使用的是 Anthropic 上月在其安全合作計劃 Project Glasswing 中部署的同一版本,只是收到了這個模型的更新 build。

「顯著的能力躍升不一定需要新的模型發佈,」研究所寫道。這與防守方可按發佈週期調整步伐的假設相矛盾。

Anthropic 於 4 月 7 日推出 Mythos Preview,並將該模型定位為安全產業的轉捩點,因為它在內部測試中於多個主流作業系統與瀏覽器上發現了零時差漏洞。公司表示,正因這些能力,它暫緩了更大規模的發佈,而 AISI 4 月較早前的評估也標記 Mythos 較既有前沿系統有明顯躍升。

下一篇: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO

免責聲明及風險提示: 本文資訊僅供教育與參考之用,並基於作者意見,並不構成金融、投資、法律或稅務建議。 加密貨幣資產具高度波動性並伴隨高風險,可能導致投資大幅虧損或全部損失,並非適合所有投資者。 文章內容僅代表作者觀點,不代表 Yellow、創辦人或管理層立場。 投資前請務必自行徹底研究(D.Y.O.R.),並諮詢持牌金融專業人士。
Claude Mythos 在 10 次嘗試中 6 次解出 32 步 AISI 入侵演練 | Yellow.com