Claude Mythos 在 10 次嘗試中有 6 次破解 32 步 AISI 攻擊模擬

Anthropic 的 Claude Mythos 預覽版最新 checkpoint 成為首個同時破解英國政府兩個網絡攻擊模擬靶場的 AI 模型，令外界再次關注自動化駭攻的風險。

AISI 報告 Mythos 重大突破

英國 AI Security Institute（AISI） 於週三在官方報告中指，新版 Mythos checkpoint 在 10 次嘗試中，有 6 次成功完成其 32 步企業網絡攻擊靶場「The Last Ones」，而較早版本僅在 10 次中成功 3 次。

更新後的模型亦在工業控制系統靶場「Cooling Tower」中取得突破——此前從無模型通過——它在 10 次嘗試中有 3 次成功。

競爭對手 OpenAI 的 GPT-5.5 也在同一套演練中接受測試。它在「The Last Ones」中於 10 次嘗試中成功 3 次，但未能完成「Cooling Tower」。

AISI 為每次嘗試設定 1 億 tokens 的運算預算，並指出模型表現仍在該上限下持續隨資源增加而提升，顯示更高預算可能進一步推高成功率。

延伸閱讀： Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

能力倍增時間持續縮短

AISI 以「時間視窗基準」追蹤網攻能力進展，評估模型在 80% 可靠度下，可獨立完成任務的最長時長。2025 年 11 月，該機構估計的能力倍增時間為 8 個月；到 2026 年 2 月，已壓縮至 4.7 個月，而 Mythos 與 GPT-5.5 現時的表現甚至超越這條更快的趨勢線。

該機構承認，目前仍不確定最新結果是代表新一輪加速，抑或只是一次性飛躍。

研究非牟利機構 METR 則側重軟體任務而非網攻靶場，其測得的倍增時間約為 4.2 個月。AISI 指出，兩者趨勢一致，增強了這些數據反映真實能力提升、而非單一測評框架偏差的說服力。

該研究所同時強調，其靶場並沒有模擬主動防守方，因此成績更反映模型在防護薄弱網絡上的攻擊能力，而非面對已強化的企業級系統時的實際表現。

為何能力躍升值得關注

新版 Mythos checkpoint 並非隨全新模型發佈而來。AISI 使用的是 Anthropic 上月在其安全合作計劃 Project Glasswing 中部署的同一模型版本，只是收到了該模型的更新 build。

「顯著的能力躍升未必一定伴隨新模型發佈，」該研究所寫道。這與許多防守方假設「只要跟上模型發佈節奏即可」的想法形成反差。

Anthropic 在 4 月 7 日推出 Mythos Preview，將其描述為安全產業的轉捩點——在內部測試中，該模型在多個主流作業系統與瀏覽器上發現多項零時差漏洞。公司表示，正因這些能力，它延後了更大範圍的公開發佈，而 AISI 4 月較早前的評估亦將 Mythos 定性為較以往前沿系統明顯強一級。

接續閱讀： Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO

Steven Zeiler

Steven Zeiler 現任 Yellow 的首席推廣官（Chief Evangelist），與開發者合作，利用 Yellow SDK 建構即時、非託管的交易基礎設施。他是一名程式設計師、科技專家和企業家，曾於 Ripple 工作，協助設計點對點銀行間支付原型，並透過共識追蹤軟體為 XRP Ledger 的去中心化作出貢獻。