Claude Mythos 在 10 次嘗試中有 6 次破解 32 步 AISI 攻擊模擬

Anthropic 的 Claude Mythos 預覽版最新 checkpoint 成為首個同時破解英國政府兩個網絡攻擊模擬靶場的 AI 模型，令外界再次關注自動化駭攻的風險。

AISI 報告 Mythos 重大突破

英國 AI Security Institute（AISI） 於週三在官方報告中指，新版 Mythos checkpoint 在 10 次嘗試中，有 6 次成功完成其 32 步企業網絡攻擊靶場「The Last Ones」，而較早版本僅在 10 次中成功 3 次。

更新後的模型亦在工業控制系統靶場「Cooling Tower」中取得突破——此前從無模型通過——它在 10 次嘗試中有 3 次成功。

競爭對手 OpenAI 的 GPT-5.5 也在同一套演練中接受測試。它在「The Last Ones」中於 10 次嘗試中成功 3 次，但未能完成「Cooling Tower」。

AISI 為每次嘗試設定 1 億 tokens 的運算預算，並指出模型表現仍在該上限下持續隨資源增加而提升，顯示更高預算可能進一步推高成功率。

延伸閱讀： Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

能力倍增時間持續縮短

AISI 以「時間視窗基準」追蹤網攻能力進展，評估模型在 80% 可靠度下，可獨立完成任務的最長時長。2025 年 11 月，該機構估計的能力倍增時間為 8 個月；到 2026 年 2 月，已壓縮至 4.7 個月，而 Mythos 與 GPT-5.5 現時的表現甚至超越這條更快的趨勢線。

該機構承認，目前仍不確定最新結果是代表新一輪加速，抑或只是一次性飛躍。

研究非牟利機構 METR 則側重軟體任務而非網攻靶場，其測得的倍增時間約為 4.2 個月。AISI 指出，兩者趨勢一致，增強了這些數據反映真實能力提升、而非單一測評框架偏差的說服力。

該研究所同時強調，其靶場並沒有模擬主動防守方，因此成績更反映模型在防護薄弱網絡上的攻擊能力，而非面對已強化的企業級系統時的實際表現。

為何能力躍升值得關注

新版 Mythos checkpoint 並非隨全新模型發佈而來。AISI 使用的是 Anthropic 上月在其安全合作計劃 Project Glasswing 中部署的同一模型版本，只是收到了該模型的更新 build。

「顯著的能力躍升未必一定伴隨新模型發佈，」該研究所寫道。這與許多防守方假設「只要跟上模型發佈節奏即可」的想法形成反差。

Anthropic 在 4 月 7 日推出 Mythos Preview，將其描述為安全產業的轉捩點——在內部測試中，該模型在多個主流作業系統與瀏覽器上發現多項零時差漏洞。公司表示，正因這些能力，它延後了更大範圍的公開發佈，而 AISI 4 月較早前的評估亦將 Mythos 定性為較以往前沿系統明顯強一級。

接續閱讀： Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO