Anthropic 的 Claude Mythos 預覽版 最新 checkpoint 成為首個同時破解英國政府兩個網絡攻擊模擬靶場的 AI 模型,令外界再次關注自動化駭攻的風險。
AISI 報告 Mythos 重大突破
英國 AI Security Institute(AISI) 於週三在官方報告中指,新版 Mythos checkpoint 在 10 次嘗試中,有 6 次成功完成其 32 步企業網絡攻擊靶場「The Last Ones」,而較早版本僅在 10 次中成功 3 次。
更新後的模型亦在工業控制系統靶場「Cooling Tower」中取得突破——此前從無模型通過——它在 10 次嘗試中有 3 次成功。
競爭對手 OpenAI 的 GPT-5.5 也在同一套演練中接受測試。它在「The Last Ones」中於 10 次嘗試中成功 3 次,但未能完成「Cooling Tower」。
AISI 為每次嘗試設定 1 億 tokens 的運算預算,並指出模型表現仍在該上限下持續隨資源增加而提升,顯示更高預算可能進一步推高成功率。
延伸閱讀: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok
能力倍增時間持續縮短
AISI 以「時間視窗基準」追蹤網攻能力進展,評估模型在 80% 可靠度下,可獨立完成任務的最長時長。2025 年 11 月,該機構估計 的能力倍增時間為 8 個月;到 2026 年 2 月,已壓縮至 4.7 個月,而 Mythos 與 GPT-5.5 現時的表現甚至超越這條更快的趨勢線。
該機構承認,目前仍不確定最新結果是代表新一輪加速,抑或只是一次性飛躍。
研究非牟利機構 METR 則側重軟體任務而非網攻靶場,其測得的倍增時間約為 4.2 個月。AISI 指出,兩者趨勢一致,增強了這些數據反映真實能力提升、而非單一測評框架偏差的說服力。
該研究所同時強調,其靶場並沒有模擬主動防守方,因此成績更反映模型在防護薄弱網絡上的攻擊能力,而非面對已強化的企業級系統時的實際表現。
為何能力躍升值得關注
新版 Mythos checkpoint 並非隨全新模型發佈而來。AISI 使用的是 Anthropic 上月在其安全合作計劃 Project Glasswing 中部署的同一模型版本,只是收到了該模型的更新 build。
「顯著的能力躍升未必一定伴隨新模型發佈,」該研究所寫道。這與許多防守方假設「只要跟上模型發佈節奏即可」的想法形成反差。
Anthropic 在 4 月 7 日推出 Mythos Preview,將其描述為安全產業的轉捩點——在內部測試中,該模型在多個主流作業系統與瀏覽器上發現多項零時差漏洞。公司表示,正因這些能力,它延後了更大範圍的公開發佈,而 AISI 4 月較早前的評估亦將 Mythos 定性為較以往前沿系統明顯強一級。
接續閱讀: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO





