Anthropic 的 Claude Mythos Preview 新 checkpoint 成為首個通過英國政府兩個網路攻擊模擬的 AI 模型,讓外界再度關注自主駭客攻擊的風險。
AISI 公佈 Mythos 突破進展
英國 AI Security Institute(AISI) 於週三 表示,新版 Mythos checkpoint 在 10 次嘗試中,有 6 次成功完成其 32 步企業網路攻擊靶場「The Last Ones」,先前版本僅達成 10 次中的 3 次。
更新後的模型也成功破解「Cooling Tower」工業控制系統靶場,此前沒有任何模型能通過該靶場,而 Mythos 在 10 次嘗試中成功 3 次。
競爭對手 OpenAI 的 GPT-5.5 也在相同測試中受評估。它在 10 次嘗試中 完成「The Last Ones」3 次,但未能完成「Cooling Tower」。
AISI 在每次嘗試中給予 1 億個 token 的運算預算,並指出模型表現到這個上限仍持續隨資源增加而成長,顯示更高的預算很可能會進一步推升成功率。
延伸閱讀: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok
能力倍增時間持續縮短
AISI 透過「時間地平線」指標追蹤網安能力進展,衡量模型在 80% 可靠度下可完成的自動化任務時長。該機構在 2025 年 11 月 估計,倍增時間約為 8 個月;到了 2026 年 2 月,這一數字壓縮至 4.7 個月,而最新的 Mythos 與 GPT-5.5 的進展甚至已超越這條更快的趨勢線。
該機構也承認,目前仍不確定這些結果是否代表一波新的加速階段,還是一個單次的大幅跳躍。
專注於軟體任務而非網安靶場的研究非營利機構 METR,也得到類似、約 4.2 個月的倍增時間估計。AISI 表示,這種結果的趨同,強化了「能力真的在提升」的說法,而非只是某一套評估工具的統計異常。
AISI 也強調,其設置的靶場並沒有主動防禦者參與,因此結果更接近模型在面對防護薄弱網路時的能力,而非對抗大型企業加固後系統的情境。
為何能力躍進很重要
新版 Mythos checkpoint 並非隨著全新模型版本釋出。AISI 使用的是 Anthropic 上個月在其安全合作計畫 Project Glasswing 中部署的同一版本,只是收到了該模型的更新 build。
該研究所寫道:「顯著的能力躍進不一定需要新的模型版本釋出。」這與防禦方習慣依照模型「發布週期」來調整節奏的假設相牴觸。
Anthropic 於 4 月 7 日 發布 Mythos Preview,將此模型定位為資安產業的轉捩點,因為在內部測試中,它在多個主流作業系統與瀏覽器上發現了零時差漏洞。該公司表示,正因為這些攻擊能力,它曾 暫緩更大規模的公開。而 AISI 在 4 月較早前的評估也指出,Mythos 相較先前的前沿系統是明顯的能力躍升。
下一篇閱讀: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO





