Claude Mythos 在 10 次嘗試中 6 次破解 32 步 AISI 攻擊模擬

Claude Mythos 在 10 次嘗試中 6 次破解 32 步 AISI 攻擊模擬

AnthropicClaude Mythos Preview 新 checkpoint 成為首個通過英國政府兩個網路攻擊模擬的 AI 模型,讓外界再度關注自主駭客攻擊的風險。

AISI 公佈 Mythos 突破進展

英國 AI Security Institute(AISI) 於週三 表示,新版 Mythos checkpoint 在 10 次嘗試中,有 6 次成功完成其 32 步企業網路攻擊靶場「The Last Ones」,先前版本僅達成 10 次中的 3 次。

更新後的模型也成功破解「Cooling Tower」工業控制系統靶場,此前沒有任何模型能通過該靶場,而 Mythos 在 10 次嘗試中成功 3 次。

競爭對手 OpenAI 的 GPT-5.5 也在相同測試中受評估。它在 10 次嘗試中 完成「The Last Ones」3 次,但未能完成「Cooling Tower」。

AISI 在每次嘗試中給予 1 億個 token 的運算預算,並指出模型表現到這個上限仍持續隨資源增加而成長,顯示更高的預算很可能會進一步推升成功率。

延伸閱讀: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

能力倍增時間持續縮短

AISI 透過「時間地平線」指標追蹤網安能力進展,衡量模型在 80% 可靠度下可完成的自動化任務時長。該機構在 2025 年 11 月 估計,倍增時間約為 8 個月;到了 2026 年 2 月,這一數字壓縮至 4.7 個月,而最新的 Mythos 與 GPT-5.5 的進展甚至已超越這條更快的趨勢線。

該機構也承認,目前仍不確定這些結果是否代表一波新的加速階段,還是一個單次的大幅跳躍。

專注於軟體任務而非網安靶場的研究非營利機構 METR,也得到類似、約 4.2 個月的倍增時間估計。AISI 表示,這種結果的趨同,強化了「能力真的在提升」的說法,而非只是某一套評估工具的統計異常。

AISI 也強調,其設置的靶場並沒有主動防禦者參與,因此結果更接近模型在面對防護薄弱網路時的能力,而非對抗大型企業加固後系統的情境。

為何能力躍進很重要

新版 Mythos checkpoint 並非隨著全新模型版本釋出。AISI 使用的是 Anthropic 上個月在其安全合作計畫 Project Glasswing 中部署的同一版本,只是收到了該模型的更新 build。

該研究所寫道:「顯著的能力躍進不一定需要新的模型版本釋出。」這與防禦方習慣依照模型「發布週期」來調整節奏的假設相牴觸。

Anthropic 於 4 月 7 日 發布 Mythos Preview,將此模型定位為資安產業的轉捩點,因為在內部測試中,它在多個主流作業系統與瀏覽器上發現了零時差漏洞。該公司表示,正因為這些攻擊能力,它曾 暫緩更大規模的公開。而 AISI 在 4 月較早前的評估也指出,Mythos 相較先前的前沿系統是明顯的能力躍升。

下一篇閱讀: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO

免責聲明與風險警告: 本文提供的資訊僅供教育與參考用途,並基於作者觀點,不構成財務、投資、法律或稅務建議。 加密貨幣資產具有高度波動性並伴隨高風險,包括可能損失全部或大部分投資金額。買賣或持有加密資產可能並不適合所有投資者。 本文中所表達的觀點僅代表作者立場,不代表 Yellow、其創辦人或管理層的官方政策或意見。 請務必自行進行充分研究(D.Y.O.R.),並在做出任何投資決策前諮詢持牌金融專業人士。
Claude Mythos 在 10 次嘗試中 6 次破解 32 步 AISI 攻擊模擬 | Yellow.com