Anthropic 的 Claude Mythos Preview became the first AI model to complete a full simulated corporate network attack,根據 英國 AI 安全研究院(AISI)的說法,它解出了先前所有 AI 系統都無法破解的 73% 專家級資安任務。
AISI 網路安全評估
AISI 是隸屬於英國政府「科學、創新與科技部」的研究機構,在 Anthropic 於 4 月 7 日公布該模型後,ran 了兩組測試。
公司選擇不向大眾廣泛釋出 Claude Mythos,而是granting 限制性存取權給資安研究公司。
在奪旗賽(capture-the-flag)評估中,Claude Mythos 在專家級任務上達成 73% 的成功率。
在 2025 年 4 月之前,沒有任何模型能解出這些任務。AISI 也打造了一個 32 個步驟的企業網路攻擊模擬「The Last Ones」,設計上約需人類專業人士 20 小時完成。Claude Mythos 在 10 次嘗試中有 3 次完成全部模擬,平均完成 32 個步驟中的 22 個;相較之下,下一個最佳表現者 Claude Opus 4.6 平均為 16 個步驟。
AISI 表示:「Mythos Preview 在其中一個網路攻防場域上的成功顯示,它至少已具備在已取得網路存取權的情境下,自主攻擊規模較小、防禦鬆散且易受攻擊的企業系統的能力。」
延伸閱讀: Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns
零時差漏洞攻擊
Anthropic 自家的紅隊發現,當使用者明確指示時,Claude Mythos 能在所有主流作業系統與主流瀏覽器上偵測並利用零時差(zero-day)漏洞。公司表示,其發現的漏洞中有超過 99% 仍未被修補。
Anthropic 表示:「我們在此能公開的內容相當有限。透露細節將是不負責任的行為。」
該模型的能力已經reached 政策圈。
根據 路透社,美國財政部長 Scott Bessent 與 聯準會主席 Jerome Powell held 了與主要銀行執行長的緊急會議,討論與該模型相關的潛在網路風險。
Anthropic 的安全回應
Anthropic 在宣布該模型的同時啟動了 Project Glasswing,將其描述為利用 Claude Mythos 協助保護關鍵軟體的計畫。公司將這項倡議定位為為未來做準備:在那個時代,資安團隊必須領先 AI 驅動的攻擊者一步。AISI 建議,各機構應優先強化基礎資安措施,包括定期修補、嚴格的存取控制、設定強化,以及完整的紀錄與稽核。
4 月 7 日的宣布,緊接在數個月來對 AI 在網路安全領域角色的擔憂升溫之後。先前的前沿模型展現的攻擊能力有限,沒有任何一款能通過專家級 CTF 基準測試,或完成多步驟的攻擊模擬,而 Claude Mythos 則打破了這個局面。






