Anthropic 的 **Claude Mythos 預覽版成為首個完成完整模擬企業網絡攻擊的 AI 模型,根據 英國 AI 安全研究所(AISI)的說法,它解決了 73% 以往沒有任何 AI 系統能破解的專家級網絡安全任務。
AISI 網安評估
隸屬英國政府科學、創新及科技部門的研究機構 AISI,在 Anthropic 於 4 月 7 日發布相關消息後,對該模型進行了 兩組測試。
公司選擇不向大眾廣泛發布 Claude Mythos,而是只向少數網絡安全研究公司提供有限存取權。
在「奪旗賽」(capture-the-flag)評估中,Claude Mythos 在專家級任務上達到 73% 成功率。
在 2025 年 4 月之前,沒有任何模型能解出這些題目。AISI 亦建立了一個名為「The Last Ones」的 32 步驟企業網絡攻擊模擬,設計上預期需人類專業人士大約 20 小時完成。Claude Mythos 在 10 次嘗試中有 3 次完成整個模擬,平均可完成 32 個步驟中的 22 個;而表現次佳的 Claude Opus 4.6 則平均完成 16 步。
AISI 表示:「Mythos 預覽版在某個網絡靶場上的成功,顯示它至少有能力在已取得網絡存取的情況下,自主攻擊規模較小、防禦薄弱且存在漏洞的企業系統。」
延伸閱讀: Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns
零日漏洞攻擊
Anthropic 自家的紅隊發現,當用戶明確指示時,Claude Mythos 能在所有主要作業系統及主流瀏覽器上偵測並利用零日漏洞。公司表示,它所發現的漏洞中,超過 99% 仍未被修補。
Anthropic 表示:「我們在這裡能透露的內容有限。披露相關細節對我們來說是不負責任的。」
該模型的能力已經引起政策圈的關注。
根據 路透社 報道,美國財長 Scott Bessent 與 聯準會主席 Jerome Powell 已經與多間大型銀行的行政總裁緊急會面,討論與該模型相關的潛在網絡風險。
Anthropic 的安全應對
Anthropic 在宣布該模型的同時推出 Project Glasswing,並將其形容為利用 Claude Mythos 來協助保護關鍵軟件的計劃。公司將此倡議定位為為未來作準備——在那個年代,安全團隊必須領先 AI 驅動的攻擊者一步。AISI 建議,各機構應優先處理基礎網絡安全措施,包括定期修補漏洞、嚴格存取控制、強化系統設定,以及全面性的日誌紀錄。
4 月 7 日的公告之前,外界對 AI 在網絡安全領域所扮演角色的憂慮已持續升溫。以往的前沿模型僅展示有限的攻擊能力,但在 Claude Mythos 出現之前,從未有模型能通過專家級 CTF 基準測試,或完成多步驟的攻擊模擬。






