Claude Mythos 成為首個完成模擬企業網絡攻擊的人工智能

Anthropic 的 **Claude Mythos 預覽版成為首個完成完整模擬企業網絡攻擊的 AI 模型，根據 英國 AI 安全研究所（AISI）的說法，它解決了 73% 以往沒有任何 AI 系統能破解的專家級網絡安全任務。

AISI 網安評估

隸屬英國政府科學、創新及科技部門的研究機構 AISI，在 Anthropic 於 4 月 7 日發布相關消息後，對該模型進行了兩組測試。

公司選擇不向大眾廣泛發布 Claude Mythos，而是只向少數網絡安全研究公司提供有限存取權。

在「奪旗賽」（capture-the-flag）評估中，Claude Mythos 在專家級任務上達到 73% 成功率。

在 2025 年 4 月之前，沒有任何模型能解出這些題目。AISI 亦建立了一個名為「The Last Ones」的 32 步驟企業網絡攻擊模擬，設計上預期需人類專業人士大約 20 小時完成。Claude Mythos 在 10 次嘗試中有 3 次完成整個模擬，平均可完成 32 個步驟中的 22 個；而表現次佳的 Claude Opus 4.6 則平均完成 16 步。

AISI 表示：「Mythos 預覽版在某個網絡靶場上的成功，顯示它至少有能力在已取得網絡存取的情況下，自主攻擊規模較小、防禦薄弱且存在漏洞的企業系統。」

延伸閱讀： Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns

零日漏洞攻擊

Anthropic 自家的紅隊發現，當用戶明確指示時，Claude Mythos 能在所有主要作業系統及主流瀏覽器上偵測並利用零日漏洞。公司表示，它所發現的漏洞中，超過 99% 仍未被修補。

Anthropic 表示：「我們在這裡能透露的內容有限。披露相關細節對我們來說是不負責任的。」

該模型的能力已經引起政策圈的關注。

根據 路透社 報道，美國財長 Scott Bessent 與 聯準會主席 Jerome Powell 已經與多間大型銀行的行政總裁緊急會面，討論與該模型相關的潛在網絡風險。

Anthropic 的安全應對

Anthropic 在宣布該模型的同時推出 Project Glasswing，並將其形容為利用 Claude Mythos 來協助保護關鍵軟件的計劃。公司將此倡議定位為為未來作準備——在那個年代，安全團隊必須領先 AI 驅動的攻擊者一步。AISI 建議，各機構應優先處理基礎網絡安全措施，包括定期修補漏洞、嚴格存取控制、強化系統設定，以及全面性的日誌紀錄。

4 月 7 日的公告之前，外界對 AI 在網絡安全領域所扮演角色的憂慮已持續升溫。以往的前沿模型僅展示有限的攻擊能力，但在 Claude Mythos 出現之前，從未有模型能通過專家級 CTF 基準測試，或完成多步驟的攻擊模擬。

下一篇閱讀： RaveDAO Just Exploded 1,194% In A Week — Here's The Real Story Behind The Crypto That Turns Raves Into Blockchain