Claude Mythos 成為首個完成模擬企業網路攻擊的 AI

Anthropic 的 Claude Mythos Preview became the first AI model to complete a full simulated corporate network attack，根據 英國 AI 安全研究院（AISI）的說法，它解出了先前所有 AI 系統都無法破解的 73% 專家級資安任務。

AISI 網路安全評估

AISI 是隸屬於英國政府「科學、創新與科技部」的研究機構，在 Anthropic 於 4 月 7 日公布該模型後，ran 了兩組測試。

公司選擇不向大眾廣泛釋出 Claude Mythos，而是granting 限制性存取權給資安研究公司。

在奪旗賽（capture-the-flag）評估中，Claude Mythos 在專家級任務上達成 73% 的成功率。

在 2025 年 4 月之前，沒有任何模型能解出這些任務。AISI 也打造了一個 32 個步驟的企業網路攻擊模擬「The Last Ones」，設計上約需人類專業人士 20 小時完成。Claude Mythos 在 10 次嘗試中有 3 次完成全部模擬，平均完成 32 個步驟中的 22 個；相較之下，下一個最佳表現者 Claude Opus 4.6 平均為 16 個步驟。

AISI 表示：「Mythos Preview 在其中一個網路攻防場域上的成功顯示，它至少已具備在已取得網路存取權的情境下，自主攻擊規模較小、防禦鬆散且易受攻擊的企業系統的能力。」

延伸閱讀： Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns

零時差漏洞攻擊

Anthropic 自家的紅隊發現，當使用者明確指示時，Claude Mythos 能在所有主流作業系統與主流瀏覽器上偵測並利用零時差（zero-day）漏洞。公司表示，其發現的漏洞中有超過 99% 仍未被修補。

Anthropic 表示：「我們在此能公開的內容相當有限。透露細節將是不負責任的行為。」

該模型的能力已經reached 政策圈。

根據 路透社，美國財政部長 Scott Bessent 與 聯準會主席 Jerome Powell held 了與主要銀行執行長的緊急會議，討論與該模型相關的潛在網路風險。

Anthropic 的安全回應

Anthropic 在宣布該模型的同時啟動了 Project Glasswing，將其描述為利用 Claude Mythos 協助保護關鍵軟體的計畫。公司將這項倡議定位為為未來做準備：在那個時代，資安團隊必須領先 AI 驅動的攻擊者一步。AISI 建議，各機構應優先強化基礎資安措施，包括定期修補、嚴格的存取控制、設定強化，以及完整的紀錄與稽核。

4 月 7 日的宣布，緊接在數個月來對 AI 在網路安全領域角色的擔憂升溫之後。先前的前沿模型展現的攻擊能力有限，沒有任何一款能通過專家級 CTF 基準測試，或完成多步驟的攻擊模擬，而 Claude Mythos 則打破了這個局面。

下一篇： RaveDAO Just Exploded 1,194% In A Week — Here's The Real Story Behind The Crypto That Turns Raves Into Blockchain