Anthropic 表示計劃向公眾開放其漏洞獵捕式 AI 模型 Mythos,但前提是先建立目前仍未存在的防護措施。
重點:
- Anthropic 計劃先擴大對美國及其盟友政府的授權,之後再廣泛釋出 Mythos 級模型。
- 公司坦言,包括自己在內,現時沒有任何公司建立了足夠強韌的防護機制來阻止濫用。
- Mythos 已在 1,000 個開源專案中標記逾 23,000 個問題,其中 6,202 個屬高風險或嚴重漏洞。
Anthropic Mythos 發佈計劃
Anthropic 在 Project Glasswing(其有限存取的安全計劃)的更新中確認了這項計劃,另一份報告則指出實際時間表仍不明朗。
公司表示會先與美國及其盟友政府合作,擴大該計劃的涵蓋範圍。之後會在不久的將來更廣泛地釋出「Mythos 級模型」。
Anthropic 對風險態度直言不諱。它表示,目前沒有任何公司(包括 Anthropic 自身)已建構出足夠強大的防護措施,能防止這類模型被濫用並造成嚴重傷害。
即便如此,公司預期類似工具將迅速擴散,並預測 Mythos 等級的模型會在六至十二個月內廣泛可得。
Mythos 在四月首次亮相。Anthropic 表示,在測試中,它有 72.4% 的情況能產生可運作的攻擊程式,而先前的 Claude 模型幾乎為零。
延伸閱讀:Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks
Mythos 的漏洞發現
自推出以來,該模型已掃描超過 1,000 個開源專案,並找出 23,019 個問題,其中 6,202 個被評為高風險或嚴重等級。
其中一項發現尤其突出:Mythos 在 wolfSSL 密碼學函式庫中發現了一個漏洞。該函式庫被數十億裝置使用,這個漏洞可能讓攻擊者偽造憑證,冒充銀行或電郵服務供應商。這個問題現已被修補。
大量報告對負責修復的人員造成壓力。開源維護者已要求 Anthropic 放慢披露速度,指漏洞數量遠超他們的處理能力。
研究人員看到更深層次的不平衡。Anthropic 認為,現在找出程式錯誤比修復更容易,並已與開放原始碼安全基金會(Open Source Security Foundation)的 Alpha-Omega 專案合作,協助維護者分流及處理積壓的問題。
Claude Mythos 的系統卡(system card)預測,長遠來看 AI 將更有利於防禦方,但 Anthropic 也承認,目前攻擊者可能仍佔上風。
當Mythos 首次曝光時,Anthropic 向包括 Apple、Microsoft 和 Google 在內的逾 50 間機構提供了存取權,並附送約 1 億美元的使用額度,同時因為擔心它能武器化軟體漏洞,而暫不向大眾開放。
下一篇閱讀:Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High





