Anthropic 將在防護措施追上後向公眾開放 Claude Mythos,或需 12 個月

Anthropic 將在防護措施追上後向公眾開放 Claude Mythos,或需 12 個月

Anthropic 表示計劃向公眾開放其漏洞獵捕式 AI 模型 Mythos,但前提是先建立目前仍未存在的防護措施。

重點:

  • Anthropic 計劃先擴大對美國及其盟友政府的授權,之後再廣泛釋出 Mythos 級模型。
  • 公司坦言,包括自己在內,現時沒有任何公司建立了足夠強韌的防護機制來阻止濫用。
  • Mythos 已在 1,000 個開源專案中標記逾 23,000 個問題,其中 6,202 個屬高風險或嚴重漏洞。

Anthropic Mythos 發佈計劃

Anthropic 在 Project Glasswing(其有限存取的安全計劃)的更新中確認了這項計劃,另一份報告則指出實際時間表仍不明朗。

公司表示會先與美國及其盟友政府合作,擴大該計劃的涵蓋範圍。之後會在不久的將來更廣泛地釋出「Mythos 級模型」。

Anthropic 對風險態度直言不諱。它表示,目前沒有任何公司(包括 Anthropic 自身)已建構出足夠強大的防護措施,能防止這類模型被濫用並造成嚴重傷害。

即便如此,公司預期類似工具將迅速擴散,並預測 Mythos 等級的模型會在六至十二個月內廣泛可得。

Mythos 在四月首次亮相。Anthropic 表示,在測試中,它有 72.4% 的情況能產生可運作的攻擊程式,而先前的 Claude 模型幾乎為零。

延伸閱讀:Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks

Mythos 的漏洞發現

自推出以來,該模型已掃描超過 1,000 個開源專案,並找出 23,019 個問題,其中 6,202 個被評為高風險或嚴重等級。

其中一項發現尤其突出:Mythos 在 wolfSSL 密碼學函式庫中發現了一個漏洞。該函式庫被數十億裝置使用,這個漏洞可能讓攻擊者偽造憑證,冒充銀行或電郵服務供應商。這個問題現已被修補。

大量報告對負責修復的人員造成壓力。開源維護者已要求 Anthropic 放慢披露速度,指漏洞數量遠超他們的處理能力。

研究人員看到更深層次的不平衡。Anthropic 認為,現在找出程式錯誤比修復更容易,並已與開放原始碼安全基金會(Open Source Security Foundation)的 Alpha-Omega 專案合作,協助維護者分流及處理積壓的問題。

Claude Mythos 的系統卡(system card)預測,長遠來看 AI 將更有利於防禦方,但 Anthropic 也承認,目前攻擊者可能仍佔上風。

Mythos 首次曝光時,Anthropic 向包括 Apple、Microsoft 和 Google 在內的逾 50 間機構提供了存取權,並附送約 1 億美元的使用額度,同時因為擔心它能武器化軟體漏洞,而暫不向大眾開放。

下一篇閱讀:Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High

免責聲明及風險提示: 本文資訊僅供教育與參考之用,並基於作者意見,並不構成金融、投資、法律或稅務建議。 加密貨幣資產具高度波動性並伴隨高風險,可能導致投資大幅虧損或全部損失,並非適合所有投資者。 文章內容僅代表作者觀點,不代表 Yellow、創辦人或管理層立場。 投資前請務必自行徹底研究(D.Y.O.R.),並諮詢持牌金融專業人士。
Anthropic 將在防護措施追上後向公眾開放 Claude Mythos,或需 12 個月 | Yellow.com