Anthropic 或在 12 個月內向公眾開放 Claude Mythos, 但會先等防護措施追上

Anthropic 或在 12 個月內向公眾開放 Claude Mythos, 但會先等防護措施追上

Anthropic 表示,打算在建立好目前仍不存在的防護措施之後,向公眾開放其用於尋找漏洞的 AI 模型 Mythos,但在那之前不會釋出。

重點:

  • Anthropic 計劃先擴大對美國及其盟友政府的開放,再廣泛釋出 Mythos 等級的模型。
  • 公司坦言,包括自己在內,至今沒有任何一家業者建立出足以阻止濫用的強韌防護機制。
  • Mythos 已在 1,000 個以上的開源專案中標記出逾 23,000 個問題,其中 6,202 個被評為高風險或嚴重漏洞。

Anthropic Mythos 推出計劃

Anthropic 在 Project Glasswing(其限量存取的安全計劃)的更新中證實了這項規劃,另有報導指出實際時間表仍不確定。

公司表示,將先與美國及盟友政府合作擴大該計劃的範圍,其後才在不久的將來更廣泛釋出「Mythos 等級模型」。

Anthropic 直言風險嚴峻。它表示,目前沒有任何一家公司(包括 Anthropic 自身)已打造出足以防止模型被濫用並造成嚴重傷害的防護機制。

即便如此,公司仍預期類似工具將快速擴散,並預測在未來六到十二個月內,具備 Mythos 等級能力的模型將會廣泛可得。

Mythos 在四月首次亮相。Anthropic 表示,在測試中它有 72.4% 的時間能產生可運作的攻擊程式,而先前版本的 Claude 模型幾乎為零。

延伸閱讀:Cisco 研究顯示前沿 AI 模型在多輪攻擊下表現失常

Mythos 的漏洞發現成果

自首次亮相以來,該模型已掃描超過 1,000 個開源專案,並找出 23,019 個問題,其中 6,202 個被評為高風險或嚴重等級。

其中一項發現特別突出。Mythos 在 wolfSSL 密碼學函式庫中挖出一個漏洞——這個函式庫被數十億裝置採用——該漏洞可能讓攻擊者偽造憑證,並冒充銀行或電郵服務供應商。這個問題現已被修補。

大量的回報對負責修補的人造成壓力。多位開源維護者已要求 Anthropic 放慢揭露節奏,稱目前問題數量遠超過他們可處理的能力。

研究人員看到更深層的不平衡。Anthropic 認為,目前「找漏洞」已遠比「修漏洞」容易,因此公司已與 Open Source Security Foundation 旗下的 Alpha-Omega 計劃合作,協助維護者為這些積壓問題排定優先順序。

Claude Mythos 的系統卡預測,長遠來看 AI 終將讓防守方占優,不過 Anthropic 也承認,現階段攻擊者可能仍佔上風。

Mythos 首度公開時,Anthropic 為包括 Apple、Microsoft、Google 在內的 50 多間組織提供了存取權,以及約 1 億美元的使用額度,但基於該模型能武器化軟體漏洞的能力,選擇不向公眾開放。

下一篇閱讀:Cardano 鯨魚囤積 67.5% ADA 供應量,創六年新高

免責聲明及風險提示: 本文資訊僅供教育與參考之用,並基於作者意見,並不構成金融、投資、法律或稅務建議。 加密貨幣資產具高度波動性並伴隨高風險,可能導致投資大幅虧損或全部損失,並非適合所有投資者。 文章內容僅代表作者觀點,不代表 Yellow、創辦人或管理層立場。 投資前請務必自行徹底研究(D.Y.O.R.),並諮詢持牌金融專業人士。
Anthropic 或在 12 個月內向公眾開放 Claude Mythos, 但會先等防護措施追上 | Yellow.com