Anthropic 在公司機密提交公開發行申請後僅一天,就向約 150 家新機構開放其最強大的 人工智慧模型 Claude Mythos 的使用權。
重點摘要:
- Anthropic 透過其 Claude Mythos 存取計畫 Project Glasswing,新增了約 150 家、分布於超過 15 個國家的機構。
- 擴大計畫的時間點,正值公司機密提交首次公開發行申請後的一天。
- 研究人員警告,儘管 Anthropic 將該模型定位為防禦工具,它仍可能讓網路攻擊變得更容易。
Glasswing 擴展橫跨 15 個國家
公司於週二宣布,將擴大 Project Glasswing——這是一個受控計畫,旨在在模型向大眾開放前,找出並修補軟體漏洞。
新合作夥伴分布在超過 15 個國家。每個組織在取得存取權前,都必須通過安全審查要求。
第一批約 50 家機構在四月加入,其中包括 Google、Microsoft、Palo Alto Networks 與 JPMorganChase。這些早期用戶迄今已回報超過一萬個高風險或重大軟體弱點。新一波加入者使總數提升至約 200 家。
最新一批成員補上數個關鍵缺口,涵蓋電力、自來水、醫療保健、通訊及硬體等先前參與較少的領域。
公司估計,這些企業當中只要有一家遭到單一入侵事件,可能就會對逾一億人造成傷害。
延伸閱讀: Study Finds Four Major AI Labs Use Incompatible Prompt Injection Metrics
為何 Claude Mythos 讓研究人員憂心
研究人員與政府機構質疑,如此強大的模型是否會讓複雜網路攻擊更容易執行。Anthropic 則持相反立場,主張防禦方必須先取得更銳利的工具,才能在攻擊者掌握之前取得優勢,並將此次發布定位為防禦上的長期優勢。
獨立測試更加劇了辯論。英國 AI 安全研究所記錄到,該模型曾自行執行一個 32 步驟的模擬網路攻擊。Mozilla 回報 Mythos 在 Firefox 瀏覽器中找到 271 個漏洞並加以修補,而新創公司 Calif 則描述了一個鎖定 Apple M5 晶片的攻擊鏈。
公司預期,競爭對手開發者會在六到十二個月內推出能力相近、但防護可能較弱的模型。
依其警告,這段落差可能帶來更頻繁的攻擊。與此同時,Anthropic 已在其公開模型上推出 Claude Security 工具,三週內已修補逾 2,100 個弱點。
Claude Mythos 於三月首度曝光。當時公司內部的草擬資料外流,之後 Anthropic 一直拒絕在沒有更嚴密保障的情況下,向所有人全面開放完整模型。在預測市場 Myriad 上,截至六月底前全面公開的機率已從一週前的 58.5%,下滑至約 26.5%。
接下來閱讀: Durov Renames Toncoin To Gram, Coin Pops 10% On Roots Return





