Anthropic 将在安全防护到位后向公众开放 Claude Mythos,或需 12 个月

Anthropic 将在安全防护到位后向公众开放 Claude Mythos,或需 12 个月

Anthropic 表示,计划向公众开放其漏洞猎捕 AI 模型 Mythos,但前提是先构建目前尚不存在的安全防护措施。

要点:

  • Anthropic 计划先扩大对美国及其盟友政府的开放,再广泛发布 Mythos 级模型。
  • 公司承认,目前包括其自身在内,没有任何机构建立起足以有效阻止滥用的安全防护。
  • Mythos 已在 1,000 个开源项目中标记出超过 23,000 个问题,其中 6,202 个被评为高危或严重漏洞。

Anthropic Mythos 发布计划

Anthropic 在其有限访问安全项目 Project Glasswing更新中确认了这一计划,另一份报告则指出具体时间表仍不确定。

公司称,将首先与美国及其盟友政府合作,扩大该项目的覆盖范围。随后将在不久的将来更广泛地发布“Mythos 级模型”。

Anthropic 对风险的表述十分直白。它在一份声明中指出,目前尚无任何公司(包括 Anthropic 自身)构建出足以防止模型被滥用并造成严重危害的安全防护。

尽管如此,公司预计类似工具仍将迅速传播,并预测 Mythos 级模型将在 6 至 12 个月内实现广泛可用。

Mythos 于四月首次亮相。Anthropic 称,在测试中它有 72.4% 的概率能生成可用漏洞利用代码,而早期 Claude 模型几乎为零。

延伸阅读: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks

Mythos 的漏洞发现情况

自发布以来,该模型已扫描超过 1,000 个开源项目,并发现了 23,019 个问题,其中 6,202 个被评为高危或严重级别。

其中一个发现尤为突出:Mythos 在加密库 wolfSSL 中发现了一个漏洞。wolfSSL 被数十亿设备使用,该漏洞可能允许攻击者伪造证书并冒充银行或电子邮件服务提供商。该问题现已被修复。

大量报告给负责修复的人带来了巨大压力。开源维护者已要求 Anthropic 放慢披露节奏,称漏洞数量远超其处理能力。

研究人员则看到更深层的不平衡。Anthropic 认为,借助此类工具“找漏洞”已比“修漏洞”容易得多。为此,公司与开放源代码安全基金会(Open Source Security Foundation)的 Alpha-Omega 项目合作,帮助维护者对堆积如山的报告进行分级与优先排序。

Claude Mythos 的系统卡片预测,长期来看 AI 会更有利于防御方,但 Anthropic 也承认,目前攻击者可能仍然占据优势。

Mythos 首次公布时,Anthropic 曾向包括 Apple、Microsoft 和 Google 在内的 50 多家机构提供访问权限,并附带约 1 亿美元的使用额度;同时并未向公众开放该模型,原因正是其具备将软件缺陷“武器化”的潜力。

下篇阅读: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。