Anthropic 于 2026 年 6 月上旬发布报告,呼吁各大人工智能实验室建立一种协调机制,当安全状况恶化时,能够减缓甚至叫停高级 AI 开发。
要点速览
- Anthropic 发布报告警告,AI 系统正接近可以递归自我改进的阈值。
- 公司敦促头部 AI 实验室预先准备一种协调机制,以便在安全风险升级时减缓或停止开发。
- Anthropic 指出,快速进展可能会超出人类监控和纠正 AI 行为的能力。
- 此呼吁源于 Anthropic 自家 Claude 模型据称已经在撰写部分自身代码。
- 报告也推动了更广泛的政策讨论,美国国会正在审议新的 AI 安全立法。
半岛电视台报道称,该文件警告,AI 系统正逼近这样一个门槛:它们能够设计并构建改进版自身的速度,可能快于人类工程师监控或干预的能力。Anthropic 将这种递归自我改进动态描述为“切实存在的近期风险”,而非遥远未来的纯假设性担忧。
Anthropic 报告的核心观点
报告的核心主张既技术性又具体。Anthropic认为,当前的 AI 训练流程已经在有限程度上允许模型参与改进自身。该公司旗舰模型 Claude 据称在多轮开发周期中编写了部分自家代码。
报告并未呼吁立刻按下“急停键”,而是呼吁提前做好准备。Anthropic 希望包括自身在内的前沿实验室事先就“触发暂停”的条件达成一致,并提前构建好可以迅速执行暂停的基础设施。
这样的表述与 Anthropic 一贯的公共定位相一致。自创立以来,该公司一直主张:在开发强大 AI 的同时同步构建安全护栏,才是负责任的道路,这一立场被其称为“负责任扩展”。新报告实际上是在说,这个等式中“安全”一侧需要加速。
文档还提出了一个问题:由谁来协调这样的暂停?目前并不存在对 AI 开发拥有强制性执法权的国际治理机构。报告在事实上呼吁的是私营公司之间的自愿协调,而批评者指出,这是一种执行力最弱的模式。
延伸阅读: Justin Sun Escalates Fight With WLFI As HTX Removes USD1
华盛顿的政策背景
Anthropic 的警告出现在国会激烈辩论的当口。一份本周在众议院流传的跨党派讨论稿,拟对全国最强大的 AI 开发者实施安全义务和独立审计。该草案专门针对“前沿实验室”,这一范畴包括 Anthropic、OpenAI 和 Google DeepMind。
另一部更为宽泛的 AI 法案已于 2026 年 6 月 4 日在众议院委员会表决中通过。该立法拟在联邦标准制定期间,冻结各州层面的 AI 消费者保护法三年。
特朗普政府又为局面增添了一层复杂性。白宫本周发布行政命令,为前沿 AI 模型设立自愿性的 30 天审查期,使国家安全机构能够在公开部署前获得提前访问。政府方面据报也在与 OpenAI 商谈潜在的政府股权持有事宜。
Anthropic 对“暂停机制”的呼吁,既是一项安全主张,也是一种“市场结构设计”举措。如果在政府背书下建立起暂停框架,它很可能有利于已经处在前沿位置的公司,因为规模较小的竞争者往往缺乏在全面叫停后迅速恢复至同等规模的资源。
延伸阅读: Trump Administration Eyes Government Stake in OpenAI
业界反应与行业格局
整个 AI 行业并未一致接受 Anthropic 的叙事框架。Microsoft 的 AI 负责人 Mustafa Suleiman 本周表示,微软的目标是独立跻身顶级 AI 实验室之列,这表明公司更侧重加速而非克制。腾讯 同时聘请一位前 OpenAI 研究员出任首席 AI 科学家,以推动其自家 AGI 项目。
这两个动向凸显了 Anthropic 报告中所指出的“集体行动困境”。某一家实验室单方面暂停,将让继续推进研发的竞争对手受益。如果缺乏有约束力的协调,“暂停机制”的呼吁就仍停留在愿景层面。
Anthropic 的 9650 亿美元估值,是在近期 H 轮融资后形成的,这为公司在面对开发放缓时提供了充足的资金缓冲,而小型实验室则不具备类似韧性。在评估该公司安全倡议时,这种不对称性是不容忽视的因素。
报告发布之际,Anthropic 的 Claude 模型正与 GPT-5.5 和 Google 的 Gemini 系列在企业合同市场上直接竞争。对于受监管行业的客户来说,“安全定位”可以成为重要的商业差异化因素。
下一篇: Tencent Hires Former OpenAI Researcher Yao Shunyu as Chief AI Scientist





