人工智能是否正接近无法回头的临界点？Anthropic 呼吁建立“暂停框架”

Anthropic 于 2026 年 6 月上旬发布了一份报告，呼吁领先的人工智能实验室建立一种协调机制，当安全状况恶化时，能够减缓或叫停高级人工智能开发。

要点概览

Anthropic 发布报告，警告人工智能系统正在接近能够递归自我改进的门槛。
公司敦促头部 AI 实验室预先筹备一种协调机制，当安全风险升级时减缓或停止开发。
Anthropic 警告说，快速进展可能会超出人类监控和纠正 AI 行为的能力。
此次呼吁是在其 Claude 模型据称已编写部分自身代码的背景下发出的。
报告也加剧了更广泛的政策争论，美国国会正在审议新的 AI 安全立法。

半岛电视台报道称，该文件警告，AI 系统正逼近这样一个门槛：它们可以比人类工程师监控或干预的速度更快地设计和构建自身的改进版本。Anthropic 将这种递归自我改进动态描述为“近期的实质性风险”，而不是遥远未来的投机性担忧。

Anthropic 报告的核心内容

报告的核心主张是技术性且具体的。Anthropic 认为，当前的 AI 训练流程已经在有限程度上允许模型参与对自身的改进。该公司旗舰模型 Claude 据称在多个开发周期中编写了自身部分代码。

报告并未呼吁立即停止开发，而是呼吁“预作准备”。Anthropic 希望包括自身在内的前沿实验室预先就一套触发暂停的条件达成一致，并准备好能够快速执行暂停的基础设施。

这一表述与 Anthropic 更广泛的公众立场保持一致。自成立以来，该公司一直主张，在开发强大的 AI 的同时构建安全护栏才是负责任的路径，并将这一立场称为“负责任的扩展”（responsible scaling）。新报告实质上是在说，这个等式中的“安全”一边必须跑得更快。

文件还提出了由谁来协调这种“暂停”的问题。目前不存在对 AI 开发拥有强制执法权的国际治理机构。报告在事实上呼吁私营公司之间进行自愿协调，而批评者认为，这是一种最弱的执行模式。

延伸阅读： Justin Sun Escalates Fight With WLFI As HTX Removes USD1

华盛顿的政策背景

Anthropic 的警告正好落在国会激烈辩论的中途。本周在众议院流传的一份跨党派讨论稿，拟对国内最强大的 AI 开发者施加安全义务和独立审计要求。该法案点名针对“前沿实验室”，其中包括 Anthropic、OpenAI 和 Google DeepMind。

另一项范围更广的 AI 法案已于 2026 年 6 月 4 日在众议院委员会表决通过。该立法拟在联邦标准制定期间，冻结各州层面的 AI 消费者保护法三年。

特朗普政府又增加了一层复杂性。本周白宫发布行政命令，为前沿 AI 模型设立自愿性的 30 天审查窗口，使国家安全机构能在公开部署前提前接触这些模型。据报道，政府还在与 OpenAI 商谈潜在的政府股权持有事宜。

在这样的环境中，Anthropic 关于“暂停机制”的呼吁，既是安全举措，也是一种市场结构性动作。如果在政府支持下建立起暂停框架，它很可能有利于已经位于前沿的公司，因为规模较小的竞争者在暂停后往往缺乏恢复大规模开发的资源。

延伸阅读： Trump Administration Eyes Government Stake in OpenAI

行业反应与竞争格局

整个 AI 行业对 Anthropic 的这种表述并未形成一致欢迎。Microsoft 的 AI 负责人 Mustafa Suleiman 本周表示，微软的目标是独立跻身顶级 AI 实验室之列，这暗示公司更关注提速而非克制。腾讯同时聘请了一位前 OpenAI 研究员出任首席 AI 科学家，推动其自身的 AGI 计划。

这两个动向凸显了 Anthropic 报告中指出的“集体行动难题”。某一家实验室单方面暂停，实际上会让继续开发的对手受益。如果缺乏有约束力的协调，所谓“暂停机制”的呼吁就仍停留在愿景层面。

Anthropic 9650 亿美元估值是在最近一轮 H 轮融资后形成的，这为其在开发放缓时提供了足够的资金缓冲，而小型实验室则不具备这种能力。在评估该公司安全倡议时，这种不对称性尤为重要。

报告发布之际，Anthropic 的 Claude 模型正在企业合同市场上与 GPT-5.5 和 Google 的 Gemini 系列直接竞争。对于受监管行业的客户而言，将“安全定位”作为商业差异化手段，可能会带来竞争优势。

下篇阅读： Tencent Hires Former OpenAI Researcher Yao Shunyu as Chief AI Scientist