Anthropic 在 2026 年 6 月初發表一份報告,呼籲主要人工智能實驗室制定一套協調機制, 在安全情況惡化時,有能力放緩甚至停止 advanced AI development。
重點摘要
- Anthropic 發表報告,警告 AI 系統正逼近一個可能出現遞迴自我改進的門檻。
- 公司敦促領先 AI 實驗室預先準備一套協調機制,以便在安全風險升級時放緩或暫停研發。
- Anthropic 警告,快速進展可能超出人類監督及修正 AI 行為的能力。
- 這一呼籲源於 Anthropic 自家 Claude 模型據報在開發週期中撰寫了部分自身程式碼。
- 報告亦加深了更廣泛的政策辯論,正值美國國會考慮新的 AI 安全立法。
Al Jazeera reported 指出, 文件警告 AI 系統正接近一個門檻:在該點上,它們可以設計及建構改良版本的自己,其速度快於人類工程師的監督與干預能力。 Anthropic 將這種遞迴自我改進動態描述為「實質且近期的風險」,而非遙遠未來的臆測。
Anthropic 報告的主要內容
報告的核心主張具技術性且相當具體。Anthropic argues, 現行 AI 訓練流程已在有限程度上,容許模型參與改進自身的過程。 該公司旗艦模型 Claude 據稱已在多個開發週期中,撰寫了部分自身的程式碼。
報告並非呼籲立即停止研發,而是呼籲「預作準備」。 Anthropic 希望包括自身在內的前沿實驗室,事先同意一套會啟動暫停的「觸發條件」, 並預先建好在短時間內落實暫停所需的基礎設施。
這樣的框架與 Anthropic 一貫的公共立場相符。 自創立以來,該公司一直主張:在開發強大 AI 的同時同步建立安全護欄,才是負責任的道路, 並將此稱為「responsible scaling」(負責任擴展)。 新報告實際上是在說:這個等式中的「安全那一邊」必須加快腳步。
文件亦提出一個問題:究竟由誰來協調這種暫停? 目前並不存在具強制執行力、可以監管 AI 發展的國際治理機構。 報告實際上是呼籲私人公司之間自願協調,而批評者指出,這是執行力最弱的一種模式。
延伸閱讀: Justin Sun Escalates Fight With WLFI As HTX Removes USD1
華府的政策背景
Anthropic 的警示,正好落在國會激烈辯論的當口。 本週流傳的一份跨黨派眾議院討論草案,擬對全美最強大的 AI 開發者施加安全要求及獨立審計。 草案鎖定的正是前沿實驗室一類,包括 Anthropic、OpenAI 和 Google DeepMind。
另一項範圍更廣泛的 AI 法案則在 2026 年 6 月 4 日通過眾議院委員會表決。 該法案將在聯邦標準制定期間,暫時凍結各州層面的 AI 消費者保護法律三年。
特朗普政府加入後又增加了一層複雜性。 白宮本週發布行政命令,為前沿 AI 模型設立一個自願性的 30 天審查期, 讓國家安全機構在公開部署前優先接觸相關模型。 政府據報亦正與 OpenAI 商討政府入股的可能性。
在這樣的環境下,Anthropic 對「暫停機制」的呼籲,同時具有市場結構調整與安全治理的雙重意涵。 若有政府背書、建立起暫停框架,極可能有利於已處前沿位置的公司; 因為較小的競爭者通常沒有在暫停後迅速恢復大規模研發的資源。
延伸閱讀: Trump Administration Eyes Government Stake in OpenAI
回應與產業動態
整個 AI 行業對 Anthropic 的論述並非一面倒支持。 Microsoft 的 AI 負責人 Mustafa Suleiman 本週表示, Microsoft 目標是獨立躋身頂尖 AI 實驗室之列,顯示公司更著眼於加速而非收斂。 Tencent 同時延攬一名前 OpenAI 研究員出任首席 AI 科學家,以推進其自家 AGI 計劃。
這兩個例子凸顯了 Anthropic 報告所指出的「集體行動困境」: 一家實驗室單方面暫停,將使持續研發的競爭對手受益。 若缺乏具約束力的協調,「暫停機制」的呼籲就仍然只是理想目標。
Anthropic's $965 billion valuation, 是在最近一輪 H 輪融資後達成,為公司提供了足夠的財務空間, 令其有能力承受研發放緩的衝擊,而小型實驗室則難以比擬。 這種不對稱性,是評估該公司安全倡議時不得不考慮的因素。
報告發表之際,Anthropic 的 Claude 模型正與 GPT-5.5 及 Google 的 Gemini 系列在企業合約市場上正面競爭。 在受監管行業之中,「安全定位」本身亦可成為一項商業差異化賣點。
Read Next: Tencent Hires Former OpenAI Researcher Yao Shunyu as Chief AI Scientist





