Anthropic 於 2026 年 6 月初發表一份報告,呼籲各大人工智能實驗室建立一套協調機制,一旦安全情況惡化,能夠放慢甚至停止先進 AI 開發。
重點摘要
- Anthropic 發表報告警告,人工智能系統正逼近可進行遞迴式自我提升的臨界點。
- 公司敦促各大 AI 實驗室預先建立協調機制,在安全風險升溫時能放慢或停止開發。
- Anthropic 指出,AI 的快速進展可能會超出人類監督與修正 AI 行為的能力。
- 此番呼籲,緊接著 Anthropic 自家 Claude 模型據報已能撰寫部分自身程式碼。
- 這份報告亦加深了政策層面的爭論,因為美國國會正考慮新的 AI 安全立法。
半島電視台報道指,該文件警告 AI 系統正接近一個門檻,屆時它們能夠設計和構建比現有版本更強的後繼系統,而且速度遠快於人類工程師可監察或介入的能力。Anthropic 將這種遞迴式自我提升動態描述為「切身且迫近的風險」,而非遙遠、純屬臆測的長期問題。
Anthropic 報告的關鍵內容
報告的核心主張具體而技術性強。Anthropic主張當前的 AI 訓練流程,已在有限範圍內允許模型對自身的改進作出貢獻。公司旗艦模型 Claude 據報在研發週期內,已撰寫了部分自身程式碼。
報告並非要求立即「停機」,而是要求「做好準備」。Anthropic 希望包括自己在內的前沿實驗室,事先就「觸發暫停」的條件達成共識,並預先建好可以迅速啟動暫停的基礎設施。
這種定調與 Anthropic 一貫的公共形象相符。自創立以來,公司一直主張,一邊開發強大 AI、一邊同步建立安全護欄,才是負責任之道,並將此路線稱為「負責任擴展」(responsible scaling)。新報告實際上在說:在這個等式中,安全那一邊必須加速。
文件亦提出一個關鍵問題:由誰來協調這種「暫停」?目前並沒有具強制力、能管轄 AI 開發的國際治理機構。報告實質上是呼籲私人公司之間進行自願協調,批評者指出,這是最弱的一種執行模式。
延伸閱讀:Justin Sun Escalates Fight With WLFI As HTX Removes USD1
華盛頓的政策背景
Anthropic 的警告落在美國國會激烈辯論的關鍵時刻。一份由兩黨眾議員推動、於本週流傳的討論草案,擬對全美最強大的 AI 開發者施加安全義務與獨立審核。法案明確鎖定「前沿實驗室」,其中包括 Anthropic、OpenAI 及 Google DeepMind。
另一項更廣泛的 AI 法案則已於 2026 年 6 月 4 日在眾議院委員會表決通過。該法案擬暫停各州在 AI 消費者保護方面制定新法三年,讓聯邦有時間建立統一標準。
特朗普政府則再增添一層複雜性。白宮本週頒布行政命令,為前沿 AI 模型創設一個自願性的 30 天審查期,讓國安機構能在公開部署前優先接觸這些模型。據報,政府亦正與 OpenAI 商談潛在的政府持股安排。
在這樣的環境下,Anthropic 提出的「暫停機制」既是安全措施,也是一種「市場結構」安排。若在政府背書下建立暫停框架,最有利的往往是已站在技術前沿的大公司,因為中小競爭者往往缺乏在暫停後迅速恢復大規模開發的資源。
延伸閱讀:Trump Administration Eyes Government Stake in OpenAI
反應與產業動態
整個 AI 行業對 Anthropic 的定調並未一致買帳。Microsoft 的 AI 負責人 Mustafa Suleiman 本週表明,微軟打算以自身力量躋身頂尖 AI 實驗室之列,顯示公司更關注加速,而非收緊節奏。與此同時,騰訊 則延攬一名前 OpenAI 研究員出任首席 AI 科學家,以推進其自家 AGI 計劃。
這兩個例子凸顯了 Anthropic 報告所指出的「集體行動困境」。若只有一家實驗室單方面暫停,繼續開發的對手就能坐收漁人之利。在缺乏具約束力的協調機制下,「暫停框架」目前仍然只是願景。
Anthropic 的 9,650 億美元估值,源自近期一輪 H 輪融資,為其提供了足夠財務空間來承受開發放緩——這是許多小型實驗室所不具備的條件。評估該公司在安全議題上的倡議時,這種不對稱性不可忽視。
報告發布之際,Anthropic 的 Claude 模型亦正與 GPT-5.5 及 Google 的 Gemini 系列在企業合約市場上正面競爭。對於受嚴格監管行業的客戶而言,「安全定位」本身就可以成為商業差異化的賣點。
下一篇閱讀:Tencent Hires Former OpenAI Researcher Yao Shunyu as Chief AI Scientist





