人工智能是否正逼近無法回頭的臨界點？Anthropic 呼籲建立「暫停框架」

Anthropic 於 2026 年 6 月初發表一份報告，呼籲各大人工智能實驗室建立一套協調機制，一旦安全情況惡化，能夠放慢甚至停止先進 AI 開發。

重點摘要

Anthropic 發表報告警告，人工智能系統正逼近可進行遞迴式自我提升的臨界點。
公司敦促各大 AI 實驗室預先建立協調機制，在安全風險升溫時能放慢或停止開發。
Anthropic 指出，AI 的快速進展可能會超出人類監督與修正 AI 行為的能力。
此番呼籲，緊接著 Anthropic 自家 Claude 模型據報已能撰寫部分自身程式碼。
這份報告亦加深了政策層面的爭論，因為美國國會正考慮新的 AI 安全立法。

半島電視台報道指，該文件警告 AI 系統正接近一個門檻，屆時它們能夠設計和構建比現有版本更強的後繼系統，而且速度遠快於人類工程師可監察或介入的能力。Anthropic 將這種遞迴式自我提升動態描述為「切身且迫近的風險」，而非遙遠、純屬臆測的長期問題。

Anthropic 報告的關鍵內容

報告的核心主張具體而技術性強。Anthropic主張當前的 AI 訓練流程，已在有限範圍內允許模型對自身的改進作出貢獻。公司旗艦模型 Claude 據報在研發週期內，已撰寫了部分自身程式碼。

報告並非要求立即「停機」，而是要求「做好準備」。Anthropic 希望包括自己在內的前沿實驗室，事先就「觸發暫停」的條件達成共識，並預先建好可以迅速啟動暫停的基礎設施。

這種定調與 Anthropic 一貫的公共形象相符。自創立以來，公司一直主張，一邊開發強大 AI、一邊同步建立安全護欄，才是負責任之道，並將此路線稱為「負責任擴展」（responsible scaling）。新報告實際上在說：在這個等式中，安全那一邊必須加速。

文件亦提出一個關鍵問題：由誰來協調這種「暫停」？目前並沒有具強制力、能管轄 AI 開發的國際治理機構。報告實質上是呼籲私人公司之間進行自願協調，批評者指出，這是最弱的一種執行模式。

延伸閱讀：Justin Sun Escalates Fight With WLFI As HTX Removes USD1

華盛頓的政策背景

Anthropic 的警告落在美國國會激烈辯論的關鍵時刻。一份由兩黨眾議員推動、於本週流傳的討論草案，擬對全美最強大的 AI 開發者施加安全義務與獨立審核。法案明確鎖定「前沿實驗室」，其中包括 Anthropic、OpenAI 及 Google DeepMind。

另一項更廣泛的 AI 法案則已於 2026 年 6 月 4 日在眾議院委員會表決通過。該法案擬暫停各州在 AI 消費者保護方面制定新法三年，讓聯邦有時間建立統一標準。

特朗普政府則再增添一層複雜性。白宮本週頒布行政命令，為前沿 AI 模型創設一個自願性的 30 天審查期，讓國安機構能在公開部署前優先接觸這些模型。據報，政府亦正與 OpenAI 商談潛在的政府持股安排。

在這樣的環境下，Anthropic 提出的「暫停機制」既是安全措施，也是一種「市場結構」安排。若在政府背書下建立暫停框架，最有利的往往是已站在技術前沿的大公司，因為中小競爭者往往缺乏在暫停後迅速恢復大規模開發的資源。

延伸閱讀：Trump Administration Eyes Government Stake in OpenAI

反應與產業動態

整個 AI 行業對 Anthropic 的定調並未一致買帳。Microsoft 的 AI 負責人 Mustafa Suleiman 本週表明，微軟打算以自身力量躋身頂尖 AI 實驗室之列，顯示公司更關注加速，而非收緊節奏。與此同時，騰訊則延攬一名前 OpenAI 研究員出任首席 AI 科學家，以推進其自家 AGI 計劃。

這兩個例子凸顯了 Anthropic 報告所指出的「集體行動困境」。若只有一家實驗室單方面暫停，繼續開發的對手就能坐收漁人之利。在缺乏具約束力的協調機制下，「暫停框架」目前仍然只是願景。

Anthropic 的 9,650 億美元估值，源自近期一輪 H 輪融資，為其提供了足夠財務空間來承受開發放緩——這是許多小型實驗室所不具備的條件。評估該公司在安全議題上的倡議時，這種不對稱性不可忽視。

報告發布之際，Anthropic 的 Claude 模型亦正與 GPT-5.5 及 Google 的 Gemini 系列在企業合約市場上正面競爭。對於受嚴格監管行業的客戶而言，「安全定位」本身就可以成為商業差異化的賣點。

下一篇閱讀：Tencent Hires Former OpenAI Researcher Yao Shunyu as Chief AI Scientist