人工智慧正接近無法回頭的臨界點？Anthropic 呼籲建立「暫停框架」

Anthropic 在 2026 年 6 月初發布一份報告，呼籲領先的人工智慧實驗室建立一套協調機制，一旦安全狀況惡化，能夠放緩或停止先進 AI 的開發。

重要重點

Anthropic 發布報告警告，AI 系統正接近一個臨界點，可能具備遞迴自我改進的能力。
公司敦促領先 AI 實驗室預先擬定一套協調機制，在安全風險升高時，能放緩或暫停開發。
Anthropic 警告，快速進展可能超出人類監控與修正 AI 行為的能力。
這項呼籲緊接在該公司 Claude 模型 reportedly 能撰寫部分自身程式碼之後。
報告也加劇了更廣泛的政策辯論，因為美國國會正考慮新的 AI 安全立法。

半島電視台報導指出，這份文件警告 AI 系統正逼近一個門檻：它們可能設計並建構更優化的自身版本，其速度會快過人類工程師的監控或介入能力。Anthropic 將這種遞迴自我改進的動態描述為「具體且在不遠將來的風險」，而非遙遠未來的純理論擔憂。

Anthropic 報告的核心內容

報告的核心主張既技術性又具體。Anthropic主張，當前的 AI 訓練流程已在有限範圍內，允許模型參與自身改進。該公司旗艦模型 Claude 在開發週期中 reportedly 已撰寫了部分自身的程式碼。

報告並未要求立刻喊停，而是要求「預作準備」。Anthropic 希望包括自家在內的前沿實驗室事先就「觸發條件」達成共識：在什麼情況下啟動暫停機制，並事先建好可迅速執行暫停的基礎設施。

此種論述方式與 Anthropic 一貫的公共立場相符。該公司自創立以來就主張，一邊開發強大 AI、一邊同步建立安全防護欄，是負責任的道路，並將此稱為「負責任擴展」（responsible scaling）。新報告等於是在說：在這個方程式中，安全這一側必須加快腳步。

文件也提出另一個問題：究竟誰來協調這樣的暫停？目前並不存在對 AI 開發具強制執行力的國際治理機構。報告在字裡行間呼籲私部門公司之間的自願協調，而批評者指出，這其實是最弱的一種執行模式。

延伸閱讀：Justin Sun Escalates Fight With WLFI As HTX Removes USD1

華府的政策情境

Anthropic 的警訊出現在國會辯論正激烈進行之際。一份本週在眾議院流傳的跨黨派討論草案，將要求美國最強大的 AI 開發者遵守安全規範並接受獨立稽核。該法案鎖定「前沿實驗室」，其中包括 Anthropic、OpenAI 和 Google DeepMind。

另一份範圍更廣的 AI 法案則在 2026 年 6 月 4 日通過眾議院委員會表決。該立法將在聯邦標準制定期間，凍結各州三年內新訂的 AI 消費者保護法。

川普政府又讓情勢更複雜。白宮本週發布行政命令，為前沿 AI 模型設置一個自願性的 30 天審查期，允許國安機構在公開部署前先行接觸。據報導，政府也正與 OpenAI 商討政府可能取得股權的方案。

Anthropic 提出的暫停機制，在這個環境下既是安全措施，也是市場結構調整手段。如果有一套獲政府背書的暫停框架，最有利的，很可能是已處於前沿位置的公司；因為小型競爭者在暫停後，往往缺乏重新大規模啟動的資源。

延伸閱讀：Trump Administration Eyes Government Stake in OpenAI

產業反應與動態

AI 產業對 Anthropic 的論述並非一面倒買帳。Microsoft 的 AI 負責人 Mustafa Suleiman 本週表示，微軟打算獨立躋身頂尖 AI 實驗室之列，暗示公司更關注加速，而非克制。Tencent 則同時延攬前 OpenAI 研究員出任首席 AI 科學家，推進自家的通用人工智慧（AGI）計畫。

這兩個事件凸顯了 Anthropic 報告所指出的「集體行動困境」。若僅有單一實驗室單方面暫停，其競爭對手若持續開發，便會相對受益。若沒有具約束力的協調機制，暫停框架的呼籲仍停留在願景層次。

Anthropic 9650 億美元估值，是在近期 H 輪融資後達成，為公司提供了足夠財務緩衝，得以承受開發放緩，而小型實驗室則往往無法。評估該公司安全倡議時，這種不對稱十分關鍵。

此份報告發布之際，Anthropic 的 Claude 模型正與 GPT-5.5 以及 Google 的 Gemini 系列在企業合約市場正面競爭。對於受監管產業的客戶而言，在「安全性」上的定位，可能成為關鍵的商業差異化因素。

下一篇閱讀：Tencent Hires Former OpenAI Researcher Yao Shunyu as Chief AI Scientist