OpenAI 陳立權：能自行做研究的 AI 快要出現了

OpenAI 首席研究長 陳立權（Mark Chen） 表示，公司正在逼近能自行開展研究的 AI 模型，讓通用人工智慧（AGI）變得觸手可及。

重點整理：

陳立權主張，擴展法則仍然有效，預訓練與更長的推理鏈依舊在推動 AGI 的進展。

他表示，能自我維持研究的模型已經很接近實現，這將徹底改變人類研究人員的工作內容。

他點出愈演愈烈的評估危機，以及尚未解決的持續學習，是這個領域面臨的最大障礙。

陳立權在最近一檔 podcast 訪談中詳細說明他的想法，他一邊在鏡頭前下廚，一邊解釋 OpenAI 的研究策略。

他反駁了「擴展已經停滯」的說法。每當這個領域遇到新的瓶頸時，這種論點就會再度浮現，他說。

他表示，公司至今仍踩在一條橫跨近 10 個數量級的指數成長曲線上，幾乎看不出會中斷的跡象，他如此聲稱。

陳立權也指出，OpenAI 押注在推理能力上。他說，公司內部早期就有人質疑 o1 專案，直到 Jakub Pachocki、Ilya Sutskever 等少數人推動它往前走。

現在，他預期模型將能承擔長達數週的研究任務，產生能突破人類專家盲點的點子。

他透露，OpenAI 的路線圖大約拉三年，終點是可以從最初的想法一路做到完整成果、全程處理研究流程的模型。

陳立權提出了一個引人注意的名詞：「vibe 研究員」。

在他想像的未來，最頂尖的研究員不再親自寫完每一行程式碼，而是駕馭能處理執行與排程的模型。人類的工作被收斂成兩件事：提出犀利的問題，以及判斷一個答案是否真正「有味道」。

這個願景的基礎並不穩固，而陳立權也沒有假裝不是這樣。

他警告所謂的「評估危機」：團隊追逐各種基準分數，卻沒有帶來真正進展，他把這種習慣稱為「benchmaxxing」。舊的測試已被模型「打爆」，而新的測試幾乎一公開就開始迅速貶值。

持續學習則是更棘手的缺口。陳立權稱它為這個領域仍必須解鎖的一項基本能力，即便他也說，現在已有許多研究在針對這個問題。

如果這條軌跡成立，他認為，人類最稀缺的資源將從「純粹的智力」轉向「判斷力與真實的生活經驗」。

陳立權過去已多次提出類似論點。在 GPT-4.5 發布前後，他主張擴展典範仍可繼續推進，也一再堅稱沒有證據顯示擴展法則已經失效。