OpenAI 陳銘實：能自行開展研究的 AI 即將到來，AGI 近在眼前

OpenAI 研究長 陳銘實（Mark Chen） 表示，公司正接近能自行進行研究的 AI 模型，讓實現通用人工智慧（AGI）的距離愈來愈近。

重點整理：

陳銘實主張擴展定律仍然有效，預訓練與更長的推理鏈條依舊在推動 AGI 進展。

他表示，能自我維持研究的模型已經臨近，這將重塑人類研究者的角色。

他點出日益加劇的評估危機，以及尚未解決的持續學習，是目前領域最大障礙。

陳銘實在近期的一段播客訪談中，邊在鏡頭前下廚，邊講解 OpenAI 的研究策略。

他反駁了「擴展已經停滯」的說法。他指出，每當這個領域遭遇新的瓶頸時，這種論點就會再度出現。

他表示，公司至今都在一條跨越將近 10 個數量級的指數曲線上前進，而且幾乎看不到會中斷的跡象，他在一篇文章中如此聲稱。

陳銘實也提到 OpenAI 在「推理能力」上的押注。他說，在 Jakub Pachocki、Ilya Sutskever 以及少數幾位成員推動 o1 專案之前，公司內部早期其實有不少質疑聲音。

現在，他預期模型能接手長達數週的研究任務，產出能突破人類專家盲點的點子。

他指出，OpenAI 的路線圖大約規畫三年，終點是能從最初的想法一路到完整成果，全程處理研究工作的模型。

延伸閱讀： BitMine 在拋售潮中逆勢而行：4,300 萬美元押注以太幣，策略引發關注

陳銘實拋出了一個引人注意的名詞──「氛圍研究員」（vibe researcher）。

在他描繪的未來裡，最頂尖的研究者不再親自寫每一行程式碼，而是負責操盤與引導，讓模型去處理執行與排程。人類工作將縮減為兩件事：提出犀利的問題，以及判斷一個答案是否真正「有品味」。

這個願景的基礎並不牢靠，陳銘實也並未刻意回避這點。

他警告正在形成一場評估危機：許多團隊執著於拉高基準測試分數，卻沒有實質進步，他把這種習慣稱作「benchmaxxing」。舊的測試如今已接近飽和，而新的測試一旦公開，很快也會失去參考價值。

持續學習則是更棘手的缺口。陳銘實稱，這是一項領域仍未解鎖的基本能力，儘管他也指出，已有許多研究正對此展開攻堅。

如果這條曲線能維持下去，他認為，最稀缺的人類資源將會從「原始智力」轉向「判斷力與實際生活經驗」。

過去他也多次提出類似觀點。在 GPT-4.5 發布前後，他曾主張擴展典範仍可持續推進，並長期堅稱沒有證據顯示擴展定律已經失效。

接著看： CZ 稱幣安原本距離取得 MiCA 核准只差幾天，卻因政治因素受阻