OpenAI 首席研究長 陳駿(Mark Chen) 表示,公司正接近能自行進行研究的 AI 模型,讓人工通用智能(AGI)變得愈來愈可觸及。
重點摘要:
- 陳駿主張擴展定律依然有效,預訓練和更長的推理鏈仍在推動 AGI 的進展。
- 他表示,具備自我維持研究能力的模型已經不遠,這將徹底改變人類研究者的工作內容。
- 他點出日益加劇的評估危機,以及尚未解決的持續學習,是整個領域面臨的最大障礙。
陳駿勾勒 AGI 的路徑
陳駿在最近的一次 podcast 訪談中,邊在鏡頭前下廚,邊講解 OpenAI 的研究策略。
他反駁「擴展已經停滯」的說法。陳駿指出,只要這個領域遇到新的瓶頸,這個論點就會再度浮現。
他聲稱,公司一路沿著一條跨越近十個數量級的指數曲線前進,而目前幾乎沒有跡象顯示這條曲線會斷裂,他在訪談中也再次強調這一點。
陳駿同時提到 OpenAI 在「推理」上的押注。他說,當初公司內部曾有人懷疑 o1 專案的前景,後來在 Jakub Pachocki、Ilya Sutskever 以及少數幾位核心成員的推動下才持續往前走。
現在,他預期模型將能承擔長達數週的研究任務,產出能超越人類專家盲點的構想與成果。
他表示,OpenAI 的路線圖大約是三年期,終點是能從最初構想到最後成果,都由模型端對端處理的研究流程。
延伸閱讀: BitMine 在拋售潮中逆勢而行,豪押 4,300 萬美元買進以太幣,策略引發關注
為何「vibe 研究員」這個概念重要
陳駿提出一個引人注意的說法:vibe 研究員。
在他描繪的未來裡,最頂尖的研究者將不再親自撰寫每一行程式碼,而是指揮與引導負責執行與排程的模型。人類的工作會收斂到兩件事:提出犀利的問題,以及判斷一個答案是否真正「有品味」。
這個願景本身並不穩固,陳駿也並沒有假裝它已經站得十分穩當。
他在受訪時警告,正出現一場「評估危機」:許多團隊一味追逐基準測試分數,卻沒有帶來實質進步,他將這種行為稱為 benchmaxxing。舊的測試基準已經被模型「打滿分」,而新的測試一旦公開,很快也會失去鑑別力與參考價值。
持續學習仍然是更棘手的缺口。陳駿稱之為這個領域仍未解鎖的一項基本能力,儘管他也指出,已經有許多研究正針對這個問題發力。
如果這樣的發展軌跡能夠持續,他認為,人類最稀缺的資源將從「原始智力」轉向「判斷力與真實生活經驗」。
陳駿其實已經多次提出類似的觀點。在 GPT-4.5 發布前後,他曾主張擴展範式仍可延續下去,並且長期以來他也堅稱沒有證據顯示擴展定律已經失效。





