OpenAI 首席研究長 Mark Chen 表示,公司正接近能自行進行研究的 AI 模型,讓人工通用智慧(AGI)變得愈來愈觸手可及。
重點整理:
- Chen 主張擴展定律依然有效,預訓練與更長的推理鏈仍在推動 AGI 的進展。
- 他表示,具備自我維持研究能力的模型已經很接近,這將徹底改變人類研究者的工作內容。
- Chen 點出評估危機加劇,以及持續學習尚未解決,是整個領域面臨的最大障礙。
Chen 勾勒 AGI 的路線圖
Chen 在最近的一次 podcast 訪談中闡述了他的想法,他一邊在鏡頭前下廚,一邊說明 OpenAI 的研究策略。
他反駁了「擴展已停滯」的說法。他表示,每當這個領域遇到新的瓶頸時,這種論點就會再度浮現。
他聲稱,公司正處在一條跨越近 10 個數量級、始終成立的指數曲線上,而幾乎沒有跡象顯示這條曲線會失效。
Chen 也提到 OpenAI 在推理上的賭注。他說,公司內部早期曾有人質疑 o1 專案,後來在 Jakub Pachocki、Ilya Sutskever 等少數人推動下才得以前進。
現在,他預期模型將能承擔長達數週的研究任務,產出能超越人類專家盲點的點子。
他表示,OpenAI 的路線圖長度約三年,最終將實現能從最初構想到完成成果、全程包辦研究工作的模型。
延伸閱讀: BitMine 在拋售潮中逆勢押注 4,300 萬美元以太幣,策略搖擺
為什麼「vibe 研究員」概念重要
Chen 提出了一個引人注意的詞:vibe 研究員。
在那樣的未來,他對聽眾說,最頂尖的研究員將不再親自寫下每一行程式碼,而是指揮能處理執行與排程的模型。人類工作將聚焦在兩件事:提出犀利的問題,以及判斷一個答案是否真正「有品味」。
這個願景的根基並不穩固,Chen 也不諱言這一點。
他警告正出現評估危機:團隊追逐基準測試分數,卻沒有實質突破,他把這種習性稱為 benchmaxxing。舊的測試已被模型「打滿分」,而新的測試一公開價值就迅速下降。
持續學習則是更棘手的缺口。Chen 認為這是一項領域仍未解鎖的基本能力,儘管他也表示已有許多研究嘗試瞄準這個問題。
若這條曲線能持續,Chen 推測,最稀缺的人類資源將從「原始智力」轉移到「判斷力與生活經驗」。
Chen 先前也多次提出類似論點。在 GPT-4.5 發佈前後,他主張擴展範式仍可繼續推進,也長期堅稱沒有證據顯示擴展定律已經失效。





