OpenAI 首席科学家(Chief Research Officer)**陈默(Mark Chen)**表示,公司正接近能够自主开展研究的 AI 模型,通用人工智能的实现愈发近在咫尺。
要点概览:
- 陈默认为,扩展定律依然有效,预训练和更长的推理链仍在推动 AGI 的进展。
- 他称,具备自我维持研究能力的模型已经临近,这一转变将重塑人类研究人员的工作方式。
- 他指出,日益加深的评测危机与尚未解决的持续学习问题,是当前领域面临的最大障碍。
陈默描绘的 AGI 路线图
陈默在最近的一期播客访谈中详细阐述了自己的思路,他一边在镜头前做饭,一边讲解 OpenAI 的研究战略。
他反驳了“扩展已陷入停滞”的说法。每当行业遭遇新的瓶颈,这种论调就会再次浮现,他说道。
他表示,公司所处的扩展曲线在近 10 个数量级范围内始终呈指数增长,目前几乎没有迹象表明这条曲线会被打破,他在访谈中声称如此。
陈默还提到了 OpenAI 在“推理”上的押注。他说,在 Jakub Pachocki、Ilya Sutskever 以及少数几人的推动下,o1 项目才得以顶住公司内部早期的质疑继续向前。
现在,他预计模型将能够承担持续数周的研究任务,产出能够突破人类专家盲区的想法。
他透露,OpenAI 目前的路线图跨度约三年,终点是能从第一个想法一直做到最终结果、端到端完成整个研究流程的模型。
延伸阅读:BitMine 在抛售潮中逆势押注 4300 万美元以太坊,其策略现隐忧
“氛围研究员”概念为何重要
陈默提出了一个引人关注的术语——“氛围研究员”(vibe researcher)。
在他描绘的未来里,顶尖研究人员不再亲自写每一行代码,而是负责操控那些负责执行与调度的模型。人类的工作被压缩为两件事:提出足够尖锐的问题,以及判断一个答案是否真正“有味道”。
他也承认,这一愿景的基础并不牢靠。
他在一次访谈中警告,当前正陷入评测危机:团队一味追逐基准分数,却未带来真实进展,他把这种习惯称为“benchmaxxing”。旧的测试已经被模型“打满分”,而新的测试一旦公开,很快也会失去参考价值。
持续学习仍然是更难跨越的鸿沟。陈默把它称作“这个领域尚未解锁的一项基础能力”,尽管他也表示,已经有许多工作在瞄准这一问题。
如果这条发展弧线能够成立,陈默认为,人类最稀缺的资源将从“原始智力”转向“判断力与真实的生活经验”。
过去他也多次表达过类似观点。在 GPT‑4.5 发布前后,他曾主张,扩展范式仍可继续推进;他也长期坚持认为,没有证据表明扩展定律已经失效。





