OpenAI 首席科学家陈马克称：能自行开展研究的 AI 即将到来

OpenAI 首席科学家（Chief Research Officer）**陈马克（Mark Chen）**表示，公司正接近能够自行开展研究的 AI 模型，使通用人工智能（AGI）变得愈发触手可及。

要点概览：

陈称规模定律依然有效，预训练与更长的推理链仍在推动 AGI 方向的进展。

他表示，具备自我维持研究能力的模型已近在眼前，这一转变将重塑人类研究者的角色。

陈指出，日益加剧的评估危机和尚未解决的持续学习问题，是当前领域面临的最大障碍。

陈在最近的一期播客采访中详细阐述了自己的观点，他一边在镜头前做饭，一边讲解 OpenAI 的研究战略。

他反驳了“扩展已停滞”的说法。陈表示，每当行业遇到新的瓶颈，这种论调就会再次浮现。

他称，公司一直沿着一条跨越近 10 个数量级的指数曲线前进，目前几乎没有迹象表明这条曲线会断裂，他在此处表示了这一观点。

陈还提到了 OpenAI 在“推理”上的押注。他说，公司内部早期曾有人怀疑 o1 项目，直到 Jakub Pachocki、Ilya Sutskever 和少数几位同事将其推进。

如今，他预计模型将能够承担跨度数周的研究任务，产出能超越人类专家盲区的创意。

他表示，OpenAI 制定的路线图跨度约三年，终点是能够从最初想法一直到最终成果，全流程完成研究工作的模型。

陈提出了一个引人注意的概念——“氛围研究员”（vibe researcher）。

在他设想的未来，最优秀的研究者不再亲自写每一行代码，而是转而驾驭负责执行和排程的模型。人类工作被收缩为两项核心任务：提出尖锐的问题，以及判断一个答案是否真正有“品味”。

陈承认，这一愿景的基础并不牢固，他也从未试图掩饰这一点。

他在一次访谈中警告，目前正出现评估危机：不少团队一味追逐基准分数，却没有真正的能力提升，他将这种做法称为“benchmaxxing”。旧的测试集已经被“刷爆”，而新的测试一公开就迅速贬值。

持续学习依然是更难跨越的鸿沟。陈称其为整个领域尚未解锁的一项基础能力，尽管他也指出，已经有许多工作在正面对这一问题。

如果这条演化轨迹能够延续，陈认为，人类最稀缺的资源将从“原始智力”转向“判断力与真实经历”。

陈此前多次提出类似主张。在 GPT‑4.5 发布前后，他曾表示，扩展范式仍可继续向前推进；他也长期坚持认为，没有证据显示规模定律已经失效。