Codex 是否刚刚在 OpenAI 内部工作流中取代了 ChatGPT？

一项新的 OpenAI 研究发现，其 Codex 代理现在生成了公司员工 99.8% 的输出令牌，这表明在工作场景中，自主式 AI 已经超越聊天机器人。

要点概览：

在 OpenAI 员工中，Codex 产生了 99.8% 的输出令牌；在外部机构中为 63.3%，在个人用户中为 16.5%。

自 2025 年 8 月以来，非开发者的使用量在个人用户中增长了 137 倍，在机构中增长了 189 倍。

现在有四分之一的个人用户会委托预估需要超过 8 小时人类劳动的任务。

Codex 在内部超越 ChatGPT

来自 OpenAI、哥伦比亚商学院、沃顿商学院和杜克大学的研究人员在 6 月 25 日发表了这篇论文，数据覆盖个人订阅用户、外部机构以及公司内部员工。该研究迅速传播，因为它依据的是可测量的行为变化，而非预测炒作中的远景。

论文将两种使用模式区分开来：把聊天视为对话，而把 Codex 视为可检查文件并运行命令的“被委派行动”。

在 OpenAI 内部，Codex 在商业应用上已基本取代 ChatGPT。在 6 月 11 日之前的一周中，大约 60.3% 的 Codex 会话调用了外部工具，而聊天机器人的这一比例为 21.9%。在公司外部，这种差异仍然明显：Codex 在机构中占据了 63.3% 的输出令牌，而在个人用户中仅为 16.5%。

延伸阅读：比特币守住 6.2 万美元，HYPE 和 ADA 点燃周末加密市场反弹

非开发者推动了这波爆发式增长

增长最猛烈的是远离工程岗位的职能，以前这些岗位的使用率几乎为零。自 2025 年 8 月起的十个月内，非开发者的采用率在个人用户中攀升了 137 倍，在机构中攀升了 189 倍。公司内部的法务、财务和招聘团队在 2026 年 4 月前后也实现了 Codex 使用占多数，只是比最先行动、并树立早期范式的工程师们晚了几个月。

随着扩散，任务复杂度也同步上升。个人用户交给代理处理、预估需要超过 8 小时人类投入的工作比例，从 2025 年 12 月的 2.1%升至 25.6%，而现在大多数人至少会委托价值半小时以上的工作。

超过十分之一的用户每周会同时运行三个或更多代理。

代理式 AI 重绘工作版图

随着这一变化，生产力显著提升：自 2025 年 11 月以来，OpenAI 员工的人均中位输出在各个岗位至少增长了十倍；其中律师达到 13 倍，研究人员则超过 50 倍。

作者也提醒，OpenAI 是一个对代理极为友好的环境：培训充分且几乎不受成本限制，因此这些数字会高估典型公司的情况。即便如此，他们认为，这一内部转向预示了更广泛采用的方向——人类价值正转移到设定任务、核查输出以及同时驾驭多个代理上。

OpenAI 于 2025 年 4 月推出 Codex，最初是为软件开发者窄向打造的工具。ChatGPT 在之后数月仍是公司的默认选择，直到工程师们逐渐转向该代理；到 2026 年上半年结束时，Codex 的周活跃用户增长超过五倍，每周超过 500 万人使用。

下篇阅读：Claude Fable 5 代码更新暴露的是路由问题，而非模型退化