一项新的 OpenAI 研究发现,其 Codex 智能体如今生成了公司员工 99.8% 的输出 Token,这表明自主 AI 在工作场景中已经超越了聊天机器人。
要点摘要:
- 在 OpenAI 员工中,Codex 贡献了 99.8% 的输出 Token,而在外部机构中为 63.3%,在个人用户中为 16.5%。
- 自 2025 年 8 月以来,非开发者用户的使用量在个人中增长了 137 倍,在机构中增长了 189 倍。
- 四分之一的个人用户现在会把预计需要超过 8 小时人力的任务交给智能体处理。
Codex 在内部超越 ChatGPT
来自 OpenAI、哥伦比亚商学院、沃顿商学院和杜克大学的研究人员于 6 月 25 日发表了这篇论文,基于个人订阅者、外部机构以及公司自家员工的使用数据。该研究迅速传播,因为它基于真实行为变化而非预测,给“智能体接管”的热炒话题提供了量化依据。
论文将两种使用模式区分开来:把聊天视为对话,而将 Codex 视为可检查文件和运行命令的“被委派行动”的执行者。
在 OpenAI 内部,Codex 在很大程度上取代了 ChatGPT 的业务用途。在 6 月 11 日之前的一周中,大约 60.3% 的 Codex 会话调用了外部工具,而聊天机器人这一比例仅为 21.9%。在公司之外,这种差距依旧明显:Codex 在机构场景中占据了 63.3% 的输出 Token,但在个人用户中仅为 16.5%。
相关阅读:比特币稳守 6.2 万美元,HYPE 与 ADA 点燃周末加密货币反弹
非开发者成为增长主力
增长最为迅猛的是工程领域之外的员工,以前这些岗位的使用几乎为零。自 2025 年 8 月以来的 10 个月里,非开发者的采用率在个人用户中攀升了 137 倍,在机构中则提升了 189 倍。公司内部的法务、财务和招聘团队在 2026 年 4 月前后就已实现 Codex 的多数占比使用,只是比率先采用的工程师晚了几个月,但最终追随了早期模式。
随着扩散,任务复杂度也同步上升。将预计需要超过 8 小时人力投入的任务交给智能体处理的个人用户占比,从 2025 年 12 月的 2.1% 上升到 25.6%,而如今大多数用户至少会把相当于半小时工作量的任务委托给智能体。
每周有超过十分之一的用户会同时运行三个或更多智能体。
代理型 AI 重绘工作版图
随着这种转变,生产力也水涨船高:自 2025 年 11 月以来,OpenAI 员工的中位输出在各岗位上至少提升了 10 倍;其中律师为 13 倍,研究人员则超过 50 倍。
作者提醒称,OpenAI 对智能体来说是一个“异常友好”的环境:培训深入、资源充足且几乎没有成本限制,因此这些数字可能高估了典型企业的情况。即便如此,他们仍然认为,这种内部转向预示了更广泛采用的方向——人类的价值正逐渐集中到设定任务、核查输出以及同时驾驭多个智能体上。
OpenAI 于 2025 年 4 月发布 Codex 时,将其定位为面向软件开发者的窄用途工具。此后数月里,ChatGPT 仍是公司的默认产品,直到工程师们逐渐转向这个智能体。到 2026 年上半年结束时,Codex 的周活跃用户数增长了五倍以上,周活超越 500 万。





