OpenAIのマーク・チェン氏、自律的に研究を行うAIが実現間近だと語る

OpenAIのチーフリサーチオフィサーであるマーク・チェン氏は、自ら研究を遂行できるAIモデルの実現が近づいており、汎用人工知能（AGI）がこれまで以上に手の届くところに来ていると述べた。

主なポイント

チェン氏は、スケーリング則はいまだ有効であり、事前学習とより長い推論チェーンが AGIへの進歩を引き続き牽引していると主張した。

自律的に研究を継続できるモデルの実現は近く、それが人間研究者の役割を一変させるだろうと語った。

評価（エバリュエーション）危機の深刻化と、未解決の継続学習を、この分野における最大の障害として挙げた。

チェン氏が描くAGIまでの道筋

チェン氏は最近のポッドキャストインタビューで自身の考えを語った。その中で、OpenAIの研究戦略を説明しながら、カメラの前で料理を cooked して見せた。

同氏は「スケーリングは行き詰まった」という主張に反論した。そうした議論は、分野が新たなボトルネックに突き当たるたびに繰り返し浮上してくるものだと述べた。

会社はほぼ10桁にわたって成立してきた指数関数的なカーブの上におり、それが崩れる兆候はほとんどないと、彼はそうclaimed している。

またチェン氏は、OpenAIが推論能力に大きく賭けていることにも言及した。社内では当初、Jakub Pachocki、Ilya Sutskever氏ら一部のメンバーが推し進めるまで、o1プロジェクトに懐疑的な声もあったという。

現在、同氏は、モデルが数週間にわたる研究タスクを担い、人間の専門家の盲点を超えるアイデアを生み出すようになると見込んでいる。

OpenAIのロードマップは約3年先まで描かれており、最初のアイデア出しから成果物の完成まで、研究プロセスを端から端までモデルが処理できる状態を最終的な姿としていると示唆した。

「バイブ研究者」というアイデアが重要な理由

チェン氏は「バイブ研究者（vibe researcher）」という、注目を集めた表現を持ち出した。

そのような未来では、最高の研究者はもはやコードの一行一行を書くのではなく、実行やスケジューリングを担うモデルを操縦する役割になると、彼はリスナーに語った。人間の仕事は鋭い問いを立てることと、その答えに本物の「センス」や「味わい」があるかを見極めることという、二つのタスクに絞られていく。

このビジョンは不確かな前提に立っており、その点についてチェン氏は目をつぶっているわけではない。

彼は、チームが実質的な進歩のないままベンチマークスコアを追いかける「benchmaxxing（ベンチマックス）」と呼ぶ習慣を、評価危機として warned した。従来のテストはすでに飽和状態にあり、新しいテストも公開されるとほとんどすぐに価値を失ってしまうと述べた。

継続学習は、さらに難しいギャップとして残っている。チェン氏はこれを、分野としてまだ解き明かさなければならない基本的な能力だと呼び、多くの取り組みがすでにこの問題を狙っているとも語った。

もしこの軌道が続くなら、最も希少な人間の資源は、生の知能から判断力と実体験へとシフトしていくとチェン氏は示唆した。

チェン氏はこれに近い主張を以前から繰り返している。 GPT-4.5のローンチ前後には、スケーリングパラダイムはまだ継続可能だとargued し、スケーリング則が死んだという証拠はないと長年 insisted してきた。

次に読む: CZ Says Binance Was Days From MiCA Approval Before Politics Hit

OpenAIのマーク・チェン氏、 自律的に研究を行うAIが実現間近だと語る

主なポイント

チェン氏が描くAGIまでの道筋

「バイブ研究者」というアイデアが重要な理由

OpenAIのマーク・チェン氏、自律的に研究を行うAIが実現間近だと語る