OpenAIのチーフリサーチオフィサーであるマーク・チェン氏は、自ら研究を遂行できるAIモデルの実現が近づいており、汎用人工知能(AGI)がこれまで以上に手の届く範囲に入ってきていると述べた。
主なポイント
- チェン氏は、事前学習と長い推論チェーンが依然としてAGIへの進歩を牽引しており、スケーリング則は有効だと主張した。
- 自律的に研究を継続できるモデルの登場が間近に迫っており、それによって人間の研究者の役割は大きく変わると述べた。
- さらに、評価の危機の深刻化と継続学習が未解決であることを、分野における最大の障害として挙げた。
チェン氏が描くAGIへの道筋
チェン氏は最近のポッドキャストインタビューで、自ら料理をしながらOpenAIの研究戦略を説明し、その考えを語った(cooked)。
彼は「スケーリングが頭打ちになった」という主張に反論した。こうした議論は、分野が新たなボトルネックに突き当たるたびに再燃する、と彼は述べている。
同社は、ほぼ10桁にわたって成り立ってきた指数関数的なカーブの上に乗っており、それが崩れる兆候はほとんどないと、彼はclaimedしている。
またチェン氏は、推論能力へのOpenAIの賭けにも言及した。社内では当初、Jakub Pachocki氏やIlya Sutskever氏ら少数のメンバーが推し進めたo1プロジェクトに懐疑的な声もあったという。
現在の彼は、モデルが数週間にわたる研究タスクを引き受け、人間の専門家の盲点を超えるアイデアを生み出すようになると見込んでいる。
OpenAIのロードマップは3年スパンだとし、その終着点として、着想から最終成果物まで、研究プロセス全体をモデルが担う姿を描いている。
関連記事: BitMine Defies The Selloff With A $43M Ethereum Bet, Strategy Blinks
なぜ「バイブ・リサーチャー」という発想が重要なのか
チェン氏は「バイブ・リサーチャー(vibe researcher)」という注目を集める言葉を提示した。
そうした未来では、優れた研究者はもはやすべてのコード行を書かず、実行やスケジューリングを担うモデルを舵取りする存在になると、彼はリスナーに語った。人間の仕事は鋭い問いを立てることと、その答えに本物の「センス」や「味」があるかを見極めることの二つに絞られていく。
ただし、このビジョンは脆い前提の上に成り立っており、チェン氏自身もそれを否定していない。
彼はwarnedとして評価危機に言及し、実質的な進歩を伴わないままベンチマークスコアだけを追いかけるチームを「benchmaxxing」と呼んで批判した。古いテストはすでに飽和しており、新しいテストも公開されるやいなやすぐに価値を失っていくという。
継続学習は、さらに難しいギャップとして残っている。チェン氏は、これは分野がまだ解き明かせていない基本能力だとしつつ、多くの取り組みがすでにこの問題を標的にしているとも述べた。
もしその軌道が続くのであれば、人間にとって最も希少なリソースは、「生の知能」から「判断力」と「実体験」へと移っていくと、チェン氏は示唆した。
チェン氏は、こうした主張を以前から繰り返してきた。GPT-4.5のローンチ前後には、スケーリングパラダイムはまだ継続し得るとarguedし、また長年にわたり、スケーリング則が死んだことを示す証拠はないとinsistedしてきた。
次に読む: CZ Says Binance Was Days From MiCA Approval Before Politics Hit





