OpenAI директор по исследованиям Марк Чен заявил, что компания приближается к моделям ИИ, которые смогут проводить собственные исследования, делая искусственный общий интеллект значительно более достижимым.
Ключевые моменты:
- Чен утверждает, что законы масштабирования по‑прежнему работают: предобучение и более длинные цепочки рассуждений продолжают двигать прогресс к AGI.
- По его словам, модели, способные к самоподдерживающимся исследованиям, уже близки — это изменит роль человеческих исследователей.
- Чен назвал углубляющийся кризис оценок и нерешённое непрерывное обучение главными препятствиями для области.
Как Чен видит путь к AGI
Чен изложил свои взгляды в недавнем подкаст-интервью, где он готовил на камеру и параллельно объяснял исследовательскую стратегию OpenAI.
Он отверг тезис о том, что масштабирование застопорилось. По его словам, этот аргумент всплывает каждый раз, когда область упирается в новый «бутылочный горлышко».
Компания движется по экспоненциальной кривой, которая сохраняется почти на десять порядков величины, и мало что указывает на то, что она сломается, как он заявил.
Чен также указал на ставку OpenAI на рассуждения. Он рассказал, что внутри компании поначалу сомневались в проекте o1, прежде чем Якуб Пахоцкий, Илья Суцкевер и ещё несколько человек протолкнули его вперёд.
Теперь он ожидает, что модели будут брать на себя исследовательские задачи, растянутые на недели, порождая идеи, выходящие за пределы слепых зон человеческих экспертов.
По его словам, дорожная карта OpenAI охватывает три года и завершается моделями, которые ведут исследования от начала до конца — от первой идеи до готового результата.
Также читайте: BitMine противостоит распродаже со ставкой $43M на Ethereum, стратегия моргает
Почему важна идея «vibe‑исследователя»
Чен предложил термин, который привлёк внимание, — vibe‑исследователь.
В таком будущем, пояснил он слушателям, лучшие исследователи перестают писать каждую строку кода и вместо этого направляют модели, которые берут на себя исполнение и планирование. Человеческая работа сужается до двух задач: задавать острые вопросы и оценивать, обладает ли ответ настоящим «вкусом».
Это видение стоит на шатком основании, и Чен этого не скрывает.
Он предупредил о кризисе оценок, описав команды, которые гонятся за результатами бенчмарков без реального прогресса, — привычку, которую он называет benchmaxxing. Старые тесты уже «перенасыщены», а новые практически теряют ценность сразу после публикации.
Непрерывное обучение остаётся более трудным пробелом. Чен назвал его базовой способностью, которую области ещё предстоит открыть, хотя, по его словам, уже многие усилия направлены на решение этой задачи.
Если эта дуга сохранится, предположил Чен, самый дефицитный человеческий ресурс сместится от «сырого» интеллекта к суждению и жизненному опыту.
Чен уже высказывал похожие тезисы и раньше. Вокруг запуска GPT‑4.5 он утверждал, что парадигма масштабирования может продолжать работать, и давно настаивает, что нет доказательств «смерти» законов масштабирования.
Читайте далее: CZ говорит, что Binance была в нескольких днях от одобрения MiCA, прежде чем вмешалась политика





