Головний директор з досліджень OpenAI Марк Чен заявив, що компанія наближається до створення моделей ШІ, які можуть проводити власні дослідження, роблячи штучний загальний інтелект дедалі досяжнішим.
Ключові тези:
- Чен стверджує, що закони масштабування залишаються чинними, а попереднє навчання та довші ланцюжки міркувань і далі рухають прогрес до AGI.
- За його словами, моделі, здатні до самопідтримуваних досліджень, уже близько, і це змінить роль людських дослідників.
- Чен назвав поглиблення кризи оцінювання та нерозв’язану проблему безперервного навчання найсерйознішими перешкодами для галузі.
Як Чен окреслює шлях до AGI
Чен виклав свій погляд у недавньому інтерв’ю подкасту, де він готував їжу в кадрі, пояснюючи дослідницьку стратегію OpenAI.
Він заперечив твердження, що масштабування зупинилося. За його словами, ця теза з’являється щоразу, коли галузь стикається з новим «вузьким місцем».
Компанія рухається по експоненційній кривій, що зберігається майже на 10 порядків величини, і мало що вказує на те, що вона зламається, він заявив.
Чен також звернув увагу на ставку OpenAI на міркування. Він сказав, що на початку всередині компанії були скептики щодо проєкту o1, перш ніж Якуб Пахоцький, Ілля Суцкевер і ще кілька людей просунули його вперед.
Тепер він очікує, що моделі братимуть на себе дослідницькі завдання, які тривають тижнями, генеруючи ідеї, що виходять за межі сліпих зон людських експертів.
За його словами, дорожня карта OpenAI розрахована на три роки й завершується моделями, які беруть на себе дослідження від початкової ідеї до готового результату.
Також читайте: BitMine протистоїть розпродажу зі ставкою $43 млн на Ethereum, стратегія блимає
Чому важлива ідея «дослідника вайбу»
Чен запропонував термін, який привернув увагу, — «vibe researcher» (дослідник вайбу).
У такому майбутньому, пояснив він слухачам, найкращі дослідники перестають писати кожен рядок коду й натомість спрямовують моделі, що відповідають за виконання та планування. Людська робота звужується до двох завдань: ставити гострі запитання й оцінювати, чи має відповідь справжній «смак».
Це бачення тримається на хиткому ґрунті, і Чен не робить вигляду, що це не так.
Він попередив про кризу оцінювання, описавши команди, які ганяються за балами в бенчмарках без реальних досягнень — звичку, яку він називає benchmaxxing. Старі тести вже «насичені», а нові втрачають цінність майже одразу після публікації.
Проблема безперервного навчання залишається ще складнішою прогалиною. Чен назвав її базовою здатністю, яку галузь усе ще має відкрити, хоча, за його словами, чимало зусиль уже спрямовано на цю проблему.
Якщо ця дуга збережеться, припустив Чен, найдефіцитнішим людським ресурсом стане не «сирий» інтелект, а судження та життєвий досвід.
Чен уже висловлював подібну позицію раніше. Під час запуску GPT-4.5 він стверджував, що парадигма масштабування може й далі працювати, і давно наполягав, що немає доказів «смерті» законів масштабування.
Читайте далі: CZ каже, що Binance була за кілька днів до схвалення MiCA, перш ніж втрутилася політика





