Марк Чен з OpenAI каже, що ШІ, здатний проводити власні дослідження, уже близько

Головний директор з досліджень OpenAI Марк Чен заявив, що компанія наближається до моделей ШІ, які зможуть проводити власні дослідження, що робить штучний загальний інтелект дедалі досяжнішим.

Ключові моменти:

Чен стверджує, що закони масштабування й досі працюють, а попереднє навчання та довші ланцюжки міркувань і надалі просувають розвиток до AGI.

За його словами, моделі, здатні до самопідтримуваних досліджень, уже близько — це зрушення, яке змінить роль людських дослідників.

Чен назвав поглиблення кризи оцінювання та невирішену проблему безперервного навчання найбільшими перешкодами в галузі.

Як Чен окреслює шлях до AGI

Чен виклав свої міркування в недавньому подкаст-інтерв’ю, де він готував наживо під час пояснення дослідницької стратегії OpenAI.

Він заперечив твердження, що масштабування зайшло в глухий кут. За його словами, ця думка з’являється щоразу, коли галузь натрапляє на нове «вузьке місце».

Компанія рухається по експоненціальній кривій, яка тримається майже на десять порядків, і мало що вказує на те, що вона зламається, він заявив.

Чен також звернув увагу на ставку OpenAI на міркування. Він сказав, що ранні скептики всередині компанії ставили під сумнів проєкт o1, перш ніж Якуб Пахоцький, Ілля Суцкевер та ще кілька людей просунули його вперед.

Тепер він очікує, що моделі братимуться за дослідницькі завдання, які тривають тижнями, генеруючи ідеї, що виходять за межі сліпих зон людських експертів.

Дорожня карта OpenAI, за його словами, розрахована на три роки й завершується моделями, які здатні виконувати дослідження «під ключ» — від першої ідеї до готового результату.

Також читайте: BitMine протистоїть розпродажу зі ставкою $43 млн на Ethereum, стратегія дає збій

Чому ідея «дослідника вайбу» має значення

Чен запропонував термін, який привернув увагу, — «дослідник вайбу».

У такому майбутньому, розповів він слухачам, найкращі дослідники перестають писати кожен рядок коду й натомість спрямовують моделі, які відповідають за виконання та планування. Людська робота звужується до двох завдань: ставити гострі запитання й оцінювати, чи має відповідь справжній «смак».

Це бачення стоїть на хиткому підґрунті, і Чен не робить вигляду, що це не так.

Він попередив про кризу оцінювання, описуючи команди, які ганяються за балами в бенчмарках без реального прогресу — звичку, яку він називає benchmaxxing. Старі тести вже насичені, а нові втрачають цінність майже відразу після публікації.

Безперервне навчання залишається складнішим розривом. Чен назвав його базовою здатністю, яку галузь ще має розкрити, хоча, за його словами, багато зусиль уже спрямовані саме на цю проблему.

Якщо така траєкторія збережеться, припустив Чен, найдефіцитнішим людським ресурсом стане не «сирий» інтелект, а судження та життєвий досвід.

Чен уже не вперше висуває подібні аргументи. Під час запуску GPT-4.5 він стверджував, що парадигма масштабування може й надалі працювати, і давно наполягав, що немає доказів «смерті» законів масштабування.

Читайте далі: CZ каже, що Binance була за крок від схвалення MiCA, перш ніж втрутилася політика