Mark Chen z OpenAI twierdzi, że AI prowadząca własne badania jest już blisko

Mark Chen, Chief Research Officer w OpenAI, powiedział, że firma jest blisko stworzenia modeli AI, które będą w stanie prowadzić własne badania, co uczyni sztuczną inteligencję ogólną (AGI) znacznie bardziej osiągalną.

Kluczowe punkty:

Chen argumentował, że prawa skalowania wciąż działają, a pretrenowanie i dłuższe łańcuchy rozumowania nadal napędzają postęp w kierunku AGI.

Powiedział, że modele zdolne do samopodtrzymujących się badań są blisko, co byłoby zmianą, która przeobrazi rolę ludzkich badaczy.

Jako największe przeszkody w dziedzinie Chen wskazał pogłębiający się kryzys ewaluacji oraz wciąż nierozwiązaną kwestię uczenia ciągłego.

Chen wytycza drogę do AGI

Chen przedstawił swoje przemyślenia w niedawnym podcaście, w którym gotował na wizji, jednocześnie wyjaśniając strategię badawczą OpenAI.

Odrzucił twierdzenie, że skalowanie utknęło w martwym punkcie. Jak powiedział, ten argument wraca za każdym razem, gdy dziedzina napotyka nową barierę.

Firma porusza się po krzywej wykładniczej, która utrzymuje się na przestrzeni niemal 10 rzędów wielkości, i niewiele wskazuje na to, by miała się załamać, jak stwierdził.

Chen zwrócił też uwagę na zakład OpenAI na rozumowanie. Powiedział, że wewnętrzni sceptycy kwestionowali na początku projekt o1, zanim Jakub Pachocki, Ilya Sutskever i kilka innych osób popchnęli go do przodu.

Teraz oczekuje, że modele przejmą zadania badawcze trwające tygodniami, generując pomysły wykraczające poza ślepe punkty ludzkich ekspertów.

Jak wskazał, mapa drogowa OpenAI sięga trzech lat i kończy się modelami, które obsługują badania od początku do końca – od pierwszego pomysłu po gotowy rezultat.

Przeczytaj także: BitMine przeciwstawia się wyprzedaży, stawiając 43 mln USD na Ethereum, strategia mruga

Dlaczego pomysł „badacza od vibe’ów” ma znaczenie

Chen wprowadził określenie, które przyciągnęło uwagę: badacz od vibe’ów.

W takiej przyszłości, jak powiedział słuchaczom, najlepsi badacze przestają pisać każdą linię kodu, a zamiast tego sterują modelami, które zajmują się wykonaniem i planowaniem. Ludzka praca zawęża się do dwóch zadań: zadawania ostrych pytań i oceniania, czy odpowiedź ma prawdziwy „smak”.

Ta wizja opiera się na kruchych założeniach i Chen tego nie ukrywa.

Ostrzegał przed kryzysem ewaluacji, opisując zespoły ścigające się o wyniki w benchmarkach bez realnych postępów – nawyk, który nazywa „benchmaxxingiem”. Starsze testy są dziś nasycone, a nowe tracą wartość niemal natychmiast po upublicznieniu.

Uczenie ciągłe pozostaje trudniejszą luką. Chen nazwał je podstawową umiejętnością, którą dziedzina musi dopiero odblokować, choć – jak dodał – wiele prac już celuje w ten problem.

Jeśli ten łuk się utrzyma, zasugerował Chen, najrzadszym ludzkim zasobem stanie się nie surowa inteligencja, ale osąd i przeżyte doświadczenie.

Chen przedstawiał już podobne argumenty wcześniej. Około premiery GPT-4.5 twierdził, że paradygmat skalowania może trwać dalej i od dawna utrzymuje, że nie ma dowodów na „śmierć” praw skalowania.

Następnie przeczytaj: CZ mówi, że Binance była o dni od uzyskania zgody MiCA, zanim uderzyła polityka