OpenAI Chief Research Officer Mark Chen powiedział, że firma zbliża się do modeli AI, które potrafią prowadzić własne badania, co stawia ogólną sztuczną inteligencję coraz bardziej w zasięgu.
Kluczowe punkty:
- Chen argumentował, że prawa skalowania nadal obowiązują, a pretrenowanie i dłuższe łańcuchy rozumowania wciąż napędzają postęp w kierunku AGI.
- Powiedział, że modele zdolne do samodzielnego, podtrzymywanego badania są blisko, co byłoby zmianą, która przeobrazi rolę ludzkich naukowców.
- Chen wskazał pogłębiający się kryzys ewaluacji i nierozwiązane uczenie ciągłe jako największe przeszkody w tej dziedzinie.
Chen kreśli ścieżkę do AGI
Chen przedstawił swoje myślenie w niedawnym podcaście, w którym gotował przed kamerą, wyjaśniając strategię badawczą OpenAI.
Odrzucił twierdzenia, że skalowanie utknęło w martwym punkcie. Jak powiedział, ten argument wraca za każdym razem, gdy dziedzina napotyka nową barierę.
Firma porusza się po krzywej wykładniczej, która utrzymuje się przez niemal 10 rzędów wielkości, i niewiele wskazuje, że miałaby się załamać, jak twierdził.
Chen wskazał też na zakład OpenAI dotyczący rozumowania. Powiedział, że wewnętrzni sceptycy na początku kwestionowali projekt o1, zanim Jakub Pachocki, Ilya Sutskever i kilka innych osób popchnęli go do przodu.
Teraz oczekuje, że modele zaczną podejmować zadania badawcze trwające tygodniami, generując pomysły wykraczające poza ślepe punkty ludzkich ekspertów.
Jak zaznaczył, mapa drogowa OpenAI obejmuje trzy lata i kończy się na modelach, które obsługują badania od początku do końca – od pierwszego pomysłu po gotowy wynik.
Przeczytaj także: BitMine przeciwstawia się wyprzedaży, stawiając 43 mln dolarów na Ethereum, strategia mruga
Dlaczego pomysł „vibe researchera” ma znaczenie
Chen zaproponował termin, który przyciągnął uwagę: vibe researcher.
W tej przyszłości, jak powiedział słuchaczom, najlepsi badacze przestają pisać każdą linię kodu i zamiast tego sterują modelami, które zajmują się wykonaniem i harmonogramowaniem. Ludzka praca zawęża się do dwóch zadań: zadawania ostrych pytań i oceniania, czy odpowiedź ma prawdziwy „smak”.
Ta wizja opiera się na kruchych podstawach i Chen nie udaje, że jest inaczej.
Ostrzegł przed kryzysem ewaluacji, opisując zespoły, które gonią za wynikami benchmarków bez realnych postępów – nawyk, który nazywa benchmaxxingiem. Starsze testy są dziś nasycone, a nowe tracą wartość niemal natychmiast po upublicznieniu.
Uczenie ciągłe pozostaje trudniejszą luką. Chen nazwał je podstawową zdolnością, którą dziedzina wciąż musi odblokować, choć zaznaczył, że wiele wysiłków jest już na to ukierunkowanych.
Jeśli ten łuk się utrzyma, zasugerował Chen, najrzadszym zasobem ludzkim stanie się nie surowa inteligencja, lecz osąd i doświadczenie życiowe.
Chen podobne argumenty przedstawiał już wcześniej. W okolicach premiery GPT-4.5 twierdził, że paradygmat skalowania może trwać dalej, i od dawna utrzymuje, że nie ma dowodów na to, by prawa skalowania przestały działać.
Następnie przeczytaj: CZ mówi, że Binance była o krok od zatwierdzenia MiCA, zanim uderzyła polityka





