Mark Chen, da OpenAI, diz que IA que conduz sua própria pesquisa está chegando perto

Mark Chen, diretor de pesquisa (Chief Research Officer) da OpenAI, disse que a empresa está se aproximando de modelos de IA capazes de conduzir suas próprias pesquisas, colocando a inteligência artificial geral cada vez mais ao alcance.

Principais pontos:

Chen argumentou que as leis de escalonamento continuam válidas, com o pré-treinamento e cadeias de raciocínio mais longas ainda impulsionando o avanço rumo à AGI.

Ele disse que modelos capazes de pesquisa autossustentável estão próximos, uma mudança que remodelaria o trabalho dos pesquisadores humanos.

Chen apontou um aprofundamento da crise de avaliação e o aprendizado contínuo ainda não resolvido como os maiores obstáculos da área.

Chen traça o caminho até a AGI

Chen expôs suas ideias em uma recente entrevista em podcast, na qual ele cozinhou diante das câmeras enquanto explicava a estratégia de pesquisa da OpenAI.

Ele rebateu a alegação de que o escalonamento teria estagnado. Segundo ele, esse argumento reaparece sempre que o campo encontra um novo gargalo.

A empresa está em uma curva exponencial que se manteve por quase 10 ordens de magnitude, e há poucos indícios de que ela vá se quebrar, ele afirmou.

Chen também destacou a aposta da OpenAI em raciocínio. Ele disse que, no início, céticos dentro da empresa questionaram o projeto o1, antes que Jakub Pachocki, Ilya Sutskever e alguns outros o impulsionassem.

Agora ele espera que os modelos assumam tarefas de pesquisa que se estendam por semanas, produzindo ideias que ultrapassem os pontos cegos de especialistas humanos.

O roteiro da OpenAI tem horizonte de três anos, segundo ele, terminando em modelos que cuidam da pesquisa de ponta a ponta, da primeira ideia ao resultado final.

Veja também: BitMine desafia a queda com aposta de US$ 43 milhões em Ethereum, estratégia pisca

Por que a ideia do pesquisador de vibe importa

Chen apresentou um termo que chamou atenção: o pesquisador de vibe.

Nesse futuro, disse ele aos ouvintes, os melhores pesquisadores deixam de escrever cada linha de código e passam a orientar modelos que cuidam da execução e do agendamento. O trabalho humano se estreita a duas tarefas: fazer perguntas afiadas e julgar se uma resposta tem “sabor” verdadeiro.

Essa visão se apoia em terreno instável, e Chen não finge o contrário.

Ele alertou para uma crise de avaliação, descrevendo equipes que correm atrás de pontuações em benchmarks sem ganhos reais, um hábito que ele chama de benchmaxxing. Testes antigos já estão saturados, e testes novos perdem valor quase assim que se tornam públicos.

O aprendizado contínuo continua sendo a lacuna mais difícil. Chen o chamou de uma capacidade básica que a área ainda precisa destravar, embora diga que muitos esforços já atacam o problema.

Se essa trajetória se mantiver, sugeriu Chen, o recurso humano mais escasso deixará de ser a inteligência bruta e passará a ser o julgamento e a experiência vivida.

Chen já apresentou variações desse argumento antes. Por volta do lançamento do GPT-4.5 ele defendeu que o paradigma de escalonamento pode continuar, e há muito tempo insiste que não há evidências de que as leis de escalonamento estejam mortas.

Leia a seguir: CZ diz que Binance estava a dias da aprovação da MiCA antes de a política interferir