Mark Chen, diretor de pesquisa (Chief Research Officer) da OpenAI, disse que a empresa está se aproximando de modelos de IA capazes de conduzir suas próprias pesquisas, colocando a inteligência artificial geral cada vez mais ao alcance.
Pontos‑chave:
- Chen argumentou que as leis de escala continuam válidas, com o pré‑treinamento e cadeias de raciocínio mais longas ainda impulsionando o progresso rumo à AGI.
- Ele disse que modelos capazes de pesquisa autossustentável estão próximos, uma mudança que redefiniria o trabalho dos pesquisadores humanos.
- Chen apontou uma crise de avaliação crescente e o aprendizado contínuo não resolvido como os maiores obstáculos da área.
Chen traça o caminho para a AGI
Chen expôs seu raciocínio em uma entrevista recente em podcast, na qual ele cozinhou diante das câmeras enquanto explicava a estratégia de pesquisa da OpenAI.
Ele rebateu a alegação de que o escalonamento teria estagnado. Segundo ele, esse argumento reaparece sempre que o campo encontra um novo gargalo.
A empresa está em uma curva exponencial que se mantém por quase 10 ordens de grandeza, e há pouco indício de que ela vá se romper, ele afirmou.
Chen também destacou a aposta da OpenAI em raciocínio. Ele disse que céticos dentro da própria empresa questionaram o projeto o1 antes que Jakub Pachocki, Ilya Sutskever e alguns outros o impulsionassem adiante.
Agora ele espera que modelos assumam tarefas de pesquisa que se estendam por semanas, produzindo ideias que ultrapassem os pontos cegos de especialistas humanos.
O roteiro da OpenAI cobre três anos, indicou ele, culminando em modelos que cuidam da pesquisa de ponta a ponta, da primeira ideia ao resultado final.
Leia também: BitMine desafia a liquidação com aposta de US$ 43 milhões em Ethereum, estratégia pisca
Por que a ideia do pesquisador de vibe importa
Chen apresentou um termo que chamou atenção: o pesquisador de vibe.
Nesse futuro, contou aos ouvintes, os melhores pesquisadores deixam de escrever cada linha de código e passam a conduzir modelos que cuidam da execução e do agendamento. O trabalho humano se estreita a duas tarefas: fazer perguntas afiadas e julgar se uma resposta tem “sabor” real.
Essa visão se apoia em bases frágeis, e Chen não finge o contrário.
Ele alertou para uma crise de avaliação, descrevendo equipes que perseguem pontuações em benchmarks sem ganhos reais, hábito que ele chama de benchmaxxing. Testes antigos agora estão saturados, e novos perdem valor quase assim que se tornam públicos.
O aprendizado contínuo continua sendo a lacuna mais difícil. Chen o chamou de capacidade básica que o campo ainda precisa destravar, embora ele diga que muitos esforços já atacam o problema.
Se esse arco se mantiver, sugeriu Chen, o recurso humano mais escasso deixará de ser inteligência bruta e passará a ser julgamento e experiência de vida.
Chen já defendeu versões desse argumento antes. Por volta do lançamento do GPT‑4.5, ele argumentou que o paradigma de escalonamento poderia continuar, e há muito tempo ele insiste que não há evidências de que as leis de escala tenham morrido.
Leia a seguir: CZ diz que Binance estava a dias de conseguir aprovação do MiCA antes de a política interferir





