El director de investigación de OpenAI, Mark Chen, afirmó que la empresa está cerca de modelos de IA capaces de realizar su propia investigación, situando la inteligencia artificial general cada vez más al alcance.
Puntos clave:
- Chen sostuvo que las leyes de escalado siguen vigentes, con el preentrenamiento y cadenas de razonamiento más largas aún impulsando el progreso hacia la AGI.
- Dijo que los modelos capaces de investigación autosostenida están cerca, un cambio que redefiniría el trabajo de los investigadores humanos.
- Chen señaló una crisis de evaluación cada vez más profunda y el aprendizaje continuo aún sin resolver como los mayores obstáculos del campo.
Chen traza el camino hacia la AGI
Chen expuso su forma de pensar en una reciente entrevista en pódcast, donde cocinó ante la cámara mientras explicaba la estrategia de investigación de OpenAI.
Rebatió la afirmación de que el escalado se ha estancado. Dijo que ese argumento reaparece cada vez que el campo se topa con un nuevo cuello de botella.
La compañía se encuentra en una curva exponencial que se ha mantenido a lo largo de casi 10 órdenes de magnitud, y hay pocos indicios de que vaya a romperse, afirmó.
Chen también señaló la apuesta de OpenAI por el razonamiento. Dijo que, al principio, algunos escépticos dentro de la empresa cuestionaban el proyecto o1 antes de que Jakub Pachocki, Ilya Sutskever y unos pocos más lo impulsaran.
Ahora espera que los modelos asuman tareas de investigación que se extiendan durante semanas, produciendo ideas que superen los puntos ciegos de los expertos humanos.
Indicó que la hoja de ruta de OpenAI abarca tres años y culmina con modelos capaces de gestionar la investigación de extremo a extremo, desde la primera idea hasta el resultado final.
También lee: BitMine desafía la venta con una apuesta de 43 M$ en Ethereum, estrategia bajo presión
Por qué importa la idea del investigador del “vibe”
Chen lanzó un término que llamó la atención: el investigador del vibe.
En ese futuro, dijo a la audiencia, los mejores investigadores dejan de escribir cada línea de código y, en cambio, dirigen modelos que se encargan de la ejecución y la planificación. El trabajo humano se reduce a dos tareas: formular preguntas incisivas y juzgar si una respuesta tiene verdadero criterio.
Esa visión se apoya en bases inestables, y Chen no pretende lo contrario.
Advirtió de una crisis de evaluación, describiendo equipos que persiguen puntuaciones en benchmarks sin ganancias reales, un hábito que él denomina benchmaxxing. Las pruebas antiguas están ahora saturadas y las nuevas pierden valor casi en cuanto se hacen públicas.
El aprendizaje continuo sigue siendo la brecha más difícil. Chen lo calificó como una capacidad básica que el campo aún debe desbloquear, aunque señaló que muchos esfuerzos ya apuntan al problema.
Si ese arco se mantiene, sugirió Chen, el recurso humano más escaso se desplaza de la inteligencia bruta hacia el juicio y la experiencia vivida.
Chen ya ha defendido versiones de este argumento antes. En torno al lanzamiento de GPT-4.5 sostuvo que el paradigma del escalado podía seguir adelante, y desde hace tiempo insiste en que no hay pruebas de que las leyes de escalado hayan muerto.
Lee a continuación: CZ dice que Binance estaba a días de la aprobación MiCA antes de que interviniera la política





