Mark Chen de OpenAI dice que la IA que lleva a cabo su propia investigación está cada vez más cerca

El director de investigación de OpenAI, Mark Chen, afirmó que la empresa está cerca de lograr modelos de IA capaces de llevar a cabo su propia investigación, lo que sitúa la inteligencia artificial general cada vez más al alcance.

Puntos clave:

Chen sostuvo que las leyes de escalado siguen vigentes, con el preentrenamiento y las cadenas de razonamiento más largas aún impulsando el progreso hacia la AGI.

Señaló que los modelos capaces de realizar investigación autosostenida están cerca, un cambio que redefiniría lo que hacen los investigadores humanos.

Chen mencionó una crisis de evaluación cada vez más profunda y el aprendizaje continuo aún sin resolver como los mayores obstáculos del campo.

Chen traza el camino hacia la AGI

Chen expuso sus ideas en una entrevista reciente en un pódcast, donde cocinó frente a la cámara mientras explicaba la estrategia de investigación de OpenAI.

Rebatió la afirmación de que el escalado se ha estancado. Dijo que ese argumento reaparece cada vez que el campo se topa con un nuevo cuello de botella.

La compañía se sitúa en una curva exponencial que se ha mantenido a lo largo de casi 10 órdenes de magnitud, y hay pocos indicios de que vaya a romperse, aseguró.

Chen también señaló la apuesta de OpenAI por el razonamiento. Comentó que, al principio, algunos escépticos dentro de la empresa cuestionaron el proyecto o1 antes de que Jakub Pachocki, Ilya Sutskever y unos pocos más lo impulsaran.

Ahora espera que los modelos asuman tareas de investigación que se extienden durante semanas, generando ideas que vayan más allá de los puntos ciegos de los expertos humanos.

Indicó que la hoja de ruta de OpenAI abarca tres años y culmina con modelos que gestionen la investigación de extremo a extremo, desde la primera idea hasta el resultado final.

También lee: BitMine desafía la caída con una apuesta de 43 millones de dólares en Ethereum; su estrategia titubea

Por qué importa la idea del investigador del “vibe”

Chen lanzó un término que llamó la atención: el investigador del vibe.

En ese futuro, dijo a los oyentes, los mejores investigadores dejan de escribir cada línea de código y, en su lugar, dirigen modelos que se encargan de la ejecución y la planificación. El trabajo humano se reduce a dos tareas: plantear preguntas precisas y juzgar si una respuesta tiene un “buen gusto” real.

Esa visión se sostiene sobre bases inestables, y Chen no pretende lo contrario.

Advirtió sobre una crisis de evaluación, describiendo equipos que persiguen puntuaciones en benchmarks sin ganancias reales, un hábito al que llama benchmaxxing. Las pruebas antiguas están ya saturadas y las nuevas pierden valor casi en cuanto se hacen públicas.

El aprendizaje continuo sigue siendo la brecha más difícil. Chen lo calificó como una capacidad básica que el campo aún debe desbloquear, aunque señaló que muchos esfuerzos ya se dirigen a ese problema.

Si esa trayectoria se mantiene, sugirió Chen, el recurso humano más escaso pasará de ser la inteligencia en bruto al juicio y la experiencia vivida.

Chen ya ha defendido versiones de este argumento antes. En torno al lanzamiento de GPT‑4.5 sostuvo que el paradigma de escalado podría seguir adelante, y desde hace tiempo insiste en que no hay pruebas de que las leyes de escalado hayan muerto.

Lee a continuación: CZ dice que Binance estuvo a días de conseguir la aprobación MiCA antes de que interviniera la política