Mark Chen, directeur de la recherche (Chief Research Officer) chez OpenAI, a déclaré que l’entreprise se rapproche de modèles d’IA capables de mener leurs propres recherches, rapprochant encore un peu plus l’intelligence artificielle générale de notre portée.
Points clés :
- Chen a soutenu que les lois de mise à l’échelle restent valides, le pré-entraînement et l’allongement des chaînes de raisonnement continuant de porter les progrès vers l’AGI.
- Il a affirmé que les modèles capables de recherches auto-entretenues sont proches, un changement qui transformerait le rôle des chercheurs humains.
- Chen a désigné comme plus grands obstacles du domaine une crise d’évaluation croissante et l’apprentissage continu encore non résolu.
Chen trace la voie vers l’AGI
Chen a exposé sa réflexion dans un récent entretien de podcast, où il cuisinait devant la caméra tout en expliquant la stratégie de recherche d’OpenAI.
Il a repoussé l’idée que la mise à l’échelle se serait essoufflée. Cet argument réapparaît, a-t-il dit, chaque fois que le domaine rencontre un nouveau goulot d’étranglement.
L’entreprise évolue sur une courbe exponentielle qui s’est vérifiée sur près de 10 ordres de grandeur, et peu de choses suggèrent qu’elle va se briser, a-t-il affirmé.
Chen a également mis en avant le pari d’OpenAI sur le raisonnement. Il a expliqué que, au début, des sceptiques en interne doutaient du projet o1, avant que Jakub Pachocki, Ilya Sutskever et quelques autres ne le fassent avancer.
Il s’attend désormais à ce que les modèles prennent en charge des tâches de recherche qui s’étalent sur des semaines, produisant des idées allant au‑delà des angles morts des experts humains.
La feuille de route d’OpenAI s’étend sur trois ans, a-t-il indiqué, pour aboutir à des modèles qui gèrent la recherche de bout en bout, de la première idée au résultat final.
À lire aussi : BitMine défie la vente massive avec un pari Ethereum de 43 M$, la stratégie vacille
Pourquoi l’idée de « vibe researcher » compte
Chen a lancé un terme qui a attiré l’attention : le « vibe researcher ».
Dans ce futur, a-t-il expliqué aux auditeurs, les meilleurs chercheurs cessent d’écrire chaque ligne de code et se contentent d’orienter des modèles qui prennent en charge l’exécution et la planification. Le travail humain se réduit à deux tâches : poser des questions aiguës et juger si une réponse a une véritable « saveur ».
Cette vision repose sur des bases fragiles, et Chen ne prétend pas le contraire.
Il a mis en garde contre une crise de l’évaluation, décrivant des équipes qui poursuivent les scores de benchmarks sans gains réels, une habitude qu’il appelle « benchmaxxing ». Les anciens tests sont désormais saturés, et les nouveaux perdent presque toute valeur dès qu’ils sont rendus publics.
L’apprentissage continu reste la lacune la plus difficile. Chen l’a qualifié de capacité de base que le domaine doit encore débloquer, tout en affirmant que de nombreux travaux ciblent déjà ce problème.
Si cette trajectoire se confirme, a suggéré Chen, la ressource humaine la plus rare se déplacera de l’intelligence brute vers le jugement et l’expérience vécue.
Chen a déjà défendu des versions de cet argument. Autour du lancement de GPT‑4.5, il a soutenu que le paradigme de la mise à l’échelle pouvait continuer, et il affirme depuis longtemps qu’il n’existe aucune preuve que les lois de mise à l’échelle soient mortes.
À lire ensuite : CZ affirme que Binance était à quelques jours de l’approbation MiCA avant que la politique ne s’en mêle





