OpenAI-Chief-Research-Officer Mark Chen sagte, das Unternehmen stehe kurz vor KI-Modellen, die ihre eigene Forschung durchführen können, wodurch künstliche allgemeine Intelligenz deutlich in greifbarere Nähe rücke.
Zentrale Punkte:
- Chen argumentierte, dass Skalierungsgesetze weiterhin gelten und dass Pretraining sowie längere Reasoning-Ketten den Fortschritt in Richtung AGI vorantreiben.
- Er sagte, Modelle, die selbsttragende Forschung betreiben können, stünden kurz bevor – ein Wandel, der die Arbeit menschlicher Forschender grundlegend verändern würde.
- Chen nannte eine sich verschärfende Evaluationskrise und das ungelöste kontinuierliche Lernen als die größten Hürden des Feldes.
Chen skizziert den Weg zu AGI
Chen legte seine Gedanken in einem kürzlichen Podcast-Interview dar, in dem er vor der Kamera kochte und zugleich OpenAIs Forschungsstrategie erklärte.
Er widersprach der Behauptung, die Skalierung sei zum Stillstand gekommen. Dieses Argument tauche, sagte er, immer dann wieder auf, wenn das Feld auf einen neuen Engpass stößt.
Das Unternehmen bewege sich auf einer exponentiellen Kurve, die sich über nahezu 10 Größenordnungen erstrecke, und wenig deute darauf hin, dass sie brechen werde, wie er behauptete.
Chen verwies außerdem auf OpenAIs Wette auf Reasoning. Er sagte, frühe Skeptiker im Unternehmen hätten das o1-Projekt infrage gestellt, bevor Jakub Pachocki, Ilya Sutskever und einige andere es vorangetrieben hätten.
Nun rechne er damit, dass Modelle Forschungstätigkeiten übernehmen, die sich über Wochen hinziehen und Ideen hervorbringen, die über die blinden Flecken menschlicher Expertinnen und Experten hinausgehen.
OpenAIs Roadmap sei auf drei Jahre angelegt, sagte er, und ende mit Modellen, die Forschung End‑to‑End abdecken – von der ersten Idee bis zum fertigen Ergebnis.
Außerdem lesen: BitMine trotzt dem Ausverkauf mit einer 43-Millionen-Dollar-Ethereum-Wette, Strategie wankt
Warum die Idee des „Vibe-Researchers“ wichtig ist
Chen brachte einen Begriff ins Spiel, der Aufmerksamkeit erregte: den Vibe-Researcher.
In dieser Zukunft, sagte er den Zuhörenden, schreiben die besten Forschenden nicht mehr jede Codezeile selbst, sondern steuern Modelle, die Ausführung und Planung übernehmen. Menschliche Arbeit verenge sich auf zwei Aufgaben: scharfe Fragen zu stellen und zu beurteilen, ob eine Antwort wirkliche „Taste“ besitzt.
Diese Vision steht auf wackligem Fundament, und Chen gibt das offen zu.
Er warnte vor einer Evaluationskrise und beschrieb Teams, die Benchmarks hinterherjagen, ohne echte Fortschritte zu erzielen – eine Gewohnheit, die er „Benchmaxxing“ nennt. Ältere Tests seien inzwischen gesättigt, und neue verlören fast sofort an Aussagekraft, sobald sie öffentlich werden.
Kontinuierliches Lernen bleibe die schwierigere Lücke. Chen nannte es eine grundlegende Fähigkeit, die das Feld noch entschlüsseln müsse, auch wenn bereits viele Bemühungen das Problem ins Visier nähmen.
Wenn dieser Bogen sich fortsetze, deutete Chen an, werde die knappste menschliche Ressource sich von roher Intelligenz hin zu Urteilsvermögen und gelebter Erfahrung verschieben.
Chen hat diese Argumentationslinie bereits früher vertreten. Rund um den GPT‑4.5‑Launch argumentierte er, dass das Skalierungsparadigma weitergehen könne, und er hat seit Langem darauf bestanden, dass es keinen Beleg dafür gebe, dass Skalierungsgesetze tot seien.
Als Nächstes lesen: CZ sagt, Binance stand kurz vor der MiCA-Genehmigung, bevor die Politik eingriff





