OpenAIs Mark Chen sagt, dass KI, die ihre eigene Forschung betreibt, bald Realität wird

OpenAI-Forschungschef Mark Chen sagte, das Unternehmen stehe kurz davor, KI-Modelle zu entwickeln, die ihre eigene Forschung durchführen können – und damit komme künstliche allgemeine Intelligenz deutlich in Reichweite.

Zentrale Punkte:

Chen argumentierte, dass Skalierungsgesetze weiterhin gelten und dass Vortraining und längere Reasoning-Ketten den Fortschritt in Richtung AGI vorantreiben.

Er sagte, Modelle, die selbsttragende Forschung betreiben können, seien nahe, was die Rolle menschlicher Forschender grundlegend verändern würde.

Chen nannte eine sich verschärfende Evaluationskrise und ungelöstes kontinuierliches Lernen als die größten Hürden des Feldes.

Chen skizziert den Weg zur AGI

Chen legte seine Sichtweise in einem aktuellen Podcast-Interview dar, in dem er vor der Kamera kochte, während er OpenAIs Forschungsstrategie erklärte.

Er widersprach der Behauptung, dass die Skalierung ins Stocken geraten sei. Dieses Argument tauche, so sagte er, immer dann wieder auf, wenn das Feld an eine neue Engstelle gerät.

Das Unternehmen bewege sich auf einer exponentiellen Kurve, die sich über fast zehn Größenordnungen gehalten habe, und wenig deute darauf hin, dass sie brechen werde, wie er behauptete.

Chen verwies außerdem auf OpenAIs Einsatz für Reasoning. Er sagte, frühe Zweifler im Unternehmen hätten das o1-Projekt infrage gestellt, bevor Jakub Pachocki, Ilya Sutskever und einige andere es vorantrieben.

Nun erwartet er, dass Modelle Forschungsvorhaben übernehmen, die sich über Wochen erstrecken, und dabei Ideen hervorbringen, die über die blinden Flecken menschlicher Expertinnen und Experten hinausgehen.

OpenAIs Fahrplan umfasst drei Jahre, sagte er, und endet mit Modellen, die Forschung von Anfang bis Ende übernehmen – von der ersten Idee bis zum fertigen Ergebnis.

Auch lesen: BitMine trotzt dem Ausverkauf mit einer Ethereum-Wette über 43 Mio. $, Strategie gerät ins Wanken

Warum die Idee der „Vibe-Forscherin“ wichtig ist

Chen prägte einen Begriff, der Aufmerksamkeit erregte: die Vibe-Forscherin bzw. der Vibe-Forscher.

In dieser Zukunft, erklärte er den Zuhörerinnen und Zuhörern, schreiben die besten Forschenden nicht mehr jede einzelne Codezeile selbst, sondern steuern Modelle, die Ausführung und Planung übernehmen. Menschliche Arbeit verengt sich auf zwei Aufgaben: scharfe Fragen stellen und beurteilen, ob eine Antwort wirklich Geschmack und Substanz hat.

Diese Vision steht auf wackligem Boden, und Chen gibt das offen zu.

Er warnte vor einer Evaluationskrise und beschrieb Teams, die Benchmarks hinterherjagen, ohne echte Fortschritte zu erzielen – eine Angewohnheit, die er „benchmaxxing“ nennt. Ältere Tests seien inzwischen gesättigt, und neue verlören fast sofort an Aussagekraft, sobald sie öffentlich werden.

Kontinuierliches Lernen bleibt die schwierigere Lücke. Chen nannte es eine grundlegende Fähigkeit, die das Feld erst noch freischalten müsse, auch wenn er sagte, dass bereits viele Ansätze dieses Problem anvisieren.

Wenn dieser Bogen hält, so Chen, verschiebe sich die knappste menschliche Ressource von reiner Intelligenz hin zu Urteilskraft und gelebter Erfahrung.

Chen hat Varianten dieses Arguments bereits früher vorgebracht. Rund um den Start von GPT-4.5 argumentierte er, dass das Skalierungsparadigma weitergehen könne, und er hat lange darauf bestanden, dass es keine Hinweise darauf gebe, dass Skalierungsgesetze tot seien.

Als Nächstes lesen: CZ sagt, Binance stand Tage vor der MiCA-Genehmigung, bevor die Politik eingriff