Neues chinesisches KI‑Modell GLM‑5.2 schlägt alle ChatGPT‑Modelle, liegt nur hinter Claude Fable von Anthropic zurück

Ein chinesisches Open-Weight-Modell GLM-5.2 gehört jetzt zu den drei stärksten Systemen weltweit und verringert den Vorsprung von Anthropics Claude Mythos und OpenAIs ChatGPT – bei nur einem Bruchteil der Kosten.

Zentrale Punkte:

GLM-5.2 gehört laut unabhängigen Benchmarks zu den drei besten großen Sprachmodellen weltweit.

Das Open-Weight-System läuft für bis zu ein Zehntel der Kosten führender US‑Modelle.

Die Veröffentlichung erfolgte wenige Tage, nachdem Washington Anthropic zwang, seine Systeme Mythos und Fable vom Netz zu nehmen.

GLM-5.2 stößt in die globale Spitzengruppe vor

Z.ai, der Pekinger Entwickler, früher bekannt als Zhipu AI, hat Mitte Juni GLM-5.2 veröffentlicht – nur wenige Tage, nachdem die US‑Regierung Anthropic anwies, seine beiden leistungsstärksten Systeme abzuschalten. Unabhängige Tester von Artificial Analysis stuften das Open-Weight-Modell weltweit auf Platz drei in einem Benchmark für reale, wirtschaftlich wertvolle Arbeit ein, hinter zwei Anthropic‑Systemen und vor allen Modellen von OpenAI und Google.

Das Ergebnis schockierte Ingenieure, die darauf gewettet hatten, dass Chip‑Beschränkungen die Lücke vergrößern, nicht schließen würden – selbst während Mythos und Fable eingefroren blieben.

Auch der Preisunterschied ist bemerkenswert. GLM-5.2 ist auf etwa 1,40 US‑Dollar pro eine Million Eingabetokens bepreist, gegenüber rund 15 US‑Dollar für Claude Opus 4.8. Jeder kann das Modell herunterladen, modifizieren und auf eigener Hardware betreiben, mit einem Fenster von einer Million Tokens, das für lange, mehrstufige Aufgaben ausgelegt ist.

Diese Offenheit – mehr noch als die reine Rechenleistung – überzeugt Entwickler im gesamten Silicon Valley, die US‑Systeme bislang als einzige ernstzunehmende Option für Produktivumgebungen betrachteten.

Auch lesenswert: Bitcoin fällt unter 59.000 US‑Dollar, da Fed‑Zinsängste in den Kryptomarkt zurückkehren

Frontier-Lücke schrumpft, während die Kosten einbrechen

Für Unternehmen, die ihre KI‑Rechnungen senken wollen, sind die Einsparungen schwer zu ignorieren.

Ein Team, das fast 10.000 US‑Dollar im Monat für ein geschlossenes System zahlt, kann vergleichbare Aufgaben auf dem chinesischen Modell oft für einen Bruchteil der Kosten erledigen. Es läuft auf heimischen Chips, da das Unternehmen seine Software anpasste, nachdem die jüngsten Beschränkungen den Zugang zu Spitzen‑Hardware von Nvidia gekappt hatten.

Z.ais Gründer Tang Jie hat der Behauptung widersprochen, echte Parität sei noch ein Jahr entfernt, und darauf bestanden, dass dieser Moment deutlich früher eintreffen werde. Elon Musk schätzte im selben öffentlichen Austausch den Zeitpunkt auf Anfang nächsten Jahres und mahnte, dass Benchmark‑Siege sich nicht immer direkt in alltagstauglichen Nutzen übersetzen.

Reale Hürden bleiben bestehen. Die schwierigsten Reasoning‑Tests sprechen weiterhin für US‑Labore, und US‑Firmen haben chinesische Rivalen beschuldigt, Zehntausende Fake‑Konten und fast 29 Millionen Anfragen genutzt zu haben, um Modellausgaben zu sammeln und günstigere Nachbildungen zu trainieren.

Manche Entwickler zögern zudem, sensible Daten über Server in China zu leiten.

Chinas Aufstieg baut sich schon seit einiger Zeit auf. Vor rund 18 Monaten schockte DeepSeek das Silicon Valley, indem es US‑Systeme zu einem Bruchteil der Kosten erreichte, und offene Modelle aus dem Land haben seither die kostenlosen Veröffentlichungen von Google und Meta überholt – der Boden für diesen neuesten Sprung an die Grenze des Machbaren.

Als Nächstes lesen: AAVE übertrifft Bitcoin, da die DeFi‑Lending‑Erzählung zurückkehrt