Ein chinesisches Open-Weight-Modell GLM-5.2 gehört nun zu den drei stärksten Systemen weltweit und verringert den Vorsprung von Anthropics Claude Mythos und OpenAIs ChatGPT – bei einem Bruchteil der Kosten.
Wichtigste Punkte:
- GLM-5.2 zählt in unabhängigen Benchmarks zu den drei besten großen Sprachmodellen weltweit.
- Das Open-Weight-System läuft für bis zu ein Zehntel der Kosten führender US-Modelle.
- Die Veröffentlichung erfolgte wenige Tage, nachdem Washington Anthropic zwang, seine Mythos- und Fable-Systeme offline zu nehmen.
GLM-5.2 stößt in die globale Spitzengruppe vor
Z.ai, der Pekinger Entwickler, der früher als Zhipu AI bekannt war, veröffentlichte GLM-5.2 Mitte Juni – nur wenige Tage, nachdem die US-Regierung Anthropic anordnete, seine beiden leistungsstärksten Systeme abzuschalten. Unabhängige Tester von Artificial Analysis stuften das Open-Weight-Modell weltweit auf Platz drei in einem Benchmark für reale, wirtschaftlich wertvolle Arbeit ein – hinter zwei Anthropic-Systemen und vor allen Modellen von OpenAI und Google.
Das Ergebnis schockierte Ingenieure, die darauf gewettet hatten, dass Chip-Beschränkungen die Lücke vergrößern und nicht schließen würden – selbst während Mythos und Fable eingefroren blieben.
Die Preisdifferenz ist ebenso auffällig. GLM-5.2 wird berechnet mit rund 1,40 US‑Dollar pro einer Million Eingabetokens, verglichen mit etwa 15 US‑Dollar für Claude Opus 4.8. Außerdem kann jeder das Modell herunterladen, modifizieren und auf eigener Hardware betreiben – mit einem Kontextfenster von einer Million Tokens für lange, mehrstufige Aufgaben.
Diese Offenheit, mehr noch als pure Rechenleistung, überzeugt inzwischen Entwickler im Silicon Valley, die amerikanische Systeme früher als einzige ernsthafte Option für Produktions-Workloads betrachtet hatten.
Auch lesenswert: Bitcoin fällt unter 59.000 US‑Dollar, da Fed-Zinsängste an den Kryptomarkt zurückkehren
Frontier-Lücke schrumpft, während Kosten einbrechen
Für Unternehmen, die ihre KI-Rechnungen kürzen, sind die Einsparungen schwer zu ignorieren.
Ein Team, das nahe 10.000 US‑Dollar pro Monat für ein geschlossenes System zahlt, kann vergleichbare Arbeit oft für einen Bruchteil dieser Summe mit dem chinesischen Modell erledigen. Es läuft auf inländischen Chips, seit das Unternehmen seine Software anpasste, nachdem die jüngsten Beschränkungen den Zugang zu Top-Hardware von Nvidia gekappt hatten.
Z.ais Gründer Tang Jie hat der Behauptung widersprochen, echte Parität sei noch ein Jahr entfernt, und beharrt darauf, dass der Moment deutlich früher kommen werde. Elon Musk, der sich in derselben öffentlichen Debatte äußerte, datierte sie auf Anfang nächsten Jahres und warnte, dass Benchmark-Siege sich nicht immer in alltägliche Nützlichkeit übersetzen.
Echte Hürden bleiben. Die schwierigsten Reasoning-Tests bevorzugen weiterhin US-Labore, und US-Unternehmen haben chinesische Konkurrenten beschuldigt, Zehntausende Fake-Accounts und fast 29 Millionen Anfragen genutzt zu haben, um Modellantworten zu ernten und günstigere Imitationen zu trainieren.
Manche Entwickler zögern außerdem, sensible Daten über Server in China zu leiten.
Chinas Aufstieg baut sich schon länger auf. Vor rund 18 Monaten schockte DeepSeek das Silicon Valley, indem es US-Systeme zu einem Bruchteil der Kosten erreichte. Seitdem haben offene Modelle aus dem Land die freien Veröffentlichungen von Google und Meta überholt und damit den Boden für diesen jüngsten Sprung an die Frontier bereitet.
Als Nächstes lesen: AAVE übertrifft Bitcoin, während das DeFi-Lending-Narrativ zurückkehrt





