Zwei der leistungsfähigsten KI‑Labs Chinas haben ihre Modellpreise diese Woche auf einen Bruchteil der westlichen Konkurrenz gesenkt, während OpenAI und Anthropic in die entgegengesetzte Richtung gingen.
Wichtigste Punkte:
- DeepSeek machte seinen 75‑prozentigen V4‑Pro‑Rabatt am 22. Mai dauerhaft und fixierte die Ausgaben bei 0,87 US‑Dollar pro Million Tokens.
- Xiaomi senkte am 26. Mai die Preise für MiMo‑V2.5 um bis zu 99 %, mit zwischengespeicherten Pro‑Eingaben ab 0,0036 US‑Dollar pro Million Tokens.
- OpenAI hob die Ausgabekosten von GPT‑5.5 auf 30 US‑Dollar pro Million Tokens an und vergrößerte damit die Lücke zu chinesischen Spitzenmodellen.
DeepSeek, Xiaomi senken die Tarife
DeepSeek bestätigte am 22. Mai, dass ein vorübergehender Rabatt von 75 % auf sein V4‑Pro‑Modell dauerhaft werde und die Ausgabekosten auf 0,87 US‑Dollar pro Million Tokens sowie die Eingabekosten auf 0,435 US‑Dollar festlege.
Die Aktion hätte ursprünglich am 31. Mai auslaufen sollen.
Wenige Tage später senkte das chinesische Schwester‑Lab Xiaomi die MiMo‑V2.5‑Tarife für zwischengespeicherte Eingaben ab dem 27. Mai um bis zu 99 %, wobei Cache‑Treffer der Pro‑Stufe nur noch 0,0036 US‑Dollar pro Million Tokens kosten.
Im Gegensatz dazu verdoppelte GPT‑5.5 von OpenAI die Ausgaberate seines Vorgängers auf 30 US‑Dollar pro Million Tokens. Claude Opus 4.7 von Anthropic listet 5 US‑Dollar für Eingaben und 25 US‑Dollar für Ausgaben.
Auch lesenswert: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release
Ingenieure verteidigen die Kalkulation
Xiaomi hat seine Token‑Pläne ebenfalls neu aufgebaut. Der 100‑US‑Dollar‑Max‑Plan gewährt jetzt 82 Milliarden Tokens statt zuvor 1,6 Milliarden; für das gleiche Geld erhalten Kunden damit fünf‑ bis achtmal so viel Nutzung wie vorher.
Fuli Luo, der Xiaomis MiMo‑Team leitet und einst beim Aufbau von DeepSeek‑V2 mitwirkte, führte die Kürzungen auf eine intelligentere Methode zurück, bereits verarbeitete Daten zu speichern und wiederzuverwenden.
Dieser Ansatz reduziert den Rechenbedarf deutlich.
Luo argumentierte, dass das Lab zu den neuen Tarifen nahezu mit voller Auslastung laufen und dennoch seine Kosten decken könne. Das deutet darauf hin, dass die Preisgestaltung auf echten Effizienzgewinnen beruht und nicht auf einer verlustreichen Lockaktion.
Die Einsparungen sind besonders wichtig für Produktivlasten, die denselben Kontext immer wieder verwenden. Agenten‑Pipelines mit stabilen Prompts, Dokumentenprozessoren und Retrieval‑Tools greifen ständig auf den Cache zu, sodass günstigere zwischengespeicherte Eingaben die laufende Rechnung direkt drücken.
Westliche Labs stehen vor einem anderen Dilemma. OpenAIs Schwenk hin zu Verbraucherfunktionen und Werbung deutet darauf hin, dass Token‑Umsätze allein die Bewertung des Unternehmens möglicherweise nicht tragen.
Warum die Lücke immer größer wird
DeepSeek und Xiaomi haben diesen Wettbewerb nicht eröffnet. Chinesische Modelle unterboten amerikanische Konkurrenten bereits, bevor eine der beiden Ankündigungen kam.
MiniMax M2.7 läuft mit 0,30 US‑Dollar für Eingaben und 1,20 US‑Dollar für Ausgaben pro Million Tokens. Kimi K2.5 von Moonshot AI liegt bei 0,60 US‑Dollar und 2,50 US‑Dollar.
Analysten, die Kosten mit Benchmark‑Leistung vergleichen, beziffern die Preis‑zu‑Qualität‑Lücke zwischen chinesischen und amerikanischen Spitzenmodellen im zweiten Quartal 2026 auf grob das 15‑ bis 30‑Fache – noch bevor Cache‑Rabatte einfließen. Die Kürzungen dieser Woche vergrößern diesen Abstand weiter für die repetitiven Arbeitslasten, die reale Einsätze dominieren.
Das Muster erinnert an Anfang 2025, als DeepSeeks günstige Veröffentlichungen die Märkte erschütterten und westliche Anbieter zwangen, ihre Preisgestaltung zu verteidigen. Ein Jahr später hat sich der Druck nur verstärkt – und die Reaktion amerikanischer Labs bestand eher darin, Preise zu halten oder zu erhöhen, statt dem Preisverfall hinterherzulaufen.
Als Nächstes lesen: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply





