Zwei der leistungsfähigsten KI‑Labs Chinas haben diese Woche ihre Modellpreise auf einen Bruchteil der westlichen Konkurrenz gesenkt, während OpenAI und Anthropic in die entgegengesetzte Richtung gingen.
Zentrale Punkte:
- DeepSeek machte seinen 75‑%‑Rabatt auf V4‑Pro am 22. Mai dauerhaft und fixierte die Ausgabekosten bei 0,87 US‑Dollar pro Million Token.
- Xiaomi senkte am 26. Mai die MiMo‑V2.5‑Preise um bis zu 99 %, mit zwischengespeicherten Pro‑Eingaben ab 0,0036 US‑Dollar pro Million Token.
- OpenAI hob die GPT‑5.5‑Ausgabekosten auf 30 US‑Dollar pro Million Token an und vergrößerte damit die Lücke zu chinesischen Frontier‑Modellen.
DeepSeek, Xiaomi senken die Tarife
DeepSeek bestätigte am 22. Mai, dass ein vorübergehender Rabatt von 75 % auf sein V4‑Pro‑Modell dauerhaft werden würde, womit die Ausgaben bei 0,87 US‑Dollar pro Million Token und die Eingaben bei 0,435 US‑Dollar festgesetzt wurden.
Die Aktion hätte ursprünglich am 31. Mai auslaufen sollen.
Wenige Tage später senkte das chinesische Schwester‑Lab Xiaomi die MiMo‑V2.5‑Tarife für zwischengespeicherte Eingaben ab dem 27. Mai um bis zu 99 %, wobei Cache‑Treffer in der Pro‑Stufe auf bis zu 0,0036 US‑Dollar pro Million Token bepreist wurden.
Im Gegensatz dazu verdoppelte GPT‑5.5 von OpenAI die Ausgaberate seines Vorgängers auf 30 US‑Dollar pro Million Token. Claude Opus 4.7 von Anthropic listet 5 US‑Dollar für Eingaben und 25 US‑Dollar für Ausgaben.
Außerdem lesenswert: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release
Ingenieure verteidigen die Rechnung
Xiaomi hat auch seine Token‑Pläne neu gestaltet. Der 100‑US‑Dollar‑Max‑Plan gewährt jetzt 82 Milliarden Token, statt zuvor 1,6 Milliarden, sodass für das gleiche Geld fünf‑ bis achtmal so viel Nutzung möglich ist wie zuvor.
Fuli Luo, der Xiaomis MiMo‑Team leitet und einst DeepSeek‑V2 mitentwickelte, führte die Senkungen auf eine intelligentere Art zurück, Daten zu speichern und wiederzuverwenden, die das Modell bereits verarbeitet hat.
Dieser Ansatz reduziert den Rechenbedarf deutlich.
Luo argumentierte, dass das Lab zu den neuen Tarifen nahezu mit voller Auslastung laufen und dennoch seine Kosten decken könne – ein Hinweis darauf, dass die Preise echte Effizienzgewinne widerspiegeln und nicht nur ein Lockangebot sind.
Die Einsparungen zählen vor allem bei Produktiv‑Workloads, die denselben Kontext wiederverwenden. Agent‑Pipelines mit stabilen Prompts, Dokumentenprozessoren und Retrieval‑Tools treffen ständig den Cache, sodass billigere zwischengespeicherte Eingaben die laufende Rechnung direkt senken.
Westliche Labs stehen vor einem anderen Dilemma. OpenAIs Schwenk hin zu Consumer‑Features und Werbung deutet darauf hin, dass Token‑Erlöse allein seine Bewertung möglicherweise nicht tragen können.
Warum die Lücke immer größer wird
DeepSeek und Xiaomi haben diesen Wettbewerb nicht eröffnet. Chinesische Modelle unterboten amerikanische Rivalen bereits, bevor eine der beiden Ankündigungen bekannt wurde.
MiniMax M2.7 läuft bei 0,30 US‑Dollar für Eingaben und 1,20 US‑Dollar für Ausgaben pro Million Token. Kimi K2.5 von Moonshot AI liegt bei 0,60 bzw. 2,50 US‑Dollar.
Analysten, die Kosten und Benchmark‑Leistung vergleichen, schätzen die Preis‑zu‑Qualität‑Lücke zwischen chinesischen und amerikanischen Frontier‑Modellen im 2. Quartal 2026 auf etwa das 15‑ bis 30‑Fache – noch bevor Cache‑Rabatte berücksichtigt werden. Die Senkungen dieser Woche vergrößern diesen Abstand für die repetitiven Workloads, die reale Deployments dominieren, weiter.
Das Muster erinnert an Anfang 2025, als DeepSeeks günstige Veröffentlichungen die Märkte erschütterten und westliche Anbieter zwangen, ihre Preise zu verteidigen. Ein Jahr später hat sich der Druck nur verstärkt, und die Antwort der amerikanischen Labs bestand eher darin, Tarife zu halten oder zu erhöhen, statt dem Preisverfall nachzujagen.
Als Nächstes lesen: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply





