Twee van China's capabelste AI-labs verlaagden deze week hun modelprijzen tot een fractie van die van westerse rivalen, terwijl OpenAI and Anthropic de tegenovergestelde koers kozen.
Belangrijkste punten:
- DeepSeek maakte op 22 mei zijn tijdelijke korting van 75% op V4-Pro permanent, met een vaste outputprijs van $0,87 per miljoen tokens.
- Xiaomi verlaagde op 26 mei de prijzen van MiMo-V2.5 met tot wel 99%, met gecachte Pro-inputs vanaf $0,0036 per miljoen tokens.
- OpenAI verhoogde de outputprijs van GPT-5.5 naar $30 per miljoen tokens, waardoor de kloof met Chinese frontier-modellen groter wordt.
DeepSeek en Xiaomi verlagen tarieven
DeepSeek confirmed op 22 mei dat een tijdelijke korting van 75% op zijn V4-Pro-model permanent zou worden, met een vaste outputprijs van $0,87 per miljoen tokens en een inputprijs van $0,435.
De promotie zou oorspronkelijk op 31 mei aflopen.
Enkele dagen later verlaagde het Chinese lab Xiaomi de tarieven voor MiMo-V2.5 slashed met tot wel 99% voor gecachte inputs, met ingang van 27 mei, waarbij cache-hits in de Pro-laag zijn geprijsd vanaf $0,0036 per miljoen tokens.
Ter vergelijking: GPT-5.5 van OpenAI verdubbelde het outputtarief van zijn voorganger naar $30 per miljoen tokens. Claude Opus 4.7 van Anthropic lists $5 voor input en $25 voor output.
Ook interessant: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release
Engineers verdedigen de rekensom
Xiaomi bouwde zijn tokenabonnementen ook opnieuw op. Het $100 Max-abonnement grants nu 82 miljard tokens, tegenover 1,6 miljard eerder, waardoor je voor hetzelfde geld vijf tot acht keer meer gebruik krijgt dan voorheen.
Fuli Luo, hoofd van Xiaomi's MiMo-team en eerder medeontwikkelaar van DeepSeek-V2, tied de prijsverlagingen aan een slimmer systeem om data die het model al heeft verwerkt op te slaan en opnieuw te gebruiken.
Die aanpak vermindert de rekenkracht die nodig is aanzienlijk.
Luo stelde dat het lab op de nieuwe tarieven bijna op volle capaciteit kan draaien en toch de kosten kan dekken, wat erop wijst dat de prijzen echte efficiëntiewinsten weerspiegelen in plaats van een verlieslatende kortingsactie.
De besparingen zijn vooral belangrijk voor productietaken die steeds dezelfde context hergebruiken. Agent-pijplijnen met stabiele prompts, documentverwerkers en retrievaltools gebruiken continu de cache, waardoor goedkopere gecachte input de operationele kosten direct verlaagt.
Westerse labs zitten in een andere klem. De koerswijziging van OpenAI richting consumentenfeatures en reclame suggereert dat alleen tokenomzet mogelijk niet voldoende is om de waardering te dragen.
Waarom de kloof blijft groeien
DeepSeek en Xiaomi zijn deze prijsoorlog niet begonnen. Chinese modellen waren al goedkoper dan Amerikaanse rivalen voordat deze aankondigingen kwamen.
MiniMax M2.7 draait op $0,30 voor input en $1,20 voor output per miljoen tokens. Kimi K2.5 van Moonshot AI sits op $0,60 en $2,50.
Analisten die kosten afzetten tegen benchmarkprestaties schatten dat de prijs-kwaliteitkloof in Q2 2026 tussen Chinese en Amerikaanse frontier-modellen ongeveer 15 tot 30 keer bedraagt, nog vóór cache-kortingen. De verlagingen van deze week verkleinen die kloof verder voor de repetitieve workloads die in echte implementaties domineren.
Dit patroon doet denken aan begin 2025, toen de goedkope releases van DeepSeek de markten opschudden en westerse aanbieders dwongen hun prijsstelling te verdedigen. Een jaar later is de druk alleen maar toegenomen, en de reactie van Amerikaanse labs is geweest om tarieven vast te houden of te verhogen in plaats van mee te dalen naar het bodemniveau.
Lees ook: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply





