Waarom Chinese AI nu 30 keer minder kost dan Amerikaanse modellen

profile-alexey-bondarev
Alexey Bondarev1 uur geleden
Waarom Chinese AI nu 30 keer minder kost dan Amerikaanse modellen

Twee van China's capabelste AI-labs verlaagden deze week hun modelprijzen tot een fractie van die van westerse rivalen, terwijl OpenAI and Anthropic de tegenovergestelde koers kozen.

Belangrijkste punten:

  • DeepSeek maakte op 22 mei zijn tijdelijke korting van 75% op V4-Pro permanent, met een vaste outputprijs van $0,87 per miljoen tokens.
  • Xiaomi verlaagde op 26 mei de prijzen van MiMo-V2.5 met tot wel 99%, met gecachte Pro-inputs vanaf $0,0036 per miljoen tokens.
  • OpenAI verhoogde de outputprijs van GPT-5.5 naar $30 per miljoen tokens, waardoor de kloof met Chinese frontier-modellen groter wordt.

DeepSeek en Xiaomi verlagen tarieven

DeepSeek confirmed op 22 mei dat een tijdelijke korting van 75% op zijn V4-Pro-model permanent zou worden, met een vaste outputprijs van $0,87 per miljoen tokens en een inputprijs van $0,435.

De promotie zou oorspronkelijk op 31 mei aflopen.

Enkele dagen later verlaagde het Chinese lab Xiaomi de tarieven voor MiMo-V2.5 slashed met tot wel 99% voor gecachte inputs, met ingang van 27 mei, waarbij cache-hits in de Pro-laag zijn geprijsd vanaf $0,0036 per miljoen tokens.

Ter vergelijking: GPT-5.5 van OpenAI verdubbelde het outputtarief van zijn voorganger naar $30 per miljoen tokens. Claude Opus 4.7 van Anthropic lists $5 voor input en $25 voor output.

Ook interessant: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

Engineers verdedigen de rekensom

Xiaomi bouwde zijn tokenabonnementen ook opnieuw op. Het $100 Max-abonnement grants nu 82 miljard tokens, tegenover 1,6 miljard eerder, waardoor je voor hetzelfde geld vijf tot acht keer meer gebruik krijgt dan voorheen.

Fuli Luo, hoofd van Xiaomi's MiMo-team en eerder medeontwikkelaar van DeepSeek-V2, tied de prijsverlagingen aan een slimmer systeem om data die het model al heeft verwerkt op te slaan en opnieuw te gebruiken.

Die aanpak vermindert de rekenkracht die nodig is aanzienlijk.

Luo stelde dat het lab op de nieuwe tarieven bijna op volle capaciteit kan draaien en toch de kosten kan dekken, wat erop wijst dat de prijzen echte efficiëntiewinsten weerspiegelen in plaats van een verlieslatende kortingsactie.

De besparingen zijn vooral belangrijk voor productietaken die steeds dezelfde context hergebruiken. Agent-pijplijnen met stabiele prompts, documentverwerkers en retrievaltools gebruiken continu de cache, waardoor goedkopere gecachte input de operationele kosten direct verlaagt.

Westerse labs zitten in een andere klem. De koerswijziging van OpenAI richting consumentenfeatures en reclame suggereert dat alleen tokenomzet mogelijk niet voldoende is om de waardering te dragen.

Waarom de kloof blijft groeien

DeepSeek en Xiaomi zijn deze prijsoorlog niet begonnen. Chinese modellen waren al goedkoper dan Amerikaanse rivalen voordat deze aankondigingen kwamen.

MiniMax M2.7 draait op $0,30 voor input en $1,20 voor output per miljoen tokens. Kimi K2.5 van Moonshot AI sits op $0,60 en $2,50.

Analisten die kosten afzetten tegen benchmarkprestaties schatten dat de prijs-kwaliteitkloof in Q2 2026 tussen Chinese en Amerikaanse frontier-modellen ongeveer 15 tot 30 keer bedraagt, nog vóór cache-kortingen. De verlagingen van deze week verkleinen die kloof verder voor de repetitieve workloads die in echte implementaties domineren.

Dit patroon doet denken aan begin 2025, toen de goedkope releases van DeepSeek de markten opschudden en westerse aanbieders dwongen hun prijsstelling te verdedigen. Een jaar later is de druk alleen maar toegenomen, en de reactie van Amerikaanse labs is geweest om tarieven vast te houden of te verhogen in plaats van mee te dalen naar het bodemniveau.

Lees ook: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply

Disclaimer en risicowaarschuwing: De informatie in dit artikel is uitsluitend voor educatieve en informatieve doeleinden en is gebaseerd op de mening van de auteur. Het vormt geen financieel, investerings-, juridisch of belastingadvies. Cryptocurrency-assets zijn zeer volatiel en onderhevig aan hoog risico, inclusief het risico om uw gehele of een substantieel deel van uw investering te verliezen. Het handelen in of aanhouden van crypto-assets is mogelijk niet geschikt voor alle beleggers. De meningen die in dit artikel worden geuit zijn uitsluitend die van de auteur(s) en vertegenwoordigen niet het officiële beleid of standpunt van Yellow, haar oprichters of haar leidinggevenden. Voer altijd uw eigen grondig onderzoek uit (D.Y.O.R.) en raadpleeg een gelicentieerde financiële professional voordat u een investeringsbeslissing neemt.
Waarom Chinese AI nu 30 keer minder kost dan Amerikaanse modellen | Yellow.com