Waarom Chinese AI nu 30 keer minder kost dan Amerikaanse modellen

Twee van China’s meest capabele AI‑labs verlaagden deze week hun modelprijzen tot een fractie van die van westerse rivalen, terwijl OpenAI en Anthropic de omgekeerde richting kozen.

Kernpunten:

DeepSeek maakte op 22 mei zijn tijdelijke korting van 75% op V4‑Pro permanent, en zette de output vast op $0,87 per miljoen tokens.

Xiaomi verlaagde op 26 mei de MiMo‑V2.5‑prijzen met tot wel 99%, met gecachete Pro‑inputs vanaf $0,0036 per miljoen tokens.

OpenAI verhoogde de GPT‑5.5‑output naar $30 per miljoen tokens, waardoor de kloof met Chinese frontier‑modellen groter werd.

DeepSeek en Xiaomi verlagen tarieven

DeepSeek bevestigde op 22 mei dat een tijdelijke korting van 75% op het V4‑Pro‑model permanent zou worden, waardoor de output werd vastgezet op $0,87 per miljoen tokens en de input op $0,435.

De promotie zou oorspronkelijk aflopen op 31 mei.

Enkele dagen later verlaagde het Chinese lab Xiaomi de MiMo‑V2.5‑tarieven fors met tot wel 99% voor gecachete inputs, met ingang van 27 mei, waarbij cache‑hits in de Pro‑tier zo laag geprijsd zijn als $0,0036 per miljoen tokens.

Ter vergelijking: GPT‑5.5 van OpenAI verdubbelde het outputtarief van zijn voorganger naar $30 per miljoen tokens. Claude Opus 4.7 van Anthropic hanteert $5 voor input en $25 voor output.

Ook lezen: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

Ingenieurs verdedigen de rekensom

Xiaomi bouwde ook zijn tokenplannen opnieuw op. Het $100 Max‑abonnement biedt nu 82 miljard tokens, tegenover 1,6 miljard eerder, waardoor hetzelfde bedrag vijf tot acht keer meer gebruik oplevert dan voorheen.

Fuli Luo, hoofd van Xiaomi’s MiMo‑team en mede‑bouwer van DeepSeek‑V2, verbindt de prijsverlagingen aan een slimmere manier om data op te slaan en opnieuw te gebruiken die het model al heeft verwerkt.

Die aanpak verlaagt de vraag naar rekenkracht aanzienlijk.

Luo betoogde dat het lab op de nieuwe tarieven bijna op volle capaciteit kan draaien en toch zijn kosten kan dekken, wat suggereert dat de prijzen echte efficiëntiewinsten weerspiegelen in plaats van een verlieslatende promotie.

De besparingen zijn vooral belangrijk voor productietaken die dezelfde context hergebruiken. Agent‑pipelines met stabiele prompts, documentverwerkers en retrieval‑tools raken voortdurend de cache, waardoor goedkopere gecachete input de operationele rekening direct verlaagt.

Westerse labs zitten in een andere klem. OpenAI’s draai naar consumentgerichte functies en advertenties suggereert dat alleen tokenomzet mogelijk niet volstaat om de waardering te dragen.

Waarom de kloof blijft groeien

DeepSeek en Xiaomi zijn deze prijzenslag niet begonnen. Chinese modellen onderboden Amerikaanse rivalen al voordat beide aankondigingen kwamen.

MiniMax M2.7 draait op $0,30 voor input en $1,20 voor output per miljoen tokens. Kimi K2.5 van Moonshot AI ligt op $0,60 en $2,50.

Analisten die kosten afzetten tegen benchmarkprestaties schatten dat de prijs‑kwaliteitkloof in Q2 2026 tussen Chinese en Amerikaanse frontier‑modellen ruwweg 15 tot 30 keer bedraagt, vóór eventuele cachediscounts. De verlagingen van deze week verkleinen die kloof verder voor de repetitieve workloads die echte implementaties domineren.

Het patroon doet denken aan begin 2025, toen de goedkope releases van DeepSeek de markten opschudden en westerse aanbieders dwongen hun prijsstelling te verdedigen. Een jaar later is de druk alleen maar toegenomen, en de reactie van Amerikaanse labs is geweest om tarieven te handhaven of te verhogen in plaats van de bodem op te zoeken.

Lees hierna: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply