Pourquoi l’IA chinoise coûte désormais 30 fois moins cher que les modèles américains

Deux des laboratoires d’IA les plus avancés de Chine ont réduit cette semaine le prix de leurs modèles à une fraction de celui de leurs concurrents occidentaux, tandis que OpenAI et Anthropic prenaient la direction inverse.

Points clés :

DeepSeek a rendu permanent, le 22 mai, son rabais de 75 % sur le modèle V4-Pro, fixant le coût de sortie à 0,87 $ par million de tokens.

Xiaomi a réduit le prix de MiMo-V2.5 jusqu’à 99 % le 26 mai, avec des entrées en cache Pro tombant à 0,0036 $ par million de tokens.

OpenAI a relevé le coût de sortie de GPT-5.5 à 30 $ par million de tokens, élargissant l’écart avec les modèles de pointe chinois.

DeepSeek et Xiaomi baissent leurs tarifs

DeepSeek a confirmé le 22 mai qu’une remise temporaire de 75 % sur son modèle V4-Pro deviendrait permanente, fixant le coût de sortie à 0,87 $ par million de tokens et celui d’entrée à 0,435 $.

La promotion devait initialement expirer le 31 mai.

Quelques jours plus tard, le laboratoire chinois Xiaomi a diminué drastiquement les tarifs de MiMo-V2.5, jusqu’à 99 % de réduction pour les entrées mises en cache, à compter du 27 mai, avec des accès cache du niveau Pro facturés aussi peu que 0,0036 $ par million de tokens.

À l’inverse, GPT-5.5 d’OpenAI a doublé le tarif de sortie de son prédécesseur pour atteindre 30 $ par million de tokens. Claude Opus 4.7 d’Anthropic affiche 5 $ pour l’entrée et 25 $ pour la sortie.

Les ingénieurs défendent les calculs

Xiaomi a également repensé ses formules de tokens. L’offre Max à 100 $ accorde désormais 82 milliards de tokens, contre 1,6 milliard auparavant, ce qui permet d’acheter avec la même somme cinq à huit fois plus d’utilisation qu’avant.

Fuli Luo, qui dirige l’équipe MiMo de Xiaomi et a auparavant co-développé DeepSeek-V2, a rattaché ces baisses à une méthode plus intelligente de stockage et de réutilisation des données déjà traitées par le modèle.

Cette approche réduit fortement la demande de calcul.

Luo affirme que le laboratoire peut tourner presque à pleine capacité avec les nouveaux tarifs tout en couvrant ses coûts, ce qui suggère que ces prix reflètent de vrais gains d’efficacité plutôt qu’une promotion menée à perte.

Les économies comptent surtout pour les tâches en production qui réutilisent le même contexte. Les chaînes d’agents avec prompts stables, les processeurs de documents et les outils de recherche sollicitent constamment le cache : des entrées en cache moins chères réduisent donc directement la facture d’exploitation.

Les laboratoires occidentaux font face à un autre dilemme. Le pivot d’OpenAI vers les fonctionnalités grand public et la publicité laisse entendre que les revenus purement liés aux tokens pourraient ne pas suffire à soutenir sa valorisation.

Pourquoi l’écart continue de se creuser

DeepSeek et Xiaomi n’ont pas déclenché cette course. Les modèles chinois proposaient déjà des tarifs inférieurs à ceux de leurs rivaux américains avant ces annonces.

MiniMax M2.7 fonctionne à 0,30 $ pour l’entrée et 1,20 $ pour la sortie par million de tokens. Kimi K2.5 de Moonshot AI se situe à 0,60 $ et 2,50 $.

Les analystes qui comparent les coûts aux performances sur les benchmarks estiment que, au deuxième trimestre 2026, l’écart prix/qualité entre les modèles de pointe chinois et américains se situe autour de 15 à 30 fois, avant tout rabais lié au cache. Les réductions de cette semaine resserrent encore davantage cet écart pour les charges de travail répétitives qui dominent les déploiements réels.

Ce schéma fait écho au début de 2025, lorsque les modèles à bas coût de DeepSeek avaient ébranlé les marchés et obligé les fournisseurs occidentaux à défendre leurs tarifs. Un an plus tard, la pression ne fait que s’intensifier, et la réponse des laboratoires américains consiste davantage à maintenir ou à augmenter les prix qu’à suivre la baisse.