Deux des laboratoires d’IA les plus avancés de Chine ont réduit cette semaine les prix de leurs modèles à une fraction de ceux de leurs rivaux occidentaux, tandis que OpenAI and Anthropic prenaient la direction opposée.
Points clés :
- DeepSeek a rendu permanent, le 22 mai, son rabais de 75 % sur V4-Pro, fixant le coût de sortie à 0,87 $ par million de tokens.
- Xiaomi a réduit le 26 mai les prix de MiMo‑V2.5 jusqu’à 99 %, avec des entrées Pro mises en cache facturées aussi peu que 0,0036 $ par million de tokens.
- OpenAI a relevé le coût de sortie de GPT‑5.5 à 30 $ par million de tokens, élargissant l’écart avec les modèles de pointe chinois.
DeepSeek et Xiaomi réduisent leurs tarifs
DeepSeek a confirmé le 22 mai qu’une remise temporaire de 75 % sur son modèle V4‑Pro deviendrait permanente, fixant le coût de sortie à 0,87 $ par million de tokens et celui d’entrée à 0,435 $.
La promotion devait initialement expirer le 31 mai.
Quelques jours plus tard, le laboratoire chinois Xiaomi a drastiquement réduit les tarifs de MiMo‑V2.5 jusqu’à 99 % pour les entrées mises en cache, à compter du 27 mai, avec des accès Pro en cache facturés aussi peu que 0,0036 $ par million de tokens.
À l’inverse, GPT‑5.5 d’OpenAI a doublé le tarif de sortie de son prédécesseur, à 30 $ par million de tokens. Claude Opus 4.7 d’Anthropic lists un coût de 5 $ pour l’entrée et 25 $ pour la sortie.
À lire aussi : Anthropic Moves Restricted Claude Mythos Model Closer To Public Release
Les ingénieurs défendent leurs calculs
Xiaomi a également repensé ses forfaits de tokens. Le forfait Max à 100 $ grants désormais 82 milliards de tokens, contre 1,6 milliard auparavant, la même somme permettant d’acheter cinq à huit fois plus d’utilisation qu’avant.
Fuli Luo, qui dirige l’équipe MiMo de Xiaomi et a co‑conçu DeepSeek‑V2, a rattaché ces baisses à une méthode plus intelligente de stockage et de réutilisation des données déjà traitées par le modèle.
Cette approche réduit fortement la demande de calcul.
Luo soutient que le laboratoire peut tourner presque à pleine capacité avec ces nouveaux tarifs tout en couvrant ses coûts, ce qui laisse penser que les prix reflètent de réels gains d’efficacité plutôt qu’une promotion de vente à perte.
Les économies comptent surtout pour les tâches de production qui réutilisent le même contexte. Les pipelines d’agents avec invites stables, les processeurs de documents et les outils de recherche exploitent en permanence le cache ; des entrées mises en cache moins chères réduisent donc directement la facture.
Les laboratoires occidentaux sont confrontés à un dilemme différent. Le virage d’OpenAI vers les fonctionnalités grand public et la publicité suggère que les revenus liés aux tokens seuls pourraient ne pas suffire à soutenir sa valorisation.
Pourquoi l’écart continue de se creuser
DeepSeek et Xiaomi n’ont pas lancé cette course. Les modèles chinois sous‑facturaient déjà leurs rivaux américains avant ces annonces.
MiniMax M2.7 fonctionne à 0,30 $ pour l’entrée et 1,20 $ pour la sortie par million de tokens. Kimi K2.5 de Moonshot AI sits à 0,60 $ et 2,50 $.
Les analystes qui comparent les coûts aux performances sur les benchmarks estiment que l’écart prix‑qualité au T2 2026 entre modèles de pointe chinois et américains se situe autour de 15 à 30 fois, avant toute remise liée au cache. Les réductions annoncées cette semaine resserrent encore plus l’écart pour les charges de travail répétitives qui dominent les déploiements réels.
Ce schéma rappelle le début de l’année 2025, lorsque les offres à bas prix de DeepSeek avaient ébranlé les marchés et forcé les fournisseurs occidentaux à défendre leurs tarifs. Un an plus tard, la pression ne s’est qu’accentuée, et la réponse des laboratoires américains a été de maintenir ou d’augmenter les prix plutôt que de s’aligner sur les plus bas niveaux.





