Por que a IA chinesa agora custa 30 vezes menos do que os modelos americanos

Dois dos laboratórios de IA mais capazes da China cortaram nesta semana os preços de seus modelos para uma fração dos rivais ocidentais, enquanto OpenAI and Anthropic seguiram na direção oposta.

Pontos principais:

A DeepSeek tornou permanente, em 22 de maio, o desconto de 75% do V4-Pro, fixando o custo de saída em US$ 0,87 por milhão de tokens.

A Xiaomi reduziu em até 99% os preços do MiMo-V2.5 em 26 de maio, com entradas em cache na versão Pro custando apenas US$ 0,0036 por milhão de tokens.

A OpenAI elevou o custo de saída do GPT-5.5 para US$ 30 por milhão de tokens, ampliando a diferença em relação aos modelos de fronteira chineses.

DeepSeek e Xiaomi reduzem tarifas

A DeepSeek confirmed em 22 de maio que um desconto temporário de 75% em seu modelo V4-Pro se tornaria permanente, fixando o custo de saída em US$ 0,87 por milhão de tokens e de entrada em US$ 0,435.

A promoção estava programada para expirar em 31 de maio.

Dias depois, o também laboratório chinês Xiaomi slashed as tarifas do MiMo-V2.5 em até 99% para entradas em cache, com efeito em 27 de maio, com acertos de cache no nível Pro custando apenas US$ 0,0036 por milhão de tokens.

Em contraste, o GPT-5.5 da OpenAI dobrou a tarifa de saída de seu predecessor para US$ 30 por milhão de tokens. O Claude Opus 4.7, da Anthropic, lists US$ 5 por entrada e US$ 25 por saída.

Também leia: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

Engenheiros defendem a matemática

A Xiaomi também reformulou seus planos de tokens. O plano Max de US$ 100 agora grants 82 bilhões de tokens, ante 1,6 bilhão, com o mesmo valor comprando de cinco a oito vezes mais uso do que antes.

Fuli Luo, que lidera a equipe MiMo da Xiaomi e já co-desenvolveu o DeepSeek-V2, tied os cortes a uma forma mais inteligente de armazenar e reutilizar dados que o modelo já processou.

Essa abordagem reduz drasticamente a demanda computacional.

Luo argumentou que o laboratório consegue operar perto da capacidade máxima com as novas tarifas e ainda cobrir seus custos, o que sugere que os preços refletem ganhos reais de eficiência, e não apenas uma promoção com prejuízo.

As economias importam principalmente para tarefas em produção que reutilizam o mesmo contexto. Pipelines de agentes com prompts estáveis, processadores de documentos e ferramentas de busca em bases de dados acessam o cache constantemente, de modo que a entrada em cache mais barata reduz diretamente a conta operacional.

Os laboratórios ocidentais enfrentam um dilema diferente. A guinada da OpenAI em direção a recursos voltados ao consumidor e publicidade indica que a receita de tokens sozinha pode não sustentar sua avaliação.

Por que a diferença continua aumentando

DeepSeek e Xiaomi não iniciaram essa disputa. Os modelos chineses já cobravam menos que os rivais americanos antes de qualquer um desses anúncios.

O MiniMax M2.7 roda a US$ 0,30 de entrada e US$ 1,20 de saída por milhão de tokens. O Kimi K2.5 da Moonshot AI sits em US$ 0,60 e US$ 2,50.

Analistas que acompanham custo em relação ao desempenho em benchmarks estimam a diferença de preço em relação à qualidade, no segundo trimestre de 2026, entre modelos de fronteira chineses e americanos em aproximadamente 15 a 30 vezes, antes de qualquer desconto de cache. As reduções desta semana ampliam ainda mais essa diferença para as cargas de trabalho repetitivas que dominam as implementações reais.

O padrão lembra o início de 2025, quando os lançamentos de baixo custo da DeepSeek agitaram os mercados e forçaram provedores ocidentais a defenderem suas tabelas de preços. Um ano depois, a pressão só se intensificou, e a resposta dos laboratórios americanos tem sido manter ou aumentar as tarifas, em vez de perseguir o preço mínimo.