Por que a IA chinesa agora custa 30 vezes menos que os modelos americanos

Dois dos laboratórios de IA mais capazes da China reduziram nesta semana os preços de seus modelos a uma fração dos rivais ocidentais, enquanto OpenAI and Anthropic seguiram na direção oposta.

Pontos-chave:

A DeepSeek tornou permanente, em 22 de maio, o desconto de 75% do V4-Pro, fixando o custo de saída em US$ 0,87 por milhão de tokens.

A Xiaomi reduziu os preços do MiMo-V2.5 em até 99% em 26 de maio, com entradas em cache no plano Pro chegando a US$ 0,0036 por milhão de tokens.

A OpenAI elevou a saída do GPT-5.5 para US$ 30 por milhão de tokens, ampliando a diferença em relação aos modelos de fronteira chineses.

DeepSeek e Xiaomi reduzem tarifas

DeepSeek confirmed em 22 de maio que um desconto temporário de 75% em seu modelo V4-Pro se tornaria permanente, fixando o custo de saída em US$ 0,87 por milhão de tokens e o de entrada em US$ 0,435.

A promoção estava prevista para expirar em 31 de maio.

Dias depois, o também laboratório chinês Xiaomi slashed as tarifas do MiMo-V2.5 em até 99% para entradas em cache, com efeito em 27 de maio, com acertos de cache no nível Pro custando apenas US$ 0,0036 por milhão de tokens.

Em contraste, o GPT-5.5 da OpenAI dobrou a tarifa de saída de seu predecessor para US$ 30 por milhão de tokens. O Claude Opus 4.7 da Anthropic lists US$ 5 para entrada e US$ 25 para saída.

Veja também: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

Engenheiros defendem a matemática

A Xiaomi também reconstruiu seus planos de tokens. O plano Max de US$ 100 agora grants 82 bilhões de tokens, ante 1,6 bilhão, com o mesmo valor comprando de cinco a oito vezes mais uso que antes.

Fuli Luo, que lidera a equipe MiMo da Xiaomi e ajudou a construir o DeepSeek-V2, tied os cortes a uma forma mais inteligente de armazenar e reutilizar dados que o modelo já processou.

Essa abordagem reduz drasticamente a demanda de computação.

Luo argumentou que o laboratório pode operar perto da capacidade total com as novas tarifas e ainda cobrir seus custos, o que sugere que o preço reflete ganhos reais de eficiência, e não uma promoção vendida com prejuízo.

As economias importam mais para tarefas de produção que reutilizam o mesmo contexto. Pipelines de agentes com prompts estáveis, processadores de documentos e ferramentas de busca batem no cache o tempo todo, então entradas em cache mais baratas reduzem diretamente a conta operacional.

Os laboratórios ocidentais enfrentam um dilema diferente. A guinada da OpenAI em direção a recursos de consumo e publicidade indica que a receita de tokens sozinha pode não sustentar sua avaliação.

Por que a diferença continua aumentando

DeepSeek e Xiaomi não começaram essa disputa. Os modelos chineses já praticavam preços inferiores aos rivais americanos antes de qualquer um dos anúncios.

MiniMax M2.7 opera a US$ 0,30 de entrada e US$ 1,20 de saída por milhão de tokens. O Kimi K2.5 da Moonshot AI sits em US$ 0,60 e US$ 2,50.

Analistas que acompanham custo em relação a desempenho de benchmark estimam a diferença de preço versus qualidade no 2º trimestre de 2026 entre modelos de fronteira chineses e americanos em algo entre 15 e 30 vezes, antes de qualquer desconto de cache. As reduções desta semana estreitam ainda mais essa diferença para as cargas de trabalho repetitivas que dominam implantações reais.

O padrão ecoa o início de 2025, quando os lançamentos de baixo custo da DeepSeek abalaram os mercados e forçaram os provedores ocidentais a defenderem seus preços. Um ano depois, a pressão só se intensificou, e a resposta dos laboratórios americanos tem sido manter ou aumentar tarifas, em vez de correr atrás do piso.

Leia a seguir: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply