Dois dos laboratórios de IA mais avançados da China reduziram nesta semana os preços de seus modelos a uma fração dos valores praticados por rivais ocidentais, enquanto OpenAI and Anthropic seguiram na direção oposta.
Pontos-chave:
- A DeepSeek tornou permanente, em 22 de maio, o desconto de 75% do V4-Pro, fixando o custo de saída em US$ 0,87 por milhão de tokens.
- A Xiaomi cortou os preços do MiMo-V2.5 em até 99% em 26 de maio, com entradas em cache da versão Pro custando apenas US$ 0,0036 por milhão de tokens.
- A OpenAI elevou o custo de saída do GPT-5.5 para US$ 30 por milhão de tokens, ampliando a diferença em relação aos modelos de ponta chineses.
DeepSeek e Xiaomi reduzem tarifas
A DeepSeek confirmed em 22 de maio que um desconto temporário de 75% em seu modelo V4-Pro se tornaria permanente, fixando o custo de saída em US$ 0,87 por milhão de tokens e o de entrada em US$ 0,435.
A promoção estava prevista para expirar em 31 de maio.
Dias depois, o também laboratório chinês Xiaomi slashed as tarifas do MiMo-V2.5 em até 99% para entradas em cache, a partir de 27 de maio, com acertos de cache no nível Pro custando apenas US$ 0,0036 por milhão de tokens.
Em contraste, o GPT-5.5 da OpenAI dobrou a tarifa de saída de seu antecessor para US$ 30 por milhão de tokens. O Claude Opus 4.7 da Anthropic lists US$ 5 por entrada e US$ 25 por saída.
Veja também: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release
Engenheiros defendem a matemática
A Xiaomi também reconstruiu seus planos de tokens. O plano Max de US$ 100 agora grants 82 bilhões de tokens, ante 1,6 bilhão, com o mesmo valor passando a comprar de cinco a oito vezes mais uso do que antes.
Fuli Luo, que lidera a equipe MiMo da Xiaomi e já co-desenvolveu o DeepSeek-V2, tied os cortes a uma forma mais inteligente de armazenar e reutilizar dados que o modelo já processou.
Essa abordagem reduz drasticamente a demanda por computação.
Luo argumentou que o laboratório consegue operar próximo da capacidade máxima com as novas tarifas e ainda assim cobrir seus custos, o que sugere que os preços refletem ganhos reais de eficiência, e não apenas uma promoção de venda a prejuízo.
As economias importam mais para tarefas de produção que reutilizam o mesmo contexto. Pipelines de agentes com prompts estáveis, processadores de documentos e ferramentas de busca em bases de dados acessam o cache o tempo todo; portanto, entradas em cache mais baratas reduzem diretamente a conta operacional.
Os laboratórios ocidentais enfrentam um dilema diferente. A guinada da OpenAI em direção a recursos para o consumidor e publicidade indica que a receita com tokens sozinha pode não sustentar sua avaliação.
Por que a diferença continua aumentando
DeepSeek e Xiaomi não iniciaram essa disputa. Modelos chineses já cobravam menos do que os rivais americanos antes mesmo desses anúncios.
O MiniMax M2.7 opera a US$ 0,30 por entrada e US$ 1,20 por saída por milhão de tokens. O Kimi K2.5 da Moonshot AI sits em US$ 0,60 e US$ 2,50.
Analistas que comparam custo e desempenho em benchmarks estimam que, no segundo trimestre de 2026, a diferença preço-qualidade entre modelos de fronteira chineses e americanos fique em torno de 15 a 30 vezes, antes de qualquer desconto de cache. As reduções desta semana estreitam ainda mais essa diferença para as cargas de trabalho repetitivas que dominam as implantações reais.
O padrão lembra o início de 2025, quando os lançamentos de baixo custo da DeepSeek abalaram os mercados e forçaram provedores ocidentais a defender seus preços. Um ano depois, a pressão só aumentou, e a resposta dos laboratórios americanos tem sido manter ou elevar tarifas, em vez de competir pelo menor preço.
Leia a seguir: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply





