Por que a IA chinesa agora custa 30 vezes menos do que os modelos americanos

Por que a IA chinesa agora custa 30 vezes menos do que os modelos americanos

Dois dos laboratórios de IA mais avançados da China reduziram nesta semana os preços de seus modelos a uma fração dos valores praticados por rivais ocidentais, enquanto OpenAI and Anthropic seguiram na direção oposta.

Pontos-chave:

  • A DeepSeek tornou permanente, em 22 de maio, o desconto de 75% do V4-Pro, fixando o custo de saída em US$ 0,87 por milhão de tokens.
  • A Xiaomi cortou os preços do MiMo-V2.5 em até 99% em 26 de maio, com entradas em cache da versão Pro custando apenas US$ 0,0036 por milhão de tokens.
  • A OpenAI elevou o custo de saída do GPT-5.5 para US$ 30 por milhão de tokens, ampliando a diferença em relação aos modelos de ponta chineses.

DeepSeek e Xiaomi reduzem tarifas

A DeepSeek confirmed em 22 de maio que um desconto temporário de 75% em seu modelo V4-Pro se tornaria permanente, fixando o custo de saída em US$ 0,87 por milhão de tokens e o de entrada em US$ 0,435.

A promoção estava prevista para expirar em 31 de maio.

Dias depois, o também laboratório chinês Xiaomi slashed as tarifas do MiMo-V2.5 em até 99% para entradas em cache, a partir de 27 de maio, com acertos de cache no nível Pro custando apenas US$ 0,0036 por milhão de tokens.

Em contraste, o GPT-5.5 da OpenAI dobrou a tarifa de saída de seu antecessor para US$ 30 por milhão de tokens. O Claude Opus 4.7 da Anthropic lists US$ 5 por entrada e US$ 25 por saída.

Veja também: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

Engenheiros defendem a matemática

A Xiaomi também reconstruiu seus planos de tokens. O plano Max de US$ 100 agora grants 82 bilhões de tokens, ante 1,6 bilhão, com o mesmo valor passando a comprar de cinco a oito vezes mais uso do que antes.

Fuli Luo, que lidera a equipe MiMo da Xiaomi e já co-desenvolveu o DeepSeek-V2, tied os cortes a uma forma mais inteligente de armazenar e reutilizar dados que o modelo já processou.

Essa abordagem reduz drasticamente a demanda por computação.

Luo argumentou que o laboratório consegue operar próximo da capacidade máxima com as novas tarifas e ainda assim cobrir seus custos, o que sugere que os preços refletem ganhos reais de eficiência, e não apenas uma promoção de venda a prejuízo.

As economias importam mais para tarefas de produção que reutilizam o mesmo contexto. Pipelines de agentes com prompts estáveis, processadores de documentos e ferramentas de busca em bases de dados acessam o cache o tempo todo; portanto, entradas em cache mais baratas reduzem diretamente a conta operacional.

Os laboratórios ocidentais enfrentam um dilema diferente. A guinada da OpenAI em direção a recursos para o consumidor e publicidade indica que a receita com tokens sozinha pode não sustentar sua avaliação.

Por que a diferença continua aumentando

DeepSeek e Xiaomi não iniciaram essa disputa. Modelos chineses já cobravam menos do que os rivais americanos antes mesmo desses anúncios.

O MiniMax M2.7 opera a US$ 0,30 por entrada e US$ 1,20 por saída por milhão de tokens. O Kimi K2.5 da Moonshot AI sits em US$ 0,60 e US$ 2,50.

Analistas que comparam custo e desempenho em benchmarks estimam que, no segundo trimestre de 2026, a diferença preço-qualidade entre modelos de fronteira chineses e americanos fique em torno de 15 a 30 vezes, antes de qualquer desconto de cache. As reduções desta semana estreitam ainda mais essa diferença para as cargas de trabalho repetitivas que dominam as implantações reais.

O padrão lembra o início de 2025, quando os lançamentos de baixo custo da DeepSeek abalaram os mercados e forçaram provedores ocidentais a defender seus preços. Um ano depois, a pressão só aumentou, e a resposta dos laboratórios americanos tem sido manter ou elevar tarifas, em vez de competir pelo menor preço.

Leia a seguir: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply

Isenção de responsabilidade e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e são baseadas na opinião do autor. Elas não constituem aconselhamento financeiro, de investimento, jurídico ou tributário. Ativos de criptomoedas são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou manter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou seus executivos. Sempre conduza sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Por que a IA chinesa agora custa 30 vezes menos do que os modelos americanos | Yellow.com