Por que a IA chinesa agora custa 30 vezes menos que os modelos americanos

Por que a IA chinesa agora custa 30 vezes menos que os modelos americanos

Dois dos laboratórios de IA mais capazes da China reduziram nesta semana os preços de seus modelos a uma fração dos rivais ocidentais, enquanto OpenAI and Anthropic seguiram na direção oposta.

Pontos-chave:

  • A DeepSeek tornou permanente, em 22 de maio, o desconto de 75% do V4-Pro, fixando o custo de saída em US$ 0,87 por milhão de tokens.
  • A Xiaomi reduziu os preços do MiMo-V2.5 em até 99% em 26 de maio, com entradas em cache no plano Pro chegando a US$ 0,0036 por milhão de tokens.
  • A OpenAI elevou a saída do GPT-5.5 para US$ 30 por milhão de tokens, ampliando a diferença em relação aos modelos de fronteira chineses.

DeepSeek e Xiaomi reduzem tarifas

DeepSeek confirmed em 22 de maio que um desconto temporário de 75% em seu modelo V4-Pro se tornaria permanente, fixando o custo de saída em US$ 0,87 por milhão de tokens e o de entrada em US$ 0,435.

A promoção estava prevista para expirar em 31 de maio.

Dias depois, o também laboratório chinês Xiaomi slashed as tarifas do MiMo-V2.5 em até 99% para entradas em cache, com efeito em 27 de maio, com acertos de cache no nível Pro custando apenas US$ 0,0036 por milhão de tokens.

Em contraste, o GPT-5.5 da OpenAI dobrou a tarifa de saída de seu predecessor para US$ 30 por milhão de tokens. O Claude Opus 4.7 da Anthropic lists US$ 5 para entrada e US$ 25 para saída.

Veja também: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

Engenheiros defendem a matemática

A Xiaomi também reconstruiu seus planos de tokens. O plano Max de US$ 100 agora grants 82 bilhões de tokens, ante 1,6 bilhão, com o mesmo valor comprando de cinco a oito vezes mais uso que antes.

Fuli Luo, que lidera a equipe MiMo da Xiaomi e ajudou a construir o DeepSeek-V2, tied os cortes a uma forma mais inteligente de armazenar e reutilizar dados que o modelo já processou.

Essa abordagem reduz drasticamente a demanda de computação.

Luo argumentou que o laboratório pode operar perto da capacidade total com as novas tarifas e ainda cobrir seus custos, o que sugere que o preço reflete ganhos reais de eficiência, e não uma promoção vendida com prejuízo.

As economias importam mais para tarefas de produção que reutilizam o mesmo contexto. Pipelines de agentes com prompts estáveis, processadores de documentos e ferramentas de busca batem no cache o tempo todo, então entradas em cache mais baratas reduzem diretamente a conta operacional.

Os laboratórios ocidentais enfrentam um dilema diferente. A guinada da OpenAI em direção a recursos de consumo e publicidade indica que a receita de tokens sozinha pode não sustentar sua avaliação.

Por que a diferença continua aumentando

DeepSeek e Xiaomi não começaram essa disputa. Os modelos chineses já praticavam preços inferiores aos rivais americanos antes de qualquer um dos anúncios.

MiniMax M2.7 opera a US$ 0,30 de entrada e US$ 1,20 de saída por milhão de tokens. O Kimi K2.5 da Moonshot AI sits em US$ 0,60 e US$ 2,50.

Analistas que acompanham custo em relação a desempenho de benchmark estimam a diferença de preço versus qualidade no 2º trimestre de 2026 entre modelos de fronteira chineses e americanos em algo entre 15 e 30 vezes, antes de qualquer desconto de cache. As reduções desta semana estreitam ainda mais essa diferença para as cargas de trabalho repetitivas que dominam implantações reais.

O padrão ecoa o início de 2025, quando os lançamentos de baixo custo da DeepSeek abalaram os mercados e forçaram os provedores ocidentais a defenderem seus preços. Um ano depois, a pressão só se intensificou, e a resposta dos laboratórios americanos tem sido manter ou aumentar tarifas, em vez de correr atrás do piso.

Leia a seguir: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply

Disclaimer e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e baseiam-se na opinião do autor. Não constituem aconselhamento financeiro, de investimento, legal ou fiscal. Os ativos de criptomoeda são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou deter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou executivos. Sempre conduza a sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Por que a IA chinesa agora custa 30 vezes menos que os modelos americanos | Yellow.com