Por que a IA chinesa agora custa 30 vezes menos que os modelos americanos

Por que a IA chinesa agora custa 30 vezes menos que os modelos americanos

Dois dos laboratórios de IA mais capazes da China reduziram nesta semana os preços de seus modelos para uma fração dos rivais ocidentais, enquanto OpenAI and Anthropic seguiram na direção oposta.

Pontos principais:

  • A DeepSeek tornou permanente, em 22 de maio, o desconto de 75% do V4-Pro, fixando o custo de saída em US$ 0,87 por milhão de tokens.
  • A Xiaomi reduziu em até 99% os preços do MiMo-V2.5 em 26 de maio, com entradas em cache do nível Pro custando apenas US$ 0,0036 por milhão de tokens.
  • A OpenAI elevou o custo de saída do GPT-5.5 para US$ 30 por milhão de tokens, ampliando a distância em relação aos modelos de ponta chineses.

DeepSeek e Xiaomi reduzem tarifas

A DeepSeek confirmou em 22 de maio que um desconto temporário de 75% em seu modelo V4-Pro se tornaria permanente, fixando a saída em US$ 0,87 por milhão de tokens e a entrada em US$ 0,435.

A promoção estava prevista para expirar em 31 de maio.

Dias depois, o laboratório chinês Xiaomi reduziu drasticamente as tarifas do MiMo-V2.5 em até 99% para entradas em cache, a partir de 27 de maio, com acertos de cache do nível Pro custando apenas US$ 0,0036 por milhão de tokens.

Em contraste, o GPT-5.5 da OpenAI dobrou a tarifa de saída de seu antecessor para US$ 30 por milhão de tokens. O Claude Opus 4.7 da Anthropic lista US$ 5 para entrada e US$ 25 para saída.

Veja também: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

Engenheiros defendem a matemática

A Xiaomi também refez seus planos de tokens. O plano Max de US$ 100 agora concede 82 bilhões de tokens, em vez de 1,6 bilhão, com o mesmo valor comprando de cinco a oito vezes mais uso do que antes.

Fuli Luo, que lidera a equipe MiMo da Xiaomi e já co-desenvolveu o DeepSeek-V2, relacionou os cortes a uma forma mais inteligente de armazenar e reutilizar dados que o modelo já processou.

Essa abordagem reduz drasticamente a demanda computacional.

Luo argumentou que o laboratório pode operar próximo à capacidade máxima com as novas tarifas e ainda cobrir seus custos, o que sugere que os preços refletem ganhos reais de eficiência em vez de uma promoção de venda com prejuízo.

As economias importam principalmente para tarefas de produção que reutilizam o mesmo contexto. Pipelines de agentes com prompts estáveis, processadores de documentos e ferramentas de recuperação acessam o cache constantemente, portanto a entrada em cache mais barata reduz diretamente a conta operacional.

Os laboratórios ocidentais enfrentam um dilema diferente. A guinada da OpenAI em direção a recursos para o consumidor e publicidade indica que a receita de tokens sozinha pode não sustentar sua avaliação.

Por que a diferença continua aumentando

DeepSeek e Xiaomi não começaram essa disputa. Modelos chineses já cobravam menos do que os rivais americanos antes de qualquer um desses anúncios.

O MiniMax M2.7 opera a US$ 0,30 de entrada e US$ 1,20 de saída por milhão de tokens. O Kimi K2.5 da Moonshot AI fica em US$ 0,60 e US$ 2,50.

Analistas que acompanham custo em relação ao desempenho em benchmarks estimam a diferença de preço versus qualidade no 2º trimestre de 2026 entre modelos de ponta chineses e americanos em cerca de 15 a 30 vezes, antes de qualquer desconto de cache. As reduções desta semana ampliam ainda mais essa diferença para as cargas de trabalho repetitivas que dominam as implantações reais.

O padrão lembra o início de 2025, quando os lançamentos de baixo custo da DeepSeek sacudiram os mercados e forçaram provedores ocidentais a defender seus preços. Um ano depois, a pressão só se intensificou, e a resposta dos laboratórios americanos tem sido manter ou aumentar as tarifas em vez de competir pelo menor preço.

Leia a seguir: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply

Disclaimer e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e baseiam-se na opinião do autor. Não constituem aconselhamento financeiro, de investimento, legal ou fiscal. Os ativos de criptomoeda são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou deter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou executivos. Sempre conduza a sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Por que a IA chinesa agora custa 30 vezes menos que os modelos americanos | Yellow.com