Por qué la IA china ahora cuesta 30 veces menos que los modelos estadounidenses

Dos de los laboratorios de IA más capaces de China redujeron esta semana los precios de sus modelos a una fracción de los de sus rivales occidentales, mientras que OpenAI y Anthropic se movieron en la dirección opuesta.

Puntos clave:

DeepSeek hizo permanente el 22 de mayo su descuento del 75% en V4-Pro, fijando el costo de salida en 0,87 USD por millón de tokens.

Xiaomi recortó los precios de MiMo-V2.5 hasta un 99% el 26 de mayo, con entradas en caché Pro tan bajas como 0,0036 USD por millón de tokens.

OpenAI elevó el costo de salida de GPT-5.5 a 30 USD por millón de tokens, ampliando la brecha con los modelos punteros chinos.

DeepSeek y Xiaomi recortan tarifas

DeepSeek confirmó el 22 de mayo que un descuento temporal del 75% en su modelo V4-Pro se volvería permanente, fijando la salida en 0,87 USD por millón de tokens y la entrada en 0,435 USD.

La promoción estaba prevista para expirar el 31 de mayo.

Días después, el también laboratorio chino Xiaomi recortó drásticamente las tarifas de MiMo-V2.5 hasta un 99% para entradas en caché, con efecto el 27 de mayo, con aciertos de caché del nivel Pro tan bajos como 0,0036 USD por millón de tokens.

En contraste, GPT-5.5 de OpenAI duplicó la tarifa de salida de su predecesor hasta 30 USD por millón de tokens. Claude Opus 4.7 de Anthropic lista 5 USD de entrada y 25 USD de salida.

También lee: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

Ingenieros defienden las cifras

Xiaomi también rediseñó sus planes de tokens. El plan Max de 100 USD ahora otorga 82 000 millones de tokens, frente a 1.600 millones, con el mismo dinero comprando entre cinco y ocho veces más uso que antes.

Fuli Luo, quien lidera el equipo MiMo de Xiaomi y una vez co-creó DeepSeek-V2, vinculó los recortes a una forma más inteligente de almacenar y reutilizar datos que el modelo ya ha procesado.

Ese enfoque reduce drásticamente la demanda de cómputo.

Luo sostuvo que el laboratorio puede operar cerca de su capacidad máxima con las nuevas tarifas y aun así cubrir sus costos, lo que sugiere que los precios reflejan ganancias reales de eficiencia más que una promoción de pérdida asumida.

Los ahorros importan sobre todo para tareas en producción que reutilizan el mismo contexto. Los pipelines de agentes con prompts estables, los procesadores de documentos y las herramientas de recuperación golpean la caché constantemente, de modo que una entrada en caché más barata reduce directamente la factura operativa.

Los laboratorios occidentales enfrentan una disyuntiva distinta. El giro de OpenAI hacia funciones de consumo y publicidad insinúa que los ingresos por tokens por sí solos pueden no sostener su valoración.

Por qué la brecha sigue ampliándose

DeepSeek y Xiaomi no iniciaron este pulso. Los modelos chinos ya ofrecían precios inferiores a los de sus rivales estadounidenses antes de estos anuncios.

MiniMax M2.7 funciona con 0,30 USD de entrada y 1,20 USD de salida por millón de tokens. Kimi K2.5 de Moonshot AI se sitúa en 0,60 USD y 2,50 USD.

Los analistas que comparan costo con rendimiento en benchmarks estiman que la brecha precio‑calidad del segundo trimestre de 2026 entre modelos punteros chinos y estadounidenses ronda entre 15 y 30 veces, antes de cualquier descuento por caché. Las rebajas de esta semana estrechan aún más esa brecha para las cargas de trabajo repetitivas que dominan los despliegues reales.

El patrón recuerda a inicios de 2025, cuando los lanzamientos de bajo costo de DeepSeek sacudieron los mercados y obligaron a los proveedores occidentales a defender sus precios. Un año después, la presión solo se ha intensificado, y la respuesta de los laboratorios estadounidenses ha sido mantener o subir tarifas en vez de perseguir el mínimo.

Lee a continuación: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply