Due dei laboratori di AI più avanzati della Cina hanno tagliato questa settimana i prezzi dei loro modelli a una frazione di quelli dei rivali occidentali, mentre OpenAI and Anthropic si sono mossi nella direzione opposta.
Punti chiave:
- DeepSeek ha reso permanente, il 22 maggio, lo sconto del 75% sul modello V4-Pro, fissando l'output a 0,87 $ per milione di token.
- Xiaomi ha tagliato i prezzi di MiMo-V2.5 fino al 99% il 26 maggio, con input Pro in cache fino a 0,0036 $ per milione di token.
- OpenAI ha alzato l'output di GPT-5.5 a 30 $ per milione di token, ampliando il divario con i modelli di frontiera cinesi.
DeepSeek e Xiaomi tagliano le tariffe
DeepSeek ha confermato il 22 maggio che uno sconto temporaneo del 75% sul modello V4-Pro sarebbe diventato permanente, fissando l'output a 0,87 $ per milione di token e l'input a 0,435 $.
La promozione sarebbe dovuta scadere il 31 maggio.
Pochi giorni dopo, il laboratorio cinese Xiaomi ha tagliato drasticamente le tariffe di MiMo-V2.5 fino al 99% per gli input in cache, a partire dal 27 maggio, con gli hit di cache del livello Pro a soli 0,0036 $ per milione di token.
Per contro, GPT-5.5 di OpenAI ha raddoppiato il tasso di output del suo predecessore, portandolo a 30 $ per milione di token. Claude Opus 4.7 di Anthropic indica 5 $ per l'input e 25 $ per l'output.
Vedi anche: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release
Gli ingegneri difendono i numeri
Xiaomi ha anche ricostruito i suoi piani di token. Il piano Max da 100 $ ora concede 82 miliardi di token, rispetto a 1,6 miliardi in precedenza, con lo stesso importo che ora compra da cinque a otto volte più utilizzo.
Fuli Luo, che guida il team MiMo di Xiaomi e in passato ha co-sviluppato DeepSeek-V2, ha collegato i tagli a un modo più intelligente di archiviare e riutilizzare i dati che il modello ha già elaborato.
Questo approccio riduce drasticamente la domanda di calcolo.
Luo ha sostenuto che il laboratorio può operare quasi a piena capacità con le nuove tariffe e coprire comunque i costi, il che suggerisce che i prezzi riflettano reali guadagni di efficienza piuttosto che una promozione in perdita.
I risparmi contano soprattutto per i compiti in produzione che riusano lo stesso contesto. Le pipeline di agenti con prompt stabili, i processori di documenti e gli strumenti di retrieval colpiscono continuamente la cache, quindi un input in cache più economico riduce direttamente il conto operativo.
I laboratori occidentali affrontano un vincolo diverso. La svolta di OpenAI verso funzionalità consumer e pubblicità lascia intendere che i soli ricavi da token potrebbero non sostenere la sua valutazione.
Perché il divario continua ad allargarsi
DeepSeek e Xiaomi non hanno aperto questa competizione. I modelli cinesi già sottoprezzavano i rivali americani prima di questi annunci.
MiniMax M2.7 costa 0,30 $ di input e 1,20 $ di output per milione di token. Kimi K2.5 di Moonshot AI si colloca a 0,60 $ e 2,50 $.
Gli analisti che confrontano i costi con le prestazioni nei benchmark stimano per il Q2 2026 un divario di prezzo–qualità tra modelli di frontiera cinesi e americani di circa 15–30 volte, prima di qualsiasi sconto sulla cache. I tagli di questa settimana riducono ulteriormente quel divario per i carichi di lavoro ripetitivi che dominano le implementazioni reali.
Il modello richiama l'inizio del 2025, quando i rilasci a basso costo di DeepSeek scossero i mercati e costrinsero i provider occidentali a difendere i propri prezzi. A un anno di distanza, la pressione si è solo intensificata e la risposta dei laboratori americani è stata di mantenere o aumentare le tariffe invece di inseguire il minimo.
Da leggere dopo: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply





