Perché l'AI cinese ora costa 30 volte meno dei modelli americani

Perché l'AI cinese ora costa 30 volte meno dei modelli americani

Due dei laboratori di AI più avanzati della Cina hanno tagliato questa settimana i prezzi dei loro modelli a una frazione di quelli dei rivali occidentali, mentre OpenAI and Anthropic si sono mossi nella direzione opposta.

Punti chiave:

  • DeepSeek ha reso permanente, il 22 maggio, lo sconto del 75% sul modello V4-Pro, fissando l'output a 0,87 $ per milione di token.
  • Xiaomi ha tagliato i prezzi di MiMo-V2.5 fino al 99% il 26 maggio, con input Pro in cache fino a 0,0036 $ per milione di token.
  • OpenAI ha alzato l'output di GPT-5.5 a 30 $ per milione di token, ampliando il divario con i modelli di frontiera cinesi.

DeepSeek e Xiaomi tagliano le tariffe

DeepSeek ha confermato il 22 maggio che uno sconto temporaneo del 75% sul modello V4-Pro sarebbe diventato permanente, fissando l'output a 0,87 $ per milione di token e l'input a 0,435 $.

La promozione sarebbe dovuta scadere il 31 maggio.

Pochi giorni dopo, il laboratorio cinese Xiaomi ha tagliato drasticamente le tariffe di MiMo-V2.5 fino al 99% per gli input in cache, a partire dal 27 maggio, con gli hit di cache del livello Pro a soli 0,0036 $ per milione di token.

Per contro, GPT-5.5 di OpenAI ha raddoppiato il tasso di output del suo predecessore, portandolo a 30 $ per milione di token. Claude Opus 4.7 di Anthropic indica 5 $ per l'input e 25 $ per l'output.

Vedi anche: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

Gli ingegneri difendono i numeri

Xiaomi ha anche ricostruito i suoi piani di token. Il piano Max da 100 $ ora concede 82 miliardi di token, rispetto a 1,6 miliardi in precedenza, con lo stesso importo che ora compra da cinque a otto volte più utilizzo.

Fuli Luo, che guida il team MiMo di Xiaomi e in passato ha co-sviluppato DeepSeek-V2, ha collegato i tagli a un modo più intelligente di archiviare e riutilizzare i dati che il modello ha già elaborato.

Questo approccio riduce drasticamente la domanda di calcolo.

Luo ha sostenuto che il laboratorio può operare quasi a piena capacità con le nuove tariffe e coprire comunque i costi, il che suggerisce che i prezzi riflettano reali guadagni di efficienza piuttosto che una promozione in perdita.

I risparmi contano soprattutto per i compiti in produzione che riusano lo stesso contesto. Le pipeline di agenti con prompt stabili, i processori di documenti e gli strumenti di retrieval colpiscono continuamente la cache, quindi un input in cache più economico riduce direttamente il conto operativo.

I laboratori occidentali affrontano un vincolo diverso. La svolta di OpenAI verso funzionalità consumer e pubblicità lascia intendere che i soli ricavi da token potrebbero non sostenere la sua valutazione.

Perché il divario continua ad allargarsi

DeepSeek e Xiaomi non hanno aperto questa competizione. I modelli cinesi già sottoprezzavano i rivali americani prima di questi annunci.

MiniMax M2.7 costa 0,30 $ di input e 1,20 $ di output per milione di token. Kimi K2.5 di Moonshot AI si colloca a 0,60 $ e 2,50 $.

Gli analisti che confrontano i costi con le prestazioni nei benchmark stimano per il Q2 2026 un divario di prezzo–qualità tra modelli di frontiera cinesi e americani di circa 15–30 volte, prima di qualsiasi sconto sulla cache. I tagli di questa settimana riducono ulteriormente quel divario per i carichi di lavoro ripetitivi che dominano le implementazioni reali.

Il modello richiama l'inizio del 2025, quando i rilasci a basso costo di DeepSeek scossero i mercati e costrinsero i provider occidentali a difendere i propri prezzi. A un anno di distanza, la pressione si è solo intensificata e la risposta dei laboratori americani è stata di mantenere o aumentare le tariffe invece di inseguire il minimo.

Da leggere dopo: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply

Disclaimer e avvertenza sui rischi: Le informazioni fornite in questo articolo sono solo per scopi educativi e informativi e sono basate sull'opinione dell'autore. Non costituiscono consulenza finanziaria, di investimento, legale o fiscale. Gli asset di criptovaluta sono altamente volatili e soggetti ad alto rischio, incluso il rischio di perdere tutto o una parte sostanziale del tuo investimento. Il trading o il possesso di asset crypto potrebbe non essere adatto a tutti gli investitori. Le opinioni espresse in questo articolo sono esclusivamente quelle dell'autore/autori e non rappresentano la politica ufficiale o la posizione di Yellow, dei suoi fondatori o dei suoi dirigenti. Conduci sempre la tua ricerca approfondita (D.Y.O.R.) e consulta un professionista finanziario autorizzato prima di prendere qualsiasi decisione di investimento.
Perché l'AI cinese ora costa 30 volte meno dei modelli americani | Yellow.com