Dlaczego chińska AI kosztuje teraz 30 razy mniej niż amerykańskie modele

Dwa z najbardziej zaawansowanych chińskich laboratoriów AI obniżyły w tym tygodniu ceny swoich modeli do ułamka stawek zachodnich rywali, podczas gdy OpenAI i Anthropic poszły w przeciwnym kierunku.

Kluczowe punkty:

DeepSeek 22 maja trwale wprowadził 75% zniżki na model V4-Pro, ustalając koszt wyjścia na 0,87 USD za milion tokenów.

Xiaomi 26 maja obniżyło ceny MiMo-V2.5 nawet o 99%, z cache’owanymi wejściami Pro za jedyne 0,0036 USD za milion tokenów.

OpenAI podniosło koszt wyjścia GPT-5.5 do 30 USD za milion tokenów, jeszcze bardziej zwiększając różnicę wobec chińskich modeli czołowych.

DeepSeek i Xiaomi tną stawki

DeepSeek potwierdził 22 maja, że tymczasowa 75‑procentowa zniżka na model V4-Pro stanie się stała, ustalając koszt wyjścia na 0,87 USD za milion tokenów, a wejścia na 0,435 USD.

Promocja miała pierwotnie wygasnąć 31 maja.

Kilka dni później chińskie laboratorium Xiaomi drastycznie obniżyło ceny MiMo-V2.5 nawet o 99% dla cache’owanych wejść, ze skutkiem od 27 maja, przy czym trafienia z cache w planie Pro kosztują zaledwie 0,0036 USD za milion tokenów.

Dla porównania, GPT-5.5 od OpenAI podwoił stawkę wyjścia względem poprzednika do 30 USD za milion tokenów. Claude Opus 4.7 od Anthropic wycenia wejście na 5 USD, a wyjście na 25 USD.

Zobacz także: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

Inżynierowie bronią kalkulacji

Xiaomi przebudowało też swoje plany tokenowe. Plan Max za 100 USD teraz zapewnia 82 miliardy tokenów, zamiast wcześniejszych 1,6 miliarda, co oznacza, że za tę samą kwotę użytkownicy dostają pięć do ośmiu razy więcej użycia niż przedtem.

Fuli Luo, szef zespołu MiMo w Xiaomi i współtwórca DeepSeek‑V2, powiązał obniżki z inteligentniejszym sposobem przechowywania i ponownego wykorzystywania danych, które model już przetworzył.

To podejście znacząco zmniejsza zapotrzebowanie na moc obliczeniową.

Luo argumentował, że laboratorium może działać niemal z pełnym wykorzystaniem zasobów przy nowych stawkach i nadal pokrywać koszty, co sugeruje, że ceny odzwierciedlają realne zyski efektywności, a nie promocję sprzedawaną poniżej kosztów.

Oszczędności są najważniejsze w zadaniach produkcyjnych, które wielokrotnie używają tego samego kontekstu. Potoki agentów ze stałymi promptami, procesory dokumentów i narzędzia wyszukiwawcze cały czas trafiają w cache, więc tańsze cache’owane wejście bezpośrednio obniża rachunek za działanie.

Zachodnie laboratoria stoją przed innym dylematem. Zwrot OpenAI w stronę funkcji konsumenckich i reklam sugeruje, że sam przychód z tokenów może nie wystarczyć do utrzymania jego wyceny.

Dlaczego różnica wciąż rośnie

DeepSeek i Xiaomi nie rozpoczęły tej rywalizacji. Chińskie modele już wcześniej były tańsze od amerykańskich odpowiedników, zanim pojawiły się te ogłoszenia.

MiniMax M2.7 kosztuje 0,30 USD za wejście i 1,20 USD za wyjście za milion tokenów. Kimi K2.5 od Moonshot AI plasuje się na poziomie 0,60 USD i 2,50 USD.

Analitycy śledzący koszty w relacji do wyników benchmarków szacują, że w II kwartale 2026 różnica cenowo‑jakościowa między chińskimi a amerykańskimi modelami czołowymi wynosi około 15–30 razy, jeszcze przed uwzględnieniem zniżek na cache. Tegoroczne obniżki jeszcze bardziej zmniejszają tę różnicę w przypadku powtarzalnych obciążeń, które dominują w realnych wdrożeniach.

Ten schemat przypomina początek 2025 roku, kiedy tanie modele DeepSeek wstrząsnęły rynkami i zmusiły zachodnich dostawców do obrony ich polityki cenowej. Rok później presja tylko wzrosła, a odpowiedzią amerykańskich laboratoriów było utrzymanie lub podwyższanie stawek, zamiast ścigania się o najniższą cenę.

Przeczytaj następnie: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply