Mengapa AI Tiongkok Kini Biayanya 30 Kali Lebih Murah Dibandingkan Model Amerika

Dua dari laboratorium AI paling mumpuni di Tiongkok memangkas harga model mereka menjadi hanya sebagian kecil dari pesaing Barat minggu ini, sementara OpenAI dan Anthropic justru bergerak sebaliknya.

Poin-Poin Utama:

DeepSeek menjadikan diskon V4-Pro 75% bersifat permanen pada 22 Mei, menetapkan biaya output di $0,87 per satu juta token.

Xiaomi memangkas harga MiMo-V2.5 hingga 99% pada 26 Mei, dengan input Pro yang tercache serendah $0,0036 per satu juta token.

OpenAI menaikkan biaya output GPT-5.5 menjadi $30 per satu juta token, memperlebar jurang dengan model frontier Tiongkok.

DeepSeek dan Xiaomi Memangkas Tarif

DeepSeek mengonfirmasi pada 22 Mei bahwa diskon sementara 75% untuk model V4-Pro akan menjadi permanen, menetapkan biaya output di $0,87 per satu juta token dan input di $0,435.

Promosi itu sebelumnya dijadwalkan berakhir pada 31 Mei.

Beberapa hari kemudian, lab Tiongkok lain, Xiaomi, memangkas tarif MiMo-V2.5 hingga 99% untuk input yang tercache, berlaku 27 Mei, dengan cache hit tier Pro serendah $0,0036 per satu juta token.

Sebaliknya, GPT-5.5 dari OpenAI menggandakan tarif output pendahulunya menjadi $30 per satu juta token. Claude Opus 4.7 dari Anthropic mencantumkan biaya $5 untuk input dan $25 untuk output.

Juga Baca: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

Insinyur Membela Perhitungannya

Xiaomi juga merombak paket tokennya. Paket Max $100 kini memberikan 82 miliar token, naik dari 1,6 miliar, dengan jumlah uang yang sama kini membeli penggunaan lima hingga delapan kali lebih banyak daripada sebelumnya.

Fuli Luo, pimpinan tim MiMo Xiaomi yang dulu ikut membangun DeepSeek-V2, mengaitkan pemangkasan itu dengan cara yang lebih cerdas untuk menyimpan dan memakai ulang data yang sudah pernah diproses model.

Pendekatan tersebut memangkas kebutuhan komputasi secara tajam.

Luo berargumen bahwa lab dapat berjalan hampir di kapasitas penuh pada tarif baru dan tetap menutup biayanya, yang menunjukkan bahwa penetapan harga mencerminkan peningkatan efisiensi nyata, bukan promosi bakar uang.

Penghematan ini paling penting untuk tugas produksi yang memakai ulang konteks yang sama. Rangkaian agen dengan prompt stabil, pemroses dokumen, dan alat retrieval terus-menerus memukul cache, sehingga input tercache yang lebih murah memotong tagihan operasional secara langsung.

Lab Barat menghadapi kebuntuan berbeda. Poros OpenAI ke fitur konsumen dan periklanan mengisyaratkan bahwa pendapatan token saja mungkin tidak cukup menopang valuasinya.

Mengapa Jurangnya Terus Melebar

DeepSeek dan Xiaomi bukan pihak yang memulai persaingan ini. Model Tiongkok sudah lebih murah daripada pesaing Amerika bahkan sebelum kedua pengumuman tersebut.

MiniMax M2.7 berjalan di $0,30 untuk input dan $1,20 untuk output per satu juta token. Kimi K2.5 dari Moonshot AI berada di $0,60 dan $2,50.

Analis yang melacak biaya terhadap kinerja benchmark memperkirakan kesenjangan harga terhadap kualitas pada Q2 2026 antara model frontier Tiongkok dan Amerika berada di kisaran 15 hingga 30 kali, sebelum diskon cache apa pun. Pemangkasan minggu ini makin mempersempit kesenjangan tersebut untuk beban kerja repetitif yang mendominasi penerapan nyata.

Pola ini menggemakan awal 2025, ketika rilis berbiaya rendah DeepSeek mengguncang pasar dan memaksa penyedia Barat mempertahankan harga mereka. Setahun kemudian, tekanannya hanya makin kuat, dan respons dari lab Amerika adalah mempertahankan atau menaikkan tarif alih-alih mengejar harga dasar.

Baca Berikutnya: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply