Vì sao AI Trung Quốc hiện rẻ hơn mô hình Mỹ tới 30 lần

Hai trong số những phòng thí nghiệm AI mạnh nhất Trung Quốc đã giảm giá mô hình xuống chỉ còn một phần nhỏ so với các đối thủ phương Tây trong tuần này, trong khi OpenAI and Anthropic lại đi theo hướng ngược lại.

Các điểm chính:

DeepSeek biến mức giảm giá 75% cho V4-Pro thành vĩnh viễn vào ngày 22/5, cố định giá đầu ra ở mức 0,87 USD cho mỗi triệu token.

Xiaomi giảm giá MiMo-V2.5 tới 99% vào ngày 26/5, với input dạng cache của bản Pro thấp tới 0,0036 USD cho mỗi triệu token.

OpenAI nâng giá đầu ra GPT-5.5 lên 30 USD cho mỗi triệu token, nới rộng khoảng cách với các mô hình tiên phong của Trung Quốc.

DeepSeek, Xiaomi cắt giảm giá

DeepSeek confirmed ngày 22/5 rằng mức giảm giá tạm thời 75% cho mô hình V4-Pro sẽ trở thành vĩnh viễn, cố định giá đầu ra ở 0,87 USD cho mỗi triệu token và đầu vào ở 0,435 USD.

Khuyến mãi này ban đầu dự kiến hết hạn vào ngày 31/5.

Vài ngày sau, phòng thí nghiệm Trung Quốc Xiaomi slashed giá MiMo-V2.5 tới 99% cho các input được cache, có hiệu lực từ 27/5, với các lần trúng cache của gói Pro rẻ tới 0,0036 USD cho mỗi triệu token.

Ngược lại, GPT-5.5 từ OpenAI đã tăng gấp đôi giá đầu ra so với phiên bản tiền nhiệm, lên 30 USD cho mỗi triệu token. Claude Opus 4.7 từ Anthropic lists 5 USD cho input và 25 USD cho output.

Cũng nên đọc: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

Kỹ sư bảo vệ bài toán chi phí

Xiaomi cũng xây dựng lại các gói token của mình. Gói Max 100 USD giờ đây grants 82 tỷ token, từ mức 1,6 tỷ trước đó, với cùng số tiền nhưng cho phép sử dụng nhiều hơn gấp năm đến tám lần.

Fuli Luo, trưởng nhóm MiMo của Xiaomi và từng đồng xây dựng DeepSeek-V2, tied việc cắt giảm giá với cách thông minh hơn để lưu trữ và tái sử dụng dữ liệu mà mô hình đã xử lý.

Cách tiếp cận này cắt giảm mạnh nhu cầu tính toán.

Luo lập luận rằng phòng thí nghiệm có thể vận hành gần hết công suất ở mức giá mới mà vẫn bù đắp được chi phí, cho thấy mức giá phản ánh các cải thiện hiệu suất thực sự chứ không chỉ là khuyến mãi bán lỗ.

Khoản tiết kiệm này đặc biệt quan trọng với các tác vụ sản xuất tái sử dụng cùng một ngữ cảnh. Các pipeline tác tử với prompt ổn định, bộ xử lý tài liệu và công cụ truy xuất đều liên tục đánh vào cache, nên input cache rẻ hơn cắt giảm trực tiếp hóa đơn vận hành.

Các phòng thí nghiệm phương Tây đối mặt với một thế kẹt khác. Việc OpenAI xoay trục sang các tính năng cho người tiêu dùng và quảng cáo cho thấy doanh thu từ token có thể không đủ để nâng đỡ định giá của họ.

Vì sao khoảng cách ngày càng nới rộng

DeepSeek và Xiaomi không phải là bên mở màn cuộc đua này. Các mô hình Trung Quốc đã rẻ hơn đối thủ Mỹ ngay cả trước khi hai thông báo này được đưa ra.

MiniMax M2.7 tính 0,30 USD cho input và 1,20 USD cho output trên mỗi triệu token. Kimi K2.5 từ Moonshot AI sits ở mức 0,60 USD cho input và 2,50 USD cho output.

Các nhà phân tích theo dõi chi phí so với hiệu năng benchmark ước tính khoảng cách giá–chất lượng trong quý 2/2026 giữa các mô hình tiên phong Trung Quốc và Mỹ ở mức khoảng 15 đến 30 lần, trước khi tính bất kỳ khoản giảm giá từ cache. Các mức cắt giảm tuần này tiếp tục thu hẹp khoảng cách đó cho những khối lượng công việc lặp lại vốn chiếm ưu thế trong triển khai thực tế.

Mẫu hình này gợi lại đầu năm 2025, khi các bản phát hành giá rẻ của DeepSeek làm chao đảo thị trường và buộc các nhà cung cấp phương Tây phải bảo vệ mức giá của mình. Sau một năm, áp lực chỉ gia tăng, và phản ứng từ các phòng thí nghiệm Mỹ là giữ nguyên hoặc tăng giá thay vì chạy đua xuống đáy.

Đọc tiếp: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply