Hai trong số các phòng thí nghiệm AI mạnh nhất Trung Quốc đã cắt giá mô hình xuống chỉ còn một phần nhỏ so với đối thủ phương Tây trong tuần này, trong khi OpenAI and Anthropic lại đi theo hướng ngược lại.
Các điểm chính:
- DeepSeek biến mức giảm giá 75% cho V4-Pro thành vĩnh viễn vào ngày 22/5, cố định chi phí đầu ra ở mức 0,87 USD mỗi triệu token.
- Xiaomi cắt giá MiMo-V2.5 tới 99% vào ngày 26/5, với input đã được cache của bản Pro thấp tới 0,0036 USD mỗi triệu token.
- OpenAI nâng giá đầu ra GPT-5.5 lên 30 USD mỗi triệu token, nới rộng khoảng cách với các mô hình tiên phong của Trung Quốc.
DeepSeek, Xiaomi giảm mạnh giá
DeepSeek xác nhận ngày 22/5 rằng chương trình giảm giá tạm thời 75% cho mô hình V4-Pro sẽ trở thành vĩnh viễn, cố định chi phí đầu ra ở 0,87 USD mỗi triệu token và input ở 0,435 USD.
Trước đó, chương trình khuyến mãi được lên lịch hết hạn vào ngày 31/5.
Vài ngày sau, phòng thí nghiệm Trung Quốc Xiaomi slashed giá MiMo-V2.5 tới 99% cho các input đã được cache, hiệu lực từ 27/5, với cache hit của gói Pro thấp tới 0,0036 USD mỗi triệu token.
Ngược lại, GPT-5.5 của OpenAI đã nhân đôi giá đầu ra so với phiên bản tiền nhiệm lên 30 USD mỗi triệu token. Claude Opus 4.7 của Anthropic lists 5 USD cho input và 25 USD cho output.
Cũng nên đọc: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release
Kỹ sư bảo vệ phép tính
Xiaomi cũng xây dựng lại các gói token của mình. Gói Max 100 USD giờ đây grants 82 tỷ token, so với 1,6 tỷ trước đó, với cùng số tiền nhưng cho phép sử dụng nhiều hơn gấp năm đến tám lần.
Fuli Luo, trưởng nhóm MiMo của Xiaomi và từng đồng xây dựng DeepSeek-V2, tied việc cắt giảm giá với một cách thông minh hơn để lưu trữ và tái sử dụng dữ liệu mà mô hình đã xử lý.
Cách tiếp cận đó cắt giảm mạnh nhu cầu tính toán.
Luo lập luận rằng phòng thí nghiệm có thể vận hành gần hết công suất ở mức giá mới mà vẫn bù được chi phí, cho thấy mức giá phản ánh các cải thiện hiệu quả thực sự chứ không phải một chương trình bán lỗ để câu khách.
Khoản tiết kiệm này quan trọng nhất với các tác vụ vận hành sử dụng lại cùng một ngữ cảnh. Các pipeline agent với prompt ổn định, bộ xử lý tài liệu và công cụ truy xuất đều liên tục truy cập cache, nên input đã được cache rẻ hơn sẽ giảm trực tiếp hóa đơn vận hành.
Các phòng thí nghiệm phương Tây đối mặt với một thế khó khác. Việc OpenAI xoay trục sang các tính năng hướng người tiêu dùng và quảng cáo ám chỉ rằng doanh thu từ token đơn thuần có thể không đủ để chống đỡ mức định giá của hãng.
Vì sao khoảng cách ngày càng lớn
DeepSeek và Xiaomi không phải là bên khơi mào cuộc đua này. Các mô hình Trung Quốc vốn đã rẻ hơn đối thủ Mỹ từ trước khi hai thông báo này được đưa ra.
MiniMax M2.7 chạy ở mức 0,30 USD cho input và 1,20 USD cho output mỗi triệu token. Kimi K2.5 của Moonshot AI sits ở mức 0,60 USD và 2,50 USD.
Các nhà phân tích theo dõi chi phí so với hiệu năng benchmark ước tính chênh lệch giá–chất lượng trong quý 2/2026 giữa mô hình tiên phong Trung Quốc và Mỹ vào khoảng 15 đến 30 lần, trước khi tính bất kỳ giảm giá do cache nào. Các đợt giảm tuần này còn thu hẹp chênh lệch thêm nữa cho những khối lượng công việc lặp đi lặp lại vốn chiếm ưu thế trong triển khai thực tế.
Mô hình này gợi lại đầu năm 2025, khi các bản phát hành giá rẻ của DeepSeek làm rung chuyển thị trường và buộc nhà cung cấp phương Tây phải bảo vệ bảng giá của mình. Một năm trôi qua, áp lực chỉ tăng thêm, và phản ứng từ các phòng thí nghiệm Mỹ là giữ hoặc tăng giá thay vì chạy đua xuống đáy.





