为何中国 AI 如今比美国模型便宜 30 倍

中国最具实力的两家 AI 实验室本周将其模型价格降至西方竞争对手的一小部分，而 OpenAI 和 Anthropic 则走向相反方向。

关键要点：

DeepSeek 于 5 月 22 日将其对 V4-Pro 的 75% 折扣永久化，将输出价固定在每百万 token 0.87 美元。

小米于 5 月 26 日将 MiMo-V2.5 价格最多下调 99%，缓存 Pro 输入最低至每百万 token 0.0036 美元。

OpenAI 将 GPT-5.5 的输出价格提升至每百万 token 30 美元，进一步拉大与中国前沿模型的差距。

DeepSeek、小米降价

DeepSeek 于 5 月 22 日确认，其对 V4-Pro 模型的临时 75% 折扣将转为长期策略，将输出价固定在每百万 token 0.87 美元、输入价为 0.435 美元。

此前该促销原定于 5 月 31 日到期。

几天后，中国同行实验室小米自 5 月 27 日起大幅下调 MiMo-V2.5 在缓存输入场景下的费率，最高降幅达 99%，Pro 阶梯的缓存命中价低至每百万 token 0.0036 美元。

相比之下，OpenAI 的 GPT-5.5 将其前代的输出费率翻倍，上调至每百万 token 30 美元。Anthropic 的 Claude Opus 4.7 标价为每百万 token 5 美元输入、25 美元输出。

工程师为“账算得过来”辩护

小米也重构了其 token 计费方案。100 美元的 Max 套餐如今提供 820 亿个 token，相比此前的 16 亿个，大致相同金额可购买到 5 至 8 倍的使用量。

领导小米 MiMo 团队、曾参与共建 DeepSeek-V2 的 骆富利（Fuli Luo） 将这轮降价归因于更聪明的数据存储与复用方式，即让模型能够重复使用已处理过的上下文。

这种方法大幅削减了算力需求。

骆表示，实验室在新价格下仍能在接近满负荷的情况下运行并覆盖成本，这表明定价反映的是真实的效率提升，而非以亏损换市场的“烧钱补贴”。

这类节省对会重复使用相同上下文的生产任务最为关键。使用稳定提示词的 Agent 流水线、文档处理器和检索工具都会高频命中缓存，更便宜的缓存输入会直接降低运行账单。

西方实验室面临的是不同的困境。OpenAI 向消费级功能和广告业务的转向，暗示仅靠 token 收入可能难以支撑其估值。

为何价差持续拉大

打响这场“价格战”的并非 DeepSeek 和小米。在这些公告之前，中国模型就已经在价格上大幅低于美国对手。

MiniMax M2.7 的计费为每百万 token 0.30 美元输入、1.20 美元输出。Moonshot AI 的 Kimi K2.5 定价为 0.60 美元输入、2.50 美元输出。

按照成本与基准测试表现进行跟踪的分析师估算，2026 年第二季度中美前沿模型的“价格-质量比”差异约在 15 至 30 倍之间，且这一数字尚未计入缓存折扣。本周的降价，进一步扩大了在真实部署中占主导地位的重复性工作负载上的优势。

这一模式呼应了 2025 年初的情形，当时 DeepSeek 的低价发布令市场震动，迫使西方服务商为自身定价辩护。一年过去，压力不减反增，而美国实验室的回应更多是维持或上调价格，而不是追随中国厂商“卷到底”。

下篇阅读： Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply