中国最具实力的两家 AI 实验室本周将其模型价格降至西方竞争对手的一小部分,而 OpenAI 和 Anthropic 则走向相反方向。
关键要点:
- DeepSeek 于 5 月 22 日将其对 V4-Pro 的 75% 折扣永久化,将输出价固定在每百万 token 0.87 美元。
- 小米于 5 月 26 日将 MiMo-V2.5 价格最多下调 99%,缓存 Pro 输入最低至每百万 token 0.0036 美元。
- OpenAI 将 GPT-5.5 的输出价格提升至每百万 token 30 美元,进一步拉大与中国前沿模型的差距。
DeepSeek、小米降价
DeepSeek 于 5 月 22 日 确认,其对 V4-Pro 模型的临时 75% 折扣将转为长期策略,将输出价固定在每百万 token 0.87 美元、输入价为 0.435 美元。
此前该促销原定于 5 月 31 日到期。
几天后,中国同行实验室 小米 自 5 月 27 日起 大幅下调 MiMo-V2.5 在缓存输入场景下的费率,最高降幅达 99%,Pro 阶梯的缓存命中价低至每百万 token 0.0036 美元。
相比之下,OpenAI 的 GPT-5.5 将其前代的输出费率翻倍,上调至每百万 token 30 美元。Anthropic 的 Claude Opus 4.7 标价 为每百万 token 5 美元输入、25 美元输出。
相关阅读: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release
工程师为“账算得过来”辩护
小米也重构了其 token 计费方案。100 美元的 Max 套餐如今 提供 820 亿个 token,相比此前的 16 亿个,大致相同金额可购买到 5 至 8 倍的使用量。
领导小米 MiMo 团队、曾参与共建 DeepSeek-V2 的 骆富利(Fuli Luo) 将这轮降价 归因于 更聪明的数据存储与复用方式,即让模型能够重复使用已处理过的上下文。
这种方法大幅削减了算力需求。
骆表示,实验室在新价格下仍能在接近满负荷的情况下运行并覆盖成本,这表明定价反映的是真实的效率提升,而非以亏损换市场的“烧钱补贴”。
这类节省对会重复使用相同上下文的生产任务最为关键。使用稳定提示词的 Agent 流水线、文档处理器和检索工具都会高频命中缓存,更便宜的缓存输入会直接降低运行账单。
西方实验室面临的是不同的困境。OpenAI 向消费级功能和广告业务的转向,暗示仅靠 token 收入可能难以支撑其估值。
为何价差持续拉大
打响这场“价格战”的并非 DeepSeek 和小米。在这些公告之前,中国模型就已经在价格上大幅低于美国对手。
MiniMax M2.7 的计费为每百万 token 0.30 美元输入、1.20 美元输出。Moonshot AI 的 Kimi K2.5 定价 为 0.60 美元输入、2.50 美元输出。
按照成本与基准测试表现进行跟踪的分析师估算,2026 年第二季度中美前沿模型的“价格-质量比”差异约在 15 至 30 倍之间,且这一数字尚未计入缓存折扣。本周的降价,进一步扩大了在真实部署中占主导地位的重复性工作负载上的优势。
这一模式呼应了 2025 年初的情形,当时 DeepSeek 的低价发布令市场震动,迫使西方服务商为自身定价辩护。一年过去,压力不减反增,而美国实验室的回应更多是维持或上调价格,而不是追随中国厂商“卷到底”。
下篇阅读: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply





