为什么中国 AI 现在比美国模型便宜 30 倍

为什么中国 AI 现在比美国模型便宜 30 倍

中国两家实力最强的 AI 实验室本周将模型价格降至远低于西方对手的水平,而 OpenAI and Anthropic 则走向了相反的方向。

要点概览:

  • DeepSeek 于 5 月 22 日将其对 V4-Pro 的 75% 折扣永久化,将输出单价锁定在每百万 token 0.87 美元。
  • 小米于 5 月 26 日将 MiMo-V2.5 价格最多下调 99%,缓存 Pro 输入最低至每百万 token 0.0036 美元。
  • OpenAI 将 GPT-5.5 输出价格提升至每百万 token 30 美元,进一步拉大与中国前沿模型之间的差距。

DeepSeek 与小米降价

DeepSeek 在 5 月 22 日确认,其对 V4-Pro 模型临时 75% 折扣将变为长期政策,将输出价锁定为每百万 token 0.87 美元,输入价为 0.435 美元。

原本这次促销计划在 5 月 31 日到期。

几天之后,中国另一家实验室 小米 于 5 月 27 日大幅下调 MiMo-V2.5 的缓存输入价格,降幅最高达 99%,其中 Pro 档的缓存命中价格最低仅为每百万 token 0.0036 美元。

相比之下,OpenAI 的 GPT-5.5 将其前代模型的输出单价翻倍至每百万 token 30 美元。Anthropic 的 Claude Opus 4.7 标价 为每百万 token 输入 5 美元、输出 25 美元。

延伸阅读: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release

工程师为这笔账辩护

小米也重做了其 token 套餐。100 美元的 Max 套餐现在提供 820 亿个 token,而此前只有 16 亿个,相同预算下可获得 5 到 8 倍的使用量。

小米 MiMo 团队负责人、曾共同打造 DeepSeek-V2 的 罗富力 将这轮降价归因于 一种更智能的方式来存储和重用模型已处理的数据。

这种方法大幅削减了算力需求。

罗富力认为,在新价格下实验室仍然可以在接近满负载的情况下运行并覆盖成本,这意味着定价反映了真实的效率提升,而非单纯的亏本拉新式促销。

这些节省对重复利用相同上下文的生产任务尤为关键。使用稳定提示词的智能体流水线、文档处理器和检索工具都会频繁命中缓存,因此更便宜的缓存输入会直接降低运行账单。

西方实验室面临的是不同的困境。OpenAI 转向面向消费者功能与广告的策略,暗示仅靠 token 收入可能难以支撑其估值。

差距为何越拉越大

打响这场“价格战”的并不是 DeepSeek 和小米。在此次宣布之前,中国模型的价格就已经明显低于美国对手。

MiniMax M2.7 的输入价为每百万 token 0.30 美元,输出为 1.20 美元。Moonshot AIKimi K2.5 定价 为每百万 token 输入 0.60 美元、输出 2.50 美元。

将成本与基准性能对比的分析人士估算,在不考虑任何缓存折扣的情况下,2026 年二季度中美前沿模型在“价格/质量”上的差距约为 15 至 30 倍。本周的降价进一步缩小了这一差距,尤其是在真实部署中占主导地位的重复性工作负载上。

这一模式呼应了 2025 年初的情形,当时 DeepSeek 的低成本发布曾令市场震动,并迫使西方服务商为其定价辩护。一年之后,压力有增无减,而美国实验室的回应却是维持甚至上调价格,而不是跟随中国厂商“卷到底”。

接着看: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。