中國兩家實力最強的 AI 實驗室,本週將模型價格降到只剩西方競爭對手的一小部分,而 OpenAI 和 Anthropic 則反向調整。
重點整理:
- DeepSeek 於 5 月 22 日將其 V4-Pro 模型 75% 折扣改為永久,輸出價格固定為每百萬 token 0.87 美元。
- 小米於 5 月 26 日將 MiMo-V2.5 價格最多下調 99%,快取 Pro 輸入最低只要每百萬 token 0.0036 美元。
- OpenAI 將 GPT-5.5 的輸出價格提高到每百萬 token 30 美元,拉大與中國前沿模型的價差。
DeepSeek、小米大幅降價
DeepSeek 於 5 月 22 日確認,其 V4-Pro 模型原本暫時性的 75% 折扣將改為永久,輸出價格固定為每百萬 token 0.87 美元,輸入則為 0.435 美元。
這項促銷原本預計在 5 月 31 日到期。
幾天後,同樣來自中國的實驗室 小米 於 5 月 27 日大砍 MiMo-V2.5 的快取輸入費率,最高降幅達 99%,Pro 方案的快取命中價格最低來到每百萬 token 0.0036 美元。
相較之下,OpenAI 的 GPT-5.5 將其前一代模型的輸出價格提高一倍,來到每百萬 token 30 美元。Anthropic 的 Claude Opus 4.7 則標示 輸入 5 美元、輸出 25 美元。
延伸閱讀: Anthropic Moves Restricted Claude Mythos Model Closer To Public Release
工程師為計算方式背書
小米同時也重構了其 token 方案。100 美元的 Max 方案現在提供 820 億個 token,遠高於之前的 16 億個,用同樣的金額即可獲得過去五到八倍的使用量。
小米 MiMo 團隊負責人、曾共同開發 DeepSeek-V2 的 駱福禮(Fuli Luo),將這次降價 歸因於更聰明的資料儲存與重複利用方式,也就是讓模型能再次使用已處理過的資料。
這種做法大幅削減了運算需求。
駱福禮主張,在新價格下實驗室仍可在接近滿載的情況下營運並覆蓋成本,顯示這次定價反映的是實質效率提升,而非虧本搶市的促銷策略。
這些節省對重複性較高的生產任務尤其重要,因為這類任務會重複使用相同的上下文。具有穩定提示詞的 Agent pipeline、文件處理器與檢索工具都會頻繁命中快取,因此較便宜的快取輸入能直接壓低執行帳單。
西方實驗室則面臨不同的壓力。OpenAI 轉向消費者功能與廣告的策略,暗示僅靠 token 收入可能無法支撐其估值。
為什麼價差持續擴大
開啟這場比價戰的並不是 DeepSeek 和小米。在這兩則公告發布前,中國模型就已經在價格上壓過美國對手。
MiniMax M2.7 的輸入費率為每百萬 token 0.30 美元,輸出為 1.20 美元。Moonshot AI 的 Kimi K2.5 則定價 為輸入 0.60 美元、輸出 2.50 美元。
追蹤成本與基準測試表現的分析師指出,2026 年第二季,中國與美國前沿模型之間,若以價格對品質比來看,價差大約在 15 到 30 倍之間,這還不包含任何快取折扣。本週的降價進一步擴大了此差距,特別是對真實部署中佔主流的重複性工作負載。
這個模式讓人聯想到 2025 年初,當時 DeepSeek 以超低價格的模型震撼市場,迫使西方供應商替自己的定價辯護。一年過去,壓力不減反增,而美國實驗室的回應是維持甚至提高價格,而不是跟進殺價。
接下來閱讀: Ethereum Network Empties Out As Staking Locks A Record 32% Of Supply





