中國 DeepSeek 推出久候的 AI 更新，基準測試結果令人失望

中國的 DeepSeek 於週五發布了一款新的人工智慧模型，但在表現上未能縮小與美國領先實驗室的差距，無法真正關閉這一道差距 gap with leading US labs.

彭博社 according 報導稱，這一結果澆熄了自該公司先前於 2025 年 1 月推出 R1 模型、震撼產業以來市場所累積的高度期待。

模型實際表現為何

DeepSeek 在歷經數月的期待後，終於發布這款新模型。

基準測試結果顯示，它仍未能達到目前美國頂尖模型的表現水準。

中國與美國前沿 AI 實驗室之間的差距依舊存在。截稿前，DeepSeek 尚未就彭博的評估公開回應。

DeepSeek 的 R1 模型於 2025 年 1 月問世後立即引發全球關注。該公司宣稱，R1 以遠低於報導訓練成本的代價，就能媲美美國頂尖模型的實力。

這次發布震撼了科技投資人，並引發一場關於美國對中國出口先進晶片管制的廣泛辯論。儘管 R1 的成本說法遭到部分研究人員質疑，但其在多項基準測試中的競爭力仍被廣泛承認。

由於那次 1 月的發布，DeepSeek 在 2025 年初成為美國以外討論度最高的 AI 實驗室。外界原本預期這次新發布會在此基礎上再接再厲，而根據彭博的報導，情況並非如此。

進入 2026 年之際，美國對向中國出口先進半導體的限制依然有效。這些管制部分是為了限制中國取得高效能訓練硬體，從而放緩其 AI 發展。

DeepSeek 的 R1 曾被視為證據，顯示中國實驗室或許能繞過這些限制。如今，新模型較弱的表現可能會強化一種觀點：晶片限制正發揮預期效果。隨著更多獨立基準測試結果出爐，這一論點將可能受到進一步檢驗。

這次結果並未將 DeepSeek 從競爭版圖中移除。該實驗室先前已展示過推出具備能力且具成本效率模型的實力。在特定任務上進一步縮小差距，在後續版本中仍非不可能。

關注中美 AI 競爭的投資人與決策者，將評估這次結果究竟只是短暫挫折，還是較為持久的分化跡象。

目前尚無關於 DeepSeek 下一次發布時間表的正式公告。