中國的 DeepSeek 於週五發布了一款新的人工智慧模型,但在表現上未能縮小與美國領先實驗室的差距,無法真正關閉這一道差距 gap with leading US labs.
彭博社 according 報導稱,這一結果澆熄了自該公司先前於 2025 年 1 月推出 R1 模型、震撼產業以來市場所累積的高度期待。
模型實際表現為何
DeepSeek 在歷經數月的期待後,終於發布這款新模型。
基準測試結果顯示,它仍未能達到目前美國頂尖模型的表現水準。
中國與美國前沿 AI 實驗室之間的差距依舊存在。截稿前,DeepSeek 尚未就彭博的評估公開回應。
DeepSeek 的 R1 模型於 2025 年 1 月問世後立即引發全球關注。該公司宣稱,R1 以遠低於報導訓練成本的代價,就能媲美美國頂尖模型的實力。
這次發布震撼了科技投資人,並引發一場關於美國對中國出口先進晶片管制的廣泛辯論。儘管 R1 的成本說法遭到部分研究人員質疑,但其在多項基準測試中的競爭力仍被廣泛承認。
由於那次 1 月的發布,DeepSeek 在 2025 年初成為美國以外討論度最高的 AI 實驗室。外界原本預期這次新發布會在此基礎上再接再厲,而根據彭博的報導,情況並非如此。
延伸閱讀: Researcher Breaks 15-Bit Bitcoin Key In Largest Quantum Attack to Date
晶片出口的背景
進入 2026 年之際,美國對向中國出口先進半導體的限制依然有效。這些管制部分是為了限制中國取得高效能訓練硬體,從而放緩其 AI 發展。
DeepSeek 的 R1 曾被視為證據,顯示中國實驗室或許能繞過這些限制。如今,新模型較弱的表現可能會強化一種觀點:晶片限制正發揮預期效果。隨著更多獨立基準測試結果出爐,這一論點將可能受到進一步檢驗。
接下來會怎樣
這次結果並未將 DeepSeek 從競爭版圖中移除。該實驗室先前已展示過推出具備能力且具成本效率模型的實力。在特定任務上進一步縮小差距,在後續版本中仍非不可能。
關注中美 AI 競爭的投資人與決策者,將評估這次結果究竟只是短暫挫折,還是較為持久的分化跡象。
目前尚無關於 DeepSeek 下一次發布時間表的正式公告。
下一步閱讀: Claude Mythos Vs. GPT-5.5: Gated Anthropic Model Wins 6 Of 9 Tests






