中國 DeepSeek 推出久候 AI 更新，基準測試結果令人失望

中國 DeepSeek 於周五推出一款新的人工智能模型，但在表現上仍未能縮窄與美國領先實驗室之間的差距。

彭博報道指，這一結果削弱了市場對該公司新模型的高度期望。自從該公司早前發佈的 R1 模型在 2025 年 1 月震撼業界後，外界一直寄望新模型延續驚喜，according to Bloomberg.

新模型帶來了甚麼

DeepSeek 在外界期待數月後正式發佈這款新模型。

基準測試結果顯示，它仍未能追上目前美國模型的頂級表現。

中美前沿 AI 實驗室之間的差距依然存在。截稿時，DeepSeek 尚未就彭博的相關評估作出公開回應。

DeepSeek 的 R1 模型於 2025 年 1 月推出，隨即引起全球關注。該公司聲稱，R1 以遠低於報稱訓練成本的代價，就能匹敵美國頂尖模型的表現。

這次發佈震撼科技投資者，並引發一場有關美國對華先進晶片出口管制的廣泛辯論。雖然有研究人員質疑 R1 的成本說法，但其在多項基準測試中的競爭力則被廣泛認可。

由於那次一月發佈，DeepSeek 在 2025 年初成為美國以外討論度最高的 AI 實驗室。外界原本預期這次新發佈能在該勢頭之上更進一步。根據彭博的報道，結果並非如此。

延伸閱讀: Researcher Breaks 15-Bit Bitcoin Key In Largest Quantum Attack to Date

美國在向中國出口先進半導體的限制，進入 2026 年時仍然維持生效。這些管制部分目的是透過限制高性能訓練硬件的取得，放慢中國的 AI 發展。

DeepSeek 的 R1 一度被視為證據，顯示中國實驗室或能繞過這些限制。新模型表現較弱，可能會強化一種看法：晶片限制正發揮預期效果。隨著更多獨立基準數據出爐，這種說法預料會進一步受到檢驗。

這次結果並未將 DeepSeek 排除在競爭格局之外。該實驗室此前已展示出，有能力打造性能不俗且成本效益高的模型。未來發佈的版本，仍有可能在特定任務上縮窄差距。

正密切關注中美 AI 競爭的投資者與決策者，將會評估這次結果究竟只是短暫挫折，還是預示著更持久的分化。

目前尚未有關於 DeepSeek 下一次發佈時間表的正式公告。

下一篇閱讀: Claude Mythos Vs. GPT-5.5: Gated Anthropic Model Wins 6 Of 9 Tests