中國 DeepSeek 推出久候 AI 更新,基準測試結果令人失望

中國 DeepSeek 推出久候 AI 更新,基準測試結果令人失望

中國 DeepSeek 於周五推出一款新的人工智能模型,但在表現上仍未能縮窄與美國領先實驗室之間的差距。

彭博報道指,這一結果削弱了市場對該公司新模型的高度期望。自從該公司早前發佈的 R1 模型在 2025 年 1 月震撼業界後,外界一直寄望新模型延續驚喜,according to Bloomberg.

新模型帶來了甚麼

DeepSeek 在外界期待數月後正式發佈這款新模型。

基準測試結果顯示,它仍未能追上目前美國模型的頂級表現。

中美前沿 AI 實驗室之間的差距依然存在。截稿時,DeepSeek 尚未就彭博的相關評估作出公開回應。

DeepSeek 的 R1 模型於 2025 年 1 月推出,隨即引起全球關注。該公司聲稱,R1 以遠低於報稱訓練成本的代價,就能匹敵美國頂尖模型的表現。

這次發佈震撼科技投資者,並引發一場有關美國對華先進晶片出口管制的廣泛辯論。雖然有研究人員質疑 R1 的成本說法,但其在多項基準測試中的競爭力則被廣泛認可。

由於那次一月發佈,DeepSeek 在 2025 年初成為美國以外討論度最高的 AI 實驗室。外界原本預期這次新發佈能在該勢頭之上更進一步。根據彭博的報道,結果並非如此。

延伸閱讀: Researcher Breaks 15-Bit Bitcoin Key In Largest Quantum Attack to Date

晶片出口的背景

美國在向中國出口先進半導體的限制,進入 2026 年時仍然維持生效。這些管制部分目的是透過限制高性能訓練硬件的取得,放慢中國的 AI 發展。

DeepSeek 的 R1 一度被視為證據,顯示中國實驗室或能繞過這些限制。新模型表現較弱,可能會強化一種看法:晶片限制正發揮預期效果。隨著更多獨立基準數據出爐,這種說法預料會進一步受到檢驗。

下一步會如何發展

這次結果並未將 DeepSeek 排除在競爭格局之外。該實驗室此前已展示出,有能力打造性能不俗且成本效益高的模型。未來發佈的版本,仍有可能在特定任務上縮窄差距。

正密切關注中美 AI 競爭的投資者與決策者,將會評估這次結果究竟只是短暫挫折,還是預示著更持久的分化。

目前尚未有關於 DeepSeek 下一次發佈時間表的正式公告。

下一篇閱讀: Claude Mythos Vs. GPT-5.5: Gated Anthropic Model Wins 6 Of 9 Tests

免責聲明及風險提示: 本文資訊僅供教育與參考之用,並基於作者意見,並不構成金融、投資、法律或稅務建議。 加密貨幣資產具高度波動性並伴隨高風險,可能導致投資大幅虧損或全部損失,並非適合所有投資者。 文章內容僅代表作者觀點,不代表 Yellow、創辦人或管理層立場。 投資前請務必自行徹底研究(D.Y.O.R.),並諮詢持牌金融專業人士。
中國 DeepSeek 推出久候 AI 更新,基準測試結果令人失望 | Yellow.com