中国 DeepSeek 发布久违 AI 更新,基准测试结果令人失望

中国 DeepSeek 发布久违 AI 更新,基准测试结果令人失望

中国的 DeepSeek 于周五发布了一款新的人工智能模型,但未能弥合其与美国领先实验室之间的性能差距。

据彭博社报道,这一结果削弱了外界此前的高涨预期——自该公司在 2025 年 1 月发布 R1 模型并震惊业内以来,市场一直期待其再次突破。

模型实际表现

在外界数月的期待之后,DeepSeek 发布了这款新模型。

基准测试结果显示,该模型依然未能达到当前美国顶尖模型的性能水准。

中美前沿 AI 实验室之间的差距依旧存在。截至发稿时,DeepSeek 尚未就彭博社的评估公开回应。

DeepSeek 的 R1 模型于 2025 年 1 月推出,立即引发全球关注。该公司宣称,R1 以远低于报道训练成本的代价,就能媲美美国顶级模型。

这一发布令科技投资者感到震动,并引发了关于美国对华高端芯片出口管制的广泛争论。尽管部分研究人员质疑其成本说法,但 R1 在多项基准测试中的竞争力受到普遍认可。

那次一月发布,让 DeepSeek 在 2025 年上半年成为美国以外讨论度最高的 AI 实验室。外界原本预期此次新版能在此基础上更进一步。但从彭博社的报道来看,情况并非如此。

相关阅读: Researcher Breaks 15-Bit Bitcoin Key In Largest Quantum Attack to Date

芯片出口背景

进入 2026 年之际,美国对向中国出口高端半导体的限制依然有效。这些管制部分目的在于通过限制高性能训练硬件的获取,放缓中国的 AI 发展。

DeepSeek 的 R1 先前一度被视为中国实验室有能力绕过这些限制的证据。而这次新模型表现偏弱,可能会强化一种观点:芯片管制正在发挥预期效果。随着更多独立基准数据出现,这一说法也将面临检验。

接下来会怎样

这次结果并未将 DeepSeek 排除出竞争格局。该实验室此前已经展示过打造性能不错且成本高效模型的能力。未来在特定任务上继续缩小差距的可能性依然存在。

正关注中美 AI 竞争的投资者与政策制定者,将评估此次结果究竟是阶段性的挫折,还是更长期的分化信号。

DeepSeek 目前尚未就下一次模型发布的时间做出正式宣布。

下篇阅读: Claude Mythos Vs. GPT-5.5: Gated Anthropic Model Wins 6 Of 9 Tests

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。
中国 DeepSeek 发布久违 AI 更新,基准测试结果令人失望 | Yellow.com