中国新开源权重模型 GLM-5.2 击败所有 ChatGPT 版本,仅次于 Anthropic 的 Claude Fable

中国新开源权重模型 GLM-5.2 击败所有 ChatGPT 版本,仅次于 Anthropic 的 Claude Fable

中国开源权重模型 GLM-5.2 现已跻身全球三大最强模型之列,大幅缩小了与AnthropicClaude MythosOpenAIChatGPT 的差距,而成本仅为其一小部分。

关键点:

  • GLM-5.2 在独立基准测试中位列全球前三大语言模型。
  • 这套开源权重系统的运行成本最低可达美国主流模型的十分之一。
  • 其发布时间仅在华盛顿迫使 Anthropic 将其 Mythos 和 Fable 系统下线后数日。

GLM-5.2 挤入全球顶级阵营

北京开发商 Z.ai(前身为智谱 AI)在 6 月中旬发布了 GLM-5.2,就在美国政府下令 Anthropic 关闭其两款最强系统后的数天。独立测评机构 Artificial Analysis 在一项真实、具经济价值工作的基准上,将这款开源权重模型评为全球第三,仅落后于两款 Anthropic 系统,并领先 OpenAI 和 Google 所有模型。

这一结果震惊了许多工程师——他们原本认为芯片限制会拉大差距,而不是在 Mythos 和 Fable 被迫“冻结”时反而缩小。

价格差距同样醒目。GLM-5.2 的定价约为每百万输入 token 1.40 美元,而 Claude Opus 4.8 约为 15 美元。任何人都可以下载该模型,进行修改并在私有硬件上运行,且其具备一百万 token 的上下文窗口,专为冗长、多步骤任务设计。

对许多开发者而言,比起纯算力,这种开放性才是关键,它正吸引曾将美国系统视为唯一生产级选项的硅谷团队转向。

延伸阅读:比特币跌破 5.9 万美元,美联储加息担忧重返加密市场

前沿差距缩小,成本断崖式下跌

对于削减 AI 账单的企业而言,这样的节省难以忽视。

一支团队如果为封闭系统每月支付近 1 万美元,如今往往可以用这款中国模型以其一小部分的支出完成相近工作。该模型能够运行在国产芯片上,因为公司在最新出口管制切断其获取顶级 Nvidia 硬件后,对软件进行了适配

Z.ai 创始人 唐杰对“真正达到平价还需一年”的说法进行了反驳,坚持认为这一时刻会更早到来。Elon Musk 在同一公开讨论中插话,认为时间点大约在明年年初,并提醒说,基准测试的胜利并不总能转化为日常使用中的优势。

挑战仍然存在。在最难的推理测试上,美国实验室依旧占优,而美国公司则指控中国竞争对手运营了数以万计的虚假账号,并发出近 2900 万次查询,以采集模型输出、训练更廉价的“仿制品”。

一些开发者也对将敏感数据经由中国服务器传输心存疑虑。

中国在这一领域的崛起已酝酿多时。大约 18 个月前,DeepSeek 以极小成本匹配美国系统的表现,令硅谷震动。此后,中国开源模型持续超越 Google 和 Meta 的免费发布模型,为如今这次向全球前沿再度跃升铺平了道路。

下一篇阅读:AAVE 表现优于比特币,DeFi 借贷叙事回归

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。