中国新开源权重模型 GLM-5.2 击败所有 ChatGPT 模型，仅次于 Anthropic 的 Claude Fable

一款中国开源权重模型 GLM-5.2 现已跻身全球最强三大模型之列，大幅缩小了Anthropic 的 Claude Mythos 和 OpenAI 的 ChatGPT 的领先优势，而成本仅为其一小部分。

要点速览：

在独立评测中，GLM-5.2 跻身全球前三大语言模型之列。

这一开源权重系统的运行成本最低可至美国主流模型的十分之一。

它的发布仅在华盛顿迫使 Anthropic 将 Mythos 与 Fable 系统下线数日之后。

GLM-5.2 挤入全球顶尖梯队

总部位于北京、前身为智谱 AI 的 Z.ai 在 6 月中旬发布了 GLM-5.2，就在美国政府要求 Anthropic 关闭其两款最强系统后的几天。独立测试机构 Artificial Analysis 在一项针对真实、具有经济价值工作的基准上，将这一开源权重模型评为全球第三，仅次于两款 Anthropic 系统，并领先于 OpenAI 和 Google 的所有模型。

这一结果令许多工程师大跌眼镜——他们原本押注芯片限制会拉大差距而非缩小，即便 Mythos 和 Fable 仍被按下“暂停键”。

价格差异同样醒目。GLM-5.2 的定价约为每百万输入 token 1.40 美元，而 Claude Opus 4.8 约为 15 美元。任何人都可以下载该模型，对其进行修改，并在私有硬件上运行；其百万 token 上下文窗口专为处理冗长、多步骤任务而设计。

正是这种开放性，而非纯粹的“算力马力”，正在说服一度将美国系统视作唯一严肃生产选项的硅谷开发者转向。

延伸阅读：比特币跌破 5.9 万美元，美联储加息担忧重压加密市场

前沿差距收窄，成本同步暴跌

对于正削减 AI 账单的企业来说，这种节省很难被忽视。

原本为闭源系统每月支付接近 1 万美元的团队，往往可以用这款中国产模型以极低成本完成类似工作。由于公司在最新一轮出口管制切断其获取顶级 Nvidia 硬件后，对软件进行了适配，GLM-5.2 可以运行在国产芯片上。

Z.ai 创始人唐杰对“真正追平还需一年”的说法予以反驳，坚称这一时刻会更早到来。Elon Musk 在同一公开讨论中给出的时间点是“明年初”，并提醒称，基准测试上的胜利并不总能直接转化为日常使用中的实用性。

现实障碍仍然存在。最难的推理测试依旧更青睐美国实验室，而美国公司则指控中国竞争对手动用数万虚假账号，发起近 2900 万次查询，以收集模型输出并据此训练更廉价的仿制品。

一些开发者也对将敏感数据经由中国境内服务器传输保持犹豫。

中国的崛起已酝酿多时。大约 18 个月前，DeepSeek 以极低成本追平美国系统的表现，令硅谷震惊；此后，中国开源模型一路超越 Google 与 Meta 的免费模型，为这次向前沿进一步逼近埋下伏笔。

下一篇：AAVE 表现跑赢比特币，DeFi 借贷叙事再度升温