中國新 AI「GLM-5.2」擊敗所有 ChatGPT 模型, 只略遜於 Anthropic 的 Claude Fable

中國新 AI「GLM-5.2」擊敗所有 ChatGPT 模型, 只略遜於 Anthropic 的 Claude Fable

中國開源權重模型 GLM-5.2 現已躋身全球三大最強模型之一,進一步縮窄 AnthropicClaude MythosOpenAIChatGPT 的領先優勢,而且成本只是其一小部分。

重點摘要:

  • 在獨立評測中,GLM-5.2 躋身全球前三大大型語言模型之列。
  • 這個開源權重系統的運行成本最低可達美國頂尖模型的約十分之一。
  • 它的發佈僅在華府迫使 Anthropic 將其 Mythos 和 Fable 系統下線的數日之後。

GLM-5.2 打入全球頂尖行列

北京開發商 Z.ai(前身為智譜 AI)在 6 月中旬 發佈 了 GLM-5.2,就在美國政府下令 Anthropic 關閉其兩個最強大系統的數天之後。獨立測試機構 Artificial Analysis 在一項針對真實且具經濟價值工作的基準測試上,將這個開源權重模型 評為 全球第三,僅次於兩個 Anthropic 系統,並領先 OpenAI 和 Google 的所有模型。

這一結果 令工程師大感意外,他們原本押注晶片限制會擴大而非縮窄差距,而此時 Mythos 和 Fable 仍處於凍結狀態。

價格差距同樣醒目。GLM-5.2 的定價約為每百萬輸入 token 1.40 美元左右,而 Claude Opus 4.8 則約為 15 美元,任何人都可以下載該模型、加以修改,並在私有硬件上運行,而且內建一百萬 token 的上下文視窗,以應付冗長、分多步驟的任務。

對許多開發者來說,正是這種開放性——而非單純的算力——正在說服那些過去只把美國系統視為生產環境唯一嚴肅選項的矽谷團隊改投門庭。

延伸閱讀:比特幣跌穿 59,000 美元,美聯儲升息憂慮重返加密市場

前沿差距收窄,成本同步暴跌

對於正設法削減 AI 開支的公司而言,這些節省難以忽視。

一支原本每月為封閉系統支付接近 10,000 美元的團隊,往往可以在這款中國模型上以其中一小部分成本完成相近工作。GLM-5.2 可以運行於國產晶片上,因為在最新一輪出口管制切斷其取得頂級 Nvidia 硬件後,該公司已調整 軟件以適配本地晶片。

Z.ai 創辦人 唐杰 對「真正實現齊頭並進仍需一年」的說法予以反駁,堅稱這一時刻將更早到來。Elon Musk 在同一場公開討論中則認為,大概要到明年年初,同時提醒基準測試的勝利未必總能轉化為日常使用體驗的優勢。

現實障礙依然存在。最困難的推理測試仍傾向美國實驗室佔優,而美國公司已指控 中國對手運行數萬個假帳戶、發出近 2,900 萬條查詢,以收集模型輸出、訓練更廉價的模仿系統。

也有部分開發者對將敏感數據經由中國伺服器處理有所卻步。

中國在這方面的崛起已醞釀多時。約 18 個月前,DeepSeek 以極低成本追平美國系統的表現,令矽谷震驚;此後,來自中國的開源模型陸續超越 Google 和 Meta 的免費釋出版本,為這次向前沿再躍進一次奠定基礎。

下一篇閱讀:AAVE 表現跑贏比特幣,DeFi 借貸敘事再度升溫

免責聲明及風險提示: 本文資訊僅供教育與參考之用,並基於作者意見,並不構成金融、投資、法律或稅務建議。 加密貨幣資產具高度波動性並伴隨高風險,可能導致投資大幅虧損或全部損失,並非適合所有投資者。 文章內容僅代表作者觀點,不代表 Yellow、創辦人或管理層立場。 投資前請務必自行徹底研究(D.Y.O.R.),並諮詢持牌金融專業人士。
中國新 AI「GLM-5.2」擊敗所有 ChatGPT 模型, 只略遜於 Anthropic 的 Claude Fable | Yellow.com