新興中国AI「GLM-5.2」が全ChatGPTモデルを上回り、 AnthropicのClaude Fableにのみ一歩及ばず

中国のオープンウェイトモデル GLM-5.2 が、世界で最も強力なモデル上位3つの一角に入り、Anthropic の Claude Mythos と OpenAI の ChatGPT が持っていたリードを、コストの面で大きく縮めつつある。

主なポイント:

GLM-5.2 は、独立系ベンチマークにおいて世界トップ3の大規模言語モデルの一つに位置している。

このオープンウェイトシステムは、アメリカのトップモデルの最大10分の1という低コストで動作する。

リリースは、ワシントンがAnthropicに対してMythosとFableのシステム停止を命じてから数日後に行われた。

GLM-5.2 が世界トップ層に食い込む

北京の開発企業で、かつてはZhipu AIとして知られていた Z.ai は、米政府がAnthropicに対し最強クラスの2システムの停止を命じてからわずか数日後の6月中旬に GLM-5.2 を公開した。独立系評価機関 Artificial Analysis は、このオープンウェイトモデルを、実際の経済的価値を持つタスクに基づくベンチマークで世界3位にランク付けし、Anthropicの2システムに続く位置で、OpenAIや Google のすべてのモデルを上回った。

この結果は、MythosやFableが停止されたままであるにもかかわらず、半導体規制によって差は広がると予想していたエンジニアたちを驚かせた。

価格差も同じくらい衝撃的だ。GLM-5.2 は入力100万トークンあたり約1.40ドルに設定されているのに対し、Claude Opus 4.8 はおよそ15ドルだ。さらに、誰でもこのモデルをダウンロードし、改変し、自前のハードウェア上で動かすことができ、長く多段階のジョブ向けに設計された100万トークンのコンテキストウィンドウを備えている。

こうしたオープン性は、生の性能以上に、かつては本番環境で使う「唯一の本命」としてアメリカ製システムを扱っていたシリコンバレーの開発者たちを引きつけている。

最先端とのギャップが縮小、コストは急落

AIコストを削減しようとする企業にとって、この節約効果は無視しがたい。

閉じたシステムに月1万ドル近くを支払っているチームでも、中国製モデルを使えば、そのごく一部のコストで同等の仕事をこなせる場合が多い。Z.aiは、最新の規制によってトップクラスの Nvidia 製ハードウェアへのアクセスが制限された後、自社ソフトウェアを適応させ、国産チップ上で動作させている。

Z.ai の創業者 唐傑（Tang Jie） は、「真のパリティ達成にはあと1年かかる」という見方に反論し、その瞬間はもっと早く訪れると主張している。同じ公開の場で意見を述べた Elon Musk は、それを「来年初め」と見積もり、ベンチマークでの勝利が必ずしも日常的な有用性に直結するわけではないと警鐘を鳴らした。

課題が消えたわけではない。最も難易度の高い推論タスクでは依然として米研究所が優位に立っており、米企業は、中国の競合他社が何万もの偽アカウントと約2,900万件のクエリを使ってモデルの出力を収集し、より安価な模倣モデルを訓練していると非難している。

また、一部の開発者は、機密データを中国のサーバー経由で送ることに慎重だ。

中国の台頭は、今に始まったことではない。約18カ月前、DeepSeek が、ごく一部のコストで米国勢に匹敵する性能を見せつけ、シリコンバレーを驚かせた。その後も同国のオープンモデルは、Google や Meta が無料で公開しているモデルを次々と上回り、今回の「フロンティア」への新たな跳躍につながっている。

次に読む: AAVEがBitcoinをアウトパフォーム、DeFiレンディング再評価の波