中国のオープンウェイトモデル GLM-5.2 が、世界で最も強力なモデルのトップ3に入り、Anthropic の Claude Mythos と OpenAI の ChatGPT が持っていたリードを、コストはその一部に抑えつつ急速に縮めている。
重要ポイント:
- GLM-5.2 は独立系ベンチマークで、世界の大規模言語モデルのトップ3に位置している。
- オープンウェイト方式により、米国の先端モデルの最大10分の1のコストで動作する。
- その公開は、ワシントンがAnthropicに対し、MythosとFableシステムを停止させてから数日後に行われた。
GLM-5.2 が世界トップ層へ食い込む
かつてZhipu AIとして知られた北京の開発企業 Z.ai は、米政府がAnthropicに対し最強クラスの2システムの停止を命じた数日後の6月中旬に、GLM-5.2を公開した。独立系評価機関 Artificial Analysis は、このオープンウェイトモデルを、実際の経済価値のあるタスクを測るベンチマークにおいて世界3位にランク付けし、2つのAnthropicモデルに次ぐ一方、OpenAIと Google の全モデルを上回ると評価した。
この結果は、MythosとFableが停止されたままの状況にもかかわらず、半導体規制によって差は広がると予想していたエンジニアたちを驚かせた。
価格差も同様に際立っている。GLM-5.2は、入力トークン100万個あたり約1.40ドルという価格設定で、Claude Opus 4.8の約15ドルと比べて一桁安い。誰でもモデルをダウンロードして改変でき、プライベートなハードウェア上で実行可能であり、長く複雑なマルチステップ作業向けに100万トークンのコンテキストウィンドウが用意されている。
こうした「オープンさ」は、生の計算能力以上に影響力を持ち、かつて米国製モデルだけを本番運用の選択肢とみなしていたシリコンバレーの開発者たちを引きつけつつある。
関連記事: Bitcoin Slides Under $59K As Fed Rate Fears Return To Crypto
先端モデルの差が縮まり、コストは急落
AIコスト削減を迫られる企業にとって、この節約効果は無視しがたい。
月額1万ドル近くをクローズドなシステムに支払っているチームでも、中国製モデルを使えば、その一部のコストで同程度の作業を処理できる場合が多い。最新の輸出規制でトップクラスの Nvidia ハードウェアへのアクセスが断たれた後、同社はソフトウェアを最適化し、モデルを国産チップ上で動かせるようにしている。
Z.aiの創業者 唐杰(Tang Jie) は、「本当の意味での性能パリティ達成はまだ1年先だ」という見方に反論し、その時はもっと早く訪れると主張している。同じ公開の場で意見を述べた Elon Musk は、時期を「来年初め」と見積もりつつも、ベンチマークでの勝利が必ずしも日常利用での有用性につながるわけではないと警鐘を鳴らした。
課題が解消されたわけではない。最も難易度の高い推論テストでは、いまだ米国の研究所が優位に立っており、米企業は、中国勢が何万もの偽アカウントと約2900万件のクエリを使ってモデル出力を収集し、安価な模倣モデルの訓練に利用していると非難している。
一部の開発者は、機密データを中国国内のサーバーに経由させることにも慎重だ。
中国勢の台頭は突然のものではない。約18か月前、DeepSeek が米国モデルと遜色ない性能を、ごく一部のコストで実現してシリコンバレーを驚かせており、その後も同国発のオープンモデルは、Googleや Meta の無償モデルを次々と上回り、今回の最前線への大きな前進へとつながっている。
次を読む: AAVE Outperforms Bitcoin As DeFi Lending Narrative Returns





