NVIDIA は2026年6月1日、Mixture-of-Transformersアーキテクチャを採用した、フィジカルAI向けのオープンな世界基盤モデル「Cosmos 3」を発表した。
NVIDIA Newsroom によると、このモデルはフィジカルAI向けアプリケーションを主な対象としている。具体的には、ロボット、自動運転車、そして行動前に現実世界を理解する必要があるスマートスペースなどが含まれる。
Cosmos 3とは何か
Cosmos 3はワールドモデル型の基盤モデルであり、言語モデルではない。
これは、機械が物理環境について推論するのに役立つ、合成世界データを生成する。
そのMixture-of-Transformersアーキテクチャは、標準的な高密度トランスフォーマースタックとは一線を画している。すべての入力をフルネットワークに通す代わりに、入力ごとに専門化されたサブモデルへルーティングする。その結果、1回のフォワードパスあたりの計算量が減少する。
NVIDIAはCosmos 3を「オープン」と位置づけており、この言葉には重要な意味がある。
開発者はモデルの重みへ直接アクセスできる。これこそが、フィジカルAI領域にひしめくクローズドウェイトの代替モデル群との差別化要因となっている。
Also Read: Sui Foundation Blames Upgrade Bugs for Three Costly Outages
背景
NVIDIAは2024年、初代CosmosのリリースによってフィジカルAIモデル分野に参入した。そのバージョンが、生成された世界データを用いてロボットや自律システムを訓練するためのフレームワークを確立した。
Cosmosシリーズは、Google DeepMindのワールドモデル研究や、MetaのJEPAアーキテクチャプログラムと競合している。2026年5月のベンチマークでは、最新フロンティアモデルが物理世界の推論タスクにおいて脆さを見せることが判明していた。
NVIDIAのデータセンター事業は、2026年初頭まで記録的な四半期を連続して計上している。Cosmos 3は、そのインフラ拡大の流れをモデルレイヤーへと押し広げる位置づけにある。
Also Read: ETH Loses Its Last Floor And Stares Down A Drop Toward $1,800
オープンソース版コンパニオンリリース
Cosmos 3と同時に、NVIDIAはフィジカルAI向けのオープンソースエージェントツールおよびスキル群を公開した。詳細は separate announcement による。
これらのツールは、知覚、ナビゲーション、マニピュレーション(操作)タスクをカバーしている。Cosmos 3の上で推論バックボーンとして動作するよう設計されている。
NVIDIAはまた、DSX OS platform に関する技術ドキュメントも公開した。同社はこれを、大規模なAIファクトリー運用のためのオープンかつモジュール式ソフトウェアとして説明している。
こうした同時リリースにより、NVIDIAはモデルの重みからエージェントツーリング、運用ソフトウェアに至るまで、フィジカルAIスタックの複数レイヤーを押さえるポジションを築きつつある。
Read Next: OpenAI Hands Japan's Megabanks Its GPT-5.5 Cyber Defense Model To Withstand AI Hacks





