NVIDIA は2026年6月1日、Mixture-of-Transformersアーキテクチャを採用した物理AI向けオープンワールド基盤モデル「Cosmos 3」を発表した。
NVIDIA Newsroom によると、このモデルは物理AIアプリケーションを対象としている。具体的には、行動を起こす前に現実世界を理解しなければならないロボット、自動運転車、スマートスペースなどが含まれる。
Cosmos 3とは
Cosmos 3はワールド基盤モデルであり、言語モデルではない。
このモデルは、機械が物理環境について推論するのに役立つ、合成ワールドデータを生成する。
その Mixture-of-Transformers アーキテクチャは、標準的な高密度トランスフォーマースタックとは一線を画す。すべての入力をフルネットワークに通すのではなく、入力ごとに専門化されたサブモデルへとルーティングする。その結果、1回のフォワードパスあたりの計算量が削減される。
NVIDIAはCosmos 3を「オープン」と呼んでおり、その言葉には重要な意味がある。
開発者はモデルのウェイトに直接アクセスできる。これは、物理AI分野にひしめくクローズドウェイトの代替モデルとの差別化要因となる。
Also Read: Sui Foundation Blames Upgrade Bugs for Three Costly Outages
背景
NVIDIAは2024年、初代Cosmosのリリースによって物理AIモデル分野に参入した。この初期バージョンは、生成されたワールドデータを用いてロボットや自律システムを学習させるための枠組みを確立した。
Cosmosシリーズは、Google DeepMindのワールドモデル研究や、MetaのJEPAアーキテクチャプログラムと競合している。2026年5月に行われたベンチマークでは、最先端モデルが物理世界の推論タスクにおいて脆弱であることが示された。
NVIDIAのデータセンター事業は、2026年初頭まで四半期ごとの最高益を更新し続けている。Cosmos 3は、そのインフラ拡大をモデルレイヤーへと押し広げる位置づけとなる。
Also Read: ETH Loses Its Last Floor And Stares Down A Drop Toward $1,800
オープンソースのコンパニオンリリース
Cosmos 3と同時に、NVIDIAは物理AI向けオープンソースエージェントツールおよびスキルのコレクションを公開した。詳細は separate announcement で説明されている。
これらのツールは、認識、ナビゲーション、マニピュレーションタスクをカバーしている。Cosmos 3を推論バックボーンとして動作するよう設計されている。
NVIDIAはまた、DSX OS platform に関する技術ドキュメントも公開した。同社はこれを、大規模なAIファクトリー運用のためのオープンかつモジュール型ソフトウェアと位置づけている。
これらを組み合わせたリリースにより、NVIDIAはモデルウェイトからエージェント向けツール群、運用ソフトウェアに至るまで、物理AIスタックの複数レイヤーを押さえる体制を整えたことになる。
Read Next: OpenAI Hands Japan's Megabanks Its GPT-5.5 Cyber Defense Model To Withstand AI Hacks





