NVIDIA 推出 Cosmos 3：以混合 Transformer 架構打造的開放式實體 AI 模型

NVIDIA 於 2026 年 6 月 1 日推出 Cosmos 3，這是一款為實體 AI 打造的開放世界基礎模型，採用混合 Transformer（mixture-of-transformers）架構。

根據 NVIDIA Newsroom 的說明，該模型鎖定實體 AI 應用場景，包括機器人、自動駕駛車輛與必須在採取行動前先理解現實世界的智慧空間系統。

什麼是 Cosmos 3

Cosmos 3 是一款世界基礎模型，而不是語言模型。

它會生成合成世界資料，讓機器能夠對物理環境進行推理。

其混合 Transformer 架構有別於標準的稠密 Transformer 堆疊。模型並非將所有輸入一股腦推進完整網路，而是將各個輸入導向專門的子模型。如此一來，每次前向傳遞所需的運算量更少。

NVIDIA 將 Cosmos 3 稱為「開放」，而這個字在此具有相當分量。

開發者可以直接存取模型權重，這正是它與在實體 AI 領域中林立的閉源權重方案之間的關鍵差異。

延伸閱讀： Sui Foundation Blames Upgrade Bugs for Three Costly Outages

背景

NVIDIA 在 2024 年以首版 Cosmos 進入實體 AI 模型領域。該版本建立了以生成世界資料訓練機器人與自動化系統的框架。

Cosmos 系列正與 Google DeepMind 的世界模型研究、以及 Meta 的 JEPA 架構計畫展開競爭。2026 年 5 月的基準測試顯示，當前前沿模型在實體世界推理任務上仍相當脆弱。

NVIDIA 的資料中心業務一路成長，在 2026 年初依然締造連續多季的歷史新高。Cosmos 3 則是把這項基礎設施優勢延伸到模型層。

延伸閱讀： ETH Loses Its Last Floor And Stares Down A Drop Toward $1,800

搭配的開源發佈

與 Cosmos 3 同步，NVIDIA 也釋出一套針對實體 AI 的開源智能體工具與技能組合，詳見這則獨立公告。

這些工具涵蓋感知、導航與操作等任務，且設計為可在 Cosmos 3 之上運行，把它當作推論骨幹。

NVIDIA 也釋出關於 DSX OS 平台的技術文件，將其描述為用於大規模營運 AI 工廠的開放、模組化軟體。

這次整合式發佈，使 NVIDIA 得以在實體 AI 技術堆疊中掌握多個層面，從模型權重，到智能體工具，再到營運軟體。

接下來看： OpenAI Hands Japan's Megabanks Its GPT-5.5 Cyber Defense Model To Withstand AI Hacks

Mehjabeen Arsiwala

Mehjabeen Arsiwala 是一名記者，專門報導加密貨幣新聞、去中心化金融（DeFi）、交易所、交易以及市場分析。過去三年來，她專注於塑造數位資產市場的趨勢與敘事，內容涵蓋從價格走勢與預測，到交易所發展與鏈上訊號。她擅長以清晰易懂的報導，協助讀者了解市場上正在發生的事，以及這些事件為何重要。