NVIDIA 於 2026 年 6 月 1 日推出 Cosmos 3,這是一款為實體 AI 打造的開放世界基礎模型,採用混合 Transformer(mixture-of-transformers)架構。
根據 NVIDIA Newsroom 的說明,該模型鎖定實體 AI 應用場景,包括機器人、自動駕駛車輛與必須在採取行動前先理解現實世界的智慧空間系統。
什麼是 Cosmos 3
Cosmos 3 是一款世界基礎模型,而不是語言模型。
它會生成合成世界資料,讓機器能夠對物理環境進行推理。
其混合 Transformer 架構有別於標準的稠密 Transformer 堆疊。模型並非將所有輸入一股腦推進完整網路,而是將各個輸入導向專門的子模型。如此一來,每次前向傳遞所需的運算量更少。
NVIDIA 將 Cosmos 3 稱為「開放」,而這個字在此具有相當分量。
開發者可以直接存取模型權重,這正是它與在實體 AI 領域中林立的閉源權重方案之間的關鍵差異。
延伸閱讀: Sui Foundation Blames Upgrade Bugs for Three Costly Outages
背景
NVIDIA 在 2024 年以首版 Cosmos 進入實體 AI 模型領域。該版本建立了以生成世界資料訓練機器人與自動化系統的框架。
Cosmos 系列正與 Google DeepMind 的世界模型研究、以及 Meta 的 JEPA 架構計畫展開競爭。2026 年 5 月的基準測試顯示,當前前沿模型在實體世界推理任務上仍相當脆弱。
NVIDIA 的資料中心業務一路成長,在 2026 年初依然締造連續多季的歷史新高。Cosmos 3 則是把這項基礎設施優勢延伸到模型層。
延伸閱讀: ETH Loses Its Last Floor And Stares Down A Drop Toward $1,800
搭配的開源發佈
與 Cosmos 3 同步,NVIDIA 也釋出一套針對實體 AI 的開源智能體工具與技能組合,詳見這則獨立公告。
這些工具涵蓋感知、導航與操作等任務,且設計為可在 Cosmos 3 之上運行,把它當作推論骨幹。
NVIDIA 也釋出關於 DSX OS 平台 的技術文件,將其描述為用於大規模營運 AI 工廠的開放、模組化軟體。
這次整合式發佈,使 NVIDIA 得以在實體 AI 技術堆疊中掌握多個層面,從模型權重,到智能體工具,再到營運軟體。
接下來看: OpenAI Hands Japan's Megabanks Its GPT-5.5 Cyber Defense Model To Withstand AI Hacks





