NVIDIA 於 2026 年 6 月 1 日推出 Cosmos 3,一款面向實體 AI 的開放世界基礎模型,採用混合 Transformer(mixture-of-transformers)架構。
根據 NVIDIA Newsroom 的資料,該模型鎖定實體 AI 應用,包括機械人、自動駕駛車輛,以及必須在行動前理解現實世界的智慧空間。
什麼是 Cosmos 3
Cosmos 3 是世界模型(world foundation model),而不是語言模型。
它會生成合成世界數據,這類數據可幫助機器推理物理環境。
其混合 Transformer 架構有別於傳統的密集 Transformer 堆疊。它並非將每個輸入都推送到完整網絡,而是將輸入分流至專門的子模型。如此可減少每次前向傳遞所需的運算量。
NVIDIA 稱 Cosmos 3 是開放的,而「開放」在這裡具有重要意義。
開發者可以直接存取模型權重,這亦是它與眾多封閉權重的實體 AI 競品之間的明顯分野。
延伸閱讀: Sui Foundation Blames Upgrade Bugs for Three Costly Outages
背景
NVIDIA 於 2024 年首次推出 Cosmos,正式進入實體 AI 模型領域。該版本為利用生成世界數據訓練機械人與自動化系統建立了框架。
Cosmos 系列正與 Google DeepMind 的世界模型研究,以及 Meta 的 JEPA 架構計劃展開競爭。2026 年 5 月的一項基準測試指出,當前前沿模型在實體世界推理任務上仍然相當脆弱。
NVIDIA 的數據中心業務在 2026 年初前連續多季創下新高。Cosmos 3 則將這一基礎設施優勢進一步延伸到模型層。
延伸閱讀: ETH Loses Its Last Floor And Stares Down A Drop Toward $1,800
配套開源發佈
與 Cosmos 3 同步,NVIDIA 亦推出了一套面向實體 AI 的開源代理工具與技能組,詳見這份 separate announcement。
這些工具涵蓋感知、導航與操作等任務,並設計為在 Cosmos 3 之上運行,將其作為推理後端。
NVIDIA 同時在 DSX OS platform 上釋出技術文件,並將其描述為用於大規模營運 AI 工廠的開放式、模組化軟件。
這次組合發佈,讓 NVIDIA 能從模型權重,到代理工具,再到營運軟件,掌握實體 AI 技術棧的多個層面。
下篇閱讀: OpenAI Hands Japan's Megabanks Its GPT-5.5 Cyber Defense Model To Withstand AI Hacks





