NVIDIA 於 2026 年 6 月 1 日推出 Cosmos 3,一款開放世界物理 AI 基礎模型,採用 mixture-of-transformers 架構。
根據 NVIDIA Newsroom 報道,該模型鎖定物理 AI 應用場景,包括機器人、自主駕駛車輛以及必須在行動前理解現實世界的智慧空間。
Cosmos 3 是甚麼
Cosmos 3 是世界模型(world foundation model),而不是語言模型。
它用於生成合成世界數據,協助機器對物理環境進行推理。
其 mixture-of-transformers 架構打破了傳統稠密 transformer 堆疊的做法。模型不再將每個輸入推送經過完整網絡,而是把輸入導向專門的子模型,從而在每一次前向傳播中減少運算量。
NVIDIA 稱 Cosmos 3 是開放的,而「開放」在這裡具有實質意義。
開發者可以直接存取模型權重,這正是它與物理 AI 領域眾多封閉權重替代方案之間的最大差異。
延伸閱讀: Sui Foundation Blames Upgrade Bugs for Three Costly Outages
背景
NVIDIA 在 2024 年以首個 Cosmos 版本正式進入物理 AI 模型領域。當時的版本為利用生成世界數據訓練機器人與自動化系統建立了框架。
Cosmos 系列正與 Google DeepMind 的世界模型研究及 Meta 的 JEPA 架構計畫展開競爭。2026 年 5 月的一項基準測試顯示,當前前沿模型在物理世界推理任務上的表現仍然相當脆弱。
NVIDIA 的資料中心業務在 2026 年初之前已連續多季創下紀錄新高。Cosmos 3 則把這一基礎設施攻勢進一步延伸至模型層。
延伸閱讀: ETH Loses Its Last Floor And Stares Down A Drop Toward $1,800
開源配套發布
與 Cosmos 3 同步,NVIDIA 亦依據一則獨立公告,發布了一套開源代理工具與技能集合,用於物理 AI。
這些工具涵蓋感知、導航及操作等任務,設計上是以 Cosmos 3 作為推理骨幹來運行。
NVIDIA 亦在 DSX OS platform 上釋出技術文件,將其描述為用於大規模營運 AI 工廠的開放模組化軟體。
透過這次整合發布,NVIDIA 得以在物理 AI 堆疊的多個層面取得主導地位,從模型權重到代理工具,再到營運軟體。
下一步閱讀: OpenAI Hands Japan's Megabanks Its GPT-5.5 Cyber Defense Model To Withstand AI Hacks





