Yellow.com

NVIDIA 于 2026 年 6 月 1 日发布了 Cosmos 3，这是一款面向物理 AI 的开放世界基础模型，基于混合 Transformer（mixture-of-transformers）架构构建。

根据 NVIDIA Newsroom 的介绍，该模型专注于物理 AI 应用场景，包括机器人、自动驾驶车辆以及智能空间，这些系统在采取行动前必须先理解真实世界。

Cosmos 3 是什么

Cosmos 3 是一个世界模型基础模型，而不是语言模型。

它生成合成世界数据，这类数据可以帮助机器对物理环境进行推理。

其混合 Transformer 架构不同于标准的致密（dense）Transformer 堆栈。它并不会把每一个输入都推送到完整网络中，而是将输入路由到专门的子模型。这样可以在每一次前向传播中减少计算量。

NVIDIA 将 Cosmos 3 称为“开放”的模型，这个说法在这里含义重大。

开发者可以直接访问模型权重，这一点使其有别于在物理 AI 领域中大量存在的闭源权重替代方案。

Also Read: Sui Foundation Blames Upgrade Bugs for Three Costly Outages

NVIDIA 在 2024 年通过首个 Cosmos 版本进入物理 AI 模型领域。那一版本为利用生成的世界数据训练机器人和自动化系统建立了一个框架。

Cosmos 系列与 Google DeepMind 的世界模型研究以及 Meta 的 JEPA 架构项目展开竞争。2026 年 5 月的一项基准测试发现，当前前沿模型在物理世界推理任务中表现脆弱。

NVIDIA 的数据中心业务在 2026 年初之前已连续多个季度创下纪录。Cosmos 3 则是将这一基础设施扩张进一步延伸到了模型层。

Also Read: ETH Loses Its Last Floor And Stares Down A Drop Toward $1,800

与 Cosmos 3 同步，NVIDIA 还发布了一套面向物理 AI 的开源智能体工具和技能集，详见这一 separate announcement。

这些工具覆盖感知、导航与操作等任务，设计上是运行在 Cosmos 3 之上的推理骨干。

NVIDIA 还在 DSX OS platform 上发布了技术文档，将其描述为用于大规模运行 AI 工厂的开放、模块化软件。

通过这次组合发布，NVIDIA 有望掌握物理 AI 技术栈的多个层级，从模型权重到智能体工具再到运行软件。

Mehjabeen Arsiwala 是一名记者，报道加密新闻、DeFi、交易所、交易和市场分析。过去三年中，她专注于塑造数字资产市场的趋势和叙事，从价格走势与预测到交易所发展和链上信号。她擅长通过清晰的报道，帮助读者理解市场中正在发生的事情以及其重要性所在。