英伟达发布 Cosmos 3:基于混合 Transformer 的开放物理 AI 模型

英伟达发布 Cosmos 3:基于混合 Transformer 的开放物理 AI 模型

英伟达(NVIDIA) 于 2026 年 6 月 1 日推出 Cosmos 3,这是一款面向物理 AI 的开放世界基础模型,采用混合 Transformer 架构构建。

根据 NVIDIA Newsroom 的介绍,该模型主要面向物理 AI 应用场景,包括机器人、自动驾驶车辆以及必须在采取行动前充分理解真实世界的智能空间。

Cosmos 3 是什么

Cosmos 3 是世界模型基础模型,而不是语言模型。

它生成合成世界数据,这类数据可以帮助机器推理物理环境。

其混合 Transformer 架构不同于标准的稠密 Transformer 堆叠结构。它并非让每个输入都通过完整网络,而是将输入路由到专门的子模型。这样可以在一次前向传播中减少计算量。

英伟达称 Cosmos 3 为开放模型,而“开放”在这里意义重大。

开发者可以直接访问模型权重。这一点使其有别于物理 AI 领域众多闭源权重的替代方案。

相关阅读: Sui Foundation Blames Upgrade Bugs for Three Costly Outages

背景

英伟达在 2024 年凭借首个 Cosmos 版本进入物理 AI 模型领域。该版本为利用生成世界数据训练机器人和自动化系统建立了框架。

Cosmos 系列与 Google DeepMind 的世界模型研究以及 Meta 的 JEPA 架构项目展开竞争。2026 年 5 月的一项基准测试发现,当前前沿模型在物理世界推理任务中表现脆弱。

英伟达的数据中心业务在 2026 年初之前已连续多个季度创下纪录。Cosmos 3 将这股基础设施攻势进一步延伸至模型层面。

相关阅读: ETH Loses Its Last Floor And Stares Down A Drop Toward $1,800

配套开源发布

与 Cosmos 3 同期,英伟达还发布了一套面向物理 AI 的开源智能体工具与技能集,详情见这份单独公告

这些工具涵盖感知、导航和操作等任务,设计上可运行在 Cosmos 3 之上,将其作为推理“骨干”。

英伟达还在 DSX OS 平台 上发布了技术文档,将其描述为用于大规模运行 AI 工厂的开放、模块化软件。

这一组合发布使英伟达有望在物理 AI 堆栈的多个层面占据主导地位,从模型权重到智能体工具,再到运营软件。

下篇阅读: OpenAI Hands Japan's Megabanks Its GPT-5.5 Cyber Defense Model To Withstand AI Hacks

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。
英伟达发布 Cosmos 3:基于混合 Transformer 的开放物理 AI 模型 | Yellow.com