英伟达(NVIDIA) 于 2026 年 6 月 1 日推出 Cosmos 3,这是一款面向物理 AI 的开放世界基础模型,采用混合 Transformer 架构构建。
根据 NVIDIA Newsroom 的介绍,该模型主要面向物理 AI 应用场景,包括机器人、自动驾驶车辆以及必须在采取行动前充分理解真实世界的智能空间。
Cosmos 3 是什么
Cosmos 3 是世界模型基础模型,而不是语言模型。
它生成合成世界数据,这类数据可以帮助机器推理物理环境。
其混合 Transformer 架构不同于标准的稠密 Transformer 堆叠结构。它并非让每个输入都通过完整网络,而是将输入路由到专门的子模型。这样可以在一次前向传播中减少计算量。
英伟达称 Cosmos 3 为开放模型,而“开放”在这里意义重大。
开发者可以直接访问模型权重。这一点使其有别于物理 AI 领域众多闭源权重的替代方案。
相关阅读: Sui Foundation Blames Upgrade Bugs for Three Costly Outages
背景
英伟达在 2024 年凭借首个 Cosmos 版本进入物理 AI 模型领域。该版本为利用生成世界数据训练机器人和自动化系统建立了框架。
Cosmos 系列与 Google DeepMind 的世界模型研究以及 Meta 的 JEPA 架构项目展开竞争。2026 年 5 月的一项基准测试发现,当前前沿模型在物理世界推理任务中表现脆弱。
英伟达的数据中心业务在 2026 年初之前已连续多个季度创下纪录。Cosmos 3 将这股基础设施攻势进一步延伸至模型层面。
相关阅读: ETH Loses Its Last Floor And Stares Down A Drop Toward $1,800
配套开源发布
与 Cosmos 3 同期,英伟达还发布了一套面向物理 AI 的开源智能体工具与技能集,详情见这份单独公告。
这些工具涵盖感知、导航和操作等任务,设计上可运行在 Cosmos 3 之上,将其作为推理“骨干”。
英伟达还在 DSX OS 平台 上发布了技术文档,将其描述为用于大规模运行 AI 工厂的开放、模块化软件。
这一组合发布使英伟达有望在物理 AI 堆栈的多个层面占据主导地位,从模型权重到智能体工具,再到运营软件。
下篇阅读: OpenAI Hands Japan's Megabanks Its GPT-5.5 Cyber Defense Model To Withstand AI Hacks





