NVIDIA는 2026년 6월 1일, 모듈형 트랜스포머 아키텍처를 기반으로 한 물리 AI 오픈 월드 기반 모델 ‘코스모스 3(Cosmos 3)’를 출시했다.
NVIDIA Newsroom에 따르면, 이 모델은 물리 AI 애플리케이션을 주요 대상으로 한다. 여기에는 로봇, 자율주행 차량, 그리고 실제 세계를 이해한 뒤 그 안에서 행동해야 하는 스마트 공간 등이 포함된다.
코스모스 3란 무엇인가
코스모스 3는 ‘월드 파운데이션 모델’이다. 언어 모델이 아니다.
이 모델은 기계가 물리적 환경에 대해 추론하는 데 도움이 되는 형태의 합성 월드 데이터를 생성한다.
코스모스 3의 모듈형 트랜스포머(mixture-of-transformers) 아키텍처는 기존의 조밀한(dense) 트랜스포머 스택과는 다른 접근을 취한다. 모든 입력을 전체 네트워크로 밀어넣는 대신, 각 입력을 특화된 서브 모델로 라우팅한다. 그 결과, 한 번의 포워드 패스에 필요한 연산량이 줄어든다.
NVIDIA는 코스모스 3를 ‘오픈’하다고 표현하는데, 이 단어에는 중요한 의미가 담겨 있다.
개발자는 모델 가중치에 직접 접근할 수 있다. 이것이 물리 AI 영역에서 폐쇄형 가중치 모델들로 붐비는 경쟁 환경 속에서 코스모스 3를 차별화하는 지점이다.
Also Read: Sui Foundation Blames Upgrade Bugs for Three Costly Outages
배경
NVIDIA는 2024년 첫 코스모스 버전을 출시하며 물리 AI 모델 영역에 진입했다. 당시 버전은 생성된 월드 데이터를 활용해 로봇과 자율 시스템을 훈련하기 위한 기본 프레임워크를 마련했다.
코스모스 시리즈는 Google DeepMind의 월드 모델 연구, Meta의 JEPA 아키텍처 프로그램과 경쟁하고 있다. 2026년 5월에 발표된 한 벤치마크에서는, 최전선(frontier) 모델들이 물리 세계 추론 과제에서 여전히 쉽게 깨지는 취약성을 보인다고 평가했다.
NVIDIA의 데이터 센터 사업은 2026년 초까지 연속해서 분기별 최대 실적을 기록해 왔다. 코스모스 3는 이러한 인프라 확장을 모델 레이어로까지 이어가는 시도로 볼 수 있다.
Also Read: ETH Loses Its Last Floor And Stares Down A Drop Toward $1,800
동반 오픈소스 공개
코스모스 3와 함께, NVIDIA는 물리 AI용 오픈소스 에이전트 도구 및 스킬 모음도 별도 공개했다. 관련 내용은 separate announcement에 정리돼 있다.
이 도구들은 인지(perception), 내비게이션, 조작(manipulation) 작업을 포괄한다. 코스모스 3를 추론 백본으로 두고 그 위에서 동작하도록 설계됐다.
NVIDIA는 또한 DSX OS platform에 대한 기술 문서도 공개했다. DSX OS는 대규모 AI 팩토리를 운영하기 위한 개방형·모듈형 소프트웨어로 설명된다.
이 일련의 공개를 통해 NVIDIA는 모델 가중치에서 에이전트 툴링, 운영 소프트웨어에 이르는 물리 AI 스택의 여러 레이어를 동시에 장악할 수 있는 위치를 선점하게 됐다.
Read Next: OpenAI Hands Japan's Megabanks Its GPT-5.5 Cyber Defense Model To Withstand AI Hacks





