NVIDIA는 2026년 6월 1일, 모듈형 트랜스포머 아키텍처를 기반으로 한 오픈 월드 피지컬 AI 기초 모델 ‘코스모스 3(Cosmos 3)’를 공개했다.
NVIDIA Newsroom에 따르면, 이 모델은 피지컬 AI 응용 분야를 겨냥하고 있다. 여기에는 실제 세계를 이해한 뒤 그 안에서 행동해야 하는 로봇, 자율주행 차량, 스마트 공간 등이 포함된다.
코스모스 3란 무엇인가
코스모스 3는 ‘월드 파운데이션 모델’이며, 전통적인 의미의 언어 모델은 아니다.
이 모델은 기계가 물리적 환경에 대해 추론하는 데 도움을 주는 ‘세계(world) 데이터’를 합성해 생성한다.
코스모스 3의 모듈형 트랜스포머(mixture-of-transformers) 아키텍처는 표준적인 조밀(dense) 트랜스포머 스택과는 다르다. 모든 입력을 전체 네트워크에 그대로 통과시키는 대신, 각 입력을 특화된 서브 모델로 라우팅한다. 그 결과, 한 번의 포워드 패스에 필요한 연산량이 줄어든다.
NVIDIA는 코스모스 3를 “오픈”하다고 표현하는데, 이 단어는 여기서 상당한 의미를 가진다.
개발자는 모델의 가중치에 직접 접근할 수 있다. 이것이 피지컬 AI 영역을 가득 메우고 있는 클로즈드 웨이트 대안들과 코스모스 3를 구분 짓는 핵심 요소다.
Also Read: Sui Foundation Blames Upgrade Bugs for Three Costly Outages
배경
NVIDIA는 2024년 첫 번째 코스모스 버전을 출시하며 피지컬 AI 모델 분야에 진입했다. 당시 버전은 생성된 세계 데이터를 활용해 로봇과 자율 시스템을 훈련하는 프레임워크를 마련했다.
코스모스 시리즈는 Google DeepMind의 월드 모델 연구와 Meta의 JEPA 아키텍처 프로그램과 경쟁하고 있다. 2026년 5월에 발표된 한 벤치마크에서는, 최전선(froniter) 모델들이 물리 세계 추론 과제에서 쉽게 깨지는 취약성을 보인다고 평가했다.
NVIDIA의 데이터센터 사업은 2026년 초까지 연속적인 분기 최대 실적을 기록하고 있다. 코스모스 3는 이러한 인프라 확대 기조를 모델 레이어로까지 확장하는 역할을 한다.
Also Read: ETH Loses Its Last Floor And Stares Down A Drop Toward $1,800
동반 오픈소스 공개
코스모스 3와 함께, NVIDIA는 별도의 발표를 통해 피지컬 AI용 오픈소스 에이전트 도구 및 스킬 모음을 공개했다.
이 도구들은 인지(perception), 내비게이션, 조작 작업을 다루며, 코스모스 3를 추론 백본으로 사용해 동작하도록 설계됐다.
NVIDIA는 또한 DSX OS 플랫폼에 대한 기술 문서를 공개했다. 이 플랫폼은 대규모 AI 팩토리를 운영하기 위한 오픈형 모듈식 소프트웨어라고 설명된다.
이번 통합 발표를 통해 NVIDIA는 모델 가중치에서 에이전트 툴링, 운영 소프트웨어에 이르는 피지컬 AI 스택의 여러 레이어를 동시에 장악할 수 있는 위치를 선점하게 됐다.
Read Next: OpenAI Hands Japan's Megabanks Its GPT-5.5 Cyber Defense Model To Withstand AI Hacks





