Nous Research는 일요일 Hermes Mixture of Agents 2.0을 공개했다. 이 시스템은 GPT, Claude, DeepSeek을 포함한 여러 대형 언어 모델(LLM)의 출력을 결합해, 어떤 개별 모델이 표준 벤치마크에서 내는 점수보다 높은 응답을 생성한다.
보도에 따르면, MoA 2.0은 Nous Research의 기존 Hermes Agent 프레임워크의 업데이트 버전으로, 오픈소스 구조를 그대로 유지한다.
시스템 작동 방식
Hermes MoA 2.0은 앙상블 레이어로 동작한다. 여러 기본 모델을 병렬로 질의해 출력을 수집한 뒤, 이를 종합해 최종 응답을 만든다. 이 접근법은 Mixture of Agents(에이전트 혼합)로 알려져 있으며, 하나의 모델이 모든 작업을 혼자 처리하도록 요구하는 대신, 서로 다른 AI 모델을 전문 기여자로 취급한다.
사용자는 특정 앙상블에 어떤 모델이 참여할지 구성할 수 있다. 기본 설정은 서로 다른 학습 철학과 데이터 구성을 대표하는 세 모델인 GPT, Claude, DeepSeek을 활용한다. 이들의 출력을 풀링함으로써 MoA 2.0은 상호 보완적인 강점을 포착한다.
공개된 벤치마크 결과에 따르면 MoA 2.0은 추론, 코딩, 인스트럭션 팔로잉(지시 수행) 작업 전반에서 각 구성 모델을 개별적으로 사용했을 때보다 더 높은 성능을 보여준다. 특히 개별 모델이 쉽게 일관성을 잃기 쉬운 장기 추론(long-horizon reasoning) 테스트에서 의미 있는 격차를 기록했다.
이 프레임워크는 계속해서 오픈소스로 제공되므로, 연구자와 개발자는 아키텍처를 검토하고, 기본 모델을 교체하며, 특정 활용 사례에 맞춰 앙상블을 적응시킬 수 있다.
또 읽어보기: Anthropic, 9,650억 달러 기업가치로 OpenAI 제치며 AI 투자 경쟁 재편
오픈 웨이트 연구소들의 에이전트 오케스트레이션 진출
Nous Research는 연구 커뮤니티를 겨냥한 오픈 웨이트(open-weight) 모델 공개로 명성을 쌓아왔다. 원래의 Hermes Agent 프레임워크는 2026년 초에 멀티 모델 오케스트레이션의 기준선을 세웠다.
더 넓게 보면, 오픈 웨이트 AI 개발 사이클이 가속화되는 흐름 속에 있다. Z.ai는 2026년 7월 초 GLM-5.2를 공개하며, 장기 엔지니어링 작업을 위한 오픈 웨이트 코딩 모델로 포지셔닝했다. 이는 폐쇄형 모델이 평판상 우위를 점하고 있던 특정 능력 영역을 겨냥해 오픈 웨이트 연구소들이 제품을 내놓는 패턴을 따른 것이다.
또 읽어보기: 전문가들 “OpenAI 5% 지분, AI의 국가 통제 심화시킬 것”
Qwen의 전 기술 리드였던 Junyang Lin은 2026년 6월 말, 에이전트형 시스템이 AI 발전의 올바른 다음 단계라고 공개적으로 주장했다. 이 주장은 개별 학습 한 번으로는 쉽게 복제하기 어려운 능력 향상을 위해 에이전트와 모델 조합을 활용하는 MoA 2.0의 설계 철학과도 맞닿아 있다.
Hermes MoA의 공개는 또한, 기저 모델(foundation model)과 에이전트 레이어 중 어느 쪽이 어떤 역할을 맡아야 하는지를 두고 AI 연구 커뮤니티 내에서 벌어지는 활발한 논쟁 한가운데에서 이뤄졌다.
Andrej Karpathy는 이번 주 초, 에이전트 우선 개발 전략이 OpenAI의 초기 연구 사이클에서 반복되었던 실수를 되풀이할 위험이 있다고 경고했다. Nous Research의 접근법은 강력한 기저 모델을 입력으로 활용하면서 그 위에 오케스트레이션 레이어를 더하는 ‘중도 노선’을 시도하는 것이다.
또 읽어보기: OpenAI, 1조 달러 IPO 노리지만 진짜 승자는 마이크로소프트?
앞으로의 관전 포인트
Hermes MoA 2.0은 아직 가장 최근에 공개된 최전선(frontier) 모델들과 직접 비교 테스트를 거치지 않았다. 2026년 중반에 출시된 Claude Sonnet 5와 최신 GPT 변형 모델들은 벤치마크 지형을 바꿀 수 있다. Nous Research는 이번 공개와 함께 정식 학술 논문을 발표하지도 않았다.
개발자에게 실질적으로 중요한 점은 분명하다. 폐쇄형 모델들의 벤치마크 성능을, 그것들을 조합함으로써 입증 가능하게 끌어올리는 오픈소스 도구는, 연구팀이 최전선 수준의 추론 능력에 접근하기 위해 매 호출마다 프런티어 모델 API 비용을 지불하지 않아도 되도록 장벽을 낮춘다.
AI 산업 전반에서는 MoA 2.0이 “단일 지배 모델”이 아니라 “모델 다양성”이 향후 AI 배치의 다음 단계를 규정할 수 있다는 주장에 힘을 싣는다. 앞으로 몇 달간 OpenAI와 Anthropic이 앙상블 기반 접근법에 어떤 대응을 내놓을지 지켜볼 필요가 있다.





