Hermes MoA 2.0, GPT·Claude·DeepSeek을 결합해 단일 모델보다 높은 점수를 기록하다

Nous Research는 일요일에 Hermes Mixture of Agents 2.0을 공개했다. 이 시스템은 GPT, Claude, DeepSeek을 포함한 여러 대규모 언어 모델의 출력을 결합해, 어떤 개별 모델이 표준 벤치마크에서 내는 점수보다 높은 결과를 만들어낸다.

보도에 따르면, MoA 2.0은 Nous Research가 보유하던 기존 Hermes Agent 프레임워크의 업데이드 버전으로, 오픈소스 구조를 그대로 유지한다.

시스템 동작 방식

Hermes MoA 2.0은 앙상블 레이어로 동작한다. 여러 베이스 모델에 병렬로 질의를 보내 출력을 수집한 뒤, 이를 종합해 최종 응답을 만든다. Mixture of Agents라 불리는 이 접근 방식은, 하나의 모델이 모든 작업을 처리하도록 요구하는 대신 서로 다른 AI 모델들을 특화된 기여자로 취급한다.

사용자는 어떤 모델들을 하나의 앙상블에 참여시킬지 구성할 수 있다. 기본 설정에서는 GPT, Claude, DeepSeek을 사용하며, 이 세 모델은 서로 다른 학습 철학과 데이터 구성을 대표한다. 이들의 출력을 모아 풀링함으로써 MoA 2.0은 상호 보완적인 강점을 끌어낸다.

공개와 함께 발표된 벤치마크 결과에 따르면, MoA 2.0은 추론, 코딩, 지시 수행 작업 전반에서 각 구성 모델을 개별적으로 사용할 때보다 더 나은 성능을 보였다. 특히 단일 모델이 장기 추론에서 자주 일관성을 잃는 테스트에서 의미 있는 격차를 기록했다.

이 프레임워크는 계속 오픈소스로 유지되기 때문에, 연구자와 개발자는 아키텍처를 들여다보고, 베이스 모델을 교체하며, 특정 사용 사례에 맞게 앙상블을 조정할 수 있다.

또 읽어보기: Anthropic, 9,650억 달러 가치 평가로 OpenAI 추월… AI 투자 레이스 재편

오픈웨이트 연구소들의 에이전트 오케스트레이션 진출

Nous Research는 연구 커뮤니티를 겨냥한 오픈웨이트 모델 공개로 명성을 쌓아왔다. 원래의 Hermes Agent 프레임워크는 2026년 초부터 멀티 모델 오케스트레이션의 기준선을 세웠다.

더 넓게 보면, 오픈웨이트 AI 개발 사이클이 가속하는 흐름 속에 있다. Z.ai는 2026년 7월 초 GLM-5.2를 공개하면서, 장기 엔지니어링 작업을 위한 오픈웨이트 코딩 모델로 자리매김했다. 이는 폐쇄형 모델들이 평판상 우위를 점하고 있는 특정 능력 영역을, 오픈웨이트 연구소들이 정조준해 들어가는 패턴의 연장선이다.

또 읽어보기: 전문가들, OpenAI 5% 지분이 AI를 더 깊은 국가 통제 아래 둘 것이라 경고

Qwen의 전 기술 리드인 Junyang Lin은 2026년 6월 말, 에이전트형 시스템이 AI 발전의 올바른 다음 단계라고 공개적으로 주장했다. 이 주장은, 에이전트와 모델 조합을 개별 학습만으로는 쉽게 복제하기 어려운 성능 향상의 경로로 보는 MoA 2.0의 설계 철학과 맞닿아 있다.

Hermes MoA의 공개는 또한, 기저 모델과 에이전트 레이어 중 어느 쪽이 더 중요한 역할을 해야 하는지를 두고 AI 연구 커뮤니티에서 벌어지는 활발한 논쟁 속에서 나왔다.

Andrej Karpathy는 이번 주 초, 에이전트 우선 개발이 OpenAI 초기 연구 사이클에서의 실수를 반복할 위험이 있다고 경고했다. Nous Research의 접근 방식은 강력한 기저 모델을 입력으로 사용하되 그 위에 오케스트레이션 레이어를 쌓는, 중간 지점을 추구하려는 시도로 보인다.

또 읽어보기: OpenAI, 1조 달러 IPO 노리지만 가장 큰 수혜자는 마이크로소프트

앞으로의 관전 포인트

Hermes MoA 2.0은 아직 가장 최근에 공개된 프런티어 모델들에 대해서는 테스트되지 않았다. 2026년 중반에 공개된 Claude Sonnet 5와 업데이트된 GPT 계열 모델들은 벤치마크 결과 지형을 바꿀 수 있다. Nous Research는 이번 공개와 함께 정식 학술 논문은 내지 않았다.

개발자들에게 실질적인 의미는 분명하다. 여러 폐쇄형 모델을 조합해 그들보다 나은 벤치마크 성능을 내는 오픈소스 도구는, 연구팀이 매 호출마다 프런티어 모델 API 비용을 지불하지 않고도 최상급 추론 능력에 접근할 수 있는 장벽을 낮춘다.

AI 업계 전반에는, MoA 2.0이 단일 지배적 모델이 아니라 다양한 모델의 공존이 다음 AI 배포 단계의 특징이 될 것이라는 주장에 힘을 싣는다. 향후 몇 달간 OpenAI와 Anthropic이 이런 앙상블 기반 접근법에 어떻게 대응하는지 지켜볼 필요가 있다.

다음 읽기: 백악관이 설명하지 않는, 트럼프 관련 Anthropic 정책의 양면성