Hermes MoA 2.0、GPT・Claude・DeepSeek を組み合わせて 単一モデルを上回る性能を達成

Hermes MoA 2.0、GPT・Claude・DeepSeek を組み合わせて 単一モデルを上回る性能を達成

Nous Research は日曜日に Hermes Mixture of Agents 2.0 を公開した。これは GPTClaudeDeepSeek を含む複数の大規模言語モデルの出力を組み合わせ、任意の個別モデルの標準ベンチマークにおけるスコアを上回る応答を生成するものだ。

報道によると、MoA 2.0 は Nous Research の既存の Hermes Agent フレームワークのアップデート版であり、そのオープンソース構造は維持されている。

システムの仕組み

Hermes MoA 2.0 はアンサンブルレイヤーとして動作する。複数のベースモデルに並列で問い合わせを行い、その出力を収集し、最終的な応答を統合して合成する。このアプローチは「Mixture of Agents(エージェント混合法)」として知られ、個々の AI モデルを専門家として扱い、単一モデルにすべてのタスク処理を求めない設計思想に基づいている。

利用者は、特定のアンサンブルにどのモデルを参加させるかを設定できる。デフォルト構成では、GPT、Claude、DeepSeek の 3 つのモデルを用いる。これらは異なる訓練方針やデータ構成を代表するモデルであり、出力をプールすることで MoA 2.0 はそれぞれの補完的な強みを引き出す。

公開とともに共有されたベンチマーク結果では、MoA 2.0 は推論、コーディング、指示追従タスクのすべてで、各構成要素モデルを個別に用いた場合より高い性能を示した。特に、単一モデルが一貫性を失いがちな長期的推論テストにおいて、有意な差が見られた。

このフレームワークは引き続きオープンソースで提供されており、研究者や開発者はアーキテクチャを検証したり、ベースモデルを入れ替えたり、特定のユースケース向けにアンサンブルを適応させたりできる。

関連記事: Anthropic、評価額 9,650 億ドルで OpenAI を上回り AI 資金レースが再編

オープンウェイト系ラボによるエージェント連携への進出

Nous Research は、研究コミュニティを対象としたオープンウェイトモデルの公開で評価を高めてきた。オリジナルの Hermes Agent フレームワークは、2026 年初頭にマルチモデル連携のベースラインを打ち立てた。

その背後には、オープンウェイト AI 開発サイクルの加速という広い文脈がある。Z.ai は 2026 年 7 月初旬に GLM-5.2 を公開し、長期的なエンジニアリングタスク向けのオープンウェイトなコーディングモデルとして位置づけた。このリリースは、クローズドモデルが評判面で優位にある特定の能力領域を、オープンウェイト系ラボが狙い撃ちにするという傾向を踏襲している。

関連記事: 専門家「OpenAI の 5% 出資で AI の国家統制が一段と進む」

Qwen の元テックリードである Junyang Lin は、2026 年 6 月末に、公的な場で「エージェント的システムこそが AI 開発における正しい次の一歩だ」と主張した。この見解は、MoA 2.0 の設計思想とも一致している。MoA 2.0 は、エージェントやモデルの組み合わせを、単一の学習実行では容易に再現できない能力向上への道筋として捉えている。

Hermes MoA のリリースはまた、基盤モデルとエージェントレイヤーのどちらに主軸を置くべきかをめぐる、AI 研究コミュニティ内での活発な議論のさなかに登場した。

Andrej Karpathy は今週初め、エージェント第一の開発は OpenAI の過去の研究サイクルで犯した過ちを繰り返すリスクがあると警告した。Nous Research のアプローチは、強力な基盤モデルを入力として活用しつつ、その上にオーケストレーションレイヤーを重ねる「中庸」の路線を試みている。

関連記事: OpenAI、1 兆ドル規模の IPO を模索するなか「最大の戦利品」を握るのは Microsoft

注目点

Hermes MoA 2.0 は、最新のフロンティアモデルとの比較テストはまだ行われていない。Claude Sonnet 5 や 2026 年半ばにリリースされた GPT の更新版は、ベンチマークの情勢を変える可能性がある。Nous Research は、今回のリリースとあわせた正式な学術論文をまだ公開していない。

開発者にとっての実務的な意義は明確だ。クローズドモデルのベンチマークを複数モデルの組み合わせによって実際に上回ることを示したオープンソースツールは、最前線モデルの API を推論ごとに利用するコストを払わずとも、一流レベルの推論能力に研究チームがアクセスできるようにする。

AI 業界全体にとっては、MoA 2.0 は「単一の支配的モデル」ではなく「モデルの多様性」こそが、次の AI 展開フェーズを特徴づけるかもしれないという議論に重みを加える存在となる。今後数カ月で、アンサンブル手法に対する OpenAI や Anthropic の反応に注目が集まりそうだ。

次に読む: ホワイトハウスが説明しない、トランプと Anthropic をめぐる二枚舌の政策

免責事項とリスク警告: この記事で提供される情報は教育および情報提供のみを目的としており、著者の意見に基づいています。金融、投資、法的、または税務上のアドバイスを構成するものではありません。 暗号資産は非常に変動性が高く、投資の全部または相当な部分を失うリスクを含む高いリスクにさらされています。暗号資産の取引または保有は、すべての投資家に適しているとは限りません。 この記事で表明された見解は著者のものであり、Yellow、その創設者、または役員の公式な方針や立場を表すものではありません。 投資決定を行う前に、常にご自身で十分な調査(D.Y.O.R.)を行い、ライセンスを持つ金融専門家にご相談ください。
Hermes MoA 2.0、GPT・Claude・DeepSeek を組み合わせて 単一モデルを上回る性能を達成 | Yellow.com