Hermes MoA 2.0 結合 GPT、Claude 與 DeepSeek，擊敗任何單一模型

Nous Research 於週日發佈 Hermes Mixture of Agents 2.0，透過整合多個大型語言模型（包括 GPT、Claude 和 DeepSeek）的輸出，產生在標準測試上優於任何單一模型的回應。

根據一份報導，MoA 2.0 是 Nous Research 既有 Hermes Agent 框架的更新版本，並保留其開源結構。

系統如何運作

Hermes MoA 2.0 作為一個集成（ensemble）層運作。它會並行查詢多個基礎模型，收集它們的輸出，然後綜合成最終回應。這種稱為「Mixture of Agents（多代理組合）」的方法，將不同的 AI 模型視為各自專精領域的貢獻者，而不是要求單一模型獨力處理所有任務。

用戶可以自行設定要納入同一集成中的模型。預設組合使用 GPT、Claude 和 DeepSeek 三款模型，代表不同的訓練理念與資料組成。透過彙聚它們的輸出，MoA 2.0 得以捕捉互補的優勢。

隨發佈一併公開的測試結果顯示，MoA 2.0 在推理、編碼與指令跟隨任務上，都個別超前每一個組成模型。尤其在長程推理測試中，差距相當明顯，而單一模型往往會在這類測試中失去連貫性。

該框架維持開源，意味著研究人員與開發者可以檢視其架構、替換基礎模型，並針對特定使用情景調整這個集成系統。

Nous Research 以面向研究社群的「開放權重」模型釋出而聞名。原始的 Hermes Agent 框架，早在 2026 年初就為多模型協調奠定了基準。

更廣泛的背景是開放權重 AI 開發週期正在加速。Z.ai 於 2026 年 7 月初發佈 GLM-5.2，定位為針對長程工程任務的開放權重編碼模型。這次發佈延續了一個模式：開放權重實驗室會鎖定封閉模型具有聲譽優勢的特定能力領域，推出對標產品。

Qwen 前技術負責人林君陽在 2026 年 6 月下旬公開主張，代理型系統是 AI 發展的正確下一步。這個觀點與 MoA 2.0 背後的設計理念相呼應：透過代理與模型組合來提升能力，而不是完全依賴單次大型訓練即可達成。

Hermes MoA 的發佈也正值 AI 研究社群，對基礎模型與代理層各自應扮演角色的辯論如火如荼之際。

Andrej Karpathy 本週稍早提醒，將開發重心完全放在代理可能重蹈 OpenAI 早期研究週期的覆轍。Nous Research 的做法則嘗試走中間路線：以強大的基礎模型作為輸入，再在其上增加協調層。

Hermes MoA 2.0 尚未針對最新一批前沿模型進行測試。2026 年年中發佈的 Claude Sonnet 5 與更新版 GPT 變體，可能改變現有的基準圖景。Nous Research 也尚未在此次發佈同步刊出正式學術論文。

對開發者而言，其實務意義相當明確：一個能實證在封閉模型基準上，透過組合它們而取得更佳表現的開源工具，降低了研究團隊獲得頂尖推理能力的門檻，無須為每一次推理呼叫都支付前沿模型的 API 成本。

對 AI 產業來說，MoA 2.0 也為另一種觀點增添分量：未來 AI 的部署階段，可能由模型多樣性主導，而非單一稱霸的超級模型。在未來數月，可以留意 OpenAI 與 Anthropic 對於集成式方法的回應。