Hermes MoA 2.0 結合 GPT、Claude 與 DeepSeek, 表現勝過任何單一模型

Hermes MoA 2.0 結合 GPT、Claude 與 DeepSeek, 表現勝過任何單一模型

Nous Research 於週日發布 Hermes Mixture of Agents 2.0(Hermes MoA 2.0), 這個系統會結合多個大型語言模型的輸出,包括 GPTClaudeDeepSeek, 以產生在標準基準測試中得分勝過任何 單一模型的回應。

根據一份報道, MoA 2.0 是在 Nous Research 既有 Hermes Agent 框架之上的更新版本, 同時保留其開源結構。

系統如何運作

Hermes MoA 2.0 以「集成層」(ensemble layer)的方式運作。 它會並行查詢多個底層模型、收集它們的輸出,然後綜合成最終回應。 這種稱為「Mixture of Agents」(代理混合)的做法, 把不同的 AI 模型視為各自專精領域的貢獻者,而不是要求單一模型獨力處理所有任務。

使用者可以自行設定要納入集成的模型。 預設配置會調用 GPT、Claude 和 DeepSeek——三個在訓練理念與資料組成上各有特色的模型。 透過彙集它們的輸出,MoA 2.0 能夠捕捉到互補的優勢。

隨發布一併公布的基準測試結果顯示, MoA 2.0 在推理、編碼與指令跟隨等任務上,都優於各個組成模型的單獨表現。 在長程推理測試中,這個差距尤為明顯,單一模型在此類測試中往往容易失去連貫性。

該框架維持開源,意味著研究人員與開發者可檢視其架構、更換底層模型, 並針對特定應用場景調整這個集成系統。

延伸閱讀Anthropic 估值 9,650 億美元超越 OpenAI,AI 融資戰重置

開源權重實驗室進軍代理編排

Nous Research 以面向研究社群的開源權重模型發布而聞名。 原始的 Hermes Agent 框架,早在 2026 年就為多模型編排建立了基準。

更廣泛的背景是開源權重 AI 的快速迭代週期。 Z.ai 在 2026 年 7 月初發布 GLM-5.2,將其定位為面向長程工程任務的開源權重編碼模型。 這次發布延續了一個趨勢:開源權重實驗室針對特定能力領域發力, 而在這些領域中,封閉模型通常擁有名聲優勢。

延伸閱讀專家稱 OpenAI 5% 股權將把 AI 更深推向國家控制

Qwen 前技術主管林俊陽在 2026 年 6 月底公開表示, 代理式系統是 AI 發展的正確下一步。 這一觀點與 MoA 2.0 背後的設計理念相契合: 透過代理與模型組合,走出一條單次訓練無法輕易複製的能力提升路徑。

Hermes MoA 的發布,恰逢 AI 研究社群針對「基礎模型」與「代理層」正確角色展開熱烈辯論之際。

Andrej Karpathy 本週稍早曾警告, 一味走「代理優先」路線,可能重演 OpenAI 早期研究週期的錯誤。 Nous Research 的做法則嘗試走中庸之道:以強大的基礎模型作為輸入, 再在其上方加上一層編排層。

延伸閱讀OpenAI 力拼 1 兆美元 IPO,微軟或成最大贏家

值得關注的是什麼

Hermes MoA 2.0 目前尚未與最新一代前沿模型直接對比測試。 2026 年中發布的 Claude Sonnet 5 與更新版 GPT 變體, 可能會改變基準測試的版圖。 Nous Research 亦尚未在發布同時公開正式學術論文。

對開發者而言,其實務意義相當明確: 一個能夠透過組合封閉模型而在基準測試上明顯提升表現的開源工具, 降低了研究團隊取得頂尖推理能力的門檻, 而無須為每一次推論呼叫都支付前沿模型的高額 API 成本。

對整體 AI 產業而言,MoA 2.0 也強化了一種觀點: 未來 AI 的部署階段,可能由「模型多樣性」而非「單一主導模型」來定義。 未來數月,可留意 OpenAI 與 Anthropic 對這類集成式方法的回應。

下一篇閱讀白宮始終不願解釋的「兩面人」特朗普–Anthropic 政策

免責聲明及風險提示: 本文資訊僅供教育與參考之用,並基於作者意見,並不構成金融、投資、法律或稅務建議。 加密貨幣資產具高度波動性並伴隨高風險,可能導致投資大幅虧損或全部損失,並非適合所有投資者。 文章內容僅代表作者觀點,不代表 Yellow、創辦人或管理層立場。 投資前請務必自行徹底研究(D.Y.O.R.),並諮詢持牌金融專業人士。
Hermes MoA 2.0 結合 GPT、Claude 與 DeepSeek, 表現勝過任何單一模型 | Yellow.com