Nous Research 于周日发布了 Hermes Mixture of Agents 2.0,它通过组合多个大语言模型(包括 GPT、Claude 和 DeepSeek)的输出,生成在标准基准测试中优于单个模型的回答。
根据一份报道,MoA 2.0 是对 Nous Research 现有 Hermes Agent 框架的更新,并保留了其开源结构。
系统如何工作
Hermes MoA 2.0 作为一个集成层运行。它并行调用多个基础模型,收集它们的输出,然后综合成一个最终回答。该方法被称为 Mixture of Agents(代理混合),把不同的 AI 模型视为各自领域的“专家贡献者”,而不是要求单一模型独自处理所有任务。
用户可以配置在特定集成中参与的模型。默认配置调用 GPT、Claude 和 DeepSeek,这三个模型代表了不同的训练理念和数据构成。通过汇聚它们的输出,MoA 2.0 能捕捉到互补优势。
随发布一同分享的基准测试结果显示,在推理、编码和指令跟随任务上,MoA 2.0 均优于各组件模型单独运行的表现。尤其在长时程推理测试中,优势更为明显——单模型往往更容易丢失连贯性。
该框架保持开源,这意味着研究者和开发者可以审查其架构、替换基础模型,并针对特定用例调整这一集成系统。
延伸阅读:Anthropic 估值 9,650 亿美元超越 OpenAI,重塑 AI 融资赛道
开源权重实验室发力代理编排
Nous Research 因面向研究社区发布开源权重模型而建立起声誉。原始的 Hermes Agent 框架在 2026 年早些时候就为多模型编排奠定了基线。
更广阔的背景是开源权重 AI 的开发周期正在加速。Z.ai 于 2026 年 7 月初发布了 GLM-5.2,将其定位为面向长时程工程任务的开源权重代码模型。这一发布延续了开源权重实验室的模式:在闭源模型享有声誉优势的特定能力领域发起针对性突破。
延伸阅读:专家称 OpenAI 5% 股权或将把 AI 更深地推向国家控制
Qwen 前技术负责人林俊阳在 2026 年 6 月底公开表示,具备代理能力的系统代表了 AI 发展的正确下一步。这一观点与 MoA 2.0 背后的设计理念相契合:通过代理和模型组合来获取能力提升,而这些提升是单次训练难以轻易复现的。
Hermes MoA 的发布恰逢 AI 研究社区正在就基础模型与代理层各自应扮演的正确角色展开激烈讨论。
Andrej Karpathy 在本周早些时候警示,“代理优先”的开发路径有重蹈 OpenAI 早期研究周期覆辙的风险。Nous Research 的做法尝试走一条中间道路:在强大的基础模型之上,叠加一个编排层。
延伸阅读:OpenAI 盯上 1 万亿美元 IPO,而微软已握最大筹码
值得关注的动向
Hermes MoA 2.0 尚未针对最新一代前沿模型进行测试。2026 年年中发布的 Claude Sonnet 5 和更新后的 GPT 变体,可能会改变基准测试的格局。Nous Research 也尚未在发布的同时推出正式的学术论文。
对开发者而言,其现实意义相当明确:一个通过组合闭源模型、在基准测试上实证优于它们的开源工具,可以显著降低研究团队获取顶级推理能力的门槛,而无需为每一次推理调用都支付前沿模型的 API 费用。
对整个 AI 行业来说,MoA 2.0 为“模型多样性而非单一主导模型将定义下一阶段 AI 部署”的观点增添了分量。未来数月内,可以关注 OpenAI 和 Anthropic 对集成式方法的回应。





