Nous Research a publié dimanche Hermes Mixture of Agents 2.0, qui combine les sorties de plusieurs grands modèles de langage, dont GPT, Claude et DeepSeek, pour produire des réponses qui dépassent tout modèle individuel sur les benchmarks standard.
Selon un rapport, MoA 2.0 est une mise à jour du cadre Hermes Agent existant de Nous Research et en conserve la structure open source.
Comment fonctionne le système
Hermes MoA 2.0 fonctionne comme une couche d’ensemble. Il interroge plusieurs modèles de base en parallèle, collecte leurs sorties et synthétise une réponse finale. Cette approche, appelée Mixture of Agents, traite les modèles d’IA distincts comme des contributeurs spécialistes plutôt que d’exiger d’un seul modèle qu’il gère toutes les tâches à lui seul.
Les utilisateurs peuvent configurer quels modèles participent à un ensemble donné. La configuration par défaut s’appuie sur GPT, Claude et DeepSeek, trois modèles qui représentent des philosophies d’entraînement et des compositions de données différentes. En mutualisant leurs sorties, MoA 2.0 capte des forces complémentaires.
Les résultats de benchmark partagés avec la publication montrent que MoA 2.0 surpasse chacun des modèles composants pris individuellement sur des tâches de raisonnement, de programmation et de suivi d’instructions. L’écart est significatif sur les tests de raisonnement à long horizon, où les modèles uniques perdent souvent en cohérence.
Le cadre reste open source, ce qui signifie que les chercheurs et développeurs peuvent inspecter l’architecture, remplacer les modèles de base et adapter l’ensemble à des cas d’usage spécifiques.
À lire aussi : Anthropic dépasse OpenAI avec une valorisation de 965 milliards de dollars alors que la course au financement de l'IA se réinitialise
Les laboratoires open-weight se tournent vers l’orchestration d’agents
Nous Research s’est forgé une réputation avec des modèles open-weight destinés à la communauté de recherche. Le cadre Hermes Agent original a établi une base pour l’orchestration multi-modèles au début de 2026.
Le contexte plus large est un cycle de développement de l’IA open-weight qui s’accélère. Z.ai a publié GLM-5.2 début juillet 2026, le présentant comme un modèle de programmation open-weight pour des tâches d’ingénierie à long horizon. Cette publication s’inscrit dans un schéma de laboratoires open-weight visant des domaines de capacités spécifiques où les modèles fermés bénéficient d’avantages de réputation.
À lire aussi : Des experts affirment que la participation de 5 % d'OpenAI pousserait l'IA plus profondément sous contrôle étatique
L’ancien directeur technique de Qwen, Junyang Lin, a soutenu publiquement fin juin 2026 que les systèmes agents représentent la prochaine étape correcte pour le développement de l’IA. Cet argument s’aligne avec la philosophie de conception derrière MoA 2.0, qui traite les agents et les combinaisons de modèles comme une voie vers des gains de capacité que des entraînements individuels ne peuvent pas facilement reproduire.
La sortie d’Hermes MoA intervient également au milieu d’un débat actif dans la communauté de recherche en IA sur le rôle approprié des modèles de fondation par rapport aux couches d’agents.
Andrej Karpathy a mis en garde plus tôt cette semaine contre le risque que le développement « agent-first » répète des erreurs des cycles de recherche antérieurs d’OpenAI. L’approche de Nous Research tente une voie intermédiaire, en utilisant de puissants modèles de fondation comme entrées tout en ajoutant une couche d’orchestration par-dessus.
À lire aussi : OpenAI vise une IPO à 1 000 milliards de dollars tandis que Microsoft détient le plus gros lot
Ce qu’il faut surveiller
Hermes MoA 2.0 n’a pas encore été testé face aux modèles frontaliers les plus récents. Claude Sonnet 5 et les variantes mises à jour de GPT publiées à la mi-2026 pourraient modifier le paysage des benchmarks. Nous Research n’a pas publié d’article académique formel accompagnant la sortie.
La portée pratique pour les développeurs est claire. Un outil open source qui améliore de manière démontrable les benchmarks de modèles fermés en les combinant réduit la barrière pour les équipes de recherche souhaitant accéder à des capacités de raisonnement de haut niveau sans payer les coûts d’API de modèles frontaliers pour chaque appel d’inférence.
Pour l’industrie de l’IA, MoA 2.0 renforce l’argument selon lequel la diversité des modèles, plutôt qu’un modèle dominant unique, pourrait définir la prochaine phase de déploiement de l’IA. Il faudra observer les réponses d’OpenAI et d’Anthropic aux approches basées sur les ensembles dans les mois à venir.
À lire ensuite : La politique à double face de Trump sur Anthropic que la Maison-Blanche ne veut pas expliquer





