Nous Research hat am Sonntag Hermes Mixture of Agents 2.0 veröffentlicht. Das System kombiniert die Ausgaben mehrerer großer Sprachmodelle, darunter GPT, Claude und DeepSeek, um Antworten zu erzeugen, die jedes einzelne Modell in Standard-Benchmarks übertreffen.
Laut einem Bericht ist MoA 2.0 ein Update des bestehenden Hermes-Agenten-Frameworks von Nous Research und behält dessen Open-Source-Struktur bei.
Wie das System funktioniert
Hermes MoA 2.0 arbeitet als Ensemble-Schicht. Es fragt mehrere Basismodelle parallel ab, sammelt deren Ausgaben und synthetisiert daraus eine finale Antwort. Der Ansatz, bekannt als Mixture of Agents, behandelt unterschiedliche KI-Modelle als spezialisierte Beitragende, statt ein einzelnes Modell zu zwingen, jede Aufgabe allein zu bewältigen.
Nutzer können konfigurieren, welche Modelle in einem bestimmten Ensemble teilnehmen. Die Standardkonfiguration greift auf GPT, Claude und DeepSeek zurück – drei Modelle, die unterschiedliche Trainingsphilosophien und Datenzusammensetzungen repräsentieren. Durch das Zusammenführen ihrer Ausgaben fängt MoA 2.0 komplementäre Stärken ein.
Mit der Veröffentlichung geteilte Benchmark-Ergebnisse zeigen, dass MoA 2.0 jedes einzelne Komponentenmodell bei Aufgaben in den Bereichen Schlussfolgern, Programmieren und Befolgen von Anweisungen übertrifft. Der Vorsprung ist bei Langzeit-Schlussfolgetests besonders deutlich, bei denen einzelne Modelle oft an Kohärenz verlieren.
Das Framework bleibt Open Source, sodass Forschende und Entwickelnde die Architektur inspizieren, Basismodelle austauschen und das Ensemble für spezifische Anwendungsfälle anpassen können.
Auch lesenswert: Anthropic überholt OpenAI mit 965 Mrd. US-Dollar Bewertung, während das KI-Finanzierungsrennen neu startet
Open-Weight-Labs drängen in die Agenten-Orchestrierung
Nous Research hat sich mit Open-Weight-Modellveröffentlichungen, die auf die Forschungsgemeinschaft abzielen, einen Namen gemacht. Das ursprüngliche Hermes-Agenten-Framework etablierte Anfang 2026 einen Maßstab für Multi-Modell-Orchestrierung.
Der breitere Kontext ist ein sich beschleunigender Open-Weight-KI-Entwicklungszyklus. Z.ai veröffentlichte GLM-5.2 Anfang Juli 2026 und positionierte es als Open-Weight-Coding-Modell für langfristige Engineering-Aufgaben. Die Veröffentlichung folgt einem Muster von Open-Weight-Labs, die gezielt Fähigkeitsdomänen adressieren, in denen geschlossene Modelle Reputationsvorteile besitzen.
Auch lesenswert: Experten sagen, OpenAIs 5-%-Beteiligung würde KI stärker unter staatliche Kontrolle bringen
Qwens ehemaliger technischer Leiter Junyang Lin argumentierte Ende Juni 2026 öffentlich, dass agentische Systeme den richtigen nächsten Schritt für die KI-Entwicklung darstellen. Dieses Argument steht im Einklang mit der Designphilosophie hinter MoA 2.0, das Agenten und Modellkombinationen als Weg zu Fähigkeitsgewinnen betrachtet, die einzelne Trainingsläufe nicht leicht replizieren können.
Die Veröffentlichung von Hermes MoA fällt zudem in eine aktive Debatte in der KI-Forschungsgemeinschaft über die richtige Rolle von Foundation-Modellen im Vergleich zu Agenten-Schichten.
Andrej Karpathy warnte Anfang dieser Woche, dass eine agentenfirst-orientierte Entwicklung das Risiko birgt, Fehler aus früheren Forschungszyklen von OpenAI zu wiederholen. Der Ansatz von Nous Research versucht einen Mittelweg: starke Foundation-Modelle werden als Eingaben verwendet, auf die eine Orchestrierungsschicht aufgesetzt wird.
Auch lesenswert: OpenAI peilt 1-Billionen-US-Dollar-IPO an, während Microsoft den größten Gewinn hält
Worauf man achten sollte
Hermes MoA 2.0 wurde noch nicht gegen die jüngsten Frontier-Modelle getestet. Claude Sonnet 5 und aktualisierte GPT-Varianten, die Mitte 2026 veröffentlicht wurden, könnten das Benchmark-Bild verändern. Nous Research hat keine formale wissenschaftliche Publikation zur Veröffentlichung vorgelegt.
Die praktische Bedeutung für Entwickelnde ist klar: Ein Open-Source-Werkzeug, das nachweislich Benchmarks geschlossener Modelle durch deren Kombination übertrifft, senkt die Hürden für Forschungsteams, auf erstklassige Schlussfolgerungsfähigkeiten zuzugreifen, ohne für jeden Inferenzaufruf die Kosten von Frontier-Modell-APIs zahlen zu müssen.
Für die KI-Branche verleiht MoA 2.0 dem Argument Gewicht, dass Modellvielfalt – und nicht ein einziges dominierendes Modell – die nächste Phase der KI-Einführung prägen könnte. In den kommenden Monaten lohnt sich ein Blick auf die Reaktionen von OpenAI und Anthropic auf Ensemble-basierte Ansätze.
Als Nächstes lesen: Die doppelgesichtige Trump-Anthropic-Politik, die das Weiße Haus nicht erklärt





