Hermes MoA 2.0 kombiniert GPT, Claude und DeepSeek und übertrifft jedes einzelne Modell

Nous Research hat am Sonntag Hermes Mixture of Agents 2.0 veröffentlicht. Das System kombiniert Ausgaben mehrerer großer Sprachmodelle, darunter GPT, Claude und DeepSeek, um Antworten zu erzeugen, die jedes einzelne Modell in Standardbenchmarks übertreffen.

Laut einem Bericht ist MoA 2.0 ein Update des bestehenden Hermes-Agent-Frameworks von Nous Research und behält dessen Open-Source-Struktur bei.

Wie das System funktioniert

Hermes MoA 2.0 fungiert als Ensemble-Schicht. Es fragt mehrere Basismodelle parallel ab, sammelt deren Ausgaben und synthetisiert daraus eine finale Antwort. Der Ansatz, bekannt als Mixture of Agents, behandelt unterschiedliche KI-Modelle als spezialisierte Beitragsleistende, anstatt ein einzelnes Modell zu verlangen, das jede Aufgabe allein bewältigt.

Nutzende können konfigurieren, welche Modelle an einem bestimmten Ensemble teilnehmen. Die Standardkonfiguration greift auf GPT, Claude und DeepSeek zurück – drei Modelle, die unterschiedliche Trainingsphilosophien und Datenzusammenstellungen repräsentieren. Durch das Zusammenführen ihrer Ausgaben erfasst MoA 2.0 komplementäre Stärken.

Mit der Veröffentlichung geteilte Benchmark-Ergebnisse zeigen, dass MoA 2.0 jedes einzelne Komponentenmodell bei Aufgaben in den Bereichen Schlussfolgern, Programmieren und Befolgen von Anweisungen übertrifft. Der Vorsprung ist besonders bei Tests zum langfristigen Schlussfolgern deutlich, bei denen einzelne Modelle häufig an Kohärenz verlieren.

Das Framework bleibt Open Source, sodass Forschende und Entwickelnde die Architektur inspizieren, Basismodelle austauschen und das Ensemble für spezifische Anwendungsfälle anpassen können.

Auch lesen: Anthropic übertrifft OpenAI mit 965-Milliarden-Bewertung, während das KI-Finanzierungsrennen neu startet

Open-Weight-Labs drängen in die Agenten-Orchestrierung

Nous Research hat sich mit Open-Weight-Modellveröffentlichungen für die Forschungsgemeinschaft einen Namen gemacht. Das ursprüngliche Hermes-Agent-Framework setzte Anfang 2026 einen Maßstab für Multi-Modell-Orchestrierung.

Der breitere Kontext ist ein sich beschleunigender Entwicklungszyklus für Open-Weight-KI. Z.ai veröffentlichte GLM-5.2 Anfang Juli 2026 und positionierte es als Open-Weight-Coding-Modell für langfristige Ingenieuraufgaben. Die Veröffentlichung folgt einem Muster, bei dem Open-Weight-Labs gezielt Fähigkeitsdomänen ansteuern, in denen geschlossene Modelle noch Reputationsvorteile haben.

Auch lesen: Expertinnen und Experten sagen, OpenAIs 5-%-Beteiligung würde KI stärker unter staatliche Kontrolle bringen

Qwens ehemaliger technischer Leiter Junyang Lin argumentierte Ende Juni 2026 öffentlich, dass agentische Systeme den richtigen nächsten Schritt in der KI-Entwicklung darstellen. Dieses Argument steht im Einklang mit der Designphilosophie hinter MoA 2.0, das Agenten und Modellkombinationen als Weg zu Fähigkeitsgewinnen betrachtet, die sich mit einzelnen Trainingsläufen nicht leicht replizieren lassen.

Die Veröffentlichung von Hermes MoA fällt zudem in eine aktive Debatte in der KI-Forschungsgemeinschaft über die richtige Rolle von Foundation Models im Vergleich zu Agenten-Ebenen.

Andrej Karpathy warnte Anfang dieser Woche, dass eine Agent-First-Entwicklung das Risiko birgt, Fehler aus früheren Forschungszyklen von OpenAI zu wiederholen. Der Ansatz von Nous Research versucht einen Mittelweg, indem starke Foundation Models als Eingaben genutzt und darüber eine Orchestrierungsschicht gelegt wird.

Auch lesen: OpenAI peilt einen Börsengang mit 1 Billion Dollar Bewertung an, während Microsoft den größten Gewinn hält

Worauf zu achten ist

Hermes MoA 2.0 wurde noch nicht gegen die jüngsten Frontier-Modelle getestet. Claude Sonnet 5 und aktualisierte GPT-Varianten, die Mitte 2026 veröffentlicht wurden, könnten das Benchmark-Bild verändern. Nous Research hat begleitend zur Veröffentlichung kein formales wissenschaftliches Paper publiziert.

Die praktische Bedeutung für Entwickelnde ist klar: Ein Open-Source-Tool, das geschlossene Modellbenchmarks nachweislich übertrifft, indem es sie kombiniert, senkt die Hürde für Forschungsteams, auf erstklassige Schlussfolgerungsfähigkeit zuzugreifen, ohne für jeden Inferenzaufruf die API-Kosten von Frontier-Modellen zahlen zu müssen.

Für die KI-Branche stärkt MoA 2.0 das Argument, dass Modellvielfalt – statt eines einzigen dominanten Modells – die nächste Phase der KI-Einführung prägen könnte. Beobachten Sie in den kommenden Monaten, wie OpenAI und Anthropic auf ensemblebasierte Ansätze reagieren.

Als Nächstes lesen: Die doppelgesichtige Trump-Anthropic-Politik, die das Weiße Haus nicht erklären will