Nous Research ha rilasciato domenica Hermes Mixture of Agents 2.0, che combina gli output di più grandi modelli linguistici, tra cui GPT, Claude e DeepSeek, per produrre risposte che superano qualsiasi modello individuale sui benchmark standard.
Secondo un report, MoA 2.0 è un aggiornamento dell’esistente framework Hermes Agent di Nous Research e ne mantiene la struttura open source.
Come funziona il sistema
Hermes MoA 2.0 opera come uno strato di ensemble. Interroga in parallelo diversi modelli di base, raccoglie i loro output e sintetizza una risposta finale. L’approccio, noto come Mixture of Agents, tratta i modelli di IA distinti come contributori specialisti invece di richiedere a un singolo modello di gestire ogni compito da solo.
Gli utenti possono configurare quali modelli partecipano a un determinato ensemble. La configurazione predefinita utilizza GPT, Claude e DeepSeek, tre modelli che rappresentano diverse filosofie di addestramento e composizioni di dati. Combinando i loro output, MoA 2.0 cattura punti di forza complementari.
I risultati di benchmark condivisi con il rilascio mostrano che MoA 2.0 supera ciascun modello componente preso singolarmente in compiti di ragionamento, coding e seguire istruzioni. Il margine è significativo nei test di ragionamento a lungo orizzonte, dove i singoli modelli spesso perdono coerenza.
Il framework resta open source, il che significa che ricercatori e sviluppatori possono ispezionare l’architettura, sostituire i modelli di base e adattare l’ensemble a casi d’uso specifici.
Da leggere anche: Anthropic supera OpenAI con una valutazione da 965 miliardi di dollari mentre la corsa ai finanziamenti IA si resetta
I laboratori open-weight puntano sull’orchestrazione di agenti
Nous Research si è costruita una reputazione per i rilasci di modelli open-weight rivolti alla comunità di ricerca. Il framework originale Hermes Agent ha stabilito un punto di riferimento per l’orchestrazione multi‑modello all’inizio del 2026.
Il contesto più ampio è un ciclo di sviluppo IA open-weight in rapida accelerazione. Z.ai ha pubblicato GLM-5.2 all’inizio di luglio 2026, presentandolo come un modello open-weight di coding per compiti di ingegneria a lungo orizzonte. Il rilascio segue un modello di laboratori open-weight che mirano a domini di capacità specifici in cui i modelli chiusi detengono vantaggi reputazionali.
Da leggere anche: Gli esperti dicono che la quota del 5% di OpenAI spingerebbe l’IA più a fondo nel controllo statale
L’ex responsabile tecnico di Qwen, Junyang Lin, ha sostenuto pubblicamente alla fine di giugno 2026 che i sistemi agentici rappresentano il passo successivo corretto per lo sviluppo dell’IA. Questo argomento è in linea con la filosofia di progettazione alla base di MoA 2.0, che considera agenti e combinazioni di modelli come una via verso guadagni di capacità che le singole run di addestramento non possono facilmente replicare.
Il rilascio di Hermes MoA arriva anche in un momento di intenso dibattito nella comunità di ricerca sull’IA riguardo al ruolo corretto dei foundation model rispetto agli strati di agenti.
Andrej Karpathy ha avvertito all’inizio di questa settimana che uno sviluppo “agent‑first” rischia di ripetere errori dei cicli di ricerca precedenti di OpenAI. L’approccio di Nous Research tenta una via di mezzo, usando forti foundation model come input e aggiungendo sopra uno strato di orchestrazione.
Da leggere anche: OpenAI punta a una IPO da 1 trilione di dollari mentre Microsoft detiene il premio più grande
Cosa osservare
Hermes MoA 2.0 non è stato ancora testato contro i più recenti modelli di frontiera rilasciati. Claude Sonnet 5 e le varianti aggiornate di GPT rilasciate a metà 2026 potrebbero cambiare il quadro dei benchmark. Nous Research non ha pubblicato un paper accademico formale insieme al rilascio.
Il significato pratico per gli sviluppatori è chiaro. Uno strumento open source che dimostra di migliorare i benchmark dei modelli chiusi combinandoli riduce la barriera per i team di ricerca ad accedere a capacità di ragionamento di livello top senza pagare i costi delle API dei modelli di frontiera per ogni chiamata di inferenza.
Per l’industria dell’IA, MoA 2.0 aggiunge peso all’argomento secondo cui la diversità dei modelli, piuttosto che un singolo modello dominante, potrebbe definire la prossima fase di distribuzione dell’IA. Nei prossimi mesi, osserva le reazioni di OpenAI e Anthropic agli approcci basati su ensemble.
Da leggere dopo: La politica a doppio volto su Trump di Anthropic che la Casa Bianca non vuole spiegare





