Sakana Fugu orchestra diversi modelli di IA per rivaleggiare con il mito proibito di Anthropic

La startup di Tokyo Sakana AI ha lanciato Fugu, un sistema che orchestra un pool intercambiabile di modelli linguistici per rivaleggiare con i modelli Fable e Mythos con restrizioni di Anthropic.

Punti chiave:

Fugu di Sakana AI funziona come un unico modello ma coordina un pool di altri sistemi dietro un'unica API.

Fugu Ultra ha ottenuto 73,7 nel test di coding SWE-Bench Pro, superando diversi rivali di frontiera.

Il design è presentato come una copertura contro i controlli all'export che hanno bloccato Fable e Mythos.

Sakana Fugu orchestra i modelli

Il laboratorio di Tokyo ha lanciato Fugu e un livello più pesante, Fugu Ultra, il 22 giugno, entrambi raggiungibili tramite un unico endpoint compatibile con OpenAI, ha confermato. A seconda della richiesta, risponde al compito da solo oppure riunisce una squadra di altri sistemi.

Il modello esegue poi autonomamente i controlli e la sintesi.

Fugu è esso stesso un modello linguistico.

Addestrato per chiamare agenti da un pool intercambiabile, può persino richiamare copie di se stesso quando un singolo lavoro richiede più “mani” di quante un modello solo possa fornire. Il livello base punta a una bassa latenza per il coding quotidiano, la chat e strumenti come Codex, e consente ai team di escludere agenti specifici per rispettare le regole sulla privacy. Fugu Ultra invece punta alla massima qualità di risposta su problemi lunghi come la riproduzione di paper e l’analisi di sicurezza, che un gruppo di circa 500 utenti beta ha testato nelle ultime settimane.

Mollick e Levie intervengono

I valori di benchmark che l’azienda ha pubblicato collocano Fugu Ultra a 73,7 nel test di coding SWE-Bench Pro, davanti a Opus 4.8, Gemini 3.1 Pro e GPT-5.5 nella stessa prova.

L’azienda afferma che questi punteggi sono allo stesso livello di Fable 5 e Mythos Preview, e la sua tabella mostra l’orchestratore in testa in 10 delle 11 righe pubblicate.

Non tutti i tester sono stati convinti. Il ricercatore di IA Ethan Mollick ha scritto che Fugu Ultra è risultato “incredibilmente lento”, con test di coding di routine che si trascinavano per 30 minuti e output che, nell’uso reale, restavano indietro rispetto a Fable. Il CEO di Box, Aaron Levie, è parso più favorevole, definendo il routing tramite un’unica API di ogni task verso il modello più adatto un passo avanti per il modo in cui si costruisce l’IA applicata.

Altri hanno segnalato il prezzo, dato che l’orchestrazione può accumulare costi di token molte volte superiori rispetto a chiamare direttamente un singolo modello di frontiera sullo stesso compito. Sakana presenta il design a pool come una polizza assicurativa contro l’eventualità che un fornitore diventi improvvisamente inaccessibile, richiamando le nuove restrizioni all’export su Fable e Mythos come il tipo di shock che può tagliare l’accesso da un giorno all’altro.

Le origini di Sakana AI

Sakana AI ha preso forma nel 2023 sotto la guida di Llion Jones, coautore del paper di Google “Attention Is All You Need”. David Ha, un tempo responsabile della ricerca in Stability AI, si è unito come cofondatore. Il laboratorio si è fatto un nome con il merging evolutivo dei modelli e la linea AI Scientist di ricerca automatizzata, e sostiene da tempo che pool coordinati di modelli possano superare qualsiasi singolo sistema nei lavori più difficili e di lunga durata.

Da leggere dopo: Mane City Mobile arriva su iOS e Android in oltre 100 paesi