La startup di Tokyo Sakana AI ha lanciato Fugu, un sistema che orchestra un pool intercambiabile di modelli linguistici per rivaleggiare con i modelli Anthropic limitati Fable e Mythos.
Punti chiave:
- Fugu di Sakana AI gira come un unico modello ma coordina un pool di altri sistemi dietro una singola API.
- Fugu Ultra ha ottenuto 73,7 nel test di coding SWE-Bench Pro, superando diversi rivali di frontiera.
- Il design è presentato come copertura contro i controlli all’export che hanno bloccato Fable e Mythos.
Sakana Fugu orchestra i modelli
Il laboratorio di Tokyo ha presentato Fugu e un livello più pesante, Fugu Ultra, il 22 giugno, entrambi accessibili tramite un unico endpoint compatibile con OpenAI, ha confermato. A seconda della richiesta, il sistema risponde al compito da solo oppure riunisce una squadra di altri sistemi.
Il modello poi esegue autonomamente i controlli e la sintesi.
Fugu è esso stesso un modello linguistico.
Addestrato a chiamare agenti da un pool intercambiabile, può perfino richiamare copie di se stesso quando un singolo lavoro richiede più “mani” di quante un modello solo possa offrire. Il livello base punta sulla bassa latenza per il coding quotidiano, la chat e strumenti come Codex, e consente ai team di escludere agenti specifici per rispettare le norme sulla privacy. Fugu Ultra invece mira alla massima qualità delle risposte su problemi lunghi, come la riproduzione di articoli scientifici e l’analisi di sicurezza, che un gruppo di circa 500 beta tester ha provato nelle ultime settimane.
Da leggere anche: La svendita dei perp Anthropic è un avvertimento per le scommesse crypto pre-IPO?
Il parere di Mollick e Levie
I dati di benchmark che l’azienda ha pubblicato collocano Fugu Ultra a 73,7 nel test di coding SWE-Bench Pro, davanti a Opus 4.8, Gemini 3.1 Pro e GPT-5.5 nella stessa prova.
L’azienda afferma che questi punteggi sono in linea con Fable 5 e Mythos Preview, e la sua stessa tabella mostra l’orchestratore al primo posto in 10 delle 11 righe pubblicate.
Non tutti i tester si sono detti convinti. Il ricercatore di IA Ethan Mollick ha scritto che Fugu Ultra è risultato «incredibilmente lento», con test di coding di routine che si trascinavano per 30 minuti e un output che nella pratica restava indietro rispetto a Fable. Il CEO di Box, Aaron Levie, è apparso più favorevole, definendo l’instradamento tramite una singola API di ogni compito verso il modello più adatto un passo avanti nel modo in cui viene costruita l’IA applicata.
Altri hanno segnalato il prezzo, dato che l’orchestrazione può moltiplicare i costi in token molte volte rispetto alla chiamata diretta di un singolo modello di frontiera sullo stesso compito. Sakana presenta il design a pool come una polizza assicurativa contro l’eventualità che un provider si spenga, richiamando l’attenzione sulle nuove restrizioni all’export su Fable e Mythos come il tipo di shock che può interrompere l’accesso da un giorno all’altro.
Le origini di Sakana AI
Sakana AI ha preso forma nel 2023 sotto la guida di Llion Jones, co‑autore del paper di Google «Attention Is All You Need». David Ha, in passato responsabile della ricerca presso Stability AI, si è unito come cofondatore. Il laboratorio si è fatto un nome con il merging evolutivo dei modelli e la linea AI Scientist di ricerca automatizzata, e sostiene da tempo che pool coordinati di modelli possano superare qualsiasi singolo sistema nei lavori più difficili e di lunga durata.
Leggi anche: Mane City Mobile arriva su iOS e Android in oltre 100 Paesi





