La startup tokyoïte Sakana AI a lancé Fugu, un système qui orchestre un pool interchangeable de modèles de langage pour rivaliser avec les modèles Fable et Mythos restreints d’Anthropic.
Points clés :
- Fugu de Sakana AI fonctionne comme un seul modèle tout en coordonnant un pool d’autres systèmes derrière une seule API.
- Fugu Ultra a obtenu un score de 73,7 au test de codage SWE-Bench Pro, dépassant plusieurs rivaux de pointe.
- Cette architecture est présentée comme une couverture contre les contrôles à l’exportation qui ont verrouillé Fable et Mythos.
Sakana Fugu orchestre les modèles
Le laboratoire de Tokyo a déployé Fugu et une version plus lourde, Fugu Ultra, le 22 juin, toutes deux accessibles via un seul endpoint compatible OpenAI, a‑t‑il confirmé. Selon la demande, il répond seul à une tâche ou rassemble une équipe d’autres systèmes.
Le modèle effectue ensuite lui‑même les vérifications et la synthèse.
Fugu est lui‑même un modèle de langage.
Entraîné à appeler des agents depuis un pool interchangeable, il peut même invoquer des copies de lui‑même lorsqu’un seul travail nécessite plus de « mains » qu’un modèle unique ne peut en fournir. Le niveau de base vise une faible latence pour le codage quotidien, la conversation et des outils comme Codex, et permet aux équipes d’exclure des agents précis pour respecter les règles de confidentialité. Fugu Ultra cherche au contraire la meilleure qualité de réponse sur de longs problèmes comme la reproduction d’articles scientifiques et l’analyse de sécurité, que quelque 500 utilisateurs bêta ont testés ces dernières semaines.
À lire aussi : La liquidation des perpétuels Anthropic est‑elle un avertissement pour les paris crypto pré‑IPO ?
Mollick et Levie donnent leur avis
Les chiffres de benchmark que l’entreprise a publiés placent Fugu Ultra à 73,7 au test de codage SWE-Bench Pro, devant Opus 4.8, Gemini 3.1 Pro et GPT-5.5 sur la même série.
L’entreprise affirme que ces scores sont au niveau de Fable 5 et Mythos Preview, et son propre tableau montre l’orchestrateur en tête dans 10 des 11 lignes publiées.
Tous les testeurs n’ont pas été convaincus. Le chercheur en IA Ethan Mollick a écrit que Fugu Ultra fonctionnait « incroyablement lentement », avec des tests de codage courants qui traînaient jusqu’à 30 minutes et une qualité de sortie inférieure à Fable en usage réel. Le patron de Box, Aaron Levie, s’est montré plus enthousiaste, qualifiant le routage via une API unique de chaque tâche vers le modèle le plus adapté d’avancée pour la manière de construire l’IA appliquée.
D’autres ont pointé le prix, car l’orchestration peut accumuler des coûts de jetons plusieurs fois supérieurs à ceux d’un appel direct à un seul modèle de pointe pour une tâche comparable. Sakana présente cette conception mutualisée comme une assurance contre l’arrêt d’un fournisseur, en soulignant les nouvelles restrictions à l’exportation visant Fable et Mythos comme le type de choc qui peut couper l’accès du jour au lendemain.
Les origines de Sakana AI
Sakana AI a pris forme en 2023 sous la direction de Llion Jones, co‑auteur de l’article de Google « Attention Is All You Need ». David Ha, ancien responsable de recherche chez Stability AI, l’a rejoint comme co‑fondateur. Le laboratoire s’est fait connaître grâce à la fusion évolutive de modèles et à la ligne AI Scientist de recherche automatisée, et soutient depuis longtemps que des pools coordonnés de modèles peuvent surclasser n’importe quel système unique sur les travaux les plus difficiles et de longue durée.
À lire ensuite : Mane City Mobile arrive sur iOS et Android dans plus de 100 pays





