Tokijsky startup Sakana AI uruchomił Fugu, system, który dyryguje wymienną pulą modeli językowych, aby rywalizować z ograniczonymi modelami Anthropic Fable i Mythos.
Kluczowe punkty:
- Fugu Sakana AI działa jak jeden model, ale koordynuje pulę innych systemów za jednym API.
- Fugu Ultra uzyskał wynik 73,7 w teście kodowania SWE-Bench Pro, pokonując kilku czołowych rywali.
- Projekt jest przedstawiany jako zabezpieczenie przed kontrolą eksportu, która odcięła dostęp do Fable i Mythos.
Sakana Fugu orkiestruje modele
Tokijskie laboratorium wprowadziło Fugu oraz cięższy wariant Fugu Ultra 22 czerwca, oba dostępne przez jeden endpoint kompatybilny z OpenAI, co potwierdziło. W zależności od zapytania system samodzielnie odpowiada na zadanie lub zwołuje zespół innych systemów.
Następnie model sam przeprowadza sprawdzenia i syntezę.
Fugu jest sam w sobie modelem językowym.
Wytrenowany do wywoływania agentów z wymiennej puli, potrafi nawet przywoływać własne kopie, gdy jedno zadanie wymaga więcej „rąk do pracy”, niż może zapewnić pojedynczy model. Podstawowy poziom jest nastawiony na niskie opóźnienia przy codziennym kodowaniu, czacie i narzędziach takich jak Codex oraz pozwala zespołom wyłączać konkretne agenty, by spełnić wymogi prywatności. Fugu Ultra zamiast tego celuje w najwyższą jakość odpowiedzi przy długich zadaniach, takich jak replikacja prac naukowych czy analiza bezpieczeństwa, które przez ostatnie tygodnie testowała grupa około 500 użytkowników beta.
Przeczytaj także: Czy wyprzedaż Anthropic Perp to ostrzeżenie dla przed‑IPO zakładów krypto?
Mollick i Levie zabierają głos
Dane benchmarkowe, które firma upubliczniła, plasują Fugu Ultra na poziomie 73,7 w teście kodowania SWE-Bench Pro, przed Opus 4.8, Gemini 3.1 Pro i GPT-5.5 w tym samym przebiegu.
Firma twierdzi, że te wyniki dorównują Fable 5 i Mythos Preview, a jej własna tabela pokazuje, że orkiestrator kończy na szczycie w 10 z 11 opublikowanych wierszy.
Nie każdy tester był przekonany. Badacz AI Ethan Mollick napisał, że Fugu Ultra działał „niesamowicie wolno”, z rutynowymi testami kodowania przeciągającymi się do 30 minut i wynikami, które w realnym użyciu odstawały od Fable. Szef Box, Aaron Levie, był nastawiony cieplej, nazywając jednolite API, które kieruje każde zadanie do najlepiej dopasowanego modelu, krokiem naprzód w sposobie budowy zastosowań AI.
Inni zwracali uwagę na cenę, ponieważ orkiestracja może skumulować koszty tokenów wielokrotnie wyższe niż bezpośrednie wywołanie pojedynczego czołowego modelu przy porównywalnym zadaniu. Sakana przedstawia projekt puli jako polisę ubezpieczeniową na wypadek, gdyby którykolwiek dostawca „zgasł światło”, wskazując świeże ograniczenia eksportowe na Fable i Mythos jako typ szoku, który może z dnia na dzień odciąć dostęp.
Początki Sakana AI
Sakana AI powstała w 2023 roku z inicjatywy Lliona Jonesa, współautora pracy Google „Attention Is All You Need”. Dołączył do niego jako współzałożyciel David Ha, wcześniej szef badań w Stability AI. Laboratorium zbudowało swoją markę na ewolucyjnym łączeniu modeli i linii zautomatyzowanych badań AI Scientist oraz od dawna utrzymuje, że skoordynowane pule modeli mogą przewyższyć pojedynczy system przy najtrudniejszych, długotrwałych zadaniach.
Czytaj dalej: Mane City Mobile trafia na iOS i Androida w ponad 100 krajach





