Sakana Fugu dyryguje wieloma modelami AI, by rywalizować z zakazanym Mythos Anthropic

Tokijskie startup Sakana AI uruchomiło Fugu, system, który dyryguje wymienną pulą modeli językowych, aby rywalizować z ograniczonymi modelami Anthropic Fable i Mythos.

Kluczowe punkty:

Fugu Sakana AI działa jak jeden model, ale koordynuje pulę innych systemów za jednym interfejsem API.

Fugu Ultra zdobył 73,7 punktu w teście kodowania SWE-Bench Pro, wyprzedzając kilku czołowych rywali.

Projekt jest przedstawiany jako zabezpieczenie przed kontrolami eksportu, które odcięły dostęp do Fable i Mythos.

Sakana Fugu orkiestruje modele

Tokijskie laboratorium wprowadziło Fugu oraz cięższy wariant Fugu Ultra 22 czerwca, oba dostępne przez jeden endpoint kompatybilny z OpenAI, co potwierdziło. W zależności od zapytania, system wykonuje zadanie samodzielnie lub zwołuje zespół innych systemów.

Model następnie samodzielnie przeprowadza sprawdzenia i syntezę.

Fugu sam w sobie jest modelem językowym.

Wytrenowany do wywoływania agentów z wymiennej puli, może nawet przywoływać swoje własne kopie, gdy pojedyncze zadanie wymaga więcej „rąk do pracy”, niż może zapewnić jeden model. Podstawowy wariant jest ukierunkowany na niskie opóźnienia przy codziennym kodowaniu, czacie i narzędziach takich jak Codex, a także pozwala zespołom wykluczać konkretne agenty, aby spełnić wymogi prywatności. Z kolei Fugu Ultra celuje w najwyższą jakość odpowiedzi przy długich zadaniach, takich jak odtwarzanie artykułów naukowych i analizy bezpieczeństwa, które w ostatnich tygodniach testowała grupa około 500 użytkowników beta.

Przeczytaj także: Czy wyprzedaż Anthropic Perp jest ostrzeżeniem dla przed-IPO zakładów na krypto?

Mollick i Levie zabierają głos

Dane benchmarkowe, które firma udostępniła, plasują Fugu Ultra na poziomie 73,7 punktu w teście kodowania SWE-Bench Pro, przed Opus 4.8, Gemini 3.1 Pro i GPT-5.5 w tym samym przebiegu.

Firma twierdzi, że te wyniki są porównywalne z Fable 5 i Mythos Preview, a jej własna tabela pokazuje, że orkiestrator zajmuje pierwsze miejsce w 10 z 11 opublikowanych wierszy.

Nie każdego testera to przekonało. Badacz AI Ethan Mollick napisał, że Fugu Ultra działał „niesamowicie wolno”, z rutynowymi testami kodowania przeciągającymi się do 30 minut i wynikami, które w praktycznym użyciu ustępowały Fable. Szef Box, Aaron Levie, brzmiał bardziej entuzjastycznie, nazywając jednolite API, które kieruje każde zadanie do najlepiej dopasowanego modelu, krokiem naprzód dla sposobu budowania zastosowań AI.

Inni zwracali uwagę na cenę, ponieważ orkiestracja może kumulować koszty tokenów wielokrotnie wyższe niż bezpośrednie wywołanie pojedynczego modelu frontier przy porównywalnym zadaniu. Sakana przedstawia projekt z pulą modeli jako ubezpieczenie na wypadek wyłączenia któregokolwiek dostawcy, wskazując świeże ograniczenia eksportowe Fable i Mythos jako typ szoku, który może z dnia na dzień przerwać dostęp.

Początki Sakana AI

Sakana AI powstała w 2023 roku pod kierunkiem Lliona Jonesa, współautora pracy Google „Attention Is All You Need”. David Ha, niegdyś lider badań w Stability AI, dołączył do niego jako współzałożyciel. Laboratorium zbudowało swoją markę na ewolucyjnym łączeniu modeli i linii zautomatyzowanych badań AI Scientist, od dawna argumentując, że skoordynowane pule modeli mogą przewyższyć każdy pojedynczy system przy najtrudniejszych, długotrwałych zadaniach.

Czytaj dalej: Mane City Mobile trafia na iOS i Androida w ponad 100 krajach