Токийский стартап Sakana AI запустил Fugu — систему, которая координирует взаимозаменяемый пул языковых моделей, чтобы конкурировать с ограниченными моделями Anthropic Fable и Mythos.
Ключевые моменты:
- Fugu от Sakana AI выглядит как одна модель, но координирует пул других систем за единым API.
- Fugu Ultra набрал 73,7 балла в тесте SWE-Bench Pro по программированию, обогнав несколько передовых конкурентов.
- Такой дизайн позиционируется как защита от экспортного контроля, который отрезал доступ к Fable и Mythos.
Как Sakana Fugu оркестрирует модели
Токийская лаборатория вывела Fugu и более тяжёлый уровень Fugu Ultra 22 июня — оба доступны через один совместимый с OpenAI endpoint, как она подтвердила. В зависимости от запроса, система либо решает задачу сама, либо собирает «команду» из других систем.
Затем модель самостоятельно выполняет проверки и синтез результата.
Fugu сама по себе является языковой моделью.
Обученная вызывать агентов из взаимозаменяемого пула, она может даже вызывать собственные копии, если одной модели «не хватает рук» для конкретной задачи. Базовый уровень нацелен на низкую задержку в повседневных задачах — программировании, чате и инструментах вроде Codex, — и позволяет командам отключать отдельных агентов для соблюдения требований конфиденциальности. Fugu Ultra, напротив, стремится к максимальному качеству ответов в длинных задачах вроде воспроизведения научных работ и анализа безопасности, которые в последние недели тестировала группа примерно из 500 бета‑пользователей.
Также читайте: Является ли распродажа Anthropic Perp предупреждением для крипто-ставок до IPO?
Моллик и Леви высказываются
По опубликованным компанией данным, Fugu Ultra показал 73,7 балла в тесте SWE-Bench Pro, обойдя Opus 4.8, Gemini 3.1 Pro и GPT-5.5 в том же прогоне.
Компания заявляет, что эти результаты сопоставимы с Fable 5 и Mythos Preview, и её собственная таблица показывает, что оркестратор выходит на первое место в 10 из 11 опубликованных строк.
Не всех тестеров это убедило. Исследователь ИИ Итан Моллик написал, что Fugu Ultra работает «невероятно медленно»: типичные тесты по коду растягиваются до 30 минут, а качество вывода уступает Fable в реальном использовании. Глава Box Аарон Леви отнёсся теплее, назвав маршрутизацию каждой задачи к наилучшей модели через единый API шагом вперёд в том, как строятся прикладные ИИ‑системы.
Другие указали на цену: оркестрация может накапливать стоимость токенов во много раз выше, чем прямой вызов одной передовой модели на сопоставимой задаче. Sakana подаёт дизайн пула как страховку от отключения любого поставщика, отмечая недавние экспортные ограничения на Fable и Mythos как типичный шок, способный за одну ночь оборвать доступ.
Как появилась Sakana AI
Sakana AI сформировалась в 2023 году под руководством Ллиона Джонса, соавтора статьи Google «Attention Is All You Need». К нему в качестве сооснователя присоединился Дэвид Ха, ранее руководивший исследованиями в Stability AI. Лаборатория получила известность благодаря эволюционному объединению моделей и линейке автоматизированных исследований AI Scientist и давно утверждает, что скоординированные пулы моделей могут превосходить любую одиночную систему в самых сложных и долгих задачах.
Читайте далее: Mane City Mobile выходит на iOS и Android в 100+ странах





