Sakana Fugu управляет несколькими ИИ‑моделями, чтобы соперничать с запрещённым Mythos от Anthropic

Токийский стартап Sakana AI запустил Fugu — систему, которая управляет сменяемым пулом языковых моделей, чтобы соперничать с ограниченными моделями Anthropic Fable и Mythos.

Ключевые моменты:

Fugu от Sakana AI выглядит как одна модель, но координирует пул других систем за одним API.

Fugu Ultra набрал 73,7 в тесте SWE-Bench Pro по программированию, обойдя нескольких передовых конкурентов.

Дизайн подаётся как защита от экспортных ограничений, которые отрезали доступ к Fable и Mythos.

Sakana Fugu оркеструет модели

Токийская лаборатория вывела на рынок Fugu и более тяжёлый уровень Fugu Ultra 22 июня — оба доступны через один совместимый с OpenAI endpoint, как она подтвердила. В зависимости от запроса система отвечает на задачу сама или собирает команду из других систем.

Затем модель самостоятельно выполняет проверки и синтез.

Fugu сама по себе является языковой моделью.

Обученная вызывать агентов из сменяемого пула, она может даже вызывать собственные копии, когда одной модели «не хватает рук» для задачи. Базовый уровень нацелен на низкие задержки для повседневного кодинга, чата и инструментов вроде Codex и позволяет командам отключать отдельных агентов для соблюдения правил конфиденциальности. Fugu Ultra, наоборот, ориентируется на максимальное качество ответов в длинных задачах вроде воспроизведения научных работ и анализа безопасности, которые в последние недели тестировали примерно 500 бета‑пользователей.

Также читайте: Является ли распродажа Anthropic Perp предупреждением для крипто‑ставок до IPO?

Моллик и Леви оценивают Fugu

По бенчмаркам, которые компания опубликовала, Fugu Ultra набрала 73,7 в тесте SWE-Bench Pro по программированию — выше, чем Opus 4.8, Gemini 3.1 Pro и GPT-5.5 в том же прогоне.

Компания заявляет, что эти результаты сопоставимы с Fable 5 и Mythos Preview, а её собственная таблица показывает, что оркестратор оказался на первом месте в 10 из 11 опубликованных строк.

Не всех тестировщиков это убедило. Исследователь ИИ Итан Моллик написал, что Fugu Ultra работала «невероятно медленно»: обычные тесты по кодингу растягивались до 30 минут, а качество вывода уступало Fable в реальном использовании. Глава Box Аарон Леви отнёсся теплее, назвав маршрутизацию каждой задачи к наилучшей модели через единый API шагом вперёд в том, как строятся прикладные ИИ‑системы.

Другие указали на цену: оркестрация может складывать стоимость токенов во много раз выше, чем прямой вызов одной передовой модели на сопоставимой задаче. Sakana подаёт дизайн общего пула как страховку от ухода любого поставщика с рынка, отмечая свежие экспортные ограничения на Fable и Mythos как пример шока, который может в одночасье оборвать доступ.

Истоки Sakana AI

Sakana AI сформировалась в 2023 году под руководством Ллиона Джонса, соавтора статьи Google «Attention Is All You Need». К нему в качестве сооснователя присоединился Дэвид Ха, ранее возглавлявший исследования в Stability AI. Лаборатория заработала имя на эволюционном объединении моделей и линейке автоматизированных исследований AI Scientist и давно утверждает, что скоординированные пулы моделей могут превосходить любую одиночную систему в самых сложных и длительных задачах.

Читайте далее: Mane City Mobile выходит на iOS и Android в более чем 100 странах