사카나 후구, 여러 AI 모델을 지휘해 앤트로픽의 제한된 Mythos에 도전

사카나 후구, 여러 AI 모델을 지휘해 앤트로픽의 제한된 Mythos에 도전

도쿄 스타트업 Sakana AI가 여러 언어 모델을 교체 가능한 풀로 묶어 지휘하는 시스템 Fugu를 출시해, 제한된 AnthropicFable 및 Mythos 모델에 도전하고 있다.

핵심 포인트:

  • 사카나 AI의 Fugu는 겉으로는 하나의 모델처럼 동작하지만, 단일 API 뒤에서 여러 시스템 풀을 조율한다.
  • Fugu Ultra는 SWE-Bench Pro 코딩 테스트에서 73.7점을 기록해 여러 최전선 경쟁 모델을 앞질렀다.
  • 이 설계는 Fable과 Mythos를 묶어둔 수출 통제에 대한 헤지 수단으로 제시되고 있다.

사카나 후구, 모델을 오케스트레이션하다

도쿄 연구소는 6월 22일, Fugu와 더 무거운 Fugu Ultra 티어를 공개했으며, 둘 다 하나의 OpenAI 호환 엔드포인트를 통해 접근 가능하다고 확인했다. 요청에 따라 단독으로 작업을 해결하거나, 다른 시스템들로 팀을 꾸려 함께 답을 내놓는다.

그런 뒤 모델이 자체적으로 검증과 통합 과정을 수행한다.

Fugu 자체도 하나의 언어 모델이다.

교체 가능한 풀에서 에이전트를 호출하도록 훈련된 Fugu는, 한 번의 작업에 단일 모델이 감당하기 어려운 만큼의 손이 필요할 때는 자기 자신의 복제본까지 호출할 수 있다. 베이스 티어는 일상적인 코딩, 대화, Codex 같은 도구를 위한 낮은 지연 시간을 목표로 하며, 팀이 프라이버시 규정을 맞추기 위해 특정 에이전트를 제외하도록 허용한다. 반면 Fugu Ultra는 논문 재현이나 보안 분석처럼 긴 문제에서 최고의 답변 품질을 노리며, 최근 몇 주 동안 약 500명 규모의 베타 사용자 그룹이 이를 테스트했다.

함께 읽기: Anthropic Perp 급락은 프리 IPO 크립토 베팅에 대한 경고인가?

몰릭과 레비의 평가

회사가 공개한 벤치마크에 따르면, Fugu Ultra는 SWE-Bench Pro 코딩 테스트에서 73.7점을 기록해, 동일 조건에서 Opus 4.8, Gemini 3.1 Pro, GPT-5.5를 앞섰다.

회사는 이 점수가 Fable 5와 Mythos Preview와 비슷한 수준이라고 주장하며, 자체 표에서도 오케스트레이터가 공개된 11개 항목 중 10개에서 1위를 차지한 것으로 나타난다.

모든 테스터가 납득한 것은 아니다. AI 연구자 **이선 몰릭(Ethan Mollick)**은 Fugu Ultra가 “믿을 수 없을 정도로 느리게” 동작해, 일상적인 코딩 테스트조차 30분까지 늘어졌고 실제 사용에서 출력 품질도 Fable보다 떨어졌다고 썼다. Box 최고경영자 **애런 레비(Aaron Levie)**는 더 긍정적이었는데, 각 작업을 가장 적합한 모델로 단일 API에서 라우팅하는 방식을 적용 AI 구축 방식의 진전으로 평가했다.

다른 이들은 가격을 문제 삼는다. 오케스트레이션 구조상 토큰 비용이, 유사한 작업을 단일 최전선 모델에 직접 호출할 때보다 몇 배씩 쌓일 수 있기 때문이다. 사카나는 이 풀 구조를, 어떤 제공자가 갑자기 서비스를 중단하는 상황에 대비한 보험으로 설명하며, Fable과 Mythos에 새로 적용된 수출 제한이 하룻밤 사이에 접근을 끊어버리는 대표적인 충격 사례라고 지적한다.

사카나 AI의 기원

사카나 AI는 **구글(Google)**의 논문 「Attention Is All You Need」의 공저자인 **리온 존스(Llion Jones)**를 중심으로 2023년에 설립됐다. 한때 Stability AI의 리서치 리드를 맡았던 **데이비드 하(David Ha)**가 공동 창업자로 합류했다. 이 연구소는 진화적 모델 병합과 자동화된 연구 계열인 AI Scientist로 이름을 알렸으며, 특히 가장 어렵고 장기적인 작업에서는 조율된 모델 풀 구조가 어떤 단일 시스템보다 뛰어날 수 있다고 꾸준히 주장해 왔다.

다음 읽을거리: Mane City Mobile, 100여 개국 iOS·Android 동시 출시

면책 조항 및 위험 경고: 이 기사에서 제공되는 정보는 교육 및 정보 제공 목적으로만 제공되며 저자의 의견을 바탕으로 합니다. 이는 재정, 투자, 법적 또는 세무 조언을 구성하지 않습니다. 암호화폐 자산은 매우 변동성이 크고 높은 위험에 노출되어 있으며, 여기에는 투자금 전부 또는 상당 부분을 잃을 위험이 포함됩니다. 암호화폐 자산의 거래나 보유는 모든 투자자에게 적합하지 않을 수 있습니다. 이 기사에 표현된 견해는 저자(들)의 견해일 뿐이며 Yellow, 창립자 또는 임원의 공식적인 정책이나 입장을 나타내지 않습니다. 투자 결정을 내리기 전에 항상 자신만의 철저한 조사(D.Y.O.R.)를 수행하고 면허를 가진 금융 전문가와 상담하십시오.
사카나 후구, 여러 AI 모델을 지휘해 앤트로픽의 제한된 Mythos에 도전 | Yellow.com