Sakana Fugu Mengorkestrasi Beberapa Model AI Untuk Menyaingi Mythos Terbatas Milik Anthropic

Startup Tokyo Sakana AI meluncurkan Fugu, sebuah sistem yang mengorkestrasi kumpulan model bahasa yang dapat ditukar untuk menyaingi model Fable dan Mythos terbatas milik Anthropic.

Poin-Poin Utama:

Fugu dari Sakana AI berjalan seperti satu model namun mengoordinasikan kumpulan sistem lain di balik satu API.

Fugu Ultra mencetak skor 73,7 pada uji coding SWE-Bench Pro, mengungguli beberapa rival frontier.

Desain ini diposisikan sebagai lindung nilai terhadap kontrol ekspor yang mengunci akses ke Fable dan Mythos.

Sakana Fugu Mengorkestrasi Model

Lab Tokyo tersebut meluncurkan Fugu dan versi lebih berat Fugu Ultra pada 22 Juni, keduanya dapat diakses lewat satu endpoint yang kompatibel dengan OpenAI, seperti yang mereka konfirmasi. Tergantung pada permintaan, sistem ini menyelesaikan tugas sendiri atau mengumpulkan tim berbagai sistem lainnya.

Model kemudian menjalankan pengecekan dan penyintesisan secara mandiri.

Fugu sendiri adalah sebuah model bahasa.

Dilatih untuk memanggil agen dari kumpulan yang dapat ditukar, Fugu bahkan dapat memanggil salinan dirinya sendiri ketika satu pekerjaan membutuhkan lebih banyak “tangan” daripada yang dapat disediakan satu model. Tier dasar menargetkan latensi rendah untuk kebutuhan sehari-hari seperti coding, chat, dan alat seperti Codex, serta memungkinkan tim mengganti agen tertentu demi memenuhi aturan privasi. Fugu Ultra justru mengejar kualitas jawaban tertinggi pada masalah panjang seperti replikasi makalah dan analisis keamanan, yang diuji oleh sekitar 500 pengguna beta dalam beberapa minggu terakhir.

Juga Baca: Apakah Penjualan Anthropic Perp Jadi Peringatan Untuk Taruhan Kripto Pra-IPO?

Mollick Dan Levie Angkat Bicara

Angka benchmark yang dirilis perusahaan menempatkan Fugu Ultra di skor 73,7 pada uji coding SWE-Bench Pro, di depan Opus 4.8, Gemini 3.1 Pro, dan GPT-5.5 pada run yang sama.

Perusahaan mengatakan skor tersebut setara dengan Fable 5 dan Mythos Preview, dan tabel internalnya menunjukkan sang orkestrator berada di posisi teratas pada 10 dari 11 baris yang dipublikasikan.

Tidak semua penguji terkesan. Peneliti AI Ethan Mollick menulis bahwa Fugu Ultra berjalan “sangat lambat,” dengan uji coding rutin yang bisa memakan waktu hingga 30 menit dan keluaran yang tertinggal dari Fable dalam penggunaan nyata. Bos Box, Aaron Levie, terdengar lebih positif, menyebut routing setiap tugas lewat satu API ke model yang paling cocok sebagai sebuah langkah maju bagi cara AI terapan dibangun.

Pihak lain menyoroti harga, karena orkestrasi ini dapat menumpuk biaya token berkali-kali lipat lebih tinggi dibanding memanggil satu model frontier secara langsung untuk tugas serupa. Sakana membingkai desain kumpulan ini sebagai asuransi jika ada penyedia yang tiba-tiba menghilang, menandai pembatasan ekspor baru pada Fable dan Mythos sebagai jenis guncangan yang dapat memutus akses dalam semalam.

Asal-Usul Sakana AI

Sakana AI terbentuk pada 2023 di bawah Llion Jones, salah satu penulis makalah Google “Attention Is All You Need”. David Ha, yang pernah memimpin riset di Stability AI, bergabung sebagai salah satu co-founder. Lab ini membangun reputasinya lewat penggabungan model evolusioner dan lini riset otomatis AI Scientist, dan sejak lama berargumen bahwa kumpulan model yang terkoordinasi dapat mengungguli satu sistem tunggal pada pekerjaan paling berat dan jangka panjang.

Baca Berikutnya: Mane City Mobile Hadir Di iOS Dan Android Di 100+ Negara