Startup Tokyo Sakana AI meluncurkan Fugu, sebuah sistem yang mengorkestrasi kumpulan model bahasa yang bisa ditukar untuk menyaingi model Anthropic yang dibatasi, model Fable dan Mythos.
Poin Utama:
- Fugu milik Sakana AI berjalan sebagai satu model namun mengoordinasikan kumpulan sistem lain melalui satu API.
- Fugu Ultra mencetak skor 73,7 pada uji coding SWE-Bench Pro, mengungguli sejumlah pesaing frontier.
- Desain ini diposisikan sebagai lindung nilai terhadap kontrol ekspor yang mengunci Fable dan Mythos.
Sakana Fugu Mengorkestrasi Model-Model
Lab Tokyo tersebut meluncurkan Fugu dan versi lebih berat Fugu Ultra pada 22 Juni, keduanya bisa diakses melalui satu endpoint yang kompatibel dengan OpenAI, seperti yang dikonfirmasi. Bergantung pada permintaan, sistem ini menjawab tugas sendirian atau mengumpulkan tim dari sistem lain.
Model kemudian menjalankan pemeriksaan dan sintesisnya sendiri.
Fugu sendiri adalah sebuah model bahasa.
Dilatih untuk memanggil agen dari kumpulan yang dapat ditukar, Fugu bahkan bisa memanggil salinannya sendiri ketika satu pekerjaan membutuhkan lebih banyak “tangan” daripada yang bisa disediakan satu model. Tier dasar menargetkan latensi rendah untuk coding sehari-hari, chat, dan alat seperti Codex, serta memungkinkan tim mengganti agen tertentu demi memenuhi aturan privasi. Fugu Ultra sebaliknya mengejar kualitas jawaban terbaik untuk masalah panjang seperti reproduksi makalah dan analisis keamanan, yang telah diuji oleh sekitar 500 pengguna beta dalam beberapa minggu terakhir.
Juga Baca: Apakah Sell-Off Anthropic Perp Menjadi Peringatan untuk Taruhan Krypto Pra-IPO?
Mollick dan Levie Angkat Bicara
Angka benchmark yang dirilis perusahaan menempatkan Fugu Ultra di skor 73,7 pada uji coding SWE-Bench Pro, di depan Opus 4.8, Gemini 3.1 Pro, dan GPT-5.5 pada pengujian yang sama.
Perusahaan mengatakan skor tersebut setara dengan Fable 5 dan Mythos Preview, dan tabel internalnya menunjukkan sang orkestrator berada di peringkat teratas pada 10 dari 11 baris yang dipublikasikan.
Tidak semua penguji terkesan. Peneliti AI Ethan Mollick menulis bahwa Fugu Ultra berjalan “sangat lambat,” dengan uji coding rutin molor hingga 30 menit dan keluaran yang tertinggal dari Fable dalam penggunaan nyata. Bos Box, Aaron Levie, terdengar lebih positif, menyebut routing tiap tugas lewat satu API ke model yang paling sesuai sebagai sebuah langkah maju bagi cara AI terapan dibangun.
Pihak lain menyoroti harga, karena orkestrasi dapat menumpuk biaya token berkali-kali lipat dibanding memanggil satu model frontier secara langsung untuk tugas sebanding. Sakana memposisikan desain kumpulan ini sebagai asuransi jika ada penyedia yang tiba-tiba berhenti, dengan menandai pembatasan ekspor baru pada Fable dan Mythos sebagai jenis guncangan yang dapat memutus akses dalam semalam.
Asal-Usul Sakana AI
Sakana AI terbentuk pada 2023 dipimpin oleh Llion Jones, salah satu penulis makalah Google “Attention Is All You Need”. David Ha, yang sebelumnya memimpin riset di Stability AI, bergabung sebagai salah satu pendiri. Lab ini membangun namanya lewat penggabungan model secara evolusioner dan lini AI Scientist untuk riset otomatis, dan sejak lama berargumen bahwa kumpulan model yang terkoordinasi dapat melampaui sistem tunggal mana pun pada pekerjaan paling sulit dan jangka panjang.
Baca Selanjutnya: Mane City Mobile Hadir di iOS dan Android di 100+ Negara





