Sakana Fugu Mengorkestrasi Beberapa Model AI untuk Menyaingi Mythos Terbatas Anthropic

Sakana Fugu Mengorkestrasi Beberapa Model AI untuk Menyaingi Mythos Terbatas Anthropic

Startup Tokyo Sakana AI meluncurkan Fugu, sebuah sistem yang mengorkestrasi kumpulan model bahasa yang bisa ditukar untuk menyaingi model Anthropic yang dibatasi, model Fable dan Mythos.

Poin Utama:

  • Fugu milik Sakana AI berjalan sebagai satu model namun mengoordinasikan kumpulan sistem lain melalui satu API.
  • Fugu Ultra mencetak skor 73,7 pada uji coding SWE-Bench Pro, mengungguli sejumlah pesaing frontier.
  • Desain ini diposisikan sebagai lindung nilai terhadap kontrol ekspor yang mengunci Fable dan Mythos.

Sakana Fugu Mengorkestrasi Model-Model

Lab Tokyo tersebut meluncurkan Fugu dan versi lebih berat Fugu Ultra pada 22 Juni, keduanya bisa diakses melalui satu endpoint yang kompatibel dengan OpenAI, seperti yang dikonfirmasi. Bergantung pada permintaan, sistem ini menjawab tugas sendirian atau mengumpulkan tim dari sistem lain.

Model kemudian menjalankan pemeriksaan dan sintesisnya sendiri.

Fugu sendiri adalah sebuah model bahasa.

Dilatih untuk memanggil agen dari kumpulan yang dapat ditukar, Fugu bahkan bisa memanggil salinannya sendiri ketika satu pekerjaan membutuhkan lebih banyak “tangan” daripada yang bisa disediakan satu model. Tier dasar menargetkan latensi rendah untuk coding sehari-hari, chat, dan alat seperti Codex, serta memungkinkan tim mengganti agen tertentu demi memenuhi aturan privasi. Fugu Ultra sebaliknya mengejar kualitas jawaban terbaik untuk masalah panjang seperti reproduksi makalah dan analisis keamanan, yang telah diuji oleh sekitar 500 pengguna beta dalam beberapa minggu terakhir.

Juga Baca: Apakah Sell-Off Anthropic Perp Menjadi Peringatan untuk Taruhan Krypto Pra-IPO?

Mollick dan Levie Angkat Bicara

Angka benchmark yang dirilis perusahaan menempatkan Fugu Ultra di skor 73,7 pada uji coding SWE-Bench Pro, di depan Opus 4.8, Gemini 3.1 Pro, dan GPT-5.5 pada pengujian yang sama.

Perusahaan mengatakan skor tersebut setara dengan Fable 5 dan Mythos Preview, dan tabel internalnya menunjukkan sang orkestrator berada di peringkat teratas pada 10 dari 11 baris yang dipublikasikan.

Tidak semua penguji terkesan. Peneliti AI Ethan Mollick menulis bahwa Fugu Ultra berjalan “sangat lambat,” dengan uji coding rutin molor hingga 30 menit dan keluaran yang tertinggal dari Fable dalam penggunaan nyata. Bos Box, Aaron Levie, terdengar lebih positif, menyebut routing tiap tugas lewat satu API ke model yang paling sesuai sebagai sebuah langkah maju bagi cara AI terapan dibangun.

Pihak lain menyoroti harga, karena orkestrasi dapat menumpuk biaya token berkali-kali lipat dibanding memanggil satu model frontier secara langsung untuk tugas sebanding. Sakana memposisikan desain kumpulan ini sebagai asuransi jika ada penyedia yang tiba-tiba berhenti, dengan menandai pembatasan ekspor baru pada Fable dan Mythos sebagai jenis guncangan yang dapat memutus akses dalam semalam.

Asal-Usul Sakana AI

Sakana AI terbentuk pada 2023 dipimpin oleh Llion Jones, salah satu penulis makalah Google “Attention Is All You Need”. David Ha, yang sebelumnya memimpin riset di Stability AI, bergabung sebagai salah satu pendiri. Lab ini membangun namanya lewat penggabungan model secara evolusioner dan lini AI Scientist untuk riset otomatis, dan sejak lama berargumen bahwa kumpulan model yang terkoordinasi dapat melampaui sistem tunggal mana pun pada pekerjaan paling sulit dan jangka panjang.

Baca Selanjutnya: Mane City Mobile Hadir di iOS dan Android di 100+ Negara

Penafian dan Peringatan Risiko: Informasi yang diberikan dalam artikel ini hanya untuk tujuan edukasi dan informasi dan berdasarkan opini penulis. Ini tidak merupakan saran keuangan, investasi, hukum, atau pajak. Aset kripto sangat fluktuatif dan mengalami risiko tinggi, termasuk risiko kehilangan seluruh atau sebagian besar investasi Anda. Trading atau memegang aset kripto mungkin tidak cocok untuk semua investor. Pandangan yang dinyatakan dalam artikel ini adalah pandangan penulis saja dan tidak mewakili kebijakan resmi atau posisi Yellow, pendirinya, atau eksekutifnya. Selalu lakukan riset menyeluruh Anda sendiri (D.Y.O.R.) dan konsultasikan dengan profesional keuangan berlisensi sebelum membuat keputusan investasi apapun.
Sakana Fugu Mengorkestrasi Beberapa Model AI untuk Menyaingi Mythos Terbatas Anthropic | Yellow.com