Anthropic’s Fable 5 untuk sementara mengungguli OpenAI’s GPT 5.5 di berbagai benchmark AI utama sebelum pada 12 Juni perintah kontrol ekspor AS mematikannya.
Key Points:
- Fable 5 memimpin atas GPT 5.5 di Arena, SWE-Bench Pro, dan berbagai tes pemrograman utama.
- Model ini hanya tersedia selama tiga hari sebelum pemerintah AS memerintahkan Anthropic untuk menonaktifkannya.
- GPT 5.5 kini menjadi model terkuat yang tersedia secara default, bukan karena mengalahkan Fable 5.
Fable 5 Dimatikan
Fable 5 became model AI publik paling canggih setelah diluncurkan pada 9 Juni, mengungguli GPT 5.5 di berbagai benchmark utama sebelum pemerintah AS turun tangan tiga hari kemudian.
Model ini menempati peringkat pertama di Arena, sementara GPT 5.5 berada di peringkat keempat. Di SWE-Bench Pro, Fable 5 meraih skor 80,3%, dibandingkan 58,6% untuk GPT 5.5, selisih hampir 22 poin pada tugas rekayasa perangkat lunak nyata.
Keunggulan itu juga jelas di tes pemrograman. Fable 5 mencetak 1.665 di Code Arena, 98 poin Elo di atas GPT 5.5, dan meraih 29,3% di FrontierCode Diamond, sementara GPT 5.5 hanya mencapai 5,7%.
GPT 5.5 memiliki satu keunggulan yang lebih sempit dalam posisi praktis. Biayanya $5 per satu juta token input dan $30 per satu juta token output, sedangkan Fable 5 berbiaya $10 dan $50, sehingga model OpenAI lebih murah untuk penggunaan volume tinggi.
Fable 5 juga menawarkan jendela konteks satu juta token dan 128.000 token output. Anthropic menyediakannya bagi pelanggan Pro, Max, Team, dan Enterprise tanpa biaya tambahan hingga 22 Juni, sebelum perintah tersebut mengakhiri masa itu lebih awal.
Also Read: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 Jadi Raja
Penutupan ini mengikuti perintah kontrol ekspor 12 Juni yang menyebut adanya kerentanan jailbreak di Fable 5 dan keluarga model Mythos 5 yang lebih luas. Anthropic membantah temuan itu, dengan menyatakan masalahnya kecil, sudah diketahui, dan juga dapat dicapai pada GPT 5.5 tanpa metode bypass khusus.
Hasil ini tidak biasa bagi pasar AI.
Para pengembang kehilangan akses ke model yang memimpin tabel benchmark, sementara GPT 5.5 menjadi opsi terbaik yang tersedia karena pesaing terdekatnya dicabut.
Perbedaan itu paling penting bagi alur kerja pemrograman. Selisih 22 poin di SWE-Bench Pro berarti perbedaan antara model yang dapat menyelesaikan sekitar empat dari lima masalah basis kode nyata dan model yang hanya menangani sekitar tiga dari lima.
Masa singkat Fable 5 juga menunjukkan seberapa cepat frontier dapat bergerak. GPT 5.5 diluncurkan pada akhir April dengan nama internal “Spud,” tetapi keunggulannya hanya bertahan sampai Anthropic membuka akses publik ke sistem kelas Mythos yang lebih kuat pada bulan Juni.
Read Next: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





