Anthropic’s Fable 5 kısa süreliğine, 12 Haziran tarihli bir ABD ihracat kontrol direktifi modeli çevrimdışı etmeden önce, başlıca yapay zeka kıyaslamalarında OpenAI’s GPT 5.5 modelini geride bıraktı.
Öne Çıkan Noktalar:
- Fable 5, Arena, SWE-Bench Pro ve başlıca kodlama testlerinde GPT 5.5'in önündeydi.
- Model, ABD hükümeti Anthropic’ten onu devre dışı bırakmasını istemeden önce yalnızca üç gün boyunca erişilebilir durumdaydı.
- GPT 5.5 şu anda, Fable 5’i geçtiği için değil, kullanılabilir en güçlü model olduğu için varsayılan lider konumda.
Fable 5 Kapatıldı
Fable 5, 9 Haziran’daki lansmanının ardından, ABD hükümeti üç gün sonra müdahale edene kadar başlıca kıyaslamalarda GPT 5.5’i geçerek en yetenekli halka açık yapay zeka modeli haline geldi.
Model Arena’da birinci sırada yer alırken GPT 5.5 dördüncü oldu. SWE-Bench Pro’da Fable 5, GPT 5.5’in 58,6’lık skoruna karşılık 80,3 puan aldı; bu da gerçek yazılım mühendisliği görevlerinde neredeyse 22 puanlık bir fark anlamına geliyor.
Üstünlük, kodlama testlerinde de açıktı. Fable 5, Code Arena’da 1.665 puan alarak GPT 5.5’in 98 Elo puan önüne geçti ve GPT 5.5’in %5,7’de kaldığı FrontierCode Diamond’da %29,3’e ulaştı.
GPT 5.5’in pratik konumlandırmada daha dar da olsa bir avantajı vardı. Bir milyon giriş token’ı için 5 dolar, bir milyon çıkış token’ı için 30 dolar maliyete sahipken, Fable 5 için bu rakamlar sırasıyla 10 ve 50 dolardı; bu da OpenAI modelini yüksek hacimli kullanım için daha ucuz hale getiriyordu.
Fable 5 ayrıca bir milyon token’lık bağlam penceresi ve 128.000 çıkış token’ı sunuyordu. Anthropic, modeli 22 Haziran’a kadar ek ücret olmadan Pro, Max, Team ve Enterprise abonelerine açmıştı; emir bu pencereyi erken kapattı.
Bunu da Oku: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 Tahtta
Kapatma, Fable 5 ve daha geniş Mythos 5 model ailesinde bir jailbreak açığına atıfta bulunan 12 Haziran tarihli ihracat kontrol direktifinin ardından geldi. Anthropic bu tespiti tartışarak sorunun küçük, zaten bilinen ve özel atlatma yöntemleri olmadan GPT 5.5 üzerinde de üretilebilen bir durum olduğunu söyledi.
Ortaya çıkan tablo, yapay zeka piyasası için alışılmadık.
Geliştiriciler, kıyaslama tablolarının başında yer alan modele erişimi kaybederken, en yakın rakibi ortadan kaldırıldığı için GPT 5.5 eldeki en iyi seçenek haline geldi.
Bu ayrım en çok kodlama iş akışları için önem taşıyor. SWE-Bench Pro’da 22 puanlık fark, yaklaşık beş gerçek kod tabanı sorununun dördünü çözebilen bir modelle, beşte yaklaşık üçünü çözebilen bir model arasındaki fark anlamına geliyor.
Fable 5’in kısa ömrü, sınırın ne kadar hızlı hareket edebildiğini de gösterdi. GPT 5.5, dahili kod adı “Spud” ile Nisan ayı sonunda piyasaya çıktı ancak üstünlüğü, Anthropic haziranda daha güçlü bir Mythos sınıfı sisteme halka açık erişim açana kadar sürdü.
Sıradaki Yazı: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





