Anthropic’s Fable 5, 12 Haziran’da gelen bir ABD ihracat kontrol direktifiyle çevrimdışı edilmeden önce, büyük yapay zeka kıyaslamalarında kısa süreliğine OpenAI’s GPT 5.5'i geride bıraktı.
Öne Çıkan Noktalar:
- Fable 5, Chatbot Arena, SWE-Bench Pro ve büyük kodlama testlerinde GPT 5.5’in önüne geçti.
- Model, ABD hükümeti Anthropic’ten devre dışı bırakmasını isteyene kadar yalnızca üç gün boyunca erişilebilir oldu.
- GPT 5.5, Fable 5’i geçtiği için değil, Fable 5 devre dışı bırakıldığı için artık varsayılan olarak en güçlü kullanılabilir model.
Fable 5’in Kapatılması
Fable 5, 9 Haziran’daki lansmanının ardından, ABD hükümeti üç gün sonra müdahale etmeden önce, GPT 5.5’i başlıca kıyaslamalarda geride bırakarak en yetenekli halka açık yapay zeka modeli haline geldi.
Model, Chatbot Arena’da birinci sırada yer alırken GPT 5.5 dördüncü oldu. SWE-Bench Pro’da Fable 5, gerçek yazılım mühendisliği görevlerinde GPT 5.5’in yüzde 58,6’lık skoruna karşılık yüzde 80,3’e ulaştı; bu da neredeyse 22 puanlık bir fark anlamına geliyor.
Liderlik kodlama testlerinde de netti. Fable 5, Code Arena’da 1.665 puan alarak GPT 5.5’in 98 Elo puan üzerine çıktı ve GPT 5.5’in yüzde 5,7’de kaldığı FrontierCode Diamond testinde yüzde 29,3’e ulaştı.
GPT 5.5’in pratik konumlandırmada daha dar bir avantajı vardı. Maliyetler karşılaştırıldığında GPT 5.5, milyon giriş token’ı başına 5 dolar ve milyon çıkış token’ı başına 30 dolar iken, Fable 5 için bu rakamlar sırasıyla 10 ve 50 dolardı; bu da OpenAI modelini yüksek hacimli kullanım için daha ucuz hale getiriyordu.
Fable 5 ayrıca bir milyon token’lık bağlam penceresi ve 128.000 çıkış token’ı sunuyordu. Anthropic, modeli 22 Haziran’a kadar ek ücret olmadan Pro, Max, Team ve Enterprise abonelerine açmıştı; emir, bu süreyi erken bitirdi.
Ayrıca Oku: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta
GPT 5.5 Tahtta
Kapatma, Fable 5 ve daha geniş Mythos 5 model ailesinde bir jailbreak açığına atıfta bulunan 12 Haziran tarihli ihracat kontrol direktifinin ardından geldi. Anthropic, bulgulara itiraz ederek sorunun küçük, zaten bilinen ve özel baypas yöntemleri olmadan GPT 5.5’te de üretilebildiğini söyledi.
Ortaya çıkan tablo, yapay zeka pazarı için alışılmadık bir durum.
Geliştiriciler, kıyaslama tablolarında önde olan modele erişimi kaybederken, GPT 5.5, en yakın rakibi kaldırıldığı için en iyi erişilebilir seçenek haline geldi.
Bu ayrım en çok kodlama iş akışları için önemli. SWE-Bench Pro’da 22 puanlık fark, gerçek kod tabanı sorunlarının beşte dördünü çözebilen bir modelle, beşte üçüne daha yakınını halledebilen bir model arasındaki fark anlamına geliyor.
Fable 5’in kısa ömrü, sınırın ne kadar hızlı hareket edebileceğini de gösterdi. GPT 5.5, şirket içi kod adı “Spud” ile Nisan sonlarında piyasaya sürüldü, ancak liderliği yalnızca Anthropic, Haziran ayında daha güçlü bir Mythos sınıfı sistemi halka açana kadar sürdü.
Sıradaki Haber: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says





