Claude Fable 5 Kodlama Düşüşü Model Çürümesi Değil, Yönlendirici Sorununu Ortaya Koyuyor

Claude Fable 5 Kodlama Düşüşü Model Çürümesi Değil, Yönlendirici Sorununu Ortaya Koyuyor

Claude Fable 5 1 Temmuz’da geri döndü ve kullanıcı şikayetleri sertti; ancak kıyas verileri, zayıflamış bir modelden çok daha sıkı bir Anthropic yönlendiricisine işaret ediyor.

Öne Çıkan Noktalar:

  • BridgeBench, hata ayıklama görevlerinin çoğu modelden uzak yönlendirildikten sonra Fable 5’in kodlama puanlarında çöküş bildirdi.
  • Arena.AI, belge ve uzman metni kategorilerinde artışla birlikte, çoğunlukla istikrarlı kör insan-tercihi sonuçları buldu.
  • Geliştiriciler, rutin hata ayıklama istemlerinin yeni sınıflandırıcıyı tetikleyebilmesi nedeniyle en net bozulmayı yaşıyor.

Fable 5 Yönlendirmesi

Claude Fable 5, yeniden devreye alınmasının ardından 1 Temmuz’da tekrar çevrimiçi oldu ve X üzerindeki kullanıcılar onu kısa sürede bozuk, “nerf’lenmiş” veya eskisinden daha az yetenekli olarak tanımladı. Bu görüş için en güçlü kanıt, kıyas paketini yeniden çalıştıran BridgeMind’dan geldi.

Sonuçlar sert görünüyordu. Hata ayıklama 86,2’den 25,9’a düştü, yeniden düzenleme 73,6’dan 38,4’e indi ve halüsinasyona direnç 75,9’dan 61,7’ye geriledi.

Ancak bu sayılar, model düzeyinde temiz bir çöküşü göstermiyor; çünkü BridgeBench, 12 TypeScript hata ayıklama görevinin yalnızca üçünün gerçekten Fable 5’e ulaştığını söyledi. Diğer dokuzu, Anthropic’in yeni güvenlik sınıflandırıcısı tarafından yakalanarak Claude Opus 4.8’e gönderildi ve değerlendirilen model yanıt vermediği için her geri dönüş sıfır puan aldı.

Ayrıca Oku: Strategy’nin 491 BTC Gizemi Saylor’un Satış Politikası Tartışmasını Yeniden Alevlendiriyor

Anthropic Sınıflandırıcısı

Arena.AI, metin, görsel, belge, kod ve ajan görevleri dahil daha geniş bir istem karmasında kör insan tercihlerini ölçtüğü için farklı bir sonuca ulaştı. Erken veriler, Fable 5’in haziran sürümüne karşı çoğunlukla istikrarlı kaldığını gösterdi.

Ön uç kodu 1650’den 1623 Elo’ya geriledi; Arena, oylar birikmeye devam ederken bunun hâlâ güven aralığı içinde kaldığını belirtti. Belge performansı 34 puan yükseldi, uzman metni 25 puan kazandı ve yaratıcı yazım 9 puan arttı.

Bu ayrışma, istemler modele ulaştığında Fable 5’in hâlâ Fable 5 gibi davrandığını gösteriyor. Sorun, güvenlik ile ilişkili kodlama çalışmalarının, özellikle de istemler vulnerability, exploit, hook veya fix gibi terimler içerdiğinde, model yanıt vermeden önce saptırılabilmesi.

Anthropic, yeni sınıflandırıcıların sıradan kodlama ve hata ayıklama işlerinde yanlış pozitifler üreteceğini kabul etti. Şirket, sistemi zaman içinde iyileştireceğini söyledi ancak bir hedef tarih vermedi.

Mevcut kurulum, Amazon araştırmacılarının Fable 5’i yazılım açıklarını tanımlamaya ve göstermeye zorlayan bir “jailbreak” bildirmesinin ardından ortaya çıkan daha geniş bir güvenlik anlaşmazlığını takip ediyor. Anthropic’in cevabı, şimdi tasarlandığı tehlikeli istemlerden fazlasını engelliyor gibi görünen muhafazakâr bir sınıflandırıcı oldu.

Sıradaki Haber: Trump 1,4 Milyar Dolarlık Kripto Gelirinden Haberi Olmadığını Söyledi

Feragatname ve Risk Uyarısı: Bu makalede sağlanan bilgiler yalnızca eğitici ve bilgilendirici amaçlıdır ve yazarın görüşüne dayanmaktadır. Mali, yatırım, hukuki veya vergi tavsiyesi teşkil etmez. Kripto para varlıkları son derece değişkendir ve yatırımınızın tamamını veya önemli bir kısmını kaybetme riski dahil olmak üzere yüksek riske tabidir. Kripto varlık ticareti veya tutma tüm yatırımcılar için uygun olmayabilir. Bu makalede ifade edilen görüşler yalnızca yazara aittir ve Yellow, kurucuları veya yöneticilerinin resmi politikasını veya pozisyonunu temsil etmez. Her zaman kendi kapsamlı araştırmanızı yapın (D.Y.O.R.) ve herhangi bir yatırım kararı vermeden önce lisanslı bir finansal uzmanla görüşün.
Claude Fable 5 Kodlama Düşüşü Model Çürümesi Değil, Yönlendirici Sorununu Ortaya Koyuyor | Yellow.com