Rakip Yapay Zeka Araştırmacılarının Sonuçlarını Zayıflatan Claude Fable 5 Kuralını Anthropic Geri Çekti

Rakip Yapay Zeka Araştırmacılarının Sonuçlarını Zayıflatan Claude Fable 5 Kuralını Anthropic Geri Çekti

Anthropic, rakip yapay zekâ sistemleri inşa eden araştırmacılar için sonuçları gizlice düşüren ve trafiğin yalnızca %0,03’üne dokunduğunu söylediği bir kısıtlamayı getiren Claude Fable 5 politikasını geri alıyor.

Önemli Noktalar:

  • Anthropic, ileri seviye yapay zekâ araştırmaları için yanıtları sessizce zayıflatan Fable 5 politikasını geri çekti.
  • Açıklanmayan bu sınır, 319 sayfalık bir sistem kartının içine gizlenmişti ve kullanıcılara hiçbir bildirim göstermiyordu.
  • İşaretlenen istekler artık her seferinde gerekçesi gösterilerek açıkça Claude Opus 4.8’e yönlendirilecek.

Claude Fable 5 Kısıtlamaları Geri Alındı

Şirket, değişikliği ilk olarak günler süren ve çevrimiçi araştırmacılar, geliştiriciler ve politika analistleri arasındaki artan öfkenin ardından geri adımı haberleştiren Wired’a bu hafta doğruladı. Geri çekilme, salı günü piyasaya sürülen, yazılım açıklarını bulma konusunda daha keskin becerisi nedeniyle laboratuvarın uzun süre geri tuttuğu Anthropic’in halka açık ilk Mythos sınıfı modeli Fable 5’in lansmanının hemen ardından geldi. Yayınlandıktan birkaç saat sonra kullanıcılar, modelin gelişmiş yapay zekâ çalışmalarının dar bir alanında yanıtlarını sessizce yönlendirdiğini veya zayıflattığını fark etti.

Bu görevler, 319 sayfalık bir sistem kartında gömülü bir paragraf üzerinden işaretlenen, rakip modelleri eğitmeyi, yapay zekâ kodunu hata ayıklamayı ve sinir ağlarını ayarlamayı kapsıyordu. Fable 5, bunları doğrudan engellemek yerine, yanıtlarını sessizce köreltmek için gizli istem düzenlemeleri ve yönlendirme vektörlerine yaslandı; Anthropic bu kısıtlamanın trafiğin sadece %0,03’ünü etkilediğini belirtti.

Düzeltme, güvenlik önlemini korurken en çok tepki çeken gizliliği kaldırıyor. Anthropic, görünür kuralların test edilmesinin ve aşılmasının daha kolay olduğu gerekçesiyle gizli sürümü savunmuştu. Artık işaretlenen istemler, siber ve biyoloji taleplerinde kullanılanla aynı yol üzerinden, açıkça Claude Opus 4.8’e yönlendirilecek ve API yakında her reddin gerekçesini net biçimde döndürecek.

Ayrıca Oku: Cardano Whales Roar Back To Life As ADA Tests Multi-Year Lows

Araştırmacılar Gizli Sabotajı Reddediyor

Eleştiriler, sınırların kendisinden çok gizliliğin kendisine yöneldi. Anthropic, kısıtlamayı Claude’u rakip sistemler kurmak için kullanmayı yasaklayan hükümlerin bir uzantısı olarak çerçevelemiş, sessiz uygulamanın en kötü ihlalcilerin ilerleme kaydetmesini engellediğini söylemişti. American Innovation Vakfı’nda kıdemli araştırmacı olan Dean Ball, bu taktiği “gizli sabotaj” olarak nitelendirdi ve bunun, güvenlik çabalarının bazı bölümlerinin yalnızca ticari çıkarları koruduğu görüşünü güçlendirdiğini söyledi.

Bu ifade hızla yayıldı.

Başkaları, kuralın içine yerleştirilen asimetriye odaklandı. Anthropic, Fable 5’i kendi personeli için tam güçte tutarken dış ekipleri kısıtladı; bu ayrım, hem açık kaynak savunucularını hem de uzun süredir güvenlik alanında çalışan müttefiklerini kızdırdı. Fast AI’dan Jeremy Howard, laboratuvarın rakiplerini baltalamaya yemin etmiş gibi göründüğünü söylerken, AI2’den Nathan Lambert, gizli düşürmeyi dehşet verici ve bilime aykırı olarak nitelendirdi.

Tartışma, Anthropic’in bir zamanlar hiç göndermeyecek kadar riskli gördüğü Fable 5 için zorlu bir ilk haftayı taçlandırdı. Şirket, yaklaşık bir hafta önce gizli halka arz başvurusu yaptıktan sonra, bu hafta sistemi kamu kullanımına açtı; daha sıkı ve daha iyi açıklanmış koruma önlemlerinin, modelin güvenlik açıklarını bulma becerisini güvenli ellerde tutmaya yeteceğine bahse girdi.

Sıradaki Haber: OpenAI Targets Anthropic With Price Cuts Ahead Of A Pivotal IPO

Feragatname ve Risk Uyarısı: Bu makalede sağlanan bilgiler yalnızca eğitici ve bilgilendirici amaçlıdır ve yazarın görüşüne dayanmaktadır. Mali, yatırım, hukuki veya vergi tavsiyesi teşkil etmez. Kripto para varlıkları son derece değişkendir ve yatırımınızın tamamını veya önemli bir kısmını kaybetme riski dahil olmak üzere yüksek riske tabidir. Kripto varlık ticareti veya tutma tüm yatırımcılar için uygun olmayabilir. Bu makalede ifade edilen görüşler yalnızca yazara aittir ve Yellow, kurucuları veya yöneticilerinin resmi politikasını veya pozisyonunu temsil etmez. Her zaman kendi kapsamlı araştırmanızı yapın (D.Y.O.R.) ve herhangi bir yatırım kararı vermeden önce lisanslı bir finansal uzmanla görüşün.
Rakip Yapay Zeka Araştırmacılarının Sonuçlarını Zayıflatan Claude Fable 5 Kuralını Anthropic Geri Çekti | Yellow.com