Anthropic, Mythos, its vulnerability-hunting AI modeline kamu erişimi vermeyi planladığını, ancak henüz var olmayan güvenlik önlemlerini geliştirdikten sonra yapacağını söylüyor.
Öne Çıkan Noktalar:
- Anthropic, Mythos sınıfı modelleri, erişimi önce ABD ve müttefik hükümetlere genişlettikten sonra, yaygın biçimde kullanıma sunmayı planlıyor.
- Şirket, kendisi dahil hiçbir firmanın kötüye kullanımı durduracak kadar güçlü güvenlik önlemleri geliştiremediğini kabul ediyor.
- Mythos, aralarında 6.202 yüksek veya kritik kusur bulunan, 1.000 açık kaynaklı proje genelinde 23.000'den fazla sorunu işaretledi.
Anthropic Mythos'un Yayınlanması
Anthropic, sınırlı erişimli güvenlik programı Project Glasswing için yayımladığı bir güncellemede bu planı doğruladı ve ayrı bir rapor, zaman çizelgesinin belirsiz olduğuna dikkat çekti.
Şirket önce, programı genişletmek için ABD ve müttefik hükümetlerle çalışacağını söyledi. “Mythos sınıfı modellerin” daha geniş çaplı bir yayını ise yakın gelecekte gelecek.
Anthropic, risk konusunda açık konuştu. Belirttiğine göre hiçbir şirket, kendisi de dahil, modelin kötüye kullanılıp ağır zarara yol açmasını engelleyecek kadar güçlü güvenlik önlemleri kurabilmiş değil.
Buna rağmen şirket, benzer araçların hızla yayılacağını öngörüyor ve Mythos seviyesindeki modellerin altı ila 12 ay içinde geniş erişime ulaşmasını bekliyor.
Mythos, Nisan ayında ilk kez tanıtıldı. Anthropic, testlerde çalışır durumdaki açıkları oluşturma oranının yüzde 72,4 olduğunu, önceki bir Claude modelinde ise bunun neredeyse sıfır olduğunu söyledi.
Ayrıca Oku: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks
Mythos'un Açık Bulma Sonuçları
İlk çıkışından bu yana model, 1.000'den fazla açık kaynaklı projeyi taradı ve bunlarda 23.019 sorun ortaya çıkardı; bunların 6.202'si yüksek veya kritik önem derecesine sahipti.
Bulgulardan biri dikkat çekti. Mythos, milyarlarca cihaz tarafından kullanılan wolfSSL kriptografi kütüphanesinde, saldırganların sertifika taklit etmesine ve bankaları veya e‑posta sağlayıcılarını sahte biçimde taklit etmesine izin verebilecek bir kusur ortaya çıkardı. Bu açık daha sonra yamandı.
Raporlardaki bu patlama, onları düzeltmesi beklenen kişileri zorladı. Açık kaynaklı proje sorumluları, hacmin kendi kapasitelerini aştığını söyleyerek Anthropic'ten açıklamaları yavaşlatmasını istedi.
Araştırmacılar, daha derin bir dengesizlik görüyor. Anthropic, artık hataları bulmanın onları düzeltmekten çok daha kolay hale geldiğini savunuyor ve şirket, sorumluların biriken işleri önceliklendirmesine yardımcı olmak için Open Source Security Foundation'ın Alpha-Omega projesiyle iş ortaklığı kurdu.
Claude Mythos sistem kartı, uzun vadede yapay zekânın savunucular lehine avantaj yaratacağını öngörüyor; ancak Anthropic, şimdilik saldırganların üstün konumda olabileceğini kabul ediyor.
Mythos ilk kez duyurulduğunda, Anthropic modeli kamuya açmadı; yazılım açıklarını silaha dönüştürme kapasitesi nedeniyle, Apple, Microsoft ve Google dahil 50'den fazla kuruluşa ve yaklaşık 100 milyon dolarlık kullanım kredisine erişim verdi.
Sıradaki Haber: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High





