OpenAI'nin en yeni modeli GPT-5.5, 32 adımlı bir kurumsal ağ ihlali zincirini otonom biçimde birleştirebiliyor ve 12 saatlik tersine mühendislik bulmacasını yaklaşık 10 dakikada çözebiliyor.
AISI Siber Değerlendirme Sonuçları
Birleşik Krallık Bilim, İnovasyon ve Teknoloji Bakanlığı bünyesindeki araştırma kurumu Birleşik Krallık Yapay Zeka Güvenliği Enstitüsü (AISI), perşembe günü değerlendirmesini yayınladı.
Araştırmacılar, GPT-5.5’in SpecterOps ile oluşturulan çok aşamalı bir simülasyon olan "The Last Ones"ı eksiksiz çözen ikinci model olduğunu belirledi. Model, zinciri 10 denemenin ikisinde tamamladı.
Testi ilk geçen model, 10 denemenin üçünü başarıyla tamamlayan Anthropic'in Claude Mythos Önizlemesi olmuştu. AISI, insan bir uzmanın dört alt ağ ve yaklaşık 20 host üzerinde aynı saldırı zincirini tamamlaması için yaklaşık 20 saate ihtiyaç duyacağını tahmin ediyor.
Uzman seviyesindeki görevlerde GPT-5.5, %52,4 başarı oranına sahip GPT-5.4’ü ve %68,6’da kalan Mythos Önizlemesi’ni geride bırakarak %71,4 başarı oranına ulaştı.
Ayrıca Oku: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
Jailbreak Riski ve Politika Tepkisi
AISI, test edilen tüm kötü amaçlı siber sorgularda modelin güvenlik önlemlerini aşan evrensel bir jailbreak açığı tespit etti. Bu açık, uzman kırmızı ekip çalışmasıyla altı saatte geliştirildi ve bir yapılandırma sorunu, OpenAI'nin yamalarının doğrulanmasını engelledi.
Kurum, saldırı amaçlı siber yeteneğin artık akıl yürütme ve otonomi alanlarındaki genel ilerlemenin yan ürünü olarak ortaya çıktığı uyarısında bulundu.
Nisan ayında AISI’nin Mythos Önizlemesi incelemesi, herhangi bir sınır modelinin kurumsal saldırı aralığını ilk kez uçtan uca tamamlaması olarak kayda geçmişti; bu da GPT-5.5’i tek seferlik bir sıçrama yerine bir eğilimin teyidi olarak konumlandırıyor.
Sıradaki Haber: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





