Anthropic's Claude Mythos Preview ve OpenAI's GPT-5.5, iki sınır yapay zeka modeli, araştırmacıların Çarşamba günü bildirdiğine göre, mevcut yetenek tahminlerini geride bırakan bir hızda otonom siber görevleri tamamladı.
Sınır Modelleri Eğrinin Önüne Geçiyor
Claude Mythos Preview ve GPT-5.5, Birleşik Krallık'ın AI Security Institute'nin 2024 sonlarından beri izlediği ikiye katlanma eğilimini geride bıraktı.
AISI, bu yılın başlarında, siber görevlerde %80 güvenilirlik ufkunun, 2025 Kasım'ında sekiz aydan yaklaşık beş ayda bir ikiye katlanma hızına düştüğünü tahmin etmişti. Mythos Preview'in daha yeni bir kontrol noktası, "The Last Ones" adlı 32 adımlı simüle kurumsal ağ saldırısını 10 denemenin 6'sında çözdü ve "Cooling Tower" senaryosunu 10 denemenin 3'ünde tamamladı. GPT-5.5, "The Last Ones"ı 10 denemenin 3'ünde başarıyla geçti.
Bu, herhangi bir modelin ilk kez her iki AISI görev aralığını da tamamlamasıydı.
Ayrıca Oku: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided
Palo Alto'dan "Vulnpocalypse" Uyarısı
Palo Alto Networks, kendi testleriyle benzer sonuçlar bildirdi.
Şirket, geçen ay boyunca 130'dan fazla ürünü taradı ve normal aylık sayısının yedi katından fazla olan 75 gerçek güvenlik açığı ortaya çıkardı; bunların tamamı şimdi yamalandı.
Şirketin teknoloji şefi Lee Klarich, kurumların, rakiplerin benzer yetenekler kazanmasından önce dar bir zaman penceresine sahip olduğunu söyledi.
Kuruluşlar için "rakibin önüne geçmek adına üç ila beş aylık dar bir pencere" öngördüğünü belirtti.
AISI, örnekleminin hâlâ küçük olduğunu ve en zor görevler için sınırlı insan karşılaştırma verisi bulunduğunu vurguladı. Buna rağmen enstitü, analizden tek bir modeli çıkarmanın bile ikiye katlanma tahminini bir aydan daha az oynattığını belirtti. Yazılım görevlerinde yapay zekayı izleyen kâr amacı gütmeyen METR, yaklaşık dört aylık neredeyse aynı bir rakama ulaştı.
Yetenek Eğrisi Dikleşiyor
Anthropic, Mythos'un erken sürümünün geçen ayki ilk dağıtımını Palo Alto Networks, CrowdStrike, Amazon, Apple ve JPMorgan dâhil seçili bir grupla sınırladı.
OpenAI, GPT-5.5-Cyber modelini ve Daybreak siber girişimini bunu takiben duyurdu.
Son 18 ayda değişim hızı keskin bir şekilde arttı. AISI, öngördüğü ikiye katlanma süresini 2026 Şubat'ında sekiz aydan 4,7 aya düşürdü ve bu son turdan sonra süreyi yeniden kısalttı. Yeniden hesaplanan rakam şimdi, METR'nin yazılım mühendisliği görevlerine dair okumasını yansıtarak, dört aya daha yakın duruyor.
Sıradaki Haber: Coinbase Opens $100K USDC Loans Against Solana Token Holdings





