Claude Mythos, Simüle Kurumsal Ağ Saldırısını Tamamlayan İlk Yapay Zekâ Oldu

Anthropic'in Claude Mythos Preview became the first AI model to complete a full simulated corporate network attack modeli, UK AI Security Institute (AISI) verilerine göre, daha önce hiçbir yapay zekâ sisteminin başaramadığı uzman seviyesindeki siber güvenlik görevlerinin %73'ünü çözerek bir ilke imza attı.

AISI Siber Değerlendirmesi

Birleşik Krallık hükümetinin Bilim, İnovasyon ve Teknoloji Bakanlığı bünyesindeki araştırma kurumu AISI, Anthropic bu modeli 7 Nisan'da duyurduktan sonra, model üzerinde iki dizi test ran gerçekleştirdi.

Şirket, Claude Mythos'u geniş çapta piyasaya sürmek yerine, modele yalnızca belirli güvenlik araştırma şirketlerine sınırlı erişim granting vermeyi tercih etti.

Capture-the-flag değerlendirmelerinde Claude Mythos, uzman düzeyindeki görevlerde %73 başarı oranına ulaştı.

Nisan 2025'e kadar hiçbir model bu görevlerin hiçbirini çözememişti. AISI ayrıca insan uzmanların yaklaşık 20 saatini alması için tasarlanmış, "The Last Ones" adlı 32 adımlık bir kurumsal ağ saldırı simülasyonu geliştirdi. Claude Mythos bu simülasyonu 10 denemenin 3'ünde tamamen tamamladı ve ortalama 32 adımdan 22'sini gerçekleştirdi; bir sonraki en iyi model olan Claude Opus 4.6 ise ortalama 16 adımda kaldı.

AISI, "Mythos Preview'un bir siber senaryodaki başarısı, en azından, ağa erişimin sağlandığı küçük, zayıf korunmuş ve savunmasız kurumsal sistemlere otonom olarak saldırabilecek kapasitede olduğunu gösteriyor," açıklamasında bulundu.

Ayrıca Oku: Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns

Sıfır-Gün Açıkları

Anthropic'in kendi red team ekibi, kullanıcı açıkça talimat verdiğinde Claude Mythos'un tüm büyük işletim sistemlerinde ve önde gelen web tarayıcılarında sıfır-gün güvenlik açıklarını tespit edip kötüye kullanabildiğini ortaya koydu. Şirket, modelin keşfettiği açıkların %99'dan fazlasının hâlâ yamalanmamış olduğunu belirtti.

"Burada paylaşabileceklerimiz sınırlı. Bunlara dair ayrıntıları açıklamamız sorumsuzluk olurdu," diyor Anthropic.

Modelin yetenekleri çoktan politika çevrelerine reached yansımış durumda.

Reuters'a göre, ABD Hazine Bakanı Scott Bessent ve Federal Reserve Başkanı Jerome Powell, modelle bağlantılı olası siber riskleri tartışmak üzere büyük banka CEO'larıyla acil bir toplantı held gerçekleştirdi.

Anthropic'in Güvenlik Yanıtı

Anthropic, modelin duyurusuyla birlikte, Claude Mythos'un kritik yazılımların güvenliğini sağlamaya yardımcı olması için kullanılmasını hedefleyen Project Glasswing girişimini başlattı. Şirket, bu girişimi, güvenlik ekiplerinin yapay zekâ destekli saldırganlardan daima bir adım önde olması gereken bir döneme hazırlık çabası olarak tanımladı. AISI, kuruluşlara düzenli yamalama, sıkı erişim kontrolleri, yapılandırma sertleştirmesi ve kapsamlı loglama dâhil olmak üzere temel siber güvenlik önlemlerine öncelik vermelerini tavsiye etti.

7 Nisan'daki duyuru, yapay zekânın siber güvenlikteki rolüne ilişkin artan endişelerin aylarca tırmanmasının ardından geldi. Önceki sınır düzeyi modeller sınırlı saldırı kapasitesi göstermişti, ancak hiçbirisi Claude Mythos'tan önce uzman seviyesindeki CTF kıyaslamalarını geçememiş veya çok adımlı saldırı simülasyonlarını tamamlayamamıştı.

Sıradaki Haber: RaveDAO Just Exploded 1,194% In A Week — Here's The Real Story Behind The Crypto That Turns Raves Into Blockchain