Yellow.com

Anthropic's Claude Mythos Preview dan OpenAI's GPT-5.5, dua model AI terdepan, menuntaskan tugas siber otonom dengan kecepatan yang melampaui prakiraan kemampuan yang ada, menurut para peneliti pada Rabu.

Model Frontier Melampaui Tren

Claude Mythos Preview dan GPT-5.5 outperformed tren pelipatan yang dilacak AI Security Institute Inggris sejak akhir 2024.

AISI sempat memperkirakan awal tahun ini bahwa cakrawala waktu untuk mencapai reliabilitas 80% di tugas siber berlipat kira-kira tiap lima bulan, turun dari delapan bulan pada November 2025. Checkpoint terbaru Mythos Preview solved "The Last Ones," serangan jaringan korporat simulasi 32 langkah, dalam 6 dari 10 percobaan, dan menyelesaikan "Cooling Tower" dalam 3 dari 10. GPT-5.5 menuntaskan "The Last Ones" dalam 3 dari 10 percobaan.

Ini adalah pertama kalinya ada model yang menyelesaikan kedua rentang AISI.

Also Read: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided

Peringatan Vulnpocalypse dari Palo Alto

Palo Alto Networks reported kesimpulan serupa melalui pengujiannya sendiri.

Perusahaan itu memindai lebih dari 130 produk selama sebulan terakhir dan menemukan 75 kerentanan yang valid, lebih dari tujuh kali jumlah bulanan biasanya, yang semuanya kini telah ditambal.

Lee Klarich, kepala teknologi perusahaan, mengatakan organisasi hanya punya jendela waktu yang sempit sebelum para penyerang memperoleh kapabilitas serupa.

Ia memperkirakan ada "jendela tiga sampai lima bulan yang sempit bagi organisasi untuk melampaui lawan."

AISI mengingatkan bahwa sampelnya masih kecil dan tugas tersulit memiliki data pembanding manusia yang terbatas. Meski begitu, lembaga itu menyatakan bahwa mengeluarkan satu model saja dari analisis hanya menggeser estimasi periode pelipatan kurang dari satu bulan. METR, organisasi nirlaba yang tracks AI pada tugas perangkat lunak, menghasilkan angka hampir sama sekitar empat bulan.

Kurva Kapabilitas Makin Terjal

Anthropic membatasi peluncuran awal Mythos bulan lalu pada kelompok terpilih termasuk Palo Alto Networks, CrowdStrike, Amazon, Apple dan JPMorgan.

OpenAI menyusul dengan model GPT-5.5-Cyber dan inisiatif siber Daybreak.

Laju perubahan meningkat tajam selama 18 bulan terakhir. AISI memadatkan proyeksi periode pelipatannya dari delapan bulan menjadi 4,7 bulan pada Februari 2026, lalu memadatkannya lagi setelah putaran terbaru ini. Angka yang dihitung ulang kini mendekati empat bulan, mencerminkan pembacaan METR pada tugas rekayasa perangkat lunak.

Alexey Bondarev

Alexey Bondarev adalah Kepala Konten di Yellow.com, dan telah meliput dunia kripto selama 10 tahun terakhir. Ia mengkhususkan diri pada artikel Riset dan Belajar yang mendalam, dengan fokus pada pelaporan analitis, konteks industri, serta kekuatan besar yang membentuk kripto, mulai dari era AI dan teknologi keamanan hingga inovasi fintech. Ia percaya bahwa segala sesuatu yang digital akan segera mengungguli segala sesuatu yang analog dan bekerja keras untuk mewujudkannya.

Bagaimana Claude Mythos dan GPT-5.5 Diam-Diam Mengubah Perhitungan Pertahanan Siber

Model Frontier Melampaui Tren

Peringatan Vulnpocalypse dari Palo Alto

Kurva Kapabilitas Makin Terjal

Alexey Bondarev