Anthropic's Claude Mythos Preview dan OpenAI's GPT-5.5, dua model AI terdepan, menuntaskan tugas siber otonom dengan kecepatan yang melampaui prakiraan kemampuan yang ada, menurut para peneliti pada Rabu.
Model Frontier Melampaui Tren
Claude Mythos Preview dan GPT-5.5 outperformed tren pelipatan yang dilacak AI Security Institute Inggris sejak akhir 2024.
AISI sempat memperkirakan awal tahun ini bahwa cakrawala waktu untuk mencapai reliabilitas 80% di tugas siber berlipat kira-kira tiap lima bulan, turun dari delapan bulan pada November 2025. Checkpoint terbaru Mythos Preview solved "The Last Ones," serangan jaringan korporat simulasi 32 langkah, dalam 6 dari 10 percobaan, dan menyelesaikan "Cooling Tower" dalam 3 dari 10. GPT-5.5 menuntaskan "The Last Ones" dalam 3 dari 10 percobaan.
Ini adalah pertama kalinya ada model yang menyelesaikan kedua rentang AISI.
Also Read: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided
Peringatan Vulnpocalypse dari Palo Alto
Palo Alto Networks reported kesimpulan serupa melalui pengujiannya sendiri.
Perusahaan itu memindai lebih dari 130 produk selama sebulan terakhir dan menemukan 75 kerentanan yang valid, lebih dari tujuh kali jumlah bulanan biasanya, yang semuanya kini telah ditambal.
Lee Klarich, kepala teknologi perusahaan, mengatakan organisasi hanya punya jendela waktu yang sempit sebelum para penyerang memperoleh kapabilitas serupa.
Ia memperkirakan ada "jendela tiga sampai lima bulan yang sempit bagi organisasi untuk melampaui lawan."
AISI mengingatkan bahwa sampelnya masih kecil dan tugas tersulit memiliki data pembanding manusia yang terbatas. Meski begitu, lembaga itu menyatakan bahwa mengeluarkan satu model saja dari analisis hanya menggeser estimasi periode pelipatan kurang dari satu bulan. METR, organisasi nirlaba yang tracks AI pada tugas perangkat lunak, menghasilkan angka hampir sama sekitar empat bulan.
Kurva Kapabilitas Makin Terjal
Anthropic membatasi peluncuran awal Mythos bulan lalu pada kelompok terpilih termasuk Palo Alto Networks, CrowdStrike, Amazon, Apple dan JPMorgan.
OpenAI menyusul dengan model GPT-5.5-Cyber dan inisiatif siber Daybreak.
Laju perubahan meningkat tajam selama 18 bulan terakhir. AISI memadatkan proyeksi periode pelipatannya dari delapan bulan menjadi 4,7 bulan pada Februari 2026, lalu memadatkannya lagi setelah putaran terbaru ini. Angka yang dihitung ulang kini mendekati empat bulan, mencerminkan pembacaan METR pada tugas rekayasa perangkat lunak.
Read Next: Coinbase Opens $100K USDC Loans Against Solana Token Holdings





