Model terbaru OpenAI, GPT-5.5, dapat secara otonom merangkai serangan 32 langkah corporate network breach dan memecahkan teka-teki rekayasa-balik berdurasi 12 jam hanya dalam sekitar 10 menit.
Hasil Evaluasi Siber AISI
AI Security Institute U.K., sebuah badan riset di dalam Departemen Sains, Inovasi, dan Teknologi Britania Raya, published evaluasinya pada hari Kamis.
Para peneliti menemukan bahwa GPT-5.5 adalah model kedua yang sepenuhnya memecahkan "The Last Ones", sebuah simulasi multi-tahap yang dibangun bersama SpecterOps. Model ini completed rangkaian tersebut dalam dua dari sepuluh percobaan.
Model pertama yang lolos uji ini adalah Anthropic's Claude Mythos Preview, yang berhasil dalam tiga dari sepuluh percobaan. AISI memperkirakan seorang pakar manusia membutuhkan sekitar 20 jam untuk menyelesaikan kill chain yang sama di empat subnet dan sekitar 20 host.
Pada tugas level Pakar, GPT-5.5 scored tingkat kelulusan 71,4%, sedikit di atas Mythos Preview di 68,6% dan jauh melampaui GPT-5.4 di 52,4%.
Also Read: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
Risiko Jailbreak dan Respons Kebijakan
AISI menandai adanya jailbreak universal yang berhasil melewati pengaman model pada setiap kueri siber berbahaya yang diuji. Eksploit tersebut memerlukan enam jam red-teaming pakar untuk dikembangkan, dan sebuah masalah konfigurasi menghalangi verifikasi terhadap patch OpenAI.
Lembaga itu memperingatkan bahwa kemampuan siber ofensif kini tampaknya muncul sebagai produk sampingan dari peningkatan umum dalam penalaran dan otonomi.
Pada bulan April, tinjauan AISI terhadap Mythos Preview marked the first time any frontier model finished the corporate attack secara ujung ke ujung, sehingga memposisikan GPT-5.5 sebagai konfirmasi tren, bukan lompatan tunggal yang terisolasi.
Read Next: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





