Anthropic Claude Mythos Preview became the first AI model to complete a full simulated corporate network attack, memecahkan 73% tugas keamanan siber tingkat ahli yang tidak dapat dipecahkan oleh sistem AI sebelumnya, menurut UK AI Security Institute (AISI).
Evaluasi Siber AISI
AISI, badan riset di dalam Departemen Sains, Inovasi dan Teknologi pemerintah Inggris, ran dua rangkaian uji pada model tersebut setelah Anthropic mengumumkannya pada 7 April.
Perusahaan memutuskan untuk tidak merilis Claude Mythos secara luas, dan sebagai gantinya granting akses terbatas kepada firma riset keamanan.
Dalam evaluasi capture-the-flag, Claude Mythos mencapai tingkat keberhasilan 73% pada tugas level ahli.
Tidak ada model yang pernah memecahkan salah satu tugas ini sebelum April 2025. AISI juga membangun simulasi serangan jaringan korporat 32 langkah bernama "The Last Ones", yang dirancang memakan waktu sekitar 20 jam bagi profesional manusia. Claude Mythos menyelesaikan simulasi penuh dalam 3 dari 10 percobaan dan rata-rata menuntaskan 22 dari 32 langkah, dibandingkan 16 untuk Claude Opus 4.6, model dengan performa terbaik berikutnya.
"Keberhasilan Mythos Preview pada satu cyber range menunjukkan bahwa model ini setidaknya mampu menyerang secara otonom sistem enterprise kecil yang lemah, kurang dipertahankan, dan rentan ketika akses ke jaringan telah diperoleh," kata AISI.
Also Read: Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns
Eksploit Zero-Day
Tim red internal Anthropic menemukan bahwa Claude Mythos dapat mendeteksi dan mengeksploitasi kerentanan zero-day di semua sistem operasi utama dan browser web terdepan ketika pengguna secara eksplisit memerintahkannya. Perusahaan mengatakan lebih dari 99% kerentanan yang ditemukan tetap belum ditambal.
"Kami terbatas dalam hal apa yang bisa kami laporkan di sini. Akan tidak bertanggung jawab jika kami mengungkapkan detail tentang kerentanan tersebut," kata Anthropic.
Kapabilitas model ini sudah reached ke lingkaran pembuat kebijakan.
Menurut Reuters, Menteri Keuangan AS Scott Bessent dan Ketua Federal Reserve Jerome Powell held pertemuan darurat dengan para CEO bank besar untuk membahas potensi risiko siber terkait model tersebut.
Respons Keamanan Anthropic
Anthropic meluncurkan Project Glasswing bersamaan dengan pengumuman model, menggambarkannya sebagai upaya untuk menggunakan Claude Mythos guna membantu mengamankan perangkat lunak kritis. Perusahaan membingkai inisiatif ini sebagai persiapan untuk era ketika tim keamanan harus tetap selangkah di depan penyerang yang didukung AI. AISI merekomendasikan agar organisasi memprioritaskan langkah-langkah keamanan siber dasar, termasuk patching rutin, kontrol akses yang ketat, penguatan konfigurasi, dan pencatatan (logging) yang komprehensif.
Pengumuman 7 April tersebut menyusul berbulan-bulan kekhawatiran yang meningkat terkait peran AI dalam keamanan siber. Model frontier sebelumnya menunjukkan kemampuan ofensif yang terbatas, tetapi tidak ada yang berhasil melampaui tolok ukur CTF level ahli atau menyelesaikan simulasi serangan multi-langkah sebelum Claude Mythos.






