Checkpoint baru Anthropic's Claude Mythos Preview menjadi model AI pertama yang memecahkan kedua simulasi serangan siber pemerintah Inggris, memunculkan pertanyaan baru tentang peretasan otonom.
AISI Laporkan Terobosan Mythos
AI Security Institute Inggris melaporkan pada Rabu bahwa checkpoint Mythos terbaru menyelesaikan range serangan jaringan korporasi 32 langkah, "The Last Ones", dalam 6 dari 10 percobaan. Versi sebelumnya hanya berhasil 3 dari 10.
Model yang diperbarui itu juga menaklukkan "Cooling Tower", sebuah range sistem kontrol industri yang belum pernah berhasil diselesaikan model sebelumnya, dalam 3 dari 10 percobaan.
Model saingan OpenAI GPT-5.5 diuji dalam latihan yang sama. Model itu menyelesaikan "The Last Ones" dalam 3 dari 10 percobaan tetapi gagal menuntaskan "Cooling Tower".
AISI menjalankan range dengan batas komputasi 100 juta token per percobaan, dan lembaga itu mencatat bahwa kinerja terus meningkat di batas tersebut, mengisyaratkan bahwa anggaran lebih tinggi akan semakin mendorong tingkat keberhasilan.
Juga Baca: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok
Waktu Pelipatan Kian Memendek
AISI melacak kemajuan siber melalui tolok ukur horizon waktu, mengukur seberapa lama tugas otonom yang dapat diselesaikan model dengan keandalan 80%. Pada November 2025, lembaga itu memperkirakan waktu pelipatan 8 bulan. Pada Februari 2026, angka itu menyusut menjadi 4,7 bulan, dan Mythos maupun GPT-5.5 sejak itu telah melampaui tren yang lebih cepat tersebut.
Lembaga itu mengakui adanya ketidakpastian apakah hasil terbaru menandakan percepatan baru atau lompatan satu kali saja.
Lembaga riset nirlaba METR, yang melacak AI pada tugas perangkat lunak alih-alih cyber range, menghasilkan angka serupa sekitar 4,2 bulan. AISI mengatakan konvergensi ini memperkuat argumen bahwa tren tersebut mencerminkan peningkatan kemampuan nyata, bukan keanehan dari satu rangkaian evaluasi.
Institut itu menekankan bahwa range mereka tidak memiliki pembela aktif, sehingga hasil ini menunjukkan apa yang dapat dilakukan model terhadap jaringan yang lemah perlindungannya, bukan sistem perusahaan yang sudah diperkeras.
Mengapa Lonjakan Kapabilitas Penting
Checkpoint Mythos terbaru tidak hadir dengan rilis model baru. AISI menggunakan versi yang sama dengan yang dideploy Anthropic bulan lalu bersama Project Glasswing, program kemitraan keamanannya, setelah menerima build terbaru dari model yang sama.
"Lonjakan kemampuan yang signifikan tidak selalu memerlukan rilis model baru," tulis institut itu. Hal ini berlawanan dengan asumsi bahwa pihak pembela dapat mengatur ritme berdasarkan siklus peluncuran.
Anthropic memperkenalkan Mythos Preview pada 7 April, membingkai model tersebut sebagai titik balik bagi industri keamanan setelah model itu mengidentifikasi kerentanan zero-day di berbagai sistem operasi dan browser utama dalam pengujian internal. Perusahaan mengatakan pihaknya menahan rilis yang lebih luas karena kemampuan tersebut, dan evaluasi AISI pada April sebelumnya menandai Mythos sebagai lompatan jelas dibanding sistem frontier terdahulu.
Baca Selanjutnya: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO





