Model AI Mythos Anthropic memimpin dibanding sistem pesaing dalam menemukan kerentanan perangkat lunak, tetapi tolok ukur independen baru mengungkap penilaian yang lebih lemah dan biaya operasional yang tinggi.
Pratinjau Mythos Unggul dalam Audit Kode Sumber
Firma keamanan ofensif XBOW mengonfirmasi klaim utama tersebut. Perusahaan itu membentuk tim berisi 10 ahli untuk mengevaluasi model di berbagai tolok ukur, alur kerja, dan integrasi.
XBOW mengatakan Mythos Preview "merupakan lompatan signifikan dibanding semua model yang ada, terlepas dari penyedianya." Penguji menjalankan model itu terhadap aplikasi open-source beku dengan kerentanan yang sudah diketahui.
Mythos mengurangi false negative sebesar 42% dibanding Opus 4.6, dengan penurunan mencapai 55% setelah model mendapatkan akses ke kode sumber, sebagaimana dilaporkan oleh The Decoder. Model ini unggul dalam pengujian live-plus-source. Kinerjanya kurang andal ketika hanya diberi kode sumber.
Also Read: XRP ETFs Hit Record $1.39B But Token Loses 4th Spot To BNB
Pertanyaan Biaya Mengurangi Keunggulan Anthropic
Anthropic menyatakan Mythos Preview akan kira-kira 5 kali lebih mahal daripada model Opus, yang sudah termasuk opsi termahal di pasar. Premi tersebut mendorong XBOW untuk menguji apakah pesaing yang lebih murah bisa menandingi Mythos jika diberi waktu jalan lebih lama.
Jawabannya: bisa. Pada anggaran token tetap untuk penemuan kerentanan web, Mythos mengalahkan Opus 4.6 tetapi kalah dari GPT-5.5 OpenAI, yang oleh XBOW dicatat memiliki tingkat miss 10%. XBOW mencatat bahwa model tersebut "tidak terlalu tidak efisien" jika akurasi adalah tujuannya, tetapi bukan yang terbaik begitu normalisasi biaya diperhitungkan.
Firma itu kini merekomendasikan menjalankan campuran model alih-alih mengandalkan satu model saja.
Kinerja Mythos AI dalam Konteks
Mythos menunjukkan penilaian yang beragam, menolak false positive dengan lebih baik daripada pendahulunya namun kadang membuang temuan yang benar ketika bukti tidak memenuhi kriteria formalnya. Rekayasa balik dan analisis kode native termasuk di antara keahliannya yang paling tajam, dengan model mampu melakukan triase temuan dari sistem pesaing.
Anthropic pertama kali mengungkap Mythos pada awal April, membatasi akses untuk sekitar 50 mitra dan membingkai rilis tersebut sebagai lompatan besar dalam kapabilitas siber AI. UK AI Security Institute kemudian mengatakan baik Mythos maupun GPT-5.5 telah "jauh melampaui" proyeksi dipercepat mereka. Lembaga itu kini memperkirakan kapabilitas siber berlipat ganda setiap 4,7 bulan, turun dari angka delapan bulan yang ditetapkan pada November 2025.
Read Next: Hyperliquid Rejects Wall Street's Manipulation Claims As HYPE Drops 14%





