Claude Mythos AI Ungguli Pesaing dalam Audit Kode, Kalah karena Harga 5X Lebih Mahal

Claude Mythos AI Ungguli Pesaing dalam Audit Kode, Kalah karena Harga 5X Lebih Mahal

Model AI Mythos Anthropic memimpin dibanding sistem pesaing dalam menemukan kerentanan perangkat lunak, tetapi tolok ukur independen baru mengungkap penilaian yang lebih lemah dan biaya operasional yang tinggi.

Pratinjau Mythos Unggul dalam Audit Kode Sumber

Firma keamanan ofensif XBOW mengonfirmasi klaim utama tersebut. Perusahaan itu membentuk tim berisi 10 ahli untuk mengevaluasi model di berbagai tolok ukur, alur kerja, dan integrasi.

XBOW mengatakan Mythos Preview "merupakan lompatan signifikan dibanding semua model yang ada, terlepas dari penyedianya." Penguji menjalankan model itu terhadap aplikasi open-source beku dengan kerentanan yang sudah diketahui.

Mythos mengurangi false negative sebesar 42% dibanding Opus 4.6, dengan penurunan mencapai 55% setelah model mendapatkan akses ke kode sumber, sebagaimana dilaporkan oleh The Decoder. Model ini unggul dalam pengujian live-plus-source. Kinerjanya kurang andal ketika hanya diberi kode sumber.

Also Read: XRP ETFs Hit Record $1.39B But Token Loses 4th Spot To BNB

Pertanyaan Biaya Mengurangi Keunggulan Anthropic

Anthropic menyatakan Mythos Preview akan kira-kira 5 kali lebih mahal daripada model Opus, yang sudah termasuk opsi termahal di pasar. Premi tersebut mendorong XBOW untuk menguji apakah pesaing yang lebih murah bisa menandingi Mythos jika diberi waktu jalan lebih lama.

Jawabannya: bisa. Pada anggaran token tetap untuk penemuan kerentanan web, Mythos mengalahkan Opus 4.6 tetapi kalah dari GPT-5.5 OpenAI, yang oleh XBOW dicatat memiliki tingkat miss 10%. XBOW mencatat bahwa model tersebut "tidak terlalu tidak efisien" jika akurasi adalah tujuannya, tetapi bukan yang terbaik begitu normalisasi biaya diperhitungkan.

Firma itu kini merekomendasikan menjalankan campuran model alih-alih mengandalkan satu model saja.

Kinerja Mythos AI dalam Konteks

Mythos menunjukkan penilaian yang beragam, menolak false positive dengan lebih baik daripada pendahulunya namun kadang membuang temuan yang benar ketika bukti tidak memenuhi kriteria formalnya. Rekayasa balik dan analisis kode native termasuk di antara keahliannya yang paling tajam, dengan model mampu melakukan triase temuan dari sistem pesaing.

Anthropic pertama kali mengungkap Mythos pada awal April, membatasi akses untuk sekitar 50 mitra dan membingkai rilis tersebut sebagai lompatan besar dalam kapabilitas siber AI. UK AI Security Institute kemudian mengatakan baik Mythos maupun GPT-5.5 telah "jauh melampaui" proyeksi dipercepat mereka. Lembaga itu kini memperkirakan kapabilitas siber berlipat ganda setiap 4,7 bulan, turun dari angka delapan bulan yang ditetapkan pada November 2025.

Read Next: Hyperliquid Rejects Wall Street's Manipulation Claims As HYPE Drops 14%

Penafian dan Peringatan Risiko: Informasi yang diberikan dalam artikel ini hanya untuk tujuan edukasi dan informasi dan berdasarkan opini penulis. Ini tidak merupakan saran keuangan, investasi, hukum, atau pajak. Aset kripto sangat fluktuatif dan mengalami risiko tinggi, termasuk risiko kehilangan seluruh atau sebagian besar investasi Anda. Trading atau memegang aset kripto mungkin tidak cocok untuk semua investor. Pandangan yang dinyatakan dalam artikel ini adalah pandangan penulis saja dan tidak mewakili kebijakan resmi atau posisi Yellow, pendirinya, atau eksekutifnya. Selalu lakukan riset menyeluruh Anda sendiri (D.Y.O.R.) dan konsultasikan dengan profesional keuangan berlisensi sebelum membuat keputusan investasi apapun.
Claude Mythos AI Ungguli Pesaing dalam Audit Kode, Kalah karena Harga 5X Lebih Mahal | Yellow.com