Anthropic mengatakan mereka berniat memberi akses publik ke Mythos, its vulnerability-hunting AI model, tetapi hanya setelah membangun pengaman yang saat ini belum ada.
Poin Utama:
- Anthropic berencana merilis model kelas Mythos secara luas setelah terlebih dahulu memperluas akses ke pemerintah AS dan sekutu.
- Perusahaan mengakui tidak ada pihak, termasuk dirinya sendiri, yang telah membangun pengaman cukup kuat untuk menghentikan penyalahgunaan.
- Mythos telah menandai lebih dari 23.000 masalah di 1.000 proyek open-source, termasuk 6.202 cacat dengan tingkat keparahan tinggi atau kritis.
Rilis Anthropic Mythos
Anthropic mengonfirmasi rencana tersebut dalam pembaruan Project Glasswing, program keamanan akses terbatas, dan laporan terpisah menandai garis waktunya sebagai belum pasti.
Perusahaan mengatakan akan terlebih dahulu bekerja dengan pemerintah AS dan negara sekutu untuk memperluas program tersebut. Rilis yang lebih luas dari "model kelas Mythos" akan menyusul dalam waktu dekat.
Anthropic berbicara terus terang soal risikonya. Mereka menyatakan bahwa tidak ada perusahaan, termasuk dirinya sendiri, yang telah membangun pengaman cukup kuat untuk mencegah model disalahgunakan dan menyebabkan dampak parah.
Meski begitu, perusahaan memperkirakan alat serupa akan menyebar dengan cepat, memprediksi model selevel Mythos akan tersedia luas dalam enam hingga 12 bulan.
Mythos diluncurkan pada bulan April. Anthropic mengatakan model ini menghasilkan exploit yang berfungsi 72,4 persen dari waktu dalam pengujian, dibanding hampir nol persen pada model Claude sebelumnya.
Juga Baca: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks
Temuan Kerentanan Mythos
Sejak diluncurkan, model ini telah memindai lebih dari 1.000 proyek open-source dan mengungkap 23.019 masalah, di mana 6.202 dinilai berkategori tinggi atau kritis.
Satu temuan sangat menonjol. Mythos menemukan cacat di pustaka kriptografi wolfSSL, yang digunakan miliaran perangkat, yang berpotensi memungkinkan penyerang memalsukan sertifikat dan menyamar sebagai bank atau penyedia email. Cacat tersebut kini telah ditambal.
Banjir laporan ini membebani pihak yang seharusnya memperbaiki. Para pengelola open-source meminta Anthropic memperlambat pengungkapan, menyatakan volume laporan melampaui kapasitas mereka.
Para peneliti melihat ketimpangan yang lebih dalam. Anthropic berpendapat bahwa menemukan bug kini jauh lebih mudah dibanding memperbaikinya, dan perusahaan tersebut bekerja sama dengan proyek Alpha-Omega milik Open Source Security Foundation untuk membantu pengelola memilah tumpukan laporan.
System card Claude Mythos memprediksi bahwa AI pada akhirnya akan lebih menguntungkan pihak pembela, meski Anthropic mengakui untuk saat ini pihak penyerang mungkin masih unggul.
Ketika Mythos pertama kali diungkap, Anthropic memberikan akses ke lebih dari 50 organisasi, termasuk Apple, Microsoft, dan Google, bersama kredit penggunaan sekitar 100 juta dolar AS, sambil menahan model dari publik karena kemampuannya mempersenjatai celah perangkat lunak.
Baca Selanjutnya: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High





