Anthropic Akan Membuka Claude Mythos ke Publik Setelah Pengaman Siap, Mungkin dalam 12 Bulan

Anthropic mengatakan bermaksud memberi akses publik ke model Mythos, its vulnerability-hunting AI, tetapi hanya setelah membangun pengaman yang saat ini belum ada.

Poin Utama:

Anthropic berencana merilis model kelas Mythos secara luas setelah terlebih dahulu memperluas akses ke pemerintah AS dan sekutu.

Perusahaan mengakui belum ada pihak, termasuk dirinya sendiri, yang membangun pengaman cukup kuat untuk menghentikan penyalahgunaan.

Mythos telah menandai lebih dari 23.000 masalah di 1.000 proyek open-source, termasuk 6.202 cacat dengan tingkat keparahan tinggi atau kritis.

Rilis Anthropic Mythos

Anthropic mengonfirmasi rencana tersebut dalam pembaruan untuk Project Glasswing, program keamanan dengan akses terbatas, dan laporan terpisah menandai bahwa jadwalnya belum pasti.

Perusahaan mengatakan akan terlebih dahulu bekerja sama dengan pemerintah AS dan negara sekutu untuk memperluas program tersebut. Rilis yang lebih luas untuk "model kelas Mythos" akan menyusul dalam waktu dekat.

Anthropic berbicara terbuka soal risikonya. Perusahaan menyatakan bahwa belum ada perusahaan, termasuk Anthropic sendiri, yang membangun pengaman cukup kuat untuk mencegah model disalahgunakan dan menimbulkan kerugian berat.

Meski begitu, perusahaan memperkirakan alat serupa akan menyebar dengan cepat, memprediksi model setingkat Mythos akan tersedia luas dalam enam hingga 12 bulan.

Mythos diluncurkan pada April. Anthropic mengatakan model ini menghasilkan exploit yang berfungsi 72,4 persen kali dalam pengujian, dibanding hampir nol persen pada model Claude sebelumnya.

Juga Baca: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks

Temuan Kerentanan Mythos

Sejak peluncurannya, model ini telah memindai lebih dari 1.000 proyek open-source dan menemukan 23.019 masalah, di mana 6.202 di antaranya dinilai berkategori tinggi atau kritis.

Satu temuan sangat menonjol. Mythos menemukan cacat di pustaka kriptografi wolfSSL, yang digunakan miliaran perangkat, yang dapat memungkinkan penyerang memalsukan sertifikat dan menyamar sebagai bank atau penyedia email. Cacat ini kini sudah ditambal.

Banjir laporan tersebut membebani pihak yang bertugas memperbaikinya. Para pemelihara open-source meminta Anthropic memperlambat pengungkapan, dengan alasan volume laporan melampaui kapasitas mereka.

Para peneliti melihat ketimpangan yang lebih dalam. Anthropic berpendapat bahwa menemukan bug kini jauh lebih mudah daripada memperbaikinya, dan perusahaan bekerja sama dengan proyek Alpha-Omega dari Open Source Security Foundation untuk membantu para pemelihara memilah tumpukan backlog.

Kartu sistem Claude Mythos memprediksi AI pada akhirnya akan lebih menguntungkan pihak pembela, meski Anthropic mengakui untuk saat ini penyerang mungkin masih lebih diuntungkan.

Ketika Mythos pertama kali diungkap, Anthropic memberi akses ke lebih dari 50 organisasi, termasuk Apple, Microsoft, dan Google, bersamaan dengan kredit penggunaan sekitar $100 juta, sambil menahan model tersebut dari publik karena kemampuannya untuk mempersenjatai celah perangkat lunak.

Baca Berikutnya: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High