Anthropic, OpenAI, Google, dan Meta masing-masing menerbitkan pengungkapan prompt injection pada 2026, tetapi perbandingan yang diterbitkan VentureBeat pada 1 Juni menemukan tidak ada dua perusahaan yang mengukur metrik yang sama.
Ketidakkonsistenan makes hal ini menyulitkan tim keamanan perusahaan untuk membandingkan risiko antar model.
Apa yang Ditunjukkan Pengungkapan
Analisis VentureBeat mencakup agen peramban Anthropic, yang dibajak dalam 31% skenario uji sebelum pengaman keselamatan aktif. Tiga lab lainnya mengungkapkan kondisi uji yang berbeda, jenis serangan yang berbeda, dan definisi tingkat keberhasilan yang berbeda.
Anthropic mengukur tingkat pembajakan agen peramban. Lab lain berfokus pada injeksi tidak langsung dalam konteks pemanggilan alat atau tugas peringkasan dokumen. Tidak satu pun dari keempat laporan tersebut menggunakan kerangka kerja bersama atau kumpulan uji adversarial yang sama.
Pembeli perusahaan yang mengevaluasi agen AI untuk penggunaan produksi tidak memiliki dasar standar untuk perbandingan. Model yang menunjukkan tingkat injeksi rendah berdasarkan definisi satu lab dapat menghadapi paparan yang lebih tinggi di bawah desain pengujian lab lain.
Also Read: OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve
Latar Belakang
Prompt injection menjadi kategori ancaman yang diakui ketika agen AI beralih dari chatbot ke sistem otonom yang mampu melakukan tindakan nyata seperti mengirim email, mengeksekusi kode, dan memanggil API eksternal. Instruksi yang disuntikkan dapat mengarahkan ulang agen untuk melakukan tindakan di luar cakupan yang dimaksudkan.
Pada 2025, beberapa penerapan perusahaan mengalami insiden prompt injection yang melibatkan agen pemrosesan dokumen. Tidak ada yang mencapai skala pelanggaran besar, tetapi insiden tersebut memicu seruan untuk persyaratan pengungkapan yang terstandar. Belum ada badan regulasi yang mewajibkan format pelaporan umum untuk kerentanan agen AI.
Empat pengungkapan yang diterbitkan pada 2026 mewakili upaya transparansi sukarela dari lab-lab tersebut. VentureBeat mencatat bahwa ketiadaan standar bersama mencerminkan tantangan awal dalam pengungkapan kerentanan perangkat lunak sebelum sistem CVE dibentuk.
Also Read: Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B
Apa yang Harus Dilakukan Tim Keamanan
Laporan VentureBeat menyarankan tim keamanan untuk memperlakukan pengungkapan tiap lab berdasarkan istilah dan definisinya sendiri alih-alih membandingkan angka utama. Tim harus meminta detail metodologi pengujian sebelum menerapkan agen dalam alur kerja sensitif.
Tidak ada tindakan regulasi untuk standarisasi pengungkapan keamanan AI agent yang diumumkan bersamaan dengan laporan tersebut. Perbedaan ini kemungkinan akan berlanjut hingga sebuah badan industri atau regulator mewajibkan kerangka kerja umum.
Read Next: North Korea Drained $577M From Global Crypto Theft In 2026 So Far





