Studi Menemukan Empat Laboratorium AI Besar Menggunakan Metrik Prompt Injection yang Tidak Kompatibel

Studi Menemukan Empat Laboratorium AI Besar Menggunakan Metrik Prompt Injection yang Tidak Kompatibel

Anthropic, OpenAI, Google, dan Meta masing-masing menerbitkan pengungkapan prompt injection pada 2026, tetapi perbandingan yang diterbitkan VentureBeat pada 1 Juni menemukan tidak ada dua perusahaan yang mengukur metrik yang sama.

Ketidakkonsistenan makes hal ini menyulitkan tim keamanan perusahaan untuk membandingkan risiko antar model.

Apa yang Ditunjukkan Pengungkapan

Analisis VentureBeat mencakup agen peramban Anthropic, yang dibajak dalam 31% skenario uji sebelum pengaman keselamatan aktif. Tiga lab lainnya mengungkapkan kondisi uji yang berbeda, jenis serangan yang berbeda, dan definisi tingkat keberhasilan yang berbeda.

Anthropic mengukur tingkat pembajakan agen peramban. Lab lain berfokus pada injeksi tidak langsung dalam konteks pemanggilan alat atau tugas peringkasan dokumen. Tidak satu pun dari keempat laporan tersebut menggunakan kerangka kerja bersama atau kumpulan uji adversarial yang sama.

Pembeli perusahaan yang mengevaluasi agen AI untuk penggunaan produksi tidak memiliki dasar standar untuk perbandingan. Model yang menunjukkan tingkat injeksi rendah berdasarkan definisi satu lab dapat menghadapi paparan yang lebih tinggi di bawah desain pengujian lab lain.

Also Read: OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve

Latar Belakang

Prompt injection menjadi kategori ancaman yang diakui ketika agen AI beralih dari chatbot ke sistem otonom yang mampu melakukan tindakan nyata seperti mengirim email, mengeksekusi kode, dan memanggil API eksternal. Instruksi yang disuntikkan dapat mengarahkan ulang agen untuk melakukan tindakan di luar cakupan yang dimaksudkan.

Pada 2025, beberapa penerapan perusahaan mengalami insiden prompt injection yang melibatkan agen pemrosesan dokumen. Tidak ada yang mencapai skala pelanggaran besar, tetapi insiden tersebut memicu seruan untuk persyaratan pengungkapan yang terstandar. Belum ada badan regulasi yang mewajibkan format pelaporan umum untuk kerentanan agen AI.

Empat pengungkapan yang diterbitkan pada 2026 mewakili upaya transparansi sukarela dari lab-lab tersebut. VentureBeat mencatat bahwa ketiadaan standar bersama mencerminkan tantangan awal dalam pengungkapan kerentanan perangkat lunak sebelum sistem CVE dibentuk.

Also Read: Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B

Apa yang Harus Dilakukan Tim Keamanan

Laporan VentureBeat menyarankan tim keamanan untuk memperlakukan pengungkapan tiap lab berdasarkan istilah dan definisinya sendiri alih-alih membandingkan angka utama. Tim harus meminta detail metodologi pengujian sebelum menerapkan agen dalam alur kerja sensitif.

Tidak ada tindakan regulasi untuk standarisasi pengungkapan keamanan AI agent yang diumumkan bersamaan dengan laporan tersebut. Perbedaan ini kemungkinan akan berlanjut hingga sebuah badan industri atau regulator mewajibkan kerangka kerja umum.

Read Next: North Korea Drained $577M From Global Crypto Theft In 2026 So Far

Penafian dan Peringatan Risiko: Informasi yang diberikan dalam artikel ini hanya untuk tujuan edukasi dan informasi dan berdasarkan opini penulis. Ini tidak merupakan saran keuangan, investasi, hukum, atau pajak. Aset kripto sangat fluktuatif dan mengalami risiko tinggi, termasuk risiko kehilangan seluruh atau sebagian besar investasi Anda. Trading atau memegang aset kripto mungkin tidak cocok untuk semua investor. Pandangan yang dinyatakan dalam artikel ini adalah pandangan penulis saja dan tidak mewakili kebijakan resmi atau posisi Yellow, pendirinya, atau eksekutifnya. Selalu lakukan riset menyeluruh Anda sendiri (D.Y.O.R.) dan konsultasikan dengan profesional keuangan berlisensi sebelum membuat keputusan investasi apapun.
Studi Menemukan Empat Laboratorium AI Besar Menggunakan Metrik Prompt Injection yang Tidak Kompatibel | Yellow.com