Anthropic, OpenAI, Google en Meta publiceerden elk in 2026 rapporten over promptinjectie, maar uit een vergelijking door VentureBeat op 1 juni bleek dat geen twee bedrijven dezelfde metrics hanteren.
De inconsistentie maakt het moeilijk voor beveiligingsteams in ondernemingen om risico’s tussen modellen te vergelijken.
Wat de rapporten lieten zien
De analyse van VentureBeat betrof de browser-agent van Anthropic, die in 31% van de geteste scenario’s werd gekaapt voordat veiligheidsmaatregelen ingrepen. De drie andere labs publiceerden rapporten met andere testcondities, andere aanvalstypen en andere definities van succesratio’s.
Anthropic mat de frequentie van kapingen van browser-agents. Andere labs richtten zich op indirecte injectie in tool-calling-contexten of document-samenvattingstaken. Geen van de vier rapporten gebruikte een gedeeld raamwerk of een gemeenschappelijke adversariële testsuite.
Grote bedrijven die AI-agents voor productiegebruik willen evalueren, hebben geen gestandaardiseerde basis om te vergelijken. Een model dat volgens de definitie van het ene lab een lage injectiegraad toont, kan bij het testontwerp van een ander lab aan een veel groter risico blootstaan.
Also Read: OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve
Achtergrond
Promptinjectie werd een erkende dreigingscategorie toen AI-agents evolueerden van chatbots naar autonome systemen die echte acties kunnen uitvoeren, zoals e-mails versturen, code uitvoeren en externe API’s aanroepen. Een geïnjecteerde instructie kan een agent omleiden om acties uit te voeren buiten de bedoelde scope.
In 2025 deden zich bij verschillende bedrijfsimplementaties incidenten met promptinjectie voor, met name bij documentverwerkende agents. Geen daarvan bereikte de schaal van een grote datalek, maar de incidenten leidden tot oproepen voor gestandaardiseerde openbaarmakingsvereisten. Geen enkele toezichthouder heeft tot nu toe een gemeenschappelijk rapportageformat voor kwetsbaarheden in AI-agents verplicht gesteld.
De vier rapporten die in 2026 zijn gepubliceerd, vertegenwoordigen vrijwillige transparantie-initiatieven van de labs. VentureBeat merkte op dat het ontbreken van een gedeelde standaard doet denken aan de vroege uitdagingen rond het openbaar maken van softwarekwetsbaarheden, vóór de invoering van het CVE-systeem.
Also Read: Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B
Wat beveiligingsteams moeten doen
Het rapport van VentureBeat adviseerde beveiligingsteams om elk rapport van een lab op zijn eigen merites te beoordelen, in plaats van alleen de kopcijfers te vergelijken. Teams zouden om gedetailleerde informatie over de testmethodologie moeten vragen voordat ze agents in gevoelige workflows inzetten.
Er is geen regulatoire maatregel aangekondigd om de openbaarmaking van beveiligingsrisico’s van AI agent te standaardiseren. De divergentie zal waarschijnlijk aanhouden totdat een brancheorganisatie of toezichthouder een gemeenschappelijk raamwerk verplicht stelt.
Read Next: North Korea Drained $577M From Global Crypto Theft In 2026 So Far





