Yellow.com

Anthropic, OpenAI, Google en Meta publiceerden elk in 2026 rapporten over promptinjectie, maar uit een vergelijking door VentureBeat op 1 juni bleek dat geen twee bedrijven dezelfde metrics hanteren.

De inconsistentie maakt het moeilijk voor beveiligingsteams in ondernemingen om risico’s tussen modellen te vergelijken.

Wat de rapporten lieten zien

De analyse van VentureBeat betrof de browser-agent van Anthropic, die in 31% van de geteste scenario’s werd gekaapt voordat veiligheidsmaatregelen ingrepen. De drie andere labs publiceerden rapporten met andere testcondities, andere aanvalstypen en andere definities van succesratio’s.

Anthropic mat de frequentie van kapingen van browser-agents. Andere labs richtten zich op indirecte injectie in tool-calling-contexten of document-samenvattingstaken. Geen van de vier rapporten gebruikte een gedeeld raamwerk of een gemeenschappelijke adversariële testsuite.

Grote bedrijven die AI-agents voor productiegebruik willen evalueren, hebben geen gestandaardiseerde basis om te vergelijken. Een model dat volgens de definitie van het ene lab een lage injectiegraad toont, kan bij het testontwerp van een ander lab aan een veel groter risico blootstaan.

Also Read: OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve

Achtergrond

Promptinjectie werd een erkende dreigingscategorie toen AI-agents evolueerden van chatbots naar autonome systemen die echte acties kunnen uitvoeren, zoals e-mails versturen, code uitvoeren en externe API’s aanroepen. Een geïnjecteerde instructie kan een agent omleiden om acties uit te voeren buiten de bedoelde scope.

In 2025 deden zich bij verschillende bedrijfsimplementaties incidenten met promptinjectie voor, met name bij documentverwerkende agents. Geen daarvan bereikte de schaal van een grote datalek, maar de incidenten leidden tot oproepen voor gestandaardiseerde openbaarmakingsvereisten. Geen enkele toezichthouder heeft tot nu toe een gemeenschappelijk rapportageformat voor kwetsbaarheden in AI-agents verplicht gesteld.

De vier rapporten die in 2026 zijn gepubliceerd, vertegenwoordigen vrijwillige transparantie-initiatieven van de labs. VentureBeat merkte op dat het ontbreken van een gedeelde standaard doet denken aan de vroege uitdagingen rond het openbaar maken van softwarekwetsbaarheden, vóór de invoering van het CVE-systeem.

Also Read: Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B

Wat beveiligingsteams moeten doen

Het rapport van VentureBeat adviseerde beveiligingsteams om elk rapport van een lab op zijn eigen merites te beoordelen, in plaats van alleen de kopcijfers te vergelijken. Teams zouden om gedetailleerde informatie over de testmethodologie moeten vragen voordat ze agents in gevoelige workflows inzetten.

Er is geen regulatoire maatregel aangekondigd om de openbaarmaking van beveiligingsrisico’s van AI agent te standaardiseren. De divergentie zal waarschijnlijk aanhouden totdat een brancheorganisatie of toezichthouder een gemeenschappelijk raamwerk verplicht stelt.

Murtuza Merchant

Murtuza is een ervaren financieel journalist met uitgebreide ervaring in het verslaan van cryptovaluta en blockchaintechnologie. Hij heeft bijgedragen aan Benzinga en Cointelegraph, naast andere publicaties, waar hij verslag uitbracht over opkomende trends, het regelgevend landschap en meer. Je vindt hem op Twitter als @murtuza_merc en op Telegram als mmerchant001. Disclosure: Murtuza holds ATOM, AKT, TIA, INJ, and OSMO.

Onderzoek: vier grote AI-labs gebruiken onverenigbare prompt-injectiemetingen

Wat de rapporten lieten zien

Achtergrond

Wat beveiligingsteams moeten doen

Murtuza Merchant