Onderzoek: vier grote AI-labs gebruiken onverenigbare prompt-injectiemetingen

Onderzoek: vier grote AI-labs gebruiken onverenigbare prompt-injectiemetingen

Anthropic, OpenAI, Google en Meta publiceerden elk in 2026 rapporten over promptinjectie, maar uit een vergelijking door VentureBeat op 1 juni bleek dat geen twee bedrijven dezelfde metrics hanteren.

De inconsistentie maakt het moeilijk voor beveiligingsteams in ondernemingen om risico’s tussen modellen te vergelijken.

Wat de rapporten lieten zien

De analyse van VentureBeat betrof de browser-agent van Anthropic, die in 31% van de geteste scenario’s werd gekaapt voordat veiligheidsmaatregelen ingrepen. De drie andere labs publiceerden rapporten met andere testcondities, andere aanvalstypen en andere definities van succesratio’s.

Anthropic mat de frequentie van kapingen van browser-agents. Andere labs richtten zich op indirecte injectie in tool-calling-contexten of document-samenvattingstaken. Geen van de vier rapporten gebruikte een gedeeld raamwerk of een gemeenschappelijke adversariële testsuite.

Grote bedrijven die AI-agents voor productiegebruik willen evalueren, hebben geen gestandaardiseerde basis om te vergelijken. Een model dat volgens de definitie van het ene lab een lage injectiegraad toont, kan bij het testontwerp van een ander lab aan een veel groter risico blootstaan.

Also Read: OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve

Achtergrond

Promptinjectie werd een erkende dreigingscategorie toen AI-agents evolueerden van chatbots naar autonome systemen die echte acties kunnen uitvoeren, zoals e-mails versturen, code uitvoeren en externe API’s aanroepen. Een geïnjecteerde instructie kan een agent omleiden om acties uit te voeren buiten de bedoelde scope.

In 2025 deden zich bij verschillende bedrijfsimplementaties incidenten met promptinjectie voor, met name bij documentverwerkende agents. Geen daarvan bereikte de schaal van een grote datalek, maar de incidenten leidden tot oproepen voor gestandaardiseerde openbaarmakingsvereisten. Geen enkele toezichthouder heeft tot nu toe een gemeenschappelijk rapportageformat voor kwetsbaarheden in AI-agents verplicht gesteld.

De vier rapporten die in 2026 zijn gepubliceerd, vertegenwoordigen vrijwillige transparantie-initiatieven van de labs. VentureBeat merkte op dat het ontbreken van een gedeelde standaard doet denken aan de vroege uitdagingen rond het openbaar maken van softwarekwetsbaarheden, vóór de invoering van het CVE-systeem.

Also Read: Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B

Wat beveiligingsteams moeten doen

Het rapport van VentureBeat adviseerde beveiligingsteams om elk rapport van een lab op zijn eigen merites te beoordelen, in plaats van alleen de kopcijfers te vergelijken. Teams zouden om gedetailleerde informatie over de testmethodologie moeten vragen voordat ze agents in gevoelige workflows inzetten.

Er is geen regulatoire maatregel aangekondigd om de openbaarmaking van beveiligingsrisico’s van AI agent te standaardiseren. De divergentie zal waarschijnlijk aanhouden totdat een brancheorganisatie of toezichthouder een gemeenschappelijk raamwerk verplicht stelt.

Read Next: North Korea Drained $577M From Global Crypto Theft In 2026 So Far

Disclaimer en risicowaarschuwing: De informatie in dit artikel is uitsluitend voor educatieve en informatieve doeleinden en is gebaseerd op de mening van de auteur. Het vormt geen financieel, investerings-, juridisch of belastingadvies. Cryptocurrency-assets zijn zeer volatiel en onderhevig aan hoog risico, inclusief het risico om uw gehele of een substantieel deel van uw investering te verliezen. Het handelen in of aanhouden van crypto-assets is mogelijk niet geschikt voor alle beleggers. De meningen die in dit artikel worden geuit zijn uitsluitend die van de auteur(s) en vertegenwoordigen niet het officiële beleid of standpunt van Yellow, haar oprichters of haar leidinggevenden. Voer altijd uw eigen grondig onderzoek uit (D.Y.O.R.) en raadpleeg een gelicentieerde financiële professional voordat u een investeringsbeslissing neemt.
Onderzoek: vier grote AI-labs gebruiken onverenigbare prompt-injectiemetingen | Yellow.com