Yellow.com

Anthropic, OpenAI, Google e Meta hanno ciascuna pubblicato nel 2026 report sulle prompt injection, ma un confronto pubblicato da VentureBeat il 1° giugno ha rilevato che nessuna delle aziende misura le stesse metriche.

L’incoerenza makes difficile per i team di sicurezza aziendali confrontare il rischio tra i modelli.

Cosa hanno mostrato i report

L’analisi di VentureBeat ha riguardato l’agente browser di Anthropic, che è stato compromesso nel 31% degli scenari di test prima che si attivassero le misure di sicurezza. Gli altri tre laboratori hanno riportato condizioni di test diverse, tipi di attacco diversi e definizioni differenti del tasso di successo.

Anthropic ha misurato i tassi di hijacking dell’agente browser. Altri laboratori si sono concentrati su injection indiretta in contesti di tool-calling o in compiti di sintesi di documenti. Nessuno dei quattro report ha utilizzato un framework condiviso o una suite comune di test avversariali.

Gli acquirenti enterprise che valutano agenti di IA per l’uso in produzione non dispongono di una base standardizzata per il confronto. Un modello che mostra un basso tasso di injection secondo la definizione di un laboratorio può essere esposto a un rischio più elevato secondo il design di test di un altro.

Da leggere anche: OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve

Contesto

La prompt injection è diventata una categoria di minaccia riconosciuta quando gli agenti di IA sono passati da semplici chatbot a sistemi autonomi in grado di eseguire azioni reali, come inviare email, eseguire codice e chiamare API esterne. Un’istruzione iniettata può reindirizzare un agente a compiere azioni al di fuori del suo scopo previsto.

Nel 2025, diversi deployment aziendali hanno subìto incidenti di prompt injection che coinvolgevano agenti per l’elaborazione di documenti. Nessuno ha raggiunto le dimensioni di una violazione grave, ma questi episodi hanno portato a richieste di requisiti di disclosure standardizzati. Nessun organismo di regolamentazione ha ancora imposto un formato di report comune per le vulnerabilità degli agenti di IA.

I quattro report pubblicati nel 2026 rappresentano sforzi volontari di trasparenza da parte dei laboratori. VentureBeat ha osservato che l’assenza di uno standard condiviso rispecchia le sfide iniziali nella disclosure delle vulnerabilità software prima dell’istituzione del sistema CVE.

Da leggere anche: Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B

Cosa dovrebbero fare i team di sicurezza

Il report di VentureBeat consiglia ai team di sicurezza di valutare ogni disclosure di laboratorio secondo i propri termini invece di confrontare solo le cifre di copertina. I team dovrebbero richiedere i dettagli della metodologia di test prima di distribuire agenti in workflow sensibili.

Nessuna azione normativa sulla standardizzazione delle disclosure di sicurezza degli AI agent è stata annunciata insieme al report. È probabile che la divergenza continui finché un organismo industriale o un regolatore non imporrà un framework comune.

Da leggere dopo: North Korea Drained $577M From Global Crypto Theft In 2026 So Far

Murtuza Merchant

Murtuza è un giornalista finanziario esperto con una vasta esperienza nella copertura di criptovalute e tecnologia blockchain. Ha collaborato con Benzinga e Cointelegraph, tra le altre testate, riportando sulle tendenze emergenti, sul quadro normativo e altro ancora. Puoi trovarlo su Twitter come @murtuza_merc e su Telegram come mmerchant001. Disclosure: Murtuza holds ATOM, AKT, TIA, INJ, and OSMO.

Studio rileva che quattro principali laboratori di IA usano metriche di prompt injection incompatibili

Cosa hanno mostrato i report

Contesto

Cosa dovrebbero fare i team di sicurezza

Murtuza Merchant