Anthropic, OpenAI, Google і Meta у 2026 році опублікували власні звіти про атаки через підказки, але порівняння, опубліковане VentureBeat 1 червня, показало, що жодна з компаній не вимірює однакові метрики.
Непослідовність makes складною для команд корпоративної безпеки оцінку та порівняння ризиків між різними моделями.
Що показали звіти
Аналіз VentureBeat охопив браузерного агента Anthropic, який було перехоплено у 31% протестованих сценаріїв до спрацьовування захисних механізмів. Інші три лабораторії розкрили інші умови тестування, інші типи атак і різні визначення показника успіху атак.
Anthropic вимірювала частоту перехоплення браузерного агента. Інші лабораторії зосередилися на непрямих інʼєкціях у контексті виклику інструментів або завдань зі стислого викладу документів. Жоден із чотирьох звітів не використовував спільну методику чи єдиний набір тестів для моделювання атак.
Корпоративні замовники, які оцінюють AI‑агентів для продакшен‑використання, не мають стандартизованої основи для порівняння. Модель, що демонструє низький рівень інʼєкцій за визначенням однієї лабораторії, може мати суттєво вищу вразливість за схемою тестування іншої.
Also Read: OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve
Передумови
Атаки через підказки стали визнаною категорією загроз, коли AI‑агенти еволюціонували від чат‑ботів до автономних систем, здатних виконувати реальні дії — надсилати листи, виконувати код і викликати зовнішні API. Інʼєкція інструкцій може спрямувати агента на виконання дій поза його початковим мандатом.
У 2025 році кілька корпоративних впроваджень зіткнулися з інцидентами атак через підказки, повʼязаних з агентами для обробки документів. Жоден випадок не досяг масштабу великої компрометації, але ці інциденти спричинили заклики до запровадження стандартизованих вимог до розкриття інформації. Жоден регуляторний орган досі не запровадив єдиного формату звітності про вразливості AI‑агентів.
Чотири звіти, опубліковані у 2026 році, є добровільною ініціативою прозорості з боку лабораторій. VentureBeat зауважує, що відсутність спільного стандарту нагадує ранні труднощі зі звітуванням про вразливості ПЗ до створення системи CVE.
Also Read: Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B
Що мають робити команди безпеки
У своєму звіті VentureBeat радить командам безпеки розглядати звіти кожної лабораторії у власному контексті, а не порівнювати лише підсумкові цифри. Перед розгортанням агентів у чутливих процесах слід вимагати детального опису методології тестування.
Жодних регуляторних кроків щодо стандартизації звітності про безпеку AI agent оголошено разом із цим звітом не було. Імовірно, розбіжності зберігатимуться доти, доки галузевий орган або регулятор не запровадить спільну рамку.
Read Next: North Korea Drained $577M From Global Crypto Theft In 2026 So Far





