Дослідження виявило, що чотири найбільші AI‑лаби використовують несумісні метрики атак через підказки

Дослідження виявило, що чотири найбільші AI‑лаби використовують несумісні метрики атак через підказки

Anthropic, OpenAI, Google і Meta у 2026 році опублікували власні звіти про атаки через підказки, але порівняння, опубліковане VentureBeat 1 червня, показало, що жодна з компаній не вимірює однакові метрики.

Непослідовність makes складною для команд корпоративної безпеки оцінку та порівняння ризиків між різними моделями.

Що показали звіти

Аналіз VentureBeat охопив браузерного агента Anthropic, який було перехоплено у 31% протестованих сценаріїв до спрацьовування захисних механізмів. Інші три лабораторії розкрили інші умови тестування, інші типи атак і різні визначення показника успіху атак.

Anthropic вимірювала частоту перехоплення браузерного агента. Інші лабораторії зосередилися на непрямих інʼєкціях у контексті виклику інструментів або завдань зі стислого викладу документів. Жоден із чотирьох звітів не використовував спільну методику чи єдиний набір тестів для моделювання атак.

Корпоративні замовники, які оцінюють AI‑агентів для продакшен‑використання, не мають стандартизованої основи для порівняння. Модель, що демонструє низький рівень інʼєкцій за визначенням однієї лабораторії, може мати суттєво вищу вразливість за схемою тестування іншої.

Also Read: OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve

Передумови

Атаки через підказки стали визнаною категорією загроз, коли AI‑агенти еволюціонували від чат‑ботів до автономних систем, здатних виконувати реальні дії — надсилати листи, виконувати код і викликати зовнішні API. Інʼєкція інструкцій може спрямувати агента на виконання дій поза його початковим мандатом.

У 2025 році кілька корпоративних впроваджень зіткнулися з інцидентами атак через підказки, повʼязаних з агентами для обробки документів. Жоден випадок не досяг масштабу великої компрометації, але ці інциденти спричинили заклики до запровадження стандартизованих вимог до розкриття інформації. Жоден регуляторний орган досі не запровадив єдиного формату звітності про вразливості AI‑агентів.

Чотири звіти, опубліковані у 2026 році, є добровільною ініціативою прозорості з боку лабораторій. VentureBeat зауважує, що відсутність спільного стандарту нагадує ранні труднощі зі звітуванням про вразливості ПЗ до створення системи CVE.

Also Read: Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B

Що мають робити команди безпеки

У своєму звіті VentureBeat радить командам безпеки розглядати звіти кожної лабораторії у власному контексті, а не порівнювати лише підсумкові цифри. Перед розгортанням агентів у чутливих процесах слід вимагати детального опису методології тестування.

Жодних регуляторних кроків щодо стандартизації звітності про безпеку AI agent оголошено разом із цим звітом не було. Імовірно, розбіжності зберігатимуться доти, доки галузевий орган або регулятор не запровадить спільну рамку.

Read Next: North Korea Drained $577M From Global Crypto Theft In 2026 So Far

Відмова від відповідальності та попередження про ризики: Інформація, надана в цій статті, призначена лише для освітніх та інформаційних цілей і базується на думці автора. Вона не є фінансовою, інвестиційною, правовою чи податковою консультацією. Криптоактиви є надзвичайно волатильними та піддаються високому ризику, включаючи ризик втрати всіх або значної частини ваших інвестицій. Торгівля або утримання криптоактивів може не підходити для всіх інвесторів. Думки, висловлені в цій статті, належать виключно автору(ам) і не представляють офіційну політику чи позицію Yellow, її засновників або керівників. Завжди проводьте власне ретельне дослідження (D.Y.O.R.) та консультуйтесь з ліцензованим фінансовим фахівцем перед прийняттям будь-яких інвестиційних рішень.
Останні новини
Показати всі новини
Схожі новини
Схожі дослідницькі статті
Схожі навчальні матеріали
Дослідження виявило, що чотири найбільші AI‑лаби використовують несумісні метрики атак через підказки | Yellow.com