Дослідження виявило, що чотири найбільші AI‑лаби використовують несумісні метрики атак через підказки

Murtuza MerchantJun, 01 2026 18:31

#штучний інтелект #Anthropic #OpenAI #Google #Meta

Anthropic, OpenAI, Google, and Meta each published prompt injection disclosures in 2026 (Image: Shutterstock)

Anthropic, OpenAI, Google і Meta у 2026 році опублікували власні звіти про атаки через підказки, але порівняння, опубліковане VentureBeat 1 червня, показало, що жодна з компаній не вимірює однакові метрики.

Непослідовність makes складною для команд корпоративної безпеки оцінку та порівняння ризиків між різними моделями.

Що показали звіти

Аналіз VentureBeat охопив браузерного агента Anthropic, який було перехоплено у 31% протестованих сценаріїв до спрацьовування захисних механізмів. Інші три лабораторії розкрили інші умови тестування, інші типи атак і різні визначення показника успіху атак.

Anthropic вимірювала частоту перехоплення браузерного агента. Інші лабораторії зосередилися на непрямих інʼєкціях у контексті виклику інструментів або завдань зі стислого викладу документів. Жоден із чотирьох звітів не використовував спільну методику чи єдиний набір тестів для моделювання атак.

Корпоративні замовники, які оцінюють AI‑агентів для продакшен‑використання, не мають стандартизованої основи для порівняння. Модель, що демонструє низький рівень інʼєкцій за визначенням однієї лабораторії, може мати суттєво вищу вразливість за схемою тестування іншої.

Also Read: OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve

Передумови

Атаки через підказки стали визнаною категорією загроз, коли AI‑агенти еволюціонували від чат‑ботів до автономних систем, здатних виконувати реальні дії — надсилати листи, виконувати код і викликати зовнішні API. Інʼєкція інструкцій може спрямувати агента на виконання дій поза його початковим мандатом.

У 2025 році кілька корпоративних впроваджень зіткнулися з інцидентами атак через підказки, повʼязаних з агентами для обробки документів. Жоден випадок не досяг масштабу великої компрометації, але ці інциденти спричинили заклики до запровадження стандартизованих вимог до розкриття інформації. Жоден регуляторний орган досі не запровадив єдиного формату звітності про вразливості AI‑агентів.

Чотири звіти, опубліковані у 2026 році, є добровільною ініціативою прозорості з боку лабораторій. VentureBeat зауважує, що відсутність спільного стандарту нагадує ранні труднощі зі звітуванням про вразливості ПЗ до створення системи CVE.

Also Read: Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B

Що мають робити команди безпеки

У своєму звіті VentureBeat радить командам безпеки розглядати звіти кожної лабораторії у власному контексті, а не порівнювати лише підсумкові цифри. Перед розгортанням агентів у чутливих процесах слід вимагати детального опису методології тестування.

Жодних регуляторних кроків щодо стандартизації звітності про безпеку AI agent оголошено разом із цим звітом не було. Імовірно, розбіжності зберігатимуться доти, доки галузевий орган або регулятор не запровадить спільну рамку.

Murtuza Merchant

Муртуза — досвідчений фінансовий журналіст із великим досвідом у висвітленні криптовалют та блокчейн‑технологій. Він співпрацював з Benzinga та Cointelegraph, а також іншими виданнями, висвітлюючи нові тренди, регуляторне середовище та інші аспекти галузі. Знайти його можна в Twitter за @murtuza_merc і в Telegram за ніком mmerchant001. Розкриття інформації: Муртуза володіє ATOM, AKT, TIA, INJ та OSMO.

Відмова від відповідальності та попередження про ризики: Інформація, надана в цій статті, призначена лише для освітніх та інформаційних цілей і базується на думці автора. Вона не є фінансовою, інвестиційною, правовою чи податковою консультацією. Криптоактиви є надзвичайно волатильними та піддаються високому ризику, включаючи ризик втрати всіх або значної частини ваших інвестицій. Торгівля або утримання криптоактивів може не підходити для всіх інвесторів. Думки, висловлені в цій статті, належать виключно автору(ам) і не представляють офіційну політику чи позицію Yellow, її засновників або керівників. Завжди проводьте власне ретельне дослідження (D.Y.O.R.) та консультуйтесь з ліцензованим фінансовим фахівцем перед прийняттям будь-яких інвестиційних рішень.

Схожі новини

Дослідження Cisco показує, що передові моделі ШІ не витримують багатокрокових атак

May 28, 2026

Дослідження Cisco виявило, що 15 провідних моделей ШІ можна обійти багатокроковими атаками до 88%, ставлячи під сумнів звичайні тести безпеки.

Claude Mythos розв’язує 32-крокову атаку AISI в 6 із 10 спроб

May 15, 2026

Новий чекпоінт Claude Mythos першим пройшов обидва кібердіапазони UK AISI, різко підвищивши успішність складних атак і загостривши питання автономного хакінгу.

Моделі ШІ успішно здійснюють мільйонні експлойти смарт‑контрактів, сигналізуючи про нову еру кіберзагроз

Dec 02, 2025

Дослідження Anthropic: агенти ШІ автономно знаходять та експлуатують вразливості смарт‑контрактів, демонструючи новий рівень реальних кіберзагроз.

OpenAI запускає режим Lockdown для блокування атак через інʼєкцію підказок

Jun 07, 2026