Исследование: четыре ведущие лаборатории ИИ используют несовместимые метрики для оценки prompt-инъекций

Murtuza MerchantJun, 01 2026 18:31

Anthropic, OpenAI, Google, and Meta each published prompt injection disclosures in 2026 (Image: Shutterstock)

Anthropic, OpenAI, Google и Meta опубликовали отчеты о prompt-инъекциях в 2026 году, но сравнение, опубликованное VentureBeat 1 июня, показало, что ни две компании не измеряют одни и те же метрики.

Несогласованность makes задачу для команд корпоративной безопасности по сравнению рисков между моделями.

Что показали раскрытия

Анализ VentureBeat охватывал браузерный агент Anthropic, который был скомпрометирован в 31% протестированных сценариев до срабатывания защит. Остальные три лаборатории раскрыли другие условия тестирования, другие типы атак и иные определения показателя успешности.

Anthropic измеряла частоту перехвата браузерного агента. Другие лаборатории сосредоточились на косвенных инъекциях в контексте вызова инструментов или задачах суммирования документов. Ни один из четырех отчетов не использовал общую методологию или единый набор адвесариальных тестов.

Корпоративные заказчики, оценивающие ИИ‑агентов для промышленной эксплуатации, не имеют стандартизированной базы для сравнения. Модель с низкой частотой инъекций по определению одной лаборатории может иметь гораздо большую экспозицию в условиях тестирования другой.

Также читайте: OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve

Предпосылки

Prompt‑инъекция стала признанной категорией угроз, когда ИИ‑агенты эволюционировали от простых чат‑ботов к автономным системам, способным выполнять реальные действия, такие как отправка электронных писем, выполнение кода и вызов внешних API. Внедренная инструкция может перенаправить агента на выполнение действий вне его изначального мандата.

В 2025 году несколько корпоративных внедрений столкнулись с инцидентами prompt‑инъекций, связанных с агентами для обработки документов. Ни один из инцидентов не достиг масштаба крупной утечки, но они вызвали призывы к стандартизированным требованиям по раскрытию подобных уязвимостей. Ни один регулятор пока не обязал использовать общий формат отчетности по уязвимостям ИИ‑агентов.

Четыре раскрытия, опубликованные в 2026 году, представляют собой добровольные усилия лабораторий по повышению прозрачности. VentureBeat отметила, что отсутствие общего стандарта напоминает ранние сложности в раскрытии уязвимостей ПО до появления системы CVE.

Также читайте: Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B

Что должны делать команды безопасности

В отчете VentureBeat рекомендовала командам безопасности рассматривать раскрытия каждой лаборатории в ее собственных терминах, а не сравнивать только итоговые показатели. Командам следует запрашивать подробности методологии тестирования перед развертыванием агентов в критичных рабочих процессах.

Никаких регуляторных мер по стандартизации раскрытия информации о безопасности AI agent объявлено одновременно с отчетом не было. Разрыв, вероятно, сохранится до тех пор, пока отраслевая организация или регулятор не утвердит единый стандарт.

Читайте далее: North Korea Drained $577M From Global Crypto Theft In 2026 So Far

Murtuza Merchant

Муртуза — опытный финансовый журналист с обширным опытом освещения криптовалют и технологий блокчейн. Он публиковался в Benzinga и Cointelegraph, а также в других изданиях, рассказывая о новых трендах, регуляторной среде и многом другом. Найти его можно в Twitter по нику @murtuza_merc и в Telegram под именем mmerchant001. Disclosure: Murtuza holds ATOM, AKT, TIA, INJ, and OSMO.

Отказ от ответственности и предупреждение о рисках: Информация, представленная в этой статье, предназначена только для образовательных и информационных целей и основана на мнении автора. Она не является финансовой, инвестиционной, юридической или налоговой консультацией. Криптоактивы крайне волатильны и подвержены высоким рискам, включая риск потери всех или значительной части ваших инвестиций. Торговля или владение криптоактивами может не подходить для всех инвесторов. Мнения, выраженные в этой статье, принадлежат исключительно автору(ам) и не представляют официальную политику или позицию Yellow, её основателей или руководителей. Всегда проводите собственное тщательное исследование (D.Y.O.R.) и консультируйтесь с лицензированным финансовым специалистом перед принятием любых инвестиционных решений.

Связанные Новости

Google останавливает первую нулевую уязвимость, созданную ИИ, пока Daybreak соперничает с Glasswing

May 12, 2026

Google заявила, что сорвала попытку хакеров использовать нулевой день, созданный с помощью ИИ, что стало первым зафиксированным случаем такого рода.

Исследование Cisco показывает, что передовые модели ИИ проваливаются под многотуровыми атаками

May 28, 2026

Исследование Cisco: многотуровые атаки обходят защиту в 15 передовых моделях ИИ с частотой до 88%, ставя под сомнение одношаговые бенчмарки.

ИИ‑модели успешно проводят миллионные эксплойты смарт‑контрактов, ознаменовав новый этап киберугроз

Dec 02, 2025

Исследование Anthropic: ИИ‑агенты Claude и GPT-5 автономно находят и эксплуатируют уязвимости смарт‑контрактов, демонстрируя новую фазу ИИ‑киберугроз.

У США есть 12 месяцев, чтобы сдержать ИИ, прежде чем Китай создаст сопоставимого соперника

Jun 08, 2026