Исследование: четыре ведущие лаборатории ИИ используют несовместимые метрики для оценки prompt-инъекций

Исследование: четыре ведущие лаборатории ИИ используют несовместимые метрики для оценки prompt-инъекций

Anthropic, OpenAI, Google и Meta опубликовали отчеты о prompt-инъекциях в 2026 году, но сравнение, опубликованное VentureBeat 1 июня, показало, что ни две компании не измеряют одни и те же метрики.

Несогласованность makes задачу для команд корпоративной безопасности по сравнению рисков между моделями.

Что показали раскрытия

Анализ VentureBeat охватывал браузерный агент Anthropic, который был скомпрометирован в 31% протестированных сценариев до срабатывания защит. Остальные три лаборатории раскрыли другие условия тестирования, другие типы атак и иные определения показателя успешности.

Anthropic измеряла частоту перехвата браузерного агента. Другие лаборатории сосредоточились на косвенных инъекциях в контексте вызова инструментов или задачах суммирования документов. Ни один из четырех отчетов не использовал общую методологию или единый набор адвесариальных тестов.

Корпоративные заказчики, оценивающие ИИ‑агентов для промышленной эксплуатации, не имеют стандартизированной базы для сравнения. Модель с низкой частотой инъекций по определению одной лаборатории может иметь гораздо большую экспозицию в условиях тестирования другой.

Также читайте: OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve

Предпосылки

Prompt‑инъекция стала признанной категорией угроз, когда ИИ‑агенты эволюционировали от простых чат‑ботов к автономным системам, способным выполнять реальные действия, такие как отправка электронных писем, выполнение кода и вызов внешних API. Внедренная инструкция может перенаправить агента на выполнение действий вне его изначального мандата.

В 2025 году несколько корпоративных внедрений столкнулись с инцидентами prompt‑инъекций, связанных с агентами для обработки документов. Ни один из инцидентов не достиг масштаба крупной утечки, но они вызвали призывы к стандартизированным требованиям по раскрытию подобных уязвимостей. Ни один регулятор пока не обязал использовать общий формат отчетности по уязвимостям ИИ‑агентов.

Четыре раскрытия, опубликованные в 2026 году, представляют собой добровольные усилия лабораторий по повышению прозрачности. VentureBeat отметила, что отсутствие общего стандарта напоминает ранние сложности в раскрытии уязвимостей ПО до появления системы CVE.

Также читайте: Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B

Что должны делать команды безопасности

В отчете VentureBeat рекомендовала командам безопасности рассматривать раскрытия каждой лаборатории в ее собственных терминах, а не сравнивать только итоговые показатели. Командам следует запрашивать подробности методологии тестирования перед развертыванием агентов в критичных рабочих процессах.

Никаких регуляторных мер по стандартизации раскрытия информации о безопасности AI agent объявлено одновременно с отчетом не было. Разрыв, вероятно, сохранится до тех пор, пока отраслевая организация или регулятор не утвердит единый стандарт.

Читайте далее: North Korea Drained $577M From Global Crypto Theft In 2026 So Far

Отказ от ответственности и предупреждение о рисках: Информация, представленная в этой статье, предназначена только для образовательных и информационных целей и основана на мнении автора. Она не является финансовой, инвестиционной, юридической или налоговой консультацией. Криптоактивы крайне волатильны и подвержены высоким рискам, включая риск потери всех или значительной части ваших инвестиций. Торговля или владение криптоактивами может не подходить для всех инвесторов. Мнения, выраженные в этой статье, принадлежат исключительно автору(ам) и не представляют официальную политику или позицию Yellow, её основателей или руководителей. Всегда проводите собственное тщательное исследование (D.Y.O.R.) и консультируйтесь с лицензированным финансовым специалистом перед принятием любых инвестиционных решений.
Последние новости
Показать все новости
Связанные Новости
Связанные исследовательские статьи
Связанные обучающие статьи
Исследование: четыре ведущие лаборатории ИИ используют несовместимые метрики для оценки prompt-инъекций | Yellow.com