OpenAI запускает режим Lockdown для блокировки атак через внедрение подсказок

OpenAI запустила Lockdown Mode — новый механизм безопасности, предназначенный для защиты пользователей, работающих с конфиденциальной информацией, от prompt injection attacks. Компания внедрила эту функцию 7 июня 2026 года.

По данным The Economic Times, Lockdown Mode разработан для защиты от внедрения подсказок — метода атаки, при котором вредоносные инструкции, встроенные во входные данные, пытаются переопределить или изменить поведение модели ИИ.

Что делает Lockdown Mode

Внедрение подсказок — одна из наиболее часто обсуждаемых уязвимостей при развертывании больших языковых моделей. Злоумышленники создают входные данные, которые инструктируют модель игнорировать предыдущие указания или раскрывать закрытую информацию. Lockdown Mode применяет дополнительные контрольные механизмы, чтобы снизить этот риск.

OpenAI пока не опубликовала полный технический разбор реализации Lockdown Mode в текущем релизе. Компания описала функцию как ориентированную на пользователей, управляющих чувствительными данными, что подразумевает аудиторию из корпоративных клиентов, исследователей и специалистов, уделяющих повышенное внимание безопасности.

Запуск отражает общую тенденцию в OpenAI по добавлению уровней доступа и слоев безопасности по мере того, как платформа используется в все более критичных сценариях. Корпоративные развертывания в юридическом секторе, здравоохранении и госуправлении усилили потребность в защитных мерах на уровне входных данных.

Также читайте: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move

Предпосылки

Усиление внимания OpenAI к инструментам, ориентированным на безопасность, последовало за периодом повышенного контроля за поведением моделей ИИ. За несколько недель до этого запуска руководители OpenAI, Anthropic, Google DeepMind и Microsoft совместно призвали Конгресс обязать проводить проверку синтетической ДНК, указав на потенциальную роль ИИ в биозащитных угрозах. Это письмо, опубликованное в конце мая и начале июня 2026 года, вывело вопросы безопасности ИИ в центр законодательной повестки Вашингтона.

Выход Lockdown Mode происходит на фоне того, что конкуренты, включая Anthropic, также ужесточают контроль доступа к своим наиболее мощным моделям. Anthropic ограничила доступ к своей системе Claude Mythos ранее в этом году в рамках добровольной процедуры предварительного обзора.

Добавление функций безопасности в продуктах OpenAI происходит накануне конфиденциальной подачи заявки на IPO компании, направленной в SEC 1 июня. Демонстрация средств защиты корпоративного уровня, вероятно, станет важным фактором для доверия инвесторов перед потенциальным публичным размещением акций.

Читайте далее: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push