OpenAI запустила Lockdown Mode — новый механизм безопасности, нацеленный на защиту пользователей, которые работают с конфиденциальной информацией, от prompt injection attacks. Компания представила эту функцию 7 июня 2026 года.
Согласно The Economic Times, Lockdown Mode предназначен для защиты от атак через внедрение промптов — метода, при котором вредоносные инструкции, встроенные во входные данные, пытаются переопределить или манипулировать поведением модели ИИ.
Что делает Lockdown Mode
Внедрение промптов — одна из наиболее часто обсуждаемых уязвимостей при развертывании больших языковых моделей. Злоумышленники создают входные данные, которые инструктируют модель игнорировать предыдущие указания или раскрывать ограниченную информацию. Lockdown Mode добавляет дополнительные уровни контроля, чтобы снизить этот риск.
OpenAI пока не опубликовала полного технического разбора реализации Lockdown Mode в текущем релизе. Компания описала эту функцию как ориентированную на пользователей, работающих с чувствительными данными, что подразумевает аудиторию из корпоративных клиентов, исследователей и специалистов, уделяющих повышенное внимание безопасности.
Запуск отражает тенденцию OpenAI к добавлению уровней доступа и слоёв безопасности по мере того, как платформа используется в всё более критичных сценариях. Корпоративные внедрения в юридическом, медицинском и государственном секторах усилили потребность в средствах защиты на уровне входных данных.
Также читайте: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move
Предпосылки
Усиление внимания OpenAI к инструментам, ориентированным на безопасность, последовало за периодом повышенного контроля над поведением моделей ИИ. За несколько недель до запуска главы OpenAI, Anthropic, Google DeepMind и Microsoft совместно призвали Конгресс обязать проводить скрининг синтетической ДНК, указывая на потенциальную роль ИИ в биозащитных угрозах. Это письмо, опубликованное в конце мая — начале июня 2026 года, вывело безопасность ИИ в центр законодательной повестки Вашингтона.
Выход Lockdown Mode происходит на фоне того, что конкуренты, включая Anthropic, также ужесточили контроль доступа к своим наиболее мощным моделям. Anthropic ограничила доступ к системе Claude Mythos ранее в этом году в рамках добровольной процедуры предварительного обзора перед широким релизом.
Добавление новых функций безопасности в продуктах OpenAI предшествует конфиденциальной подаче компанией документов на IPO в SEC 1 июня. Демонстрация средств защиты уровня enterprise, скорее всего, станет важным фактором для доверия инвесторов перед возможным публичным размещением.
Читайте далее: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push





