OpenAI запускає режим Lockdown для блокування атак через інʼєкцію підказок

OpenAI запустила Lockdown Mode — нову функцію безпеки, спрямовану на захист користувачів, що працюють із конфіденційною інформацією, від prompt injection attacks. Компанія розгорнула цю функцію 7 червня 2026 року.

За даними The Economic Times, Lockdown Mode призначений для захисту від інʼєкції підказок — методу атаки, за якого шкідливі інструкції, вбудовані у вхідні дані, намагаються змінити або підмінити поведінку моделі ШІ.

Що робить Lockdown Mode

Інʼєкція підказок є однією з найчастіше обговорюваних вразливостей під час розгортання великих мовних моделей. Зловмисники створюють такі вхідні дані, що змушують модель ігнорувати попередні інструкції або розкривати обмежену інформацію. Lockdown Mode застосовує додаткові засоби контролю, щоб зменшити цей ризик.

OpenAI не опублікувала повний технічний розбір реалізації Lockdown Mode у поточному релізі. Компанія описує функцію як орієнтовану на користувачів, які керують конфіденційними даними, що передбачає аудиторію з числа корпоративних клієнтів, дослідників і фахівців, орієнтованих на безпеку.

Запуск відображає тенденцію в OpenAI до додавання рівнів доступу та шарів безпеки у міру того, як платформа обслуговує дедалі більш критичні сценарії використання. Корпоративні розгортання в юридичній, медичній та урядовій сферах посилили потребу в засобах безпеки на рівні вхідних даних.

Також читайте: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move

Передумови

Просування OpenAI в напрямку інструментів, орієнтованих на безпеку, відбувається після періоду посиленої уваги до поведінки моделей ШІ. За кілька тижнів до цього запуску керівники OpenAI, Anthropic, Google DeepMind і Microsoft спільно закликали Конгрес зобовʼязати проводити скринінг синтетичної ДНК, посилаючись на потенційну роль ШІ в загрозах біобезпеці. Цей лист, про який повідомлялося наприкінці травня та на початку червня 2026 року, поставив безпеку ШІ в центр законодавчого порядку денного у Вашингтоні.

Випуск Lockdown Mode відбувається на тлі того, що конкуренти, зокрема Anthropic, також посилили контроль доступу до своїх найпотужніших моделей. Anthropic обмежила доступ до своєї системи Claude Mythos раніше цього року в рамках добровільної рамки попереднього перегляду перед повним релізом.

Додавання функцій безпеки від OpenAI передує конфіденційній подачі документів компанією на IPO, надісланих до SEC 1 червня. Демонстрація засобів безпеки корпоративного рівня, ймовірно, стане важливим фактором для довіри інвесторів напередодні можливого публічного розміщення.

Читайте далі: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push