OpenAI запустила режим Lockdown — нову функцію безпеки, спрямовану на захист користувачів, які працюють з конфіденційною інформацією, від prompt injection attacks. Компанія запровадила цю функцію 7 червня 2026 року.
За даними The Economic Times, режим Lockdown розроблено для захисту від інʼєкції підказок — методу атаки, за якого шкідливі інструкції, вбудовані у вхідні дані, намагаються змінити або перехопити поведінку моделі ШІ.
Що робить режим Lockdown
Інʼєкція підказок є однією з найчастіше обговорюваних вразливостей під час розгортання великих мовних моделей. Зловмисники створюють запити, які наказують моделі ігнорувати попередні інструкції або розкривати обмежену інформацію. Режим Lockdown застосовує додаткові механізми контролю, щоб зменшити цей ризик.
OpenAI поки не опублікувала повний технічний опис реалізації режиму Lockdown у поточному релізі. Компанія описує цю функцію як орієнтовану на користувачів, що працюють із чутливими даними, зокрема корпоративних клієнтів, дослідників і фахівців, які приділяють підвищену увагу безпеці.
Запуск відображає тенденцію OpenAI до додавання нових рівнів доступу та безпеки в міру того, як платформа використовується в усе більш критично важливих сценаріях. Корпоративні впровадження в юридичній, медичній та державній сферах посилили потребу в засобах захисту на рівні вхідних даних.
Також читайте: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move
Передумови
Орієнтація OpenAI на інструменти безпеки посилилася на тлі зростаючої уваги до поведінки моделей ШІ. У тижні, що передували цьому запуску, керівники OpenAI, Anthropic, Google DeepMind і Microsoft спільно закликали Конгрес зобовʼязати проводити скринінг синтетичної ДНК, наголошуючи на потенційній ролі ШІ в біобезпекових загрозах. Цей лист, оприлюднений наприкінці травня та на початку червня 2026 року, поставив безпеку ШІ в центр законодавчого порядку денного у Вашингтоні.
Випуск режиму Lockdown відбувається на тлі того, що конкуренти, включно з Anthropic, також посилюють контроль доступу до своїх найпотужніших моделей. Anthropic обмежила доступ до своєї системи Claude Mythos раніше цього року в рамках добровільної процедури попереднього перегляду перед широким запуском.
Додавання функцій безпеки від OpenAI відбувається напередодні конфіденційної подачі заявки на IPO компанії, надісланої до SEC 1 червня. Демонстрація засобів безпеки рівня підприємств, ймовірно, стане важливим фактором для інвесторів перед можливим публічним розміщенням акцій.
Читайте далі: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push





