OpenAI wprowadza tryb Lockdown, aby blokować ataki typu prompt injection

OpenAI uruchomiło tryb Lockdown, nową funkcję bezpieczeństwa mającą na celu ochronę użytkowników, którzy pracują z wrażliwymi danymi, przed prompt injection attacks. Firma udostępniła tę funkcję 7 czerwca 2026 roku.

Według The Economic Times tryb Lockdown został zaprojektowany tak, aby bronić przed prompt injection – metodą ataku, w której złośliwe instrukcje osadzone w danych wejściowych próbują nadpisać lub zmanipulować zachowanie modelu AI.

Co robi tryb Lockdown

Prompt injection jest jedną z najczęściej omawianych podatności przy wdrażaniu dużych modeli językowych. Atakujący tworzą dane wejściowe, które instruują model, by ignorował wcześniejsze polecenia lub ujawniał informacje objęte ograniczeniami. Tryb Lockdown wprowadza dodatkowe zabezpieczenia, aby to ryzyko ograniczyć.

OpenAI nie opublikowało pełnego technicznego opisu implementacji trybu Lockdown w obecnej wersji. Firma określiła tę funkcję jako skierowaną do użytkowników zarządzających danymi wrażliwymi, co sugeruje grupę odbiorców obejmującą klientów korporacyjnych, naukowców i specjalistów szczególnie dbających o bezpieczeństwo.

Wprowadzenie tej funkcji wpisuje się w szerszy wzorzec w OpenAI: dodawanie nowych poziomów dostępu i warstw bezpieczeństwa w miarę, jak platforma obsługuje coraz bardziej ryzykowne zastosowania. Wdrożenia korporacyjne w sektorach prawnym, zdrowotnym i publicznym zwiększyły potrzebę stosowania zabezpieczeń już na poziomie danych wejściowych.

Also Read: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move

Tło

Skupienie OpenAI na narzędziach zorientowanych na bezpieczeństwo następuje po okresie wzmożonej kontroli nad zachowaniem modeli AI. W tygodniach poprzedzających to wdrożenie szefowie OpenAI, Anthropic, Google DeepMind i Microsoft wspólnie wezwali Kongres do wprowadzenia obowiązkowego skanowania syntetycznego DNA, powołując się na potencjalną rolę AI w zagrożeniach dla biobezpieczeństwa. Ten list, opisywany pod koniec maja i na początku czerwca 2026 roku, umieścił bezpieczeństwo AI w centrum agendy legislacyjnej Waszyngtonu.

Wprowadzenie trybu Lockdown następuje w momencie, gdy konkurenci, w tym Anthropic, również zaostrzają kontrolę dostępu do swoich najbardziej zaawansowanych modeli. Anthropic ograniczył dostęp do systemu Claude Mythos na początku tego roku w ramach dobrowolnych procedur przeglądu przedpremierowego.

Dodanie nowych funkcji bezpieczeństwa przez OpenAI następuje przed poufnym zgłoszeniem spółki do IPO, przesłanym do SEC 1 czerwca. Wykazanie zabezpieczeń na poziomie klasy korporacyjnej prawdopodobnie będzie istotnym elementem budowania zaufania inwestorów przed ewentualnym debiutem giełdowym.