OpenAI lança modo Lockdown para bloquear ataques de prompt injection

A OpenAI lançou o Lockdown Mode, um novo recurso de segurança voltado para proteger usuários que lidam com informações sensíveis de prompt injection attacks. A empresa disponibilizou o recurso em 7 de junho de 2026.

Segundo o The Economic Times, o Lockdown Mode foi desenvolvido para se defender contra prompt injection, um método de ataque em que instruções maliciosas inseridas nas entradas tentam substituir ou manipular o comportamento do modelo de IA.

O que o Lockdown Mode faz

Prompt injection é uma das vulnerabilidades mais discutidas na implantação de grandes modelos de linguagem. Agressores criam entradas que instruem o modelo a ignorar instruções anteriores ou expor informações restritas. O Lockdown Mode aplica controles adicionais para reduzir esse risco.

A OpenAI ainda não publicou um detalhamento técnico completo da implementação do Lockdown Mode nesta fase inicial. A empresa descreveu o recurso como voltado a usuários que gerenciam dados sensíveis, sugerindo um público que inclui clientes corporativos, pesquisadores e profissionais focados em segurança.

O lançamento reflete um padrão na OpenAI de adicionar camadas de acesso e segurança à medida que a plataforma passa a lidar com casos de uso de importância crescente. Implantações empresariais nos setores jurídico, de saúde e governamental aumentaram a necessidade de controles de segurança no nível das entradas.

Também leia: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move

Contexto

A investida da OpenAI em ferramentas focadas em segurança ocorre após um período de maior escrutínio sobre o comportamento de modelos de IA. Nas semanas anteriores a este lançamento, os líderes da OpenAI, Anthropic, Google DeepMind e Microsoft pediram em conjunto que o Congresso tornasse obrigatória a triagem de DNA sintético, citando o potencial papel da IA em ameaças à biossegurança. Essa carta, divulgada no fim de maio e início de junho de 2026, colocou a segurança em IA no centro da agenda legislativa de Washington.

O lançamento do Lockdown Mode ocorre no momento em que concorrentes como a Anthropic também apertam os controles de acesso a seus modelos mais capazes. A Anthropic limitou o acesso ao seu sistema Claude Mythos no início deste ano como parte de um processo voluntário de revisão pré-lançamento.

Os novos recursos de segurança da OpenAI chegam antes do pedido confidencial de IPO da empresa, enviado à SEC em 1º de junho. Demonstrar controles de segurança em nível corporativo provavelmente será um fator importante para a confiança de investidores antes de uma eventual oferta pública.