OpenAI hat den Lockdown-Modus gestartet, eine neue Sicherheitsfunktion, die darauf abzielt, Nutzer zu schützen, die mit sensiblen Informationen arbeiten, vor prompt injection attacks. Das Unternehmen hat die Funktion am 7. Juni 2026 ausgerollt.
Laut The Economic Times wurde der Lockdown-Modus entwickelt, um sich gegen Prompt-Injection zu verteidigen – eine Angriffsform, bei der bösartige, in Eingaben eingebettete Anweisungen versuchen, das Verhalten des KI-Modells zu überschreiben oder zu manipulieren.
Was der Lockdown-Modus macht
Prompt-Injection ist eine der am häufigsten diskutierten Schwachstellen beim Einsatz großer Sprachmodelle. Angreifer formulieren Eingaben so, dass das Modell angewiesen wird, frühere Instruktionen zu ignorieren oder eingeschränkte Informationen preiszugeben. Der Lockdown-Modus führt zusätzliche Kontrollen ein, um dieses Risiko zu verringern.
OpenAI hat in der aktuellen Einführungsphase noch keine vollständige technische Analyse der Implementierung des Lockdown-Modus veröffentlicht. Das Unternehmen beschreibt die Funktion als ausgerichtet auf Nutzer, die sensible Daten verwalten – und deutet damit auf eine Zielgruppe hin, die Unternehmenskunden, Forschende und sicherheitsbewusste Fachleute einschließt.
Die Einführung spiegelt ein Muster bei OpenAI wider, zusätzliche Zugriffsstufen und Sicherheitsebenen einzuführen, während die Plattform zunehmend Anwendungen mit hohen Risiken unterstützt. Unternehmenseinsätze in Rechtswesen, Gesundheitswesen und öffentlichem Sektor haben den Bedarf an Sicherheitskontrollen auf Eingabeebene verstärkt.
Auch lesen: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move
Hintergrund
OpenAIs Vorstoß in sicherheitsfokussierte Werkzeuge folgt auf eine Phase erhöhter Prüfung des Verhaltens von KI-Modellen. In den Wochen vor dieser Einführung forderten die Chefs von OpenAI, Anthropic, Google DeepMind und Microsoft gemeinsam den Kongress auf, verpflichtende Screenings für synthetische DNA einzuführen, mit Verweis auf die mögliche Rolle von KI bei Biosicherheitsbedrohungen. Dieser Brief, der Ende Mai und Anfang Juni 2026 bekannt wurde, rückte KI-Sicherheit ins Zentrum der gesetzgeberischen Agenda in Washington.
Die Veröffentlichung des Lockdown-Modus erfolgt zu einem Zeitpunkt, an dem Wettbewerber wie Anthropic den Zugriff auf ihre leistungsfähigsten Modelle ebenfalls stärker einschränken. Anthropic hat den Zugang zu seinem Claude-Mythos-System Anfang dieses Jahres im Rahmen eines freiwilligen Vorab-Prüfungsmodells limitiert.
Die Erweiterung von OpenAIs Sicherheitsfunktionen erfolgt vor der vertraulichen Börsengangsanmeldung des Unternehmens, die am 1. Juni bei der SEC eingereicht wurde. Der Nachweis von Sicherheitskontrollen in Unternehmensqualität dürfte ein wichtiger Faktor für das Vertrauen von Investoren vor einem möglichen Börsengang sein.
Weiterlesen: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push





