OpenAI führt Lockdown‑Modus ein, um Prompt-Injection-Angriffe zu blockieren

OpenAI hat den Lockdown‑Modus eingeführt, eine neue Sicherheitsfunktion, die darauf abzielt, Nutzer zu schützen, die mit sensiblen Informationen arbeiten, vor prompt injection attacks. Das Unternehmen hat die Funktion am 7. Juni 2026 ausgerollt.

Laut The Economic Times wurde der Lockdown‑Modus entwickelt, um sich gegen Prompt-Injection zu verteidigen – eine Angriffsmethode, bei der bösartige Anweisungen in Eingaben eingebettet werden, um das Verhalten des KI-Modells zu überschreiben oder zu manipulieren.

Was der Lockdown‑Modus macht

Prompt-Injection zählt zu den am häufigsten diskutierten Schwachstellen beim Einsatz großer Sprachmodelle. Angreifer formulieren Eingaben, die das Modell dazu auffordern, frühere Anweisungen zu ignorieren oder eingeschränkte Informationen preiszugeben. Der Lockdown‑Modus wendet zusätzliche Kontrollen an, um dieses Risiko zu verringern.

OpenAI hat in der aktuellen Einführungsphase noch keine vollständige technische Aufschlüsselung der Implementierung des Lockdown‑Modus veröffentlicht. Das Unternehmen beschreibt die Funktion als ausgerichtet auf Nutzer, die mit sensiblen Daten arbeiten – darunter vermutlich Unternehmenskunden, Forschende und sicherheitsbewusste Fachkräfte.

Die Einführung spiegelt ein Muster bei OpenAI wider, zusätzliche Zugriffsstufen und Sicherheitslayer hinzuzufügen, während die Plattform zunehmend kritische Anwendungsfälle unterstützt. Insbesondere Unternehmensanwendungen in den Bereichen Recht, Gesundheitswesen und öffentlicher Sektor haben den Bedarf an sichereren Eingabekontrollen erhöht.

Auch lesen: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move

Hintergrund

OpenAIs Vorstoß in sicherheitsorientierte Werkzeuge folgt auf eine Phase erhöhter Aufmerksamkeit für das Verhalten von KI-Modellen. In den Wochen vor dieser Einführung forderten die Chefs von OpenAI, Anthropic, Google DeepMind und Microsoft gemeinsam den Kongress auf, verpflichtende Tests für synthetische DNA einzuführen, wobei sie auf die mögliche Rolle von KI bei Biosicherheitsbedrohungen verwiesen. Dieser Brief, der Ende Mai und Anfang Juni 2026 bekannt wurde, rückte KI-Sicherheit in den Mittelpunkt der legislativen Agenda in Washington.

Die Veröffentlichung des Lockdown‑Modus erfolgt zu einem Zeitpunkt, an dem Wettbewerber wie Anthropic ebenfalls die Zugriffskontrollen für ihre leistungsfähigsten Modelle verschärft haben. Anthropic hat den Zugang zu seinem Claude-Mythos-System Anfang dieses Jahres im Rahmen eines freiwilligen Prüf- und Vorabfreigabeprozesses eingeschränkt.

Die neuen Sicherheitsfunktionen von OpenAI erscheinen vor dem vertraulichen Börsengangsantrag des Unternehmens, der am 1. Juni bei der SEC eingereicht wurde. Der Nachweis sicherer, unternehmensorientierter Sicherheitskontrollen dürfte ein wichtiger Faktor für das Vertrauen der Investoren vor einem möglichen Börsengang sein.

Als Nächstes lesen: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push