OpenAI 推出全新的安全功能「鎖定模式」(Lockdown Mode),旨在保護處理敏感資訊的用戶,防禦 prompt injection attacks。該功能於 2026 年 6 月 7 日正式上線。
根據《The Economic Times》報道,「鎖定模式」是為了防禦提示注入攻擊而設計。這類攻擊會在輸入中嵌入惡意指令,企圖覆蓋或操控 AI 模型的行為。
鎖定模式的作用
提示注入是大型語言模型部署中最常被討論的弱點之一。攻擊者會精心設計輸入,指示模型忽略先前的指令,或洩露受限制的資訊。「鎖定模式」透過加入額外管控措施來降低這類風險。
OpenAI 目前尚未公開本次推出版本中「鎖定模式」的完整技術細節。公司僅表示,這項功能鎖定的是管理敏感數據的用戶族群,推測包括企業客戶、研究人員及重視安全的專業人士。
這次發佈延續了 OpenAI 在產品中分層提供存取權限與安全防護的策略,隨著平台被用於越來越高風險的場景,安全層級也持續提升。特別是在法律、醫療及政府等企業部署場景中,對輸入層級安全控制的需求愈發迫切。
延伸閱讀: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move
背景
OpenAI 近期積極推出聚焦安全的工具,正值外界對 AI 模型行為的審視愈趨嚴格。在「鎖定模式」推出前數週,OpenAI、Anthropic、Google DeepMind 與 Microsoft 的負責人曾聯名呼籲美國國會強制要求合成 DNA 篩檢,理由是 AI 可能在生物安全威脅中扮演角色。該聯名信於 2026 年 5 月下旬至 6 月初被披露,使 AI 安全議題成為華府立法討論的焦點。
「鎖定模式」發布之際,包括 Anthropic 在內的競爭對手也相繼收緊其最強大模型的存取管控。Anthropic 今年稍早就已限制對其 Claude Mythos 系統的存取,作為自願性預先發布審查框架的一部分。
OpenAI 在安全功能上的擴充,恰逢公司於 6 月 1 日向美國證監會(SEC)遞交保密 IPO 申請之前。展示企業級的安全控制能力,很可能會成為提升投資者信心、為潛在公開上市鋪路的關鍵因素之一。
接下來閱讀: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push





