OpenAI 推出「鎖定模式」(Lockdown Mode),這項全新安全功能旨在保護處理敏感資訊的使用者,免於遭受 prompt injection attacks。該功能已於 2026 年 6 月 7 日正式上線。
根據《The Economic Times》報導,鎖定模式專為防禦提示注入而設計。這種攻擊手法會在輸入中嵌入惡意指令,試圖覆寫或操控 AI 模型的行為。
鎖定模式的作用
提示注入是大型語言模型在部署時最常被討論的弱點之一。攻擊者會精心設計輸入,指示模型忽略先前指令,或洩露受限制的資訊。鎖定模式則施加額外的控管機制,以降低這類風險。
OpenAI 尚未在此次上線中公布鎖定模式完整的技術實作細節。公司僅表示,這項功能主要面向處理敏感資料的使用者,推測對象包括企業客戶、研究人員,以及高度重視安全的專業人士。
這次推出反映出 OpenAI 一貫的做法:隨著平台被用於風險愈來愈高的情境,不斷新增存取等級與安全層級。法律、醫療與政府等領域的企業級部署,都進一步凸顯對輸入層級安全控管的需求。
Also Read: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move
背景
OpenAI 近期加強安全導向工具的布局,是在外界對 AI 模型行為嚴格檢視的背景下發生的。在這項功能推出前數週,OpenAI、Anthropic、Google DeepMind 與 Microsoft 的負責人曾聯名呼籲國會強制進行合成 DNA 篩檢,理由是 AI 可能在生物安全威脅中扮演角色。這封於 2026 年 5 月下旬至 6 月初曝光的信函,讓 AI 安全成為華府立法議程的核心議題之一。
鎖定模式發表之際,包括 Anthropic 在內的競爭對手,也都在收緊對其最強大模型的存取控管。Anthropic 今年稍早就已限制對 Claude Mythos 系統的存取,作為自願性「預先發布審查」框架的一環。
OpenAI 此次新增安全功能,正值公司於 6 月 1 日向美國證券交易委員會(SEC)提交機密 IPO 申請之前。能否展現具企業級水準的安全控管,很可能會影響投資人對未來公開上市的信心。
Read Next: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push





