OpenAI 推出「鎖定模式」(Lockdown Mode),這項全新的安全功能,旨在保護處理敏感資訊的用戶,免受 prompt injection attacks 影響。公司已於 2026 年 6 月 7 日正式推出這項功能。
根據《The Economic Times》報道,「鎖定模式」專為防禦提示注入而設。提示注入是一種攻擊手法,透過在輸入內容中加入惡意指令,企圖覆蓋或操控 AI 模型的行為。
鎖定模式的作用
提示注入是大型語言模型部署中最常被討論的弱點之一。攻擊者會精心設計輸入內容,指示模型忽略既有指令,或洩露受限制的資訊。「鎖定模式」會施加額外控制,以降低這種風險。
OpenAI 尚未公布今次版本中「鎖定模式」的完整技術實作細節。公司表示,這項功能主要面向處理敏感資料的用戶,推斷目標族群包括企業客戶、研究人員及重視安全的專業人士。
是次發布延續了 OpenAI 一貫的做法:隨著平台被用於越來越高風險的情境,逐步增加存取層級與安全層次。法律、醫療及政府等企業級部署情境,進一步提高了對輸入層級安全控制的需求。
延伸閱讀: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move
背景
OpenAI 把重心轉向安全導向工具,是在外界對 AI 模型行為日益嚴格審視的背景下發生的。在推出鎖定模式前數週,OpenAI、 Anthropic、Google DeepMind 及 Microsoft 的主管曾聯合呼籲美國國會強制推行合成 DNA 篩檢,指出 AI 在生物安全威脅中可能扮演的角色。該聯合信件於 2026 年 5 月底至 6 月初被披露,令 AI 安全議題成為華府立法議程的焦點。
在 OpenAI 發布鎖定模式之際,包括 Anthropic 在內的競爭對手亦收緊了對其最強大模型的存取控制。Anthropic 今年稍早就限制外界存取其 Claude Mythos 系統,作為自願性「預發布審查」框架的一部分。
OpenAI 新增這些安全功能,也正值公司向美國證券交易委員會(SEC)於 6 月 1 日遞交機密 IPO 申請之前。展現具企業級的安全控制能力,預料將有助於在未來可能的公開上市前,提升投資者信心。
下一篇: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push





