OpenAI 推出了“锁定模式”(Lockdown Mode),这是一项新的安全功能,旨在保护处理敏感信息的用户免受prompt injection attacks(提示注入攻击)。公司于 2026 年 6 月 7 日正式上线该功能。
据《经济时报》报道,“锁定模式”旨在防御提示注入攻击。这类攻击会在输入内容中植入恶意指令,试图覆盖或操纵 AI 模型的既有行为。
锁定模式的作用
提示注入是大语言模型部署中被讨论最频繁的安全漏洞之一。攻击者会精心构造输入,指示模型忽略先前的指令,或泄露受限信息。“锁定模式”通过施加额外控制来降低这一风险。
在当前这一轮发布中,OpenAI 尚未公开锁定模式实现方式的完整技术细节。公司将该功能描述为面向管理敏感数据的用户,暗示其目标受众包括企业客户、研究人员以及高度重视安全的专业用户。
此次发布延续了 OpenAI 一贯的做法:随着平台被用于越来越高风险的场景,不断增加访问层级与安全层。法律、医疗、政府等领域的企业级部署,进一步提升了对输入级安全控制的需求。
相关阅读: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move
背景
OpenAI 推出这一安全导向工具,正值外界对 AI 模型行为的审查不断升级之际。在本次发布前的数周,OpenAI、Anthropic、Google DeepMind 和 Microsoft 的负责人联合敦促美国国会强制实施合成 DNA 筛查,理由是 AI 可能在生物安全威胁中发挥作用。这封在 2026 年 5 月下旬至 6 月初被报道的公开信,将 AI 安全置于华盛顿立法议程的中心位置。
锁定模式发布之际,竞争对手(包括 Anthropic 在内)也在收紧其最强大模型的访问控制。今年早些时候,Anthropic 将其 Claude Mythos 系统的访问权限加以限制,作为一项自愿的预发布审查框架的一部分。
OpenAI 在安全功能上的加码,也发生在公司向美国证监会(SEC)递交保密 IPO 文件之前。公司已于 6 月 1 日提交材料。展示企业级安全控制能力,很可能会成为提升投资者在潜在公开上市前信心的关键因素之一。
下篇阅读: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push





