OpenAI 推出了“锁定模式”,这是一项新的安全功能,旨在保护处理敏感信息的用户,免受 prompt injection attacks 的影响。公司于 2026 年 6 月 7 日正式上线该功能。
据《经济时报》报道,“锁定模式”旨在防御提示注入,这是一种攻击方式:攻击者在输入中嵌入恶意指令,试图覆盖或操纵 AI 模型的行为。
锁定模式的作用
提示注入是大规模语言模型部署中被讨论最频繁的安全隐患之一。攻击者会精心构造输入,指示模型忽略先前的指令或泄露受限信息。“锁定模式”通过额外的控制措施来降低这一风险。
在当前这一轮发布中,OpenAI 尚未公开“锁定模式”实现方式的完整技术细节。公司将这一功能描述为面向处理敏感数据的用户,推测其受众包括企业客户、研究人员以及重视安全的专业人士。
这一发布延续了 OpenAI 的一贯路径:随着平台被用于越来越高风险的场景,不断叠加访问层级和安全层。法律、医疗和政府等领域的企业部署,进一步凸显了对输入级安全控制的需求。
相关阅读: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move
背景
OpenAI 在安全工具方面的推进,发生在外界对 AI 模型行为高度审视的阶段。在本次发布前的数周内,OpenAI、Anthropic、Google DeepMind 和 Microsoft 的负责人联合敦促美国国会强制实行合成 DNA 筛查,理由是 AI 可能在生物安全威胁中扮演角色。该联名信在 2026 年 5 月下旬至 6 月初被媒体披露,使 AI 安全成为华盛顿立法议程的中心议题。
在 OpenAI 发布“锁定模式”的同时,包括 Anthropic 在内的竞争对手也在收紧其最强大模型的访问控制。Anthropic 在今年早些时候,依据一套自愿性的预发布审查框架,限制了其 Claude Mythos 系统的访问权限。
OpenAI 增加安全功能之际,公司还在推进上市进程:其向美国证监会(SEC)提交的保密 IPO 申请已于 6 月 1 日递交。在任何公开发行之前,展示企业级安全控制能力,很可能会成为影响投资者信心的重要因素。
下篇阅读: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push





