OpenAI 推出“锁定模式”以阻止提示注入攻击

OpenAI 推出“锁定模式”以阻止提示注入攻击

OpenAI 推出了“锁定模式”,这是一项新的安全功能,旨在保护处理敏感信息的用户,免受 prompt injection attacks 的影响。公司于 2026 年 6 月 7 日正式上线该功能。

据《经济时报》报道,“锁定模式”旨在防御提示注入,这是一种攻击方式:攻击者在输入中嵌入恶意指令,试图覆盖或操纵 AI 模型的行为。

锁定模式的作用

提示注入是大规模语言模型部署中被讨论最频繁的安全隐患之一。攻击者会精心构造输入,指示模型忽略先前的指令或泄露受限信息。“锁定模式”通过额外的控制措施来降低这一风险。

在当前这一轮发布中,OpenAI 尚未公开“锁定模式”实现方式的完整技术细节。公司将这一功能描述为面向处理敏感数据的用户,推测其受众包括企业客户、研究人员以及重视安全的专业人士。

这一发布延续了 OpenAI 的一贯路径:随着平台被用于越来越高风险的场景,不断叠加访问层级和安全层。法律、医疗和政府等领域的企业部署,进一步凸显了对输入级安全控制的需求。

相关阅读: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move

背景

OpenAI 在安全工具方面的推进,发生在外界对 AI 模型行为高度审视的阶段。在本次发布前的数周内,OpenAI、AnthropicGoogle DeepMindMicrosoft 的负责人联合敦促美国国会强制实行合成 DNA 筛查,理由是 AI 可能在生物安全威胁中扮演角色。该联名信在 2026 年 5 月下旬至 6 月初被媒体披露,使 AI 安全成为华盛顿立法议程的中心议题。

在 OpenAI 发布“锁定模式”的同时,包括 Anthropic 在内的竞争对手也在收紧其最强大模型的访问控制。Anthropic 在今年早些时候,依据一套自愿性的预发布审查框架,限制了其 Claude Mythos 系统的访问权限。

OpenAI 增加安全功能之际,公司还在推进上市进程:其向美国证监会(SEC)提交的保密 IPO 申请已于 6 月 1 日递交。在任何公开发行之前,展示企业级安全控制能力,很可能会成为影响投资者信心的重要因素。

下篇阅读: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。
OpenAI 推出“锁定模式”以阻止提示注入攻击 | Yellow.com