OpenAI 推出“锁定模式”以阻止提示注入攻击

OpenAI 推出“锁定模式”以阻止提示注入攻击

OpenAI 推出了“锁定模式”(Lockdown Mode),这是一项新的安全功能,旨在保护处理敏感信息的用户免受prompt injection attacks(提示注入攻击)。公司于 2026 年 6 月 7 日正式上线该功能。

据《经济时报》报道,“锁定模式”旨在防御提示注入攻击。这类攻击会在输入内容中植入恶意指令,试图覆盖或操纵 AI 模型的既有行为。

锁定模式的作用

提示注入是大语言模型部署中被讨论最频繁的安全漏洞之一。攻击者会精心构造输入,指示模型忽略先前的指令,或泄露受限信息。“锁定模式”通过施加额外控制来降低这一风险。

在当前这一轮发布中,OpenAI 尚未公开锁定模式实现方式的完整技术细节。公司将该功能描述为面向管理敏感数据的用户,暗示其目标受众包括企业客户、研究人员以及高度重视安全的专业用户。

此次发布延续了 OpenAI 一贯的做法:随着平台被用于越来越高风险的场景,不断增加访问层级与安全层。法律、医疗、政府等领域的企业级部署,进一步提升了对输入级安全控制的需求。

相关阅读: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move

背景

OpenAI 推出这一安全导向工具,正值外界对 AI 模型行为的审查不断升级之际。在本次发布前的数周,OpenAI、AnthropicGoogle DeepMindMicrosoft 的负责人联合敦促美国国会强制实施合成 DNA 筛查,理由是 AI 可能在生物安全威胁中发挥作用。这封在 2026 年 5 月下旬至 6 月初被报道的公开信,将 AI 安全置于华盛顿立法议程的中心位置。

锁定模式发布之际,竞争对手(包括 Anthropic 在内)也在收紧其最强大模型的访问控制。今年早些时候,Anthropic 将其 Claude Mythos 系统的访问权限加以限制,作为一项自愿的预发布审查框架的一部分。

OpenAI 在安全功能上的加码,也发生在公司向美国证监会(SEC)递交保密 IPO 文件之前。公司已于 6 月 1 日提交材料。展示企业级安全控制能力,很可能会成为提升投资者在潜在公开上市前信心的关键因素之一。

下篇阅读: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。
OpenAI 推出“锁定模式”以阻止提示注入攻击 | Yellow.com