新闻学习研究排名生态系统

平台现已上线

yellow bottom left star road

OpenAI 推出“锁定模式”以阻止提示注入攻击

Murtuza MerchantJun, 07 2026 15:05

#OpenAI #AI #ChatGPT #Anthropic #谷歌 #微软 #Claude Mythos

OpenAI 推出“锁定模式”以阻止提示注入攻击

OpenAI 推出了“锁定模式”（Lockdown Mode），这是一项新的安全功能，旨在保护处理敏感信息的用户免受prompt injection attacks（提示注入攻击）。公司于 2026 年 6 月 7 日正式上线该功能。

据《经济时报》报道，“锁定模式”旨在防御提示注入攻击。这类攻击会在输入内容中植入恶意指令，试图覆盖或操纵 AI 模型的既有行为。

锁定模式的作用

提示注入是大语言模型部署中被讨论最频繁的安全漏洞之一。攻击者会精心构造输入，指示模型忽略先前的指令，或泄露受限信息。“锁定模式”通过施加额外控制来降低这一风险。

在当前这一轮发布中，OpenAI 尚未公开锁定模式实现方式的完整技术细节。公司将该功能描述为面向管理敏感数据的用户，暗示其目标受众包括企业客户、研究人员以及高度重视安全的专业用户。

此次发布延续了 OpenAI 一贯的做法：随着平台被用于越来越高风险的场景，不断增加访问层级与安全层。法律、医疗、政府等领域的企业级部署，进一步提升了对输入级安全控制的需求。

相关阅读: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move

背景

OpenAI 推出这一安全导向工具，正值外界对 AI 模型行为的审查不断升级之际。在本次发布前的数周，OpenAI、Anthropic、Google DeepMind 和 Microsoft 的负责人联合敦促美国国会强制实施合成 DNA 筛查，理由是 AI 可能在生物安全威胁中发挥作用。这封在 2026 年 5 月下旬至 6 月初被报道的公开信，将 AI 安全置于华盛顿立法议程的中心位置。

锁定模式发布之际，竞争对手（包括 Anthropic 在内）也在收紧其最强大模型的访问控制。今年早些时候，Anthropic 将其 Claude Mythos 系统的访问权限加以限制，作为一项自愿的预发布审查框架的一部分。

OpenAI 在安全功能上的加码，也发生在公司向美国证监会（SEC）递交保密 IPO 文件之前。公司已于 6 月 1 日提交材料。展示企业级安全控制能力，很可能会成为提升投资者在潜在公开上市前信心的关键因素之一。

下篇阅读: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push

免责声明和风险警告：本文提供的信息仅用于教育和信息目的，基于作者的意见。它不构成财务、投资、法律或税务建议。加密货币资产具有高度波动性并面临高风险，包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。本文表达的观点仅为作者的观点，不代表Yellow、其创始人或高管的官方政策或立场。在做出任何投资决定之前，请务必进行自己的全面研究（D.Y.O.R.）并咨询持牌金融专业人士。

相关新闻

研究发现四大 AI 实验室使用不兼容的提示注入度量标准

四大实验室在提示注入测试条件、攻击类型与成功率定义等方面各用一套标准，缺乏统一框架导致企业难以横向比较风险。

思科研究显示前沿 AI 模型在多轮攻击下频频失守

思科对 15 个前沿封闭模型进行多轮对话攻防测试，发现所有模型在一定复杂度下都可被绕过，最高成功率达 88%，对企业安全评估提出挑战。

人工智能是否正接近无法回头的临界点？Anthropic 呼吁建立“暂停框架”

Anthropic 警告 AI 或将递归自我改进，呼吁头部实验室预先约定触发条件和机制，在安全风险升级时协调减速或暂停开发。

OpenAI 最强 GPT-5.6 模型上架，却被关在“锁着的门”后面

OpenAI 预览三款 GPT-5.6 模型，在编程、生物与网络安全上大幅提升，但因高风险评估，当前仅向少数合作伙伴开放使用。

OpenAI 准备用 GPT-5.6 挑战 Anthropic「Mythos」，却被白宫叫停

据称白宫要求限制 GPT-5.6 首次发布，访问需获政府批准，凸显美国从自愿协作转向更严监管前沿模型。

相关研究文章

42 个州已对 OpenAI 发起调查，华尔街紧盯其 IPO

42 个州在 OpenAI 提交 8,520 亿美元估值 IPO 后迅速发起调查，聚焦 AI 安全、用户数据与非营利转制，或拖慢上市进程。

OpenAI 与 Anthropic：谁能在长期夺得「AI 王冠」？

同出一源的两大实验室，在估值、营收、算力与监管缠斗中分化：OpenAI 押注消费级规模与生态， Anthropic 押注企业信任与盈利能力。

Claude Mythos 与加密货币：全新 AI 威胁对交易意味着什么

Anthropic 的 Claude Mythos 发现数千零日漏洞却因风险过高未公开，在加密行业已损失 33 亿美元背景下，加剧安全与集中化压力。

Claude Mythos 将如何重塑金融与加密行业

Anthropic 的前沿模型 Claude Mythos 通过 Project Glasswing 限制性开放，凸显其在发现高危漏洞上的能力，对银行及加密基础设施安全和市场稳定构成深远影响。

AI 赛道复苏：Bittensor 大涨 117% 能否带动板块回归？

Bittensor 带动 AI 代币单日暴涨，但整个板块在 2025 年大跌后仍低于高点一半，AI 叙事能否转为长期投资逻辑仍存疑。

相关学习文章

去中心化 AI 正在改写谁掌控驱动 Web3 的模型话语权

去中心化 AI 把“模型当资产”，用链上所有权、激励和密码学证明，重构训练与推理市场，试图为 Web3 打造开放的 AI 基础设施。

去中心化 AI 能保护你的提示隐私吗？

隐私 AI 网络通过去中心化节点执行推理，避免单一方看到完整提示与回复，并用密码学与硬件安全保障私密性与可验证性。

为什么没有自有区块链层的 AI 代理无法实现规模化

AI 代理正实际管理资金并跨链操作，但传统为人类设计的钱包在密钥托管、Gas 机制和账户模型上都不适配机器。新一代链上基础设施正围绕代理账户、免Gas执行和意图路由重构。

如何利用 AI 工具进行加密投资研究： 2025 完整指南

2025年，AI 驱动的加密货币投资研究带来巨变，为投资者创造了前所未有的机会。

如何使用 AI 股票交易机器人：免费工具与真实风险

零代码平台让散户用自然语言搭建与回测策略，但多为规则引擎而非真正智能。纸上交易与小资金分阶段试错最安全。

OpenAI 推出“锁定模式”以阻止提示注入攻击 | Yellow