OpenAI 推出「鎖定模式」,阻擋提示注入攻擊

OpenAI 推出「鎖定模式」,阻擋提示注入攻擊

OpenAI 推出「鎖定模式」(Lockdown Mode),這項全新安全功能旨在保護處理敏感資訊的使用者,免於遭受 prompt injection attacks。該功能已於 2026 年 6 月 7 日正式上線。

根據《The Economic Times》報導,鎖定模式專為防禦提示注入而設計。這種攻擊手法會在輸入中嵌入惡意指令,試圖覆寫或操控 AI 模型的行為。

鎖定模式的作用

提示注入是大型語言模型在部署時最常被討論的弱點之一。攻擊者會精心設計輸入,指示模型忽略先前指令,或洩露受限制的資訊。鎖定模式則施加額外的控管機制,以降低這類風險。

OpenAI 尚未在此次上線中公布鎖定模式完整的技術實作細節。公司僅表示,這項功能主要面向處理敏感資料的使用者,推測對象包括企業客戶、研究人員,以及高度重視安全的專業人士。

這次推出反映出 OpenAI 一貫的做法:隨著平台被用於風險愈來愈高的情境,不斷新增存取等級與安全層級。法律、醫療與政府等領域的企業級部署,都進一步凸顯對輸入層級安全控管的需求。

Also Read: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move

背景

OpenAI 近期加強安全導向工具的布局,是在外界對 AI 模型行為嚴格檢視的背景下發生的。在這項功能推出前數週,OpenAI、AnthropicGoogle DeepMindMicrosoft 的負責人曾聯名呼籲國會強制進行合成 DNA 篩檢,理由是 AI 可能在生物安全威脅中扮演角色。這封於 2026 年 5 月下旬至 6 月初曝光的信函,讓 AI 安全成為華府立法議程的核心議題之一。

鎖定模式發表之際,包括 Anthropic 在內的競爭對手,也都在收緊對其最強大模型的存取控管。Anthropic 今年稍早就已限制對 Claude Mythos 系統的存取,作為自願性「預先發布審查」框架的一環。

OpenAI 此次新增安全功能,正值公司於 6 月 1 日向美國證券交易委員會(SEC)提交機密 IPO 申請之前。能否展現具企業級水準的安全控管,很可能會影響投資人對未來公開上市的信心。

Read Next: Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push

免責聲明與風險警告: 本文提供的資訊僅供教育與參考用途,並基於作者觀點,不構成財務、投資、法律或稅務建議。 加密貨幣資產具有高度波動性並伴隨高風險,包括可能損失全部或大部分投資金額。買賣或持有加密資產可能並不適合所有投資者。 本文中所表達的觀點僅代表作者立場,不代表 Yellow、其創辦人或管理層的官方政策或意見。 請務必自行進行充分研究(D.Y.O.R.),並在做出任何投資決策前諮詢持牌金融專業人士。
OpenAI 推出「鎖定模式」,阻擋提示注入攻擊 | Yellow.com