OpenAI 推出「鎖定模式」阻擋提示注入攻擊

OpenAI 推出「鎖定模式」阻擋提示注入攻擊

OpenAI 推出「鎖定模式」(Lockdown Mode),這項全新的安全功能,旨在保護處理敏感資訊的用戶,免受 prompt injection attacks 影響。公司已於 2026 年 6 月 7 日正式推出這項功能。

根據《The Economic Times》報道,「鎖定模式」專為防禦提示注入而設。提示注入是一種攻擊手法,透過在輸入內容中加入惡意指令,企圖覆蓋或操控 AI 模型的行為。

鎖定模式的作用

提示注入是大型語言模型部署中最常被討論的弱點之一。攻擊者會精心設計輸入內容,指示模型忽略既有指令,或洩露受限制的資訊。「鎖定模式」會施加額外控制,以降低這種風險。

OpenAI 尚未公布今次版本中「鎖定模式」的完整技術實作細節。公司表示,這項功能主要面向處理敏感資料的用戶,推斷目標族群包括企業客戶、研究人員及重視安全的專業人士。

是次發布延續了 OpenAI 一貫的做法:隨著平台被用於越來越高風險的情境,逐步增加存取層級與安全層次。法律、醫療及政府等企業級部署情境,進一步提高了對輸入層級安全控制的需求。

延伸閱讀Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move

背景

OpenAI 把重心轉向安全導向工具,是在外界對 AI 模型行為日益嚴格審視的背景下發生的。在推出鎖定模式前數週,OpenAI、 AnthropicGoogle DeepMindMicrosoft 的主管曾聯合呼籲美國國會強制推行合成 DNA 篩檢,指出 AI 在生物安全威脅中可能扮演的角色。該聯合信件於 2026 年 5 月底至 6 月初被披露,令 AI 安全議題成為華府立法議程的焦點。

在 OpenAI 發布鎖定模式之際,包括 Anthropic 在內的競爭對手亦收緊了對其最強大模型的存取控制。Anthropic 今年稍早就限制外界存取其 Claude Mythos 系統,作為自願性「預發布審查」框架的一部分。

OpenAI 新增這些安全功能,也正值公司向美國證券交易委員會(SEC)於 6 月 1 日遞交機密 IPO 申請之前。展現具企業級的安全控制能力,預料將有助於在未來可能的公開上市前,提升投資者信心。

下一篇Tencent Hires Former OpenAI Researcher Yao Shunyu As Chief AI Scientist In AGI Push

免責聲明及風險提示: 本文資訊僅供教育與參考之用,並基於作者意見,並不構成金融、投資、法律或稅務建議。 加密貨幣資產具高度波動性並伴隨高風險,可能導致投資大幅虧損或全部損失,並非適合所有投資者。 文章內容僅代表作者觀點,不代表 Yellow、創辦人或管理層立場。 投資前請務必自行徹底研究(D.Y.O.R.),並諮詢持牌金融專業人士。