Yellow.com

Anthropic、OpenAI、Google 和 Meta 在 2026 年各自發布了有關提示注入的披露報告，但 VentureBeat 於 6 月 1 日發表的比較指出，沒有兩家公司採用相同的量度指標。

這種不一致 makes 令企業資安團隊難以在不同模型之間比較風險。

披露內容顯示了什麼

VentureBeat 的分析涵蓋了 Anthropic 的瀏覽器代理（browser agent），該代理在安全防護啟動前，在 31% 的測試情境中被劫持。其餘三間實驗室則披露了不同的測試條件、攻擊類型及成功率定義。

Anthropic 量度的是瀏覽器代理被劫持的比率；其他實驗室則專注於工具呼叫情境中的間接提示注入，或文件摘要任務中的注入問題。四份報告都沒有採用共同的框架或共享的對抗性測試套件。

正在評估投入生產環境的 AI 代理的企業買家，缺乏一個標準化的比較基準。在一間實驗室定義下顯示「注入率偏低」的模型，換到另一間實驗室的測試設計下，暴露風險可能顯著提高。

延伸閱讀： OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve

背景

隨着 AI 代理從純粹聊天機器人，進化為能執行實際行動（例如發送電郵、執行程式碼、呼叫外部 API）的自主系統，「提示注入」被正式視為一種威脅類別。被注入的指令可以將代理重導至超出預期範圍的行為。

2025 年，多個企業部署的文件處理代理發生了提示注入事件。雖然沒有任何一宗擴大成為重大外洩，但這些事件促使業界呼籲建立標準化的披露要求。目前仍沒有監管機構強制訂立 AI 代理弱點的共同回報格式。

2026 年發表的四份披露屬於實驗室自願性的透明化舉措。VentureBeat 指出，缺乏共同標準的情況，與 CVE 系統建立前，軟件弱點披露早期所面對的挑戰頗為相似。

延伸閱讀： Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B

資安團隊應該怎麼做

VentureBeat 的報告建議資安團隊應按各實驗室披露本身的定義與前設來解讀，而不要只比較表面的數字。團隊在將代理部署於敏感工作流程前，應主動要求對方提供詳細的測試方法論。

報告發布時，尚未有任何針對標準化 AI agent 安全披露的監管行動同步公布。這種分歧很可能會持續，直至有行業組織或監管機構強制訂立共同框架為止。

下一步閱讀： North Korea Drained $577M From Global Crypto Theft In 2026 So Far

Murtuza Merchant

Murtuza 是一位資深財經記者，在加密貨幣與區塊鏈技術領域擁有豐富的採訪與報導經驗。他曾為 Benzinga 和 Cointelegraph 等多家媒體撰稿，專注報導新興趨勢、監管環境等主題。你可以在 Twitter 上透過 @murtuza_merc，或在 Telegram 上透過 mmerchant001 找到他。 Disclosure: Murtuza holds ATOM, AKT, TIA, INJ, and OSMO.

研究發現四大 AI 實驗室使用的提示注入指標互不相容

披露內容顯示了什麼

背景

資安團隊應該怎麼做

Murtuza Merchant