研究で判明：4大AIラボが互換性のないプロンプトインジェクション指標を使用

Anthropic、OpenAI、Google、Metaはそれぞれ2026年にプロンプトインジェクションに関する開示を公表したが、6月1日にVentureBeatが発表した比較結果では、同じ指標で測定している企業は一つもないことが判明した。

この不整合により、エンタープライズのセキュリティチームはモデル間でリスクを比較することが難しくなっている。makes

開示が示したもの

VentureBeatの分析はAnthropicのブラウザエージェントを対象にしており、安全対策が作動する前にテストシナリオの31%でハイジャックされたことが分かった。他の3つのラボは、異なるテスト条件、攻撃手法、成功率の定義を開示している。

Anthropicはブラウザエージェントのハイジャック率を測定した。一方、他のラボはツール呼び出しコンテキストにおける間接的なインジェクションや、文書要約タスクに焦点を当てていた。4つの報告のいずれも、共通のフレームワークや共通の敵対的テストスイートを使用していなかった。

本番利用に向けてAIエージェントを評価するエンタープライズの購買担当者には、標準化された比較基準が存在しない。あるラボの定義に基づくとインジェクション率が低く見えるモデルでも、別のラボのテスト設計ではより大きな曝露に直面する可能性がある。

Also Read: OpenAI Model Cracks An 80-Year Math Problem No Human Could Solve

背景

プロンプトインジェクションは、チャットボットから、メール送信、コード実行、外部API呼び出しといった実際の行動が可能な自律型システムへとAIエージェントが進化する中で、脅威カテゴリとして認識されるようになった。注入された指示によって、エージェントは本来の想定範囲外の行動を取るよう誘導されうる。

2025年には、文書処理エージェントに関連するプロンプトインジェクション事案がいくつかのエンタープライズ導入環境で発生した。いずれも大規模な侵害にまでは至らなかったものの、標準化された開示要件を求める声が高まるきっかけとなった。AIエージェントの脆弱性に関する共通の報告フォーマットを義務付けた規制当局は、いまだ存在しない。

2026年に公表された4つの開示は、ラボ側の自発的な透明性向上の取り組みを示している。VentureBeatは、共通の標準が欠如している状況は、CVEシステムが整備される前のソフトウェア脆弱性開示の初期の課題とよく似ていると指摘している。

Also Read: Anthropic Overtakes OpenAI As World's Most Valuable AI Startup At $965B

セキュリティチームが取るべき対応

VentureBeatのレポートは、セキュリティチームに対し、見出しとなる数値を他社と比較するのではなく、各ラボの開示をそれぞれ独立したものとして扱うよう助言している。チームは、エージェントを機密性の高いワークフローに導入する前に、テスト手法の詳細を開示するよう求めるべきだ。

報告公表と同時に、AI agentのセキュリティ開示を標準化するための規制措置は何も発表されなかった。業界団体や規制当局が共通のフレームワークを義務付けない限り、この乖離は今後も続くと見られる。