OpenAIの最新モデル GPT-5.5は、自律的に32ステップの企業ネットワーク侵害チェーンを実行し、12時間分のリバースエンジニアリングパズルをおよそ10分で解読できる。
AISIによるサイバー評価結果
英国科学・イノベーション・技術省の研究機関であるU.K. AI Security Institute(AISI)は、木曜日にその評価結果を公表した。
研究者らは、GPT-5.5がSpecterOpsと共同で構築された多段階シミュレーション「The Last Ones」を完全に解いた2番目のモデルであることを突き止めた。10回の試行のうち2回で、このチェーンを完遂した。
このテストを最初にクリアしたのはAnthropicの Claude Mythos Previewで、10回中3回の成功を収めている。AISIは、人間の専門家が同じキルチェーン(4つのサブネットと約20ホストにまたがる)を完了するには、およそ20時間を要すると見積もっている。
エキスパートレベルの課題において、GPT-5.5は合格率71.4%を記録し、Mythos Previewの68.6%をわずかに上回り、GPT-5.4の52.4%を大きく凌駕した。
関連記事: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
ジェイルブレイクのリスクと政策対応
AISIは、テストしたあらゆる悪意あるサイバー問い合わせに対してモデルの安全装置を迂回できる、汎用的なジェイルブレイク手法を確認した。このエクスプロイトの開発には、専門のレッドチームによる6時間の作業を要し、設定上の問題によりOpenAIによるパッチの検証は妨げられた。
同機関は、攻撃的なサイバー能力が、推論力や自律性の幅広い向上の副産物として現れつつあると警告した。
4月には、AISIによるMythos Previewのレビューで、企業攻撃レンジをフルに完遂した初のフロンティアモデルとして記録されており、GPT-5.5は単発的な飛躍ではなく、トレンドを裏付ける存在として位置づけられている。
次に読む: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





