OpenAIの最新モデルGPT-5.5は、自律的に32ステップのcorporate network breachを連鎖させ、およそ10分で12時間分のリバースエンジニアリングパズルを解くことができる。
AISIによるサイバー評価結果
英国科学・イノベーション・技術省の研究機関であるU.K. AI Security Institute(英国AIセキュリティ研究所、AISI)は木曜日、その評価結果を公開した。
研究者らは、GPT-5.5がSpecterOpsと共同で構築した多段階シミュレーション「The Last Ones」を完全に解き切った、2番目のモデルであることを突き止めた。10回の試行のうち2回でこの連鎖を完了させた。
このテストを最初にクリアしたのは、AnthropicのClaude Mythos Previewで、10回中3回の達成だった。AISIは、人間の専門家が同じキルチェーン(4つのサブネットと約20ホストにまたがる)を完了するには、およそ20時間を要すると見積もっている。
エキスパート級タスクでは、GPT-5.5は71.4%の合格率を記録し、68.6%のMythos Previewをわずかに上回り、GPT-5.4(52.4%)を大きく引き離した。
関連記事: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
ジェイルブレイクリスクと政策対応
AISIは、あらゆる悪意あるサイバー関連の問い合わせでモデルのセーフガードを迂回してしまう「汎用ジェイルブレイク」を確認した。このエクスプロイトの開発には、専門のレッドチームによる6時間の作業を要し、設定上の問題によりOpenAIによるパッチの検証は妨げられた。
同機関は、攻撃的なサイバー能力が、推論力や自律性の広範な向上の副産物として現れつつあると警告している。
4月には、AISIによるMythos Previewのレビューが、いかなるフロンティアモデルにとっても初めて企業攻撃レンジをエンドツーエンドで完遂した事例となり、GPT-5.5は単発の飛躍ではなく、トレンドを裏付ける存在として位置づけられた。
次に読む: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





