GPT-5.5、32段階サイバー攻撃でClaude Mythosに匹敵 英AISIが報告

GPT-5.5、32段階サイバー攻撃でClaude Mythosに匹敵 英AISIが報告

OpenAIの最新モデルGPT-5.5は、自律的に32ステップのcorporate network breachを連鎖させ、およそ10分で12時間分のリバースエンジニアリングパズルを解くことができる。

AISIによるサイバー評価結果

英国科学・イノベーション・技術省の研究機関であるU.K. AI Security Institute(英国AIセキュリティ研究所、AISI)は木曜日、その評価結果を公開した

研究者らは、GPT-5.5がSpecterOpsと共同で構築した多段階シミュレーション「The Last Ones」を完全に解き切った、2番目のモデルであることを突き止めた。10回の試行のうち2回でこの連鎖を完了させた

このテストを最初にクリアしたのは、AnthropicのClaude Mythos Previewで、10回中3回の達成だった。AISIは、人間の専門家が同じキルチェーン(4つのサブネットと約20ホストにまたがる)を完了するには、およそ20時間を要すると見積もっている。

エキスパート級タスクでは、GPT-5.5は71.4%の合格率を記録し、68.6%のMythos Previewをわずかに上回り、GPT-5.4(52.4%)を大きく引き離した。

関連記事: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning

ジェイルブレイクリスクと政策対応

AISIは、あらゆる悪意あるサイバー関連の問い合わせでモデルのセーフガードを迂回してしまう「汎用ジェイルブレイク」を確認した。このエクスプロイトの開発には、専門のレッドチームによる6時間の作業を要し、設定上の問題によりOpenAIによるパッチの検証は妨げられた。

同機関は、攻撃的なサイバー能力が、推論力や自律性の広範な向上の副産物として現れつつあると警告している。

4月には、AISIによるMythos Previewのレビューが、いかなるフロンティアモデルにとっても初めて企業攻撃レンジをエンドツーエンドで完遂した事例となり、GPT-5.5は単発の飛躍ではなく、トレンドを裏付ける存在として位置づけられた。

次に読む: Crypto VC Funding Crashes To $659M In April, A 2-Year Low

免責事項とリスク警告: この記事で提供される情報は教育および情報提供のみを目的としており、著者の意見に基づいています。金融、投資、法的、または税務上のアドバイスを構成するものではありません。 暗号資産は非常に変動性が高く、投資の全部または相当な部分を失うリスクを含む高いリスクにさらされています。暗号資産の取引または保有は、すべての投資家に適しているとは限りません。 この記事で表明された見解は著者のものであり、Yellow、その創設者、または役員の公式な方針や立場を表すものではありません。 投資決定を行う前に、常にご自身で十分な調査(D.Y.O.R.)を行い、ライセンスを持つ金融専門家にご相談ください。
関連ニュース
関連する研究記事
GPT-5.5、32段階サイバー攻撃でClaude Mythosに匹敵 英AISIが報告 | Yellow.com