Claude MythosとGPT-5.5が静かにサイバー防御の前提を塗り替えた理由

Anthropic's Claude Mythos Preview と OpenAI's GPT-5.5 という2つの最前線AIモデルが、自律型サイバータスクを従来予測を大きく上回るペースでこなしつつあると、研究者らが水曜日に報告した。

フロンティアモデルがトレンドを凌駕

Claude Mythos PreviewとGPT-5.5は、英国の AI Security Institute（AISI） が2024年末から追跡してきた倍増トレンドを上回る成果を示した。

AISIは今年初め、サイバー攻撃における「80%信頼性」達成までの時間軸が、2025年11月の8カ月から、約5カ月ごとに半減していると推計していた。新しいチェックポイント版のMythos Previewは、32段階の企業ネットワーク攻撃シミュレーション「The Last Ones」を10回中6回で攻略し、さらに「Cooling Tower」も10回中3回で完了した。GPT-5.5も「The Last Ones」を10回中3回クリアしている。

両方のAISIレンジを完遂したのは、これらが初のモデルとなる。

パロアルトが「Vulnpocalypse」を警告

Palo Alto Networksも、自社テストを通じて同様の結論を示した。

同社は過去1カ月で130を超える製品をスキャンし、通常の月次件数の7倍以上となる75件の正当な脆弱性を発見し、すべてすでにパッチ適用済みだという。

同社のCTOである Lee Klarich 氏は、組織が攻撃者と同水準の能力を持たれるまでの猶予はごくわずかだと述べた。

彼は「組織が敵対者を上回れる猶予は、わずか3〜5カ月しかない」と見積もっている。

AISIは、サンプル数はいまだ小さく、最難関タスクについては人間との比較データも限られていると注意を促している。それでも、どれか1つのモデルを分析から外しても、倍増ペースの推計値は1カ月未満しか変動しないという。ソフトウェアタスクにおけるAI性能を追跡する非営利団体 METR も、おおむね4カ月前後というほぼ同一の数値に到達している。

能力カーブの急峻化

Anthropicは先月、初期のMythosロールアウトを、Palo Alto Networks、CrowdStrike、Amazon、Apple、JPMorgan など限られた企業グループに限定した。

OpenAIもGPT-5.5-Cyberモデルと「Daybreak」サイバーイニシアチブで追随した。

過去18カ月で能力向上のペースは急激に増している。AISIは2026年2月、能力倍増期間の予測を8カ月から4.7カ月へと短縮し、今回のラウンド後にさらに圧縮した。再試算された数値は現在、約4カ月に近づいており、ソフトウェアエンジニアリングタスクに関するMETRの読みとほぼ重なる。

次に読む: Coinbase Opens $100K USDC Loans Against Solana Token Holdings