A new checkpoint of Anthropic's Claude Mythos Preview が、英国政府のサイバー攻撃シミュレーション2種をともにクリアした初のAIモデルとなり、自律的なハッキングをめぐる新たな懸念を呼んでいる。
AISI、Mythosのブレークスルーを報告
英国の AI Security Institute は水曜日の報告で、新しいMythosチェックポイントが、企業ネットワーク攻撃レンジ「The Last Ones」の32ステップ全行程を10回の試行のうち6回完了したと明らかにした。以前のバージョンは10回中3回にとどまっていた。
この更新版モデルは、これまでどのモデルも突破できなかった産業用制御システムレンジ「Cooling Tower」も10回中3回クリアした。
競合の OpenAI 製GPT-5.5も同じ演習でテストされ、「The Last Ones」を10回中3回解決したものの、「Cooling Tower」は完了できなかった。
AISIは、1回の試行あたり1億トークンの計算予算でレンジを実行しており、その上限付近でも性能が伸び続けていたことから、より高い計算予算を与えれば成功率がさらに上がる可能性を指摘している。
Also Read: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok
能力の「倍化時間」はさらに短縮
AISIは、モデルが80%の信頼性で完了できる自律タスクの時間的な長さを測る「タイムホライズン」ベンチマークを用いて、サイバー分野での進歩を追跡している。2025年11月、同機関は倍化時間を8カ月と推定していたが、2026年2月にはそれが4.7カ月まで圧縮され、その後MythosとGPT-5.5はいずれも、このより速いトレンドを上回る結果を示している。
ただし今回の最新結果が、新たな加速トレンドを示しているのか、それとも一時的な飛躍に過ぎないのかについて、同機関は不確実性を認めている。
サイバー演習ではなくソフトウェア開発タスクに焦点を当ててAIを追跡している非営利研究機関METRも、ほぼ4.2カ月という類似の値を出している。AISIは、この一致が特定の評価スイートに固有の偏りではなく、実際の能力向上を反映しているという見方を補強すると述べた。
ただし同研究所は、自身のサイバーレンジには能動的な防御者が存在しないため、今回の結果は、堅牢に防御されたエンタープライズシステムではなく、防御が手薄なネットワークに対してモデルがどこまでできるかを示すものだと強調した。
能力ジャンプが重要な理由
新しいMythosチェックポイントは、新たなモデルリリースとともにもたらされたわけではない。AISIは、Anthropicが先月、そのセキュリティ提携プログラム「Project Glasswing」で展開したのと同じモデルバージョンを、更新ビルドとして受け取り、それを用いている。
「顕著な能力向上は、必ずしも新しいモデルリリースを必要としない」と同研究所は記している。これは、防御側がモデルのリリースサイクルに歩調を合わせればよい、という前提に反するものだ。
Anthropicは4月7日、Mythos Previewを公開し、社内テストで主要OSやブラウザにまたがるゼロデイ脆弱性を発見したことから、セキュリティ産業における転換点となるモデルだと位置づけた。同社はこれらの能力を理由に広範な一般公開を見送っていたとし、AISIが4月に行った以前の評価でも、Mythosはそれまでのフロンティアモデルを明確に上回る存在だと判定されていた。
Read Next: Gemini Space Station Hit By Multiple Securities Fraud Claims After IPO





