Claude Mythos が 32 手順の AISI ハックを 10 回中 6 回で成功

Anthropic's Claude Mythos Preview の新しいチェックポイントが、英国政府のサイバー攻撃シミュレーション両方を初めて突破し、自律ハッキングに関する新たな疑問を呼び起こしている。

AISI が Mythos のブレイクスルーを報告

英国の AI Security Institute は水曜日、より新しい Mythos チェックポイントが、32 手順から成る企業ネットワーク攻撃レンジ「The Last Ones」を 10 回中 6 回完了したと報告した。以前のバージョンは 10 回中 3 回にとどまっていた。

更新版モデルはまた、これまでどのモデルも突破できなかった産業制御システム向けレンジ「Cooling Tower」も 10 回中 3 回クリアした。

競合の OpenAI 製 GPT-5.5 も同じ演習でテストされた。GPT-5.5 は「The Last Ones」を 10 回中 3 回解決したものの、「Cooling Tower」は完了できなかった。

AISI は各試行あたり 1 億トークンの計算予算でレンジを実行し、その上限でも性能が伸び続けていたと指摘した。これは、より高い予算なら成功率がさらに押し上げられる可能性を示唆している。

Also Read: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

倍加時間は短縮を続ける

AISI は、80% の信頼度でモデルが自律的タスクを完了できる時間地平線ベンチマークを通じて、サイバー能力の進歩を追跡している。2025 年 11 月、同機関は倍加時間を 8 か月と推定していたが、2026 年 2 月までにその数値は 4.7 か月へと圧縮され、現在では Mythos と GPT-5.5 の両方がこのより速いトレンドを上回っている。

同機関は、今回の最新結果が新たな加速を示しているのか、それとも単発の飛躍なのかについては不確実性があると認めた。

サイバー演習場ではなくソフトウェアタスクを対象に AI を追跡している非営利研究機関 METR も、ほぼ 4.2 か月という類似の数値を出している。AISI は、この収束は、トレンドが単一の評価スイート特有の癖ではなく、実際の能力向上を反映しているという見方を強めると述べた。

研究所は、同機関のレンジには能動的な防御者が存在しないため、結果は堅牢なエンタープライズシステムではなく、防御の甘いネットワークに対してモデルが何をできるかを示しているにすぎないと強調した。

能力ジャンプが重要な理由

より新しい Mythos チェックポイントは、新たなモデルリリースと同時に登場したわけではない。AISI は、Anthropic が先月、セキュリティ・パートナーシップ・プログラムである Project Glasswing と共に導入したものと同じバージョンを用い、同一モデルの更新ビルドを受け取って評価した。

「顕著な能力ジャンプは、必ずしも新しいモデルリリースを必要としない」と研究所は記した。これは、防御側はリリースサイクルのペースに合わせていればよいという前提に反する。

Anthropic は 4 月 7 日に Mythos Preview を発表し、社内テストで主要 OS やブラウザにまたがるゼロデイ脆弱性を特定したことから、このモデルをセキュリティ業界にとっての転換点として位置付けた。同社は、そうした能力のためより広範な公開を見送ってきたと述べており、AISI が 4 月初旬に行った評価でも、Mythos は従来のフロンティア・システムを明確に上回るステップアップとして位置付けられていた。