**Anthropic(アンソロピック)**の Claude Mythos Preview became the first AI model to complete a full simulated corporate network attack は、これまでのどのAIシステムも突破できなかった専門家レベルのサイバーセキュリティ課題の73%を解決したと、**UK AI Security Institute(英国AIセキュリティ研究所、AISI)**は報告している。
AISIによるサイバー評価
英国政府の科学・技術・イノベーション省の研究機関であるAISIは、Anthropicが4月7日にモデルを発表した後、ran 2種類のテストを実施した。
同社はClaude Mythosを広く一般公開することを選ばず、代わりにセキュリティ研究企業に対してのみgranting 限定的なアクセス権を付与した。
キャプチャ・ザ・フラッグ(CTF)形式の評価では、Claude Mythosは専門家レベルの課題で73%の成功率を記録した。
2025年4月以前には、どのモデルもこれらの課題を一つも解けていなかった。AISIはまた、「The Last Ones」と名付けた32ステップの企業ネットワーク攻撃シミュレーションを構築した。これは人間のプロフェッショナルが約20時間かけて取り組む想定で設計されたものだ。Claude Mythosは10回中3回で全ステップを完遂し、平均22/32ステップまで到達した。これは、次点のClaude Opus 4.6の平均16ステップを大きく上回る。
「Mythos Previewが一つのサイバー演習環境で示した成功は、すでにネットワークへのアクセスが得られている状況で、小規模で防御が弱く脆弱な企業システムに対して、自律的に攻撃を行える能力を少なくとも有していることを示している」とAISIは述べた。
こちらも参照: Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns
ゼロデイ脆弱性の悪用
Anthropic自身のレッドチームは、Claude Mythosがユーザーから明示的な指示を受けた場合、主要なすべてのOSおよび主要ブラウザにおけるゼロデイ脆弱性を検出・悪用し得ることを確認した。同社によれば、同モデルが発見した脆弱性の99%以上は未修正のままだという。
「ここで報告できる内容には限りがあります。詳細を開示するのは無責任であると考えています」とAnthropicは述べている。
このモデルの能力はすでに政策決定の場にもreached している。
ロイターによると、米財務長官スコット・ベッセントと連邦準備制度理事会(FRB)議長ジェローム・パウエルは、同モデルに関連する潜在的サイバーリスクについて協議するため、大手銀行CEOとのheld 緊急会合を開いたという。
Anthropicのセキュリティ対応
Anthropicはモデル発表と同時にProject Glasswingを立ち上げ、Claude Mythosを活用して重要ソフトウェアの防御を強化する取り組みだと説明した。同社はこのイニシアチブを、AI駆動型攻撃者より一歩先を行く必要がある時代を見据えた準備だと位置付けている。AISIは、組織に対して、定期的なパッチ適用、厳格なアクセス制御、設定の堅牢化、網羅的なログ取得など、基礎的なサイバーセキュリティ対策を優先するよう推奨した。
4月7日の発表は、サイバーセキュリティ分野におけるAIの役割を巡る懸念が数カ月にわたり高まる中で行われた。これまでのフロンティアモデルも限定的な攻撃能力は示していたが、専門家レベルのCTFベンチマークを突破したり、多段階の攻撃シミュレーションを完遂したりした例は、Claude Mythos以前には存在しなかった。






