Anthropic launched Claude Mythos 5 on Tuesday, calling it the world's most capable cybersecurity model, and set its price at $10 per million input tokens.
主なポイント:
- Claude Mythos 5 は制限付きの Mythos Preview をアップグレードしたモデルで、対象は Project Glasswing パートナーと米政府のサイバー防衛担当者に限定される。
- Anthropic は Mythos 5 と一般公開向けの Fable 5 を、入力100万トークンあたり10ドルに設定し、Mythos Preview の半額以下とした。
- Fable 5 はサイバーセキュリティとバイオ関連のリクエストを Claude Opus 4.8 にルーティングし、安全装置が作動するのは 5% 未満のセッションにとどまる。
Mythos 5 が Glasswing を解放
Anthropic は、一般ユーザー向けに厳格なガードレールを備えた Claude Fable 5 と並行して、このシステムを発表した。一方で、制限のない Mythos 5 は審査を通過したパートナー専用とされている。モデル自体は Fable 5 と同じ基盤エンジン上で動作するが、サイバーおよびバイオ関連作業を制限するセーフガードが取り払われている。
現時点で Mythos 5 にアクセスできるのは、前世代モデルの検証にも参加した Project Glasswing メンバーと米政府のサイバー防衛担当者のみである。同社はまず 4 月に Mythos Preview を公開し、ソフトウェアの脆弱性を発見する性能がウォール街と連邦政府の注目を集めた。当時 Anthropic は、悪用リスクを理由にモデルを一般市場には出さない方針を示していた。
関連記事: OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead

Opus と競合を上回る性能
Anthropic は、Mythos 5 をソフトウェア脆弱性の発見と悪用において既存で最も強力なモデルと位置づけ、テストした全ての競合システムを上回ったとしている。対照的に Fable 5 は、センシティブなサイバーおよびバイオ関連の問い合わせを、脆弱性悪用タスクでスコアが約半分だった旧世代の Claude Opus 4.8 にルーティングする設計になっている。
ただし、そのフォールバックは全セッションの 5% 未満にとどまり、多くのユーザーは両モデルの違いをほとんど感じないという。いくつかのベンチマークでは、Fable 5 は公開向けフォールバックモデルである Opus 4.8 を10%以上上回るスコアを記録した。ある初期テスターは、物理学研究において OpenAI の GPT-5.5 が 4 日かかった成果を、36 時間で再現したと報告している。
展開全体は慎重なアプローチで設計されている。
Anthropic は 1,000 時間を超えるバグバウンティテストを実施し、新たなセーフガードを一括で突破できる「ユニバーサル・ジェイルブレイク」は見つからなかったと述べている。また同社は、新種の攻撃パターンの研究を目的に、法人顧客データを 30 日間保持する方針だが、その記録は今後のモデル学習には用いないとしている。
Mythos Preview は 4 月に登場し、厳重にモニタリングされたアクセスのもと、重要ソフトウェアプロバイダー数十社のみに提供される、サイバーセキュリティ分野の画期的存在と位置づけられた。その後同社は、重要インフラを構築する15 カ国以上・約 150 組織へと Glasswing を拡大している。今回の 2 つのモデルの同時リリースにより、この取り組みは外部企業向けの、より広範な「信頼されたアクセス」プログラムへと踏み出す形となる。
次に読む: Bitcoin Drawdown Reveals Why Big Buyers Still Want More BTC





