Anthropic、Claude Mythos 5 を 100 万トークン 10 ドルで提供「史上最強モデル」と主張

Anthropic launched Claude Mythos 5 を火曜日に発表し、world's most capable cybersecurity model と位置付けるとともに、価格をインプット 100 万トークンあたり 10 ドルに設定した。

主なポイント:

Claude Mythos 5 は制限付きの Mythos Preview をアップグレードしたもので、引き続き Project Glasswing のパートナーと米政府のサイバー防衛組織に限定される。

Anthropic は Mythos 5 と一般公開向けの Fable 5 を、Mythos Preview の半額以下となる 100 万インプットトークンあたり 10 ドルに設定した。

Fable 5 はサイバーセキュリティおよび生物学関連のリクエストを Claude Opus 4.8 にルーティングし、セーフガードが発動するのはセッションの 5% 未満にとどまる。

Mythos 5 が Glasswing を解放

Anthropic は、一般利用向けに厳格な制限をかけたバージョンである Claude Fable 5 と並行してこのシステムをunveiledし、制限のない Mythos 5 は審査を通過したパートナー向けに限定した。モデルは Fable 5 と同じ基盤エンジン上で動作するが、サイバーおよびバイオ関連の作業を制限するセーフガードが取り除かれている。

現時点で Mythos 5 にアクセスできるのは、前モデルのテストも担当した Project Glasswing のメンバーと米政府のサイバー防衛担当者のみである。同社は 4 月に Mythos Preview をdebutedした際、ソフトウェアの脆弱性を発見する能力がウォール街や連邦政府から注目を集めたと説明していた。Anthropic は当時、悪用リスクを理由にモデルを一般市場には出さない方針を示していた。

Also Read: OpenAI Joins $852B IPO Race As Anthropic And SpaceX Charge Ahead

Source: Anthropic

Opus と競合を凌駕

Anthropic は、Mythos 5 をソフトウェア脆弱性の発見および悪用において ranks 世界最強のモデルと位置付けており、社内テストで比較したすべての競合システムを上回ったとしている。対照的に Fable 5 は、センシティブなサイバーおよびバイオ関連の問い合わせを、悪用タスクでのスコアがおよそ半分である旧モデル Claude Opus 4.8 にroutesしている。

このフォールバックは全セッションの 5% 未満でしか発動しないため、ほとんどのユーザーは 2 つのモデルの違いをほぼ感じないという。一部ベンチマークでは、Fable 5 はフォールバック先である Opus 4.8 をscored 10 ポイント以上上回った。ある初期テスターは、物理学研究において、OpenAI の GPT-5.5 が 4 日かけて到達した成果を、36 時間でreported 達成したと述べている。

このローンチ全体は慎重さを重視して設計されている。

Anthropic は、新しいセーフガードに対して 1,000 時間以上のバグバウンティテストをranし、すべてを一度に突破できる「汎用的な脱獄手法」は見つからなかったとしている。また同社は、新たな攻撃手法を分析する目的で、法人顧客データを 30 日間保持する方針だが、その記録は今後のモデルの学習には用いないと説明する。

Mythos Preview landed in April はサイバーセキュリティ分野における画期的な出来事と位置付けられ、監視付きアクセスの対象は数十社の重要ソフトウェアプロバイダーに限定されていた。その後、同社は重要インフラを構築する 15 か国以上、約 150 の組織へと Glasswing toward roughly 150 organizations を拡大してきた。今回の 2 つのモデルの同時ローンチにより、この取り組みは外部企業を含む、より広範な「信頼されたアクセス」プログラムへと前進することになる。

Anthropic、Claude Mythos 5 を 100 万トークン 10 ドルで提供 「史上最強モデル」と主張

主なポイント:

Mythos 5 が Glasswing を解放

Opus と競合を凌駕

Anthropic、Claude Mythos 5 を 100 万トークン 10 ドルで提供「史上最強モデル」と主張