ニュース学ぶリサーチランキングエコシステム

ウォレット

トレーディング

プラットフォーム公開中

yellow bottom left star road

今すぐ始める

Claude Mythos 対 GPT-5.5：ゲート付き Anthropic モデルが 9 テスト中 6 つで勝利

Alexey BondarevApr, 24 2026 5:36

#AI #OpenAI #ChatGPT #Anthropic #Claude Mythos

Claude Mythos 対 GPT-5.5：ゲート付き Anthropic モデルが 9 テスト中 6 つで勝利

OpenAI released GPT-5.5 は水曜日に公開されたが、新しいベンチマークデータによると、Anthropic's gated Claude Mythos Preview は依然として、直接比較可能な 9 テスト中 6 テストでリードしている。

GPT-5.5 のベンチマークスコア

GPT-5.5 は 4 月 23 日に ChatGPT と Codex にarrived し、価格は入力トークン 100 万あたり 5 ドル、出力は 30 ドルと、前世代の 2 倍に設定された。

このモデルは Terminal-Bench 2.0 で scored 82.7% を記録し、唯一明確に勝利したこのベンチマークで Mythos を 0.7 ポイント上回った。

Mythos, which Anthropic withheld from public release over cybersecurity concerns は、SWE-bench Pro で 77.8% を達成し、58.6% の GPT-5.5 をリードしている。

また、ツールなしの Humanity's Last Exam でも GPT-5.5 を tops し、56.8% を記録して 41.4% を上回った。ゲート付きモデルはさらに、CyberGym、OSWorld-Verified、およびロングコンテキストの GraphWalks タスクでもリードしている。

Also Read: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

アナリストの但し書きには意味がある

両ラボとも互いのモデルを直接ベンチマークしていないため、この比較は依然として厳密ではない。OpenAI は公開比較対象として Claude Opus 4.7 をchose した一方で、Anthropic の 245 ページにわたるシステムカードは Mythos を GPT-5.4 と比較している。

テストハーネスも異なる。OpenAI は Terminal-Bench で Codex CLI セットアップを用いたのに対し、Anthropic の Terminus-2 スキャフォールドは、Terminal-Bench 2.1 のタイミングルールの下で Mythos を 92.1% まで押し上げた。

Anthropic が Mythos をゲートするという 4 月 7 日の決定は、欧州委員会との会合を招き、同モデルがサイバーリスクを突き崩しかねないとして、イングランド銀行総裁からの警告も呼び起こしたと報じられている。

Read Next: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

免責事項とリスク警告：この記事で提供される情報は教育および情報提供のみを目的としており、著者の意見に基づいています。金融、投資、法的、または税務上のアドバイスを構成するものではありません。暗号資産は非常に変動性が高く、投資の全部または相当な部分を失うリスクを含む高いリスクにさらされています。暗号資産の取引または保有は、すべての投資家に適しているとは限りません。この記事で表明された見解は著者のものであり、Yellow、その創設者、または役員の公式な方針や立場を表すものではありません。投資決定を行う前に、常にご自身で十分な調査（D.Y.O.R.）を行い、ライセンスを持つ金融専門家にご相談ください。

最新ニュース

すべてのニュースを見る

サムスン「Galaxy Z Fold 8」、AI性能100TOPS搭載でアップルに本格対抗

Galaxy Z Fold 8が100TOPSのAI性能で登場。Gemini搭載のAndroid 17と、プライバシー重視のApple Intelligenceが主導権争いへ。

ポリマーケットでトランプ大統領弾劾確率が任期中66％に上昇

予測市場がトランプ弾劾リスクを任期中66％と織り込み。 2026年末までは3％にとどまり、中間選挙での下院奪還シナリオが分水嶺に。

アンスロピック、EU公聴会に若手技術者を派遣　議員らが猛反発

アンスロピックがEU公聴会に政策責任者でなく若手技術者を出席させ、サイバー対応AI「Mythos」への対応を巡り欧州議会が強く反発。

関連ニュース

Claude Opus 4.8 が複数のコーディングテストで Gemini と GPT を上回る

Anthropic が Claude Opus 4.8 を公開し、SWE-Bench Pro などのベンチマークで GPT-5.5 や Gemini 3.1 Pro を上回ると主張。価格は据え置きで、高速モードと動的ワークフローでコスト削減を狙う。

GPT-5.5 が32段階サイバー攻撃で Claude Mythos に匹敵、英AISIが報告

GPT-5.5が32段階企業ハックとリバースエンジニアリング課題を自律実行。英AISI評価でClaude Mythosに匹敵、攻撃能力の台頭に警鐘。

Claude Opus 4.8 が知能指数で首位も、ハッキング分野では Mythos が圧倒

Anthropic の Claude Opus 4.8 は知能ベンチマークでわずかに首位に立つが、ソフトウェア攻撃コード生成では制限付きモデル Mythos が大きく上回る。

米国命令で停止する前に、Fable 5 が GPT 5.5 を上回っていた

Fable 5 は GPT 5.5 をベンチマークで一時的に上回ったが、米国の輸出規制命令で停止。技術力より規制が優先される現実を浮き彫りにした。

GPT-5.6 Sol vs Claude Fable 5：コーディングベンチマークは互角の競争を示す

GPT-5.6 Sol は Terminal-Bench で最高スコア、Claude Fable 5 は SWE-Bench Pro で大きくリード。価格は Sol が安く、Sol は限定プレビュー、Fable 5 は世界展開。

関連する研究記事

Claude Mythos と暗号資産：新たなAI脅威はトレーディングに何を意味するのか

Anthropic の Claude Mythos が数千件のゼロデイを発見し公開見送り。暗号資産は24時間市場や不可逆決済で攻撃影響が大きく特に脆弱。

Claude Mythos は金融と暗号資産業界をどう作り変えるのか

Anthropic のサイバー特化モデル Mythos は、制限付き提供と銀行・テック大手との連携により、金融・暗号資産インフラのリスク構造を一変させる可能性がある。

42州がすでにOpenAIを調査、ウォール街はIPOに熱視線

42州司法長官が、評価額8,520億ドルでIPO申請した直後のOpenAIに対し、AIモデル、安全性、ユーザーデータに関する記録提出を要求する共同調査を開始。非営利から営利への構造転換も焦点となり、上場時期や企業価値に不透明感が生じている。

AIトークンはミームコインに続く次の大型暗号トレンドになるのか？

AIトークンはミームコイン崩壊の中で急伸したが、エージェント系は85％暴落。実需と投機バブルの境界が問われている。

AI銘柄の復活：ビッテンソルの117％急騰はセクター復活を牽引できるか

ビッテンソル主導でAIトークンが急騰する一方、時価総額はピークの半分。 2025年の75％下落と構造要因で持続性への懐疑も残る。

関連する学習記事

企業の支配を受けない2.6Bドル規模のAIマーケットプレイス、 Bittensorの仕組み

Bittensorは分散型AIマーケットプレイスで、独立したモデルがTAO報酬を競う。サブネット構造とステーキングで自律的なAI経済圏を形成。

AIエージェントはなぜ独自のブロックチェーンレイヤーなしではスケールできないのか

AIエージェントは従来型ウォレットやガスモデルと根本的に相性が悪く、専用のアカウント抽象化やガスレス実行など新しい基盤レイヤーが不可欠になっている。

分散型AIはあなたのプロンプトを本当に秘密にできるのか？

プライバシー重視の分散型AIネットワークが、ノード分散や暗号技術、トークンインセンティブを用いてプロンプトを秘匿したまま推論を実行する仕組みを解説。

AIデータマーケットプレイスが本格稼働、知っておくべきポイント

分散型AIデータマーケットプレイスの仕組みと報酬、検証・プライバシー・トークン経済を概観し、中央集権型プラットフォームとの違いを解説。

AIボットがWeb3を席巻、人間性証明こそ唯一の解決策

人間性証明は、実名などを明かさずに「唯一の本物の人間」であることをブロックチェーン上で証明する仕組み。AIボット台頭で重要性が急上昇。

Claude Mythos 対 GPT-5.5：ゲート付き Anthropic モデルが 9 テスト中 6 つで勝利 | Yellow.com