Cloudflare は月曜日、Anthropic の未公開モデル Mythos Preview が、50を超える自社リポジトリに存在するバグを連鎖させて実働エクスプロイトを構築したことを確認した。
CloudflareのProject Glasswingでの知見
この事実は、Cloudflareの最高セキュリティ責任者(CSO)である Grant Bourzikas 氏のブログ投稿で明らかにされた。同氏によると、チームはMythos Previewを、ランタイム、エッジのデータパス、プロトコルスタックにまたがる本番コードに向けた。Cloudflareは、Anthropicが防御的セキュリティパートナー向けに運営する招待制プログラム「Project Glasswing」に参加している。Bourzikas氏は、このモデルを「真の前進」と評し、競合モデルにはない2つの能力を挙げた。
Mythosは、複数の小さな攻撃プリミティブを連鎖させて、動作する概念実証(PoC)にまとめ上げた。また、このモデルはスクラッチ環境でエクスプロイトコードをコンパイルして実行し、実行が失敗した際には仮説を修正することも行った。
投稿では、プレビューモデルの「拒否応答」が一貫していない点にも言及している。
あるケースでは、Mythosは特定のコードベースで複数のメモリバグを確認した後にも、デモ用エクスプロイトの作成を拒否したが、別セッションで同じタスクを別の聞き方で提示すると、今度はそれに応じてしまった。
関連記事: Crypto Funds Bleed $1.07B As Iran Tensions End Six-Week Inflow Run
マルチエージェントのハーネスは単体スキャナより有効
Cloudflareによれば、1つの汎用コーディングエージェントをリポジトリに向けるだけでは、脆弱性調査はうまくいかなかった。そこでBourzikas氏は、約50体のエージェントを狭いタスクに割り当てて並列実行する多段構成のハーネスを構築した。このパイプラインは、偵察、ハンティング、敵対的検証、重複排除、到達可能性トレースを順に実行する。
各検出結果がトリアージキューに入る前に、独立したエージェントがその正しさを検証しようとする。このプロセスにより、CやC++で書かれたメモリ安全性の低いコードで頻発する誤検知を削減している。AnthropicはProject Glasswingの一環として、モデルクレジット1億ドルと、オープンソースのセキュリティ団体向け寄付400万ドルを約束している。
Mythos Preview は一般公開されない予定だ。
暗号スマートコントラクトはAIエクスプロイトの波に直面
Cloudflareの結果が公表された背景には、オンチェーン損失の拡大がある。Verus-Ethereumブリッジは月曜日、クロスチェーン攻撃で1,100万ドルを失い、その資金は5,402 Ether (ETH) へとスワップされた。
Anthropicの研究者は以前、AIエージェントが自律的に稼働中のコントラクトを悪用して利益を上げられることを示している。あるテストでは、モデルが2,849件のデプロイ済みコントラクトをスキャンし、3,476ドルの計算資源コストに対して3,694ドル相当のエクスプロイトを生み出した。
CertiK は5月15日、レガシーなスマートコントラクトがAI駆動のハンティング波の中心にあると警告した。DeFiプロトコルは4月の約20日間で6億500万ドル超の損失を出しており、その中には4月19日の$293 million KelpDAO 流出 も含まれる。さらに、第1四半期だけでソーシャルエンジニアリングによる損失が3億600万ドルに達した。
次に読む: Iran Settles Hormuz Shipping Cover In Bitcoin, Eyes $10B Haul





