ハッカーが最も望んだ力以外すべてを携え、 Fable 5 が復活

Anthropic は Fable 5 を復旧し、7月1日に世界同時再公開した。能力はそのまま維持したうえで、問題視されたハッキング用プロンプトを試みたうち、99%以上をブロックするフィルターを追加した。

重要ポイント:

米商務省が輸出規制を解除し、Fable 5 は Anthropic の主要製品全体で世界的に再提供された。

モデルの完全な能力は維持されているが、新たなフィルターにより、特定のハッキング用プロンプトがより弱いモデルに迂回される。

テストの結果、より安価なモデルでも同じ脆弱性を見つけられることが判明し、Fable 5 を特別に危険視する根拠が弱まった。

Fable 5 が世界市場に復帰

米商務省は6月30日に緊急輸出命令を解除し、その翌日には Claude Platform、Claude.ai、Claude Code、Claude Cowork を通じて再びユーザーに届くようになった。主要クラウドプラットフォーム経由でのアクセスも順次再開される予定だ。

有料加入者は7月7日までは週ごとの上限内で利用でき、その後は継続利用が従量制クレジット方式へと移行する。

モデルが停止したのは6月12日。規制当局は、外国籍の人物が一切利用できないよう求め、同社に与えた対応時間は約90分しかなかった。このため Anthropic は、リアルタイムでユーザー一人ひとりをふるいにかける代わりに、全ユーザー向けの提供を停止する決断を下した。

こうした措置のきっかけは、Amazon の研究者が、共通するソフトウェア群にまたがる脆弱性のクラスターをモデルにフラグ付けさせるプロンプトを発見したという報告だ。その中には、単一の脆弱性をどう突くかを示す、実際に動作するコードまで生成したケースもあった。警戒を決定づけたのは、脆弱性リストそのもの以上に、その単一の実演例だった。

テストで Fable 5 は「シロ」と判定

Anthropic が政府および報告を出した企業と並行して行ったレビューでは、確認された脆弱性は、Opus 4.8、GPT-5.5、Kimi K2.7 など、はるかに弱いモデルからも同様に洗い出せることが判明した。チームがチェックした他のすべてのモデルも、あの単独のエクスプロイト実演を再現できた。これにより、「Fable 5 だけが特異なサイバー兵器を持っている」という主張は大きく揺らいだ。Anthropic はこの禁止措置を「行き過ぎ」だと批判していた。

対応策はごく限定的だ。再公開にあたり、報告された特定のプロンプトだけを検出する分類器をひとつ搭載し、それを検知した場合には、問い合わせをより弱い Opus 4.8 に迂回させる。これにより Fable 5 本来の能力は維持される一方、通常のコーディングでも誤検知が増え、介入した際にはユーザーへ警告が表示される。

Mythos 5 は制限継続

Mythos 5（同じ基盤モデルだがガードレールが緩いバージョン）は、Project Glasswing と呼ばれるプログラムの枠内で、審査を通過した米国内の約100組織にのみ提供される状態が続いている。

同社はまた、脱獄（jailbreak）報告を受け付ける公開窓口を開設したほか、今後のフロンティアモデルについて、発売前の早期テスト機会を規制当局に提供することも約束した。

Fable 5 は6月9日に、Anthropic 初の広範に提供される Mythos クラスモデルとしてローンチされ、各種業界ベンチマークで高く評価されていたが、公開から数日のうちに姿を消した。停止期間は3週間足らずだったが、そのあいだにモデルが動かない隙を突く形で、急成長中の中国系研究所がベンチマークでの主導権を静かに奪っていた。今回の復帰により、その失地を取り戻すことになる。

次の記事: XRP、再び1.07ドルを試すも、6月の失速が強気派の影落とす