Anthropic は Fable 5 を復旧し、7月1日に世界同時再公開した。能力はそのまま維持されつつ、問題視されたハッキング用プロンプトを 99%以上の試行でブロックするフィルターが追加された。
主なポイント:
- 米国商務省が輸出規制を解除し、Fable 5 は Anthropic の主要プロダクト全体で世界的に復帰した。
- モデルは能力をフル維持しているが、新しいフィルターが特定のハッキングプロンプトをより弱いモデルへと迂回させる。
- テストでは、より安価なモデルでも同じ脆弱性を見つけられることが判明し、Fable 5 を「特異的に危険」とみなす根拠が弱まった。
Fable 5 が世界的に復帰
米国商務省は6月30日に緊急輸出命令を解除し、その翌日には Claude Platform、Claude.ai、Claude Code、Claude Cowork を通じて再びユーザーの元に届いた。主要クラウドプラットフォーム経由でのアクセスも順次再開される見込みだ。
有料購読者は7月7日までは週次の利用制限内で利用でき、それ以降はメーター制のクレジット方式へと移行する。
このモデルは6月12日に停止されていた。規制当局は、あらゆる外国籍の人物をこのモデルから排除するよう命じ、企業側に与えた対応時間はわずか約90分だった。そのため Anthropic は、リアルタイムでユーザーを一人ひとり選別するのではなく、全ユーザー向けにモデル自体を停止する道を選んだ。
この指示の背景には、Amazon の研究者が、共通のシステム群にまたがるソフトウェア脆弱性のクラスターをモデルに指摘させるプロンプトを発見したことがある。あるケースでは一歩踏み込み、単一の脆弱性を悪用する方法を示す動作コードまで生成していた。この単独の実演こそが、単なる脆弱性リスト以上に警鐘を鳴らした部分だ。
関連記事: CrowdStrike、Claude Mythos がゼロデイ判断を加速し得ると警告
テストで Fable 5 が「潔白」と判定
Anthropic が政府や報告書を提出した企業と並行して実施した独自レビューでは、はるかに弱いモデルであっても同じ脆弱性を洗い出せることが確認された。対象には Opus 4.8、GPT-5.5、Kimi K2.7 などが含まれる。調査した他のすべてのモデルが、例の単独の悪用デモを再現できたことから、「Fable 5 だけが特異なサイバー兵器を持っている」とする主張は大きく揺らいだ。Anthropic は当初から、この禁止措置は行き過ぎだと主張していた。
修正はきわめて限定的だ。復帰したモデルには、報告されたプロンプトを検出するための1つの分類器が組み込まれ、それに一致した場合は、より弱い Opus 4.8 へと迂回させる。これにより Fable 5 の能力自体はそのまま保たれる一方で、通常のコーディングにも過剰反応して誤検知を起こす場面が増え、介入が行われた際にはユーザーへ警告が表示される。
Mythos 5 は依然として制限付き
Mythos 5 は、同じ基盤モデルを用いながらガードレールを減らしたバージョンだが、Project Glasswing と呼ばれるプログラムのもと、審査を通過した米国内の約100組織にのみ限定提供されたままだ。
併せて企業は、ジェイルブレイク報告のための公開窓口を開設した。また、今後のフロンティアモデルについては、正式リリース前の段階で規制当局にテスト機会をより早期に提供することも約束している。
Fable 5 は6月9日に初登場した。Anthropic にとって初の広範公開された Mythos クラスのモデルであり、公開直後からさまざまな業界ベンチマークで高い評価を受けていたが、リリースから数日のうちに姿を消した。停止期間は3週間足らずだったが、その間、急成長中の中国の研究所が静かにベンチマークで優位を確保しており、今回の復帰でようやくその地位を取り戻した形となる。





