Anthropic は、Claude Opus 4.7 と、ウェブサイトやプレゼンテーションを構築できる AI 搭載デザインツールのリリース準備を進めている。この動きは月曜日、Adobe、Wix、Figma の株価を動揺させた。
Opus 4.7 のローンチ詳細
The Information は 4 月 14 日、関係者の話として、両プロダクトが早ければ今週中にも出荷される可能性があると報じた。このデザインツールは平易な英語でのプロンプト入力に対応し、開発者だけでなく非技術系ユーザーも対象としている。
これにより、Anthropic は Gamma や Google の Stitch といったスタートアップと正面から競合する立場に置かれる。
なお、Opus 4.7 は Anthropic にとって最先端モデルですらない。
その称号を持つのは、同社が Project Glasswing を通じて一部のセキュリティ企業にのみ配布し、一般公開を控えているサイバーセキュリティ特化モデル Claude Mythos だ。
関連記事: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked
AI ベンチマーク危機と Mythos
OpenAI は最近、フロンティアモデルが学習中に解答を記憶していたことが判明したとして、主要なコーディング・ベンチマークである SWE-bench Verified を「汚染済み」と宣言した。それにもかかわらず、各ラボは依然としてモデル比較に同じテストを引用し続けている。
別の ARC-AGI-3 評価では、AI システムと人間の推論能力との大きな隔たりが浮き彫りになった。Gemini は 0.37%、GPT-5.4 は 0.26% にとどまる一方、人間は 100% を達成した。Anthropic から詳細なモデルカードが公開されていない現状では、Opus 4.7 の性能向上に関する主張を独立に検証するのは難しい。
英国の AI Security Institute は最近、Mythos Preview を評価し、他のどのモデルも到達していない水準で自律的に高度なサイバー攻撃を実行できることを確認した。同モデルは、「The Last Ones」と呼ばれる 32 ステップの企業ネットワーク攻撃シミュレーションを完遂した初の AI となった。この演習は通常、人間のレッドチームが 20 時間かけて行うものだ。
次に読む: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers






