Claude Opus 4.7 の公開が迫る一方で Anthropic 最強の AI は依然として一般非公開

Claude Opus 4.7 の公開が迫る一方で Anthropic 最強の AI は依然として一般非公開

Anthropic は、ウェブサイトやプレゼンテーションを構築するための AI 駆動デザインツールと Claude Opus 4.7 の公開を準備しており、 この動きは月曜日に AdobeWixFigma の株価を 揺るがした。

Opus 4.7 のローンチ詳細

The Information は 4 月 14 日に reported し、 計画に詳しい人物の話として、両プロダクトは早ければ今週中にも 出荷される可能性があると伝えた。 このデザインツールは自然な英語のプロンプトを受け付け、 開発者だけでなく非技術系ユーザーも対象としている。

この動きにより、Anthropicputs GammaGoogle の Stitch といったスタートアップと 直接競合することになる。

なお、Opus 4.7 は Anthropic にとって もっとも高度なモデルというわけではない。

その称号は、 企業が Project Glasswing を通じて一部のセキュリティ企業にのみ 提供しているサイバーセキュリティ特化システム Claude Mythos, a cybersecurity-focused system に属しており、一般ユーザーからは遠ざけられている。

Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked

AI ベンチマーク危機と Mythos

OpenAI は最近、最先端のコーディングベンチマークである SWE-bench Verified について、フロンティアモデルが学習時に解答を 丸暗記していたことが判明したとして「汚染されている」と宣言した。 それにもかかわらず、各研究所は依然としてモデル比較に 同じテストを引用し続けている。

別の ARC-AGI-3 評価では、AI システムと人間の推論力との ギャップが浮き彫りになった。 Gemini は 0.37%、GPT-5.4 は 0.26% だったのに対し、 人間は 100% を達成した。 Anthropic から詳細なモデルカードがないため、 Opus 4.7 の性能向上に関する主張を第三者が検証するのは 依然として難しい。

英国の AI Security Institute は最近 evaluated Mythos Preview を評価し、他のどのモデルよりも高い頻度で 自律的に高度なサイバー攻撃を実行できることを明らかにした。 Mythos は、人間のレッドチームが通常 20 時間かけて行う 32 段階の企業ネットワーク攻撃シミュレーション 「The Last Ones」を完遂した初の AI となった。

Read Next: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers

免責事項とリスク警告: この記事で提供される情報は教育および情報提供のみを目的としており、著者の意見に基づいています。金融、投資、法的、または税務上のアドバイスを構成するものではありません。 暗号資産は非常に変動性が高く、投資の全部または相当な部分を失うリスクを含む高いリスクにさらされています。暗号資産の取引または保有は、すべての投資家に適しているとは限りません。 この記事で表明された見解は著者のものであり、Yellow、その創設者、または役員の公式な方針や立場を表すものではありません。 投資決定を行う前に、常にご自身で十分な調査(D.Y.O.R.)を行い、ライセンスを持つ金融専門家にご相談ください。
Claude Opus 4.7 の公開が迫る一方で Anthropic 最強の AI は依然として一般非公開 | Yellow.com