Anthropic 正在准备发布 Claude Opus 4.7,以及一款由 AI 驱动、用于搭建网站和制作演示文稿的设计工具,此举在周一动摇了 Adobe、Wix 和 Figma 的股价。
Opus 4.7 发布详情
The Information reported 于 4 月 14 日报道称,知情人士透露,这两款产品最早可能在本周内发布。该设计工具可以接受自然英文提示,目标用户同时包括开发者和非技术用户。
这一举动 puts Anthropic 直接置于与 Gamma 等初创公司以及 Google 的 Stitch 的竞争之中。
Opus 4.7 甚至还不是 Anthropic 最先进的模型。
这一头衔属于 Claude Mythos,一款专注网络安全的系统。公司通过 Project Glasswing 仅向部分安全公司提供该模型,同时对普通公众保持封闭。
Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked
AI 基准测试争议与 Mythos
OpenAI 近期宣布,领先的编码基准 SWE-bench Verified 已被判定为“被污染”,原因是发现前沿模型在训练中记住了其解答。然而,各实验室仍在模型对比中引用这些相同测试。
另一项 ARC-AGI-3 评估凸显了 AI 系统与人类推理之间的差距。Gemini 得分为 0.37%,GPT-5.4 为 0.26%,而人类得分为 100%。在缺乏 Anthropic 提供的详细模型卡的情况下,有关 Opus 4.7 提升幅度的说法仍难以被独立验证。
英国 AI Security Institute 近日 evaluated Mythos Preview,发现它可以以迄今其他模型无法匹敌的频率,自动执行复杂的网络攻击。它成为首个完成“The Last Ones”的 AI——这是一项包含 32 个步骤的企业网络攻击模拟,人类红队通常需要 20 小时才能完成。
Read Next: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers





