Anthropic 正在准备发布 Claude Opus 4.7,以及一款由 AI 驱动、用于构建网站和演示文稿的设计工具,此举在周一动摇了 Adobe、Wix 和 Figma 的股价。
Opus 4.7 发布细节
The Information 在 4 月 14 日报道,称这两款产品最早可能在本周发布,消息来源是一位知情人士。该设计工具支持用自然英语进行提示,目标用户涵盖开发者和非技术用户。
这使得 Anthropic 直接与 Gamma 等初创公司以及 Google 的 Stitch 竞争。
Opus 4.7 甚至还不是 Anthropic 最先进的模型。
这一头衔属于Claude Mythos,一款专注网络安全的系统。公司仅通过 Project Glasswing 将其分发给少数安全公司,同时对公众保持封闭。
延伸阅读: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked
AI 测评危机与 Mythos
OpenAI 最近宣布领先的编码基准测试 SWE-bench Verified 已被“污染”,因为发现前沿模型在训练中记住了其解答。但各大实验室在进行模型对比时仍在引用同一测试。
另一项 ARC-AGI-3 评估强调了 AI 系统与人类推理之间的差距。Gemini 得分为 0.37%,GPT-5.4 为 0.26%,而人类则达到 100%。在缺乏 Anthropic 详细模型卡的情况下,外界很难独立验证关于 Opus 4.7 提升幅度的相关说法。
英国 AI Security Institute 最近评估了 Mythos Preview,发现它可以自主执行复杂的网络攻击,其成功率远超其他模型。它成为首个完成“The Last Ones”的 AI——这是一项包含 32 个步骤的企业网络攻击模拟,人类红队通常需耗时 20 小时才能完成。
下篇阅读: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers






