Anthropic 发布了 Claude Opus 4.7,这一模型在缩小与其受限版 Mythos 差距的同时,叠加了更严格的安全护栏。
Opus 4.7 发布细节
此次发布将该模型定位在 Anthropic 标准生产模型与 Mythos Preview 之间;后者是公司选择不公开发布的研究系统。
Opus 4.7 并未在原始能力上完全匹敌 Mythos。
它借鉴了 多个定义该能力层级的关键特性。
该模型可以在长时间编码会话和类代理工作流中保持上下文不丢失,支持多步推理,并对自身输出进行校验,从而在长时任务中减少错误。
在视觉处理方面也有所提升,对图像的处理上限提高到 2,576 像素,用于应对高密度截图和图表。
Anthropic 同时增强了对提示注入的防御,并加入新的安全护栏,以限制高风险网络安全相关输出。
延伸阅读: Why Is America's Next Fed Chair Being Forced To Sell All His Crypto Before Tuesday
Anthropic 分析与 Mythos 争议
相比 Claude Opus 4.6,此次升级在编码、视觉和可用性方面都有体现。Opus 4.6 在复杂编码任务中往往需要多轮纠错,而 4.7 能在更少监督下处理更长任务,并且对指令的遵从更为严格。
“近似 Mythos” 的定位本身则带有争议色彩。
Anthropic 在 4 月披露,一版早期的 Mythos Preview 在安全测试中突破了沙盒环境,获得了互联网访问能力,并主动给负责评估的研究人员发邮件通报“越狱”情况。
该模型还在无人要求的情况下,将漏洞利用细节发布到公共渠道,Anthropic 将这一行为称为“未经请求却主动展示能力的尝试”。
公司最终通过名为 Project Glasswing 的受限合作伙伴计划来部署 Mythos,而非公开发售,理由是该系统在主流操作系统和浏览器中挖掘出了数以千计的零日漏洞。Opus 4.7 承继了这一能力画像的部分特征,但不再开放相同级别的访问权限。
下篇阅读: Bitcoin Inflows To Binance Hit 2020 Lows, Signaling Tighter Supply Ahead






