Anthropic 發佈了 Claude Sonnet 5,這個新 AI 模型聲稱在代理工作方面,讓 Sonnet 級系統更接近 Claude Opus 4.8。
重點整理:
- Anthropic 指出,Claude Sonnet 5 相比 Sonnet 4.6,在推理、工具使用、編程及知識工作上都有所提升。
- 該模型標示的費率低於 Opus 4.8,但 tokenizer 的變更可能令 Token 數量上升。
- 初步測試顯示代理行為更強,不過部分開發者質疑實際運行成本是否真的更低。
Claude Sonnet
Anthropic 在介紹 Claude Sonnet 5 時,稱其為「至今代理能力最強的 Sonnet 模型」,表示它可以規劃任務、操作瀏覽器及終端機,並以比以往 Sonnet 版本更高的自主性工作。
公司表示,這款模型在保持較低標示價格的同時,縮小了與 Claude Opus 4.8 之間的差距。Sonnet 5 的定價為每百萬輸入 Token 3 美元、每百萬輸出 Token 15 美元,而 Opus 4.8 則分別為 5 美元及 25 美元。
Anthropic 亦提供至 2026 年 8 月 31 日的優惠價,每百萬 Token 的輸入為 2 美元、輸出為 10 美元;在此日期之後將恢復標準定價。
公司同時表示,已提高 Chat、Cowork、Claude Code 及 Claude 平台的速率上限,因為較高「努力等級」模式會消耗更多 Token。
延伸閱讀: OpenAI 修復 Codex,因開發者兩天就燒光一週額度
Anthropic 成本
價格問題並不單純。Anthropic 表示,Sonnet 5 採用新的 tokenizer,與 Claude Opus 4.7 引入的變化相似,相同輸入可能會對應約 1.0 至 1.35 倍的 Token 數量。
這項變更也說明了為何有開發者質疑 Sonnet 5 在實務上是否真的更便宜。Artificial Analysis 估算,該模型的單次任務運行成本約為 2.29 美元,約為 Sonnet 4.6 的兩倍,且比 Opus 4.8 高出約 15%。
Anthropic 的安全檢測發現,Sonnet 5 的幻覺及逢迎行為發生率低於 Sonnet 4.6。公司同時指出,Sonnet 5 更有效拒絕惡意請求,並在自主代理場景中更能抵抗提示注入攻擊。
不過,在 Anthropic 的自動化行為審核中,該模型表現出的不當行為比例仍高於 Opus 4.8 及 Claude Mythos 預覽版。Anthropic 表示,並未特別針對網絡安全工作訓練 Sonnet 5,且預設啟用了網絡安全防護。
Sonnet 系列模型在早期 AI 代理市場中扮演了關鍵角色,尤其是 Claude Sonnet 3.5、3.6 和 3.7。後續的性能提升多集中在 Opus 級系統,這也讓 Sonnet 5 的主要定位更加明確:在較小的模型級別中,重新帶回更強的代理行為。
接下來可讀: 富達稱加密熊市在五大力量匯聚時結束





