Anthropic 發布 Claude Sonnet 5,這款新 AI 模型據稱在代理工作表現上,讓 Sonnet 級系統更接近 Claude Opus 4.8。
重點摘要:
- Anthropic 指出,Claude Sonnet 5 在推理、工具使用、程式設計及知識型工作方面,相比 Sonnet 4.6 有所提升。
- 該模型的官方標價低於 Opus 4.8,但由於 tokenizer 變更,實際 token 數可能上升。
- 初步測試顯示代理行為更強,不過部分開發者質疑實際運行成本。
Claude Sonnet
Anthropic 在介紹 中稱 Claude Sonnet 5 為「至今最具代理性的 Sonnet 模型」,強調它能夠進行規劃、使用瀏覽器與終端機,並比以往 Sonnet 版本具備更高自主性。
公司表示,該模型在保持較低標價的同時,進一步縮小與 Claude Opus 4.8 的差距。Sonnet 5 的定價為每百萬輸入 token 3 美元、每百萬輸出 token 15 美元,相比之下,Opus 4.8 則為 5 美元與 25 美元。
Anthropic 亦提供 至 2026 年 8 月 31 日的優惠價格:輸入為每百萬 token 2 美元,輸出為 10 美元,之後將恢復標準定價。
公司同時表示,已提高 Chat、Cowork、Claude Code 及 Claude 平台的速率上限,因為較高「effort level」模式會消耗更多 token。
延伸閱讀: OpenAI 修復 Codex,因開發者兩天用光一週額度
Anthropic 成本
價格問題並不單純。Anthropic 指出,Sonnet 5 採用與 Claude Opus 4.7 類似的新 tokenizer,同一輸入約可對應為 1.0 至 1.35 倍的 token 數量。
這一變化也解釋了為何部分開發者質疑 Sonnet 5 在實務上是否更便宜。Artificial Analysis 估算,該模型平均每個任務的運行成本為 2.29 美元,約為 Sonnet 4.6 的兩倍,並比 Opus 4.8 高出約 15%。
Anthropic 的安全審查發現,Sonnet 5 的幻覺與過度逢迎行為比 Sonnet 4.6 更少。公司亦表示,Sonnet 5 更有效地拒絕惡意請求,並在自主代理情境中對提示注入攻擊有更佳抵禦能力。
不過,在 Anthropic 的自動化行為稽核中,該模型出現不當行為的比率仍高於 Opus 4.8 和 Claude Mythos Preview。Anthropic 表示,並未特別針對網絡安全工作訓練 Sonnet 5,且預設啟用網絡安全防護。
Sonnet 系列曾是早期 AI 代理市場的關鍵角色,尤其是 Claude Sonnet 3.5、3.6 和 3.7。近來的性能提升多集中在 Opus 級系統,也讓 Sonnet 5 的主要定位更明確:在較小模型級別中重新帶回更強的代理行為。
下一篇閱讀: Fidelity 指出:加密熊市在五大力量齊聚時結束





