Claude Sonnet 5 向 Opus 4.8 發起挑戰，但 Token 成本令計價更複雜

Anthropic 發布 Claude Sonnet 5，這款新 AI 模型據稱在代理工作表現上，讓 Sonnet 級系統更接近 Claude Opus 4.8。

重點摘要：

Anthropic 指出，Claude Sonnet 5 在推理、工具使用、程式設計及知識型工作方面，相比 Sonnet 4.6 有所提升。

該模型的官方標價低於 Opus 4.8，但由於 tokenizer 變更，實際 token 數可能上升。

初步測試顯示代理行為更強，不過部分開發者質疑實際運行成本。

Claude Sonnet

Anthropic 在介紹中稱 Claude Sonnet 5 為「至今最具代理性的 Sonnet 模型」，強調它能夠進行規劃、使用瀏覽器與終端機，並比以往 Sonnet 版本具備更高自主性。

公司表示，該模型在保持較低標價的同時，進一步縮小與 Claude Opus 4.8 的差距。Sonnet 5 的定價為每百萬輸入 token 3 美元、每百萬輸出 token 15 美元，相比之下，Opus 4.8 則為 5 美元與 25 美元。

Anthropic 亦提供至 2026 年 8 月 31 日的優惠價格：輸入為每百萬 token 2 美元，輸出為 10 美元，之後將恢復標準定價。

公司同時表示，已提高 Chat、Cowork、Claude Code 及 Claude 平台的速率上限，因為較高「effort level」模式會消耗更多 token。

延伸閱讀： OpenAI 修復 Codex，因開發者兩天用光一週額度

Anthropic 成本

價格問題並不單純。Anthropic 指出，Sonnet 5 採用與 Claude Opus 4.7 類似的新 tokenizer，同一輸入約可對應為 1.0 至 1.35 倍的 token 數量。

這一變化也解釋了為何部分開發者質疑 Sonnet 5 在實務上是否更便宜。Artificial Analysis 估算，該模型平均每個任務的運行成本為 2.29 美元，約為 Sonnet 4.6 的兩倍，並比 Opus 4.8 高出約 15%。

Anthropic 的安全審查發現，Sonnet 5 的幻覺與過度逢迎行為比 Sonnet 4.6 更少。公司亦表示，Sonnet 5 更有效地拒絕惡意請求，並在自主代理情境中對提示注入攻擊有更佳抵禦能力。

不過，在 Anthropic 的自動化行為稽核中，該模型出現不當行為的比率仍高於 Opus 4.8 和 Claude Mythos Preview。Anthropic 表示，並未特別針對網絡安全工作訓練 Sonnet 5，且預設啟用網絡安全防護。

Sonnet 系列曾是早期 AI 代理市場的關鍵角色，尤其是 Claude Sonnet 3.5、3.6 和 3.7。近來的性能提升多集中在 Opus 級系統，也讓 Sonnet 5 的主要定位更明確：在較小模型級別中重新帶回更強的代理行為。

下一篇閱讀： Fidelity 指出：加密熊市在五大力量齊聚時結束