Claude Sonnet 5 défie Opus 4.8, mais le coût en jetons complique le calcul

Anthropic a lancé Claude Sonnet 5, un nouveau modèle d’IA qui, selon l’entreprise, rapproche les systèmes de la gamme Sonnet de Claude Opus 4.8 pour le travail d’agent.

Points clés :

Anthropic affirme que Claude Sonnet 5 améliore le raisonnement, l’usage d’outils, la programmation et le travail de connaissance par rapport à Sonnet 4.6.

Le modèle affiche des tarifs inférieurs à ceux d’Opus 4.8, mais un changement de tokenizer peut augmenter le nombre de jetons.

Les premiers tests montrent un comportement d’agent plus robuste, tandis que certains développeurs s’interrogent sur le coût réel de son exécution.

Claude Sonnet

Anthropic a décrit Claude Sonnet 5 comme son « modèle Sonnet le plus agentique à ce jour », en expliquant qu’il peut planifier, utiliser des navigateurs et des terminaux, et travailler avec plus d’autonomie que les précédentes versions de Sonnet.

L’entreprise indique que le modèle réduit l’écart avec Claude Opus 4.8 tout en conservant un prix affiché plus bas. Sonnet 5 est facturé 3 $ par million de jetons en entrée et 15 $ par million de jetons en sortie, contre 5 $ et 25 $ pour Opus 4.8.

Anthropic propose un tarif de lancement jusqu’au 31 août 2026, avec une entrée à 2 $ par million de jetons et une sortie à 10 $ par million de jetons. La tarification standard reprend après cette date.

La société a également annoncé une augmentation des limites de débit pour Chat, Cowork, Claude Code et la plateforme Claude, car les modes à plus haut « niveau d’effort » peuvent consommer davantage de jetons.

Coûts chez Anthropic

La question du prix n’est pas simple. Anthropic explique que Sonnet 5 utilise un nouveau tokenizer, similaire au changement introduit avec Claude Opus 4.7, et qu’une même entrée peut désormais correspondre à environ 1,0 à 1,35 fois plus de jetons.

Ce changement aide à comprendre pourquoi certains développeurs doutent que Sonnet 5 soit réellement moins cher à l’usage. Artificial Analysis a estimé le coût opérationnel du modèle à 2,29 $ par tâche, soit environ deux fois celui de Sonnet 4.6 et environ 15 % de plus qu’Opus 4.8.

L’évaluation de sûreté d’Anthropic a mis en évidence des taux plus faibles d’hallucinations et de comportements obséquieux que Sonnet 4.6. L’entreprise affirme également que Sonnet 5 rejette plus efficacement les requêtes malveillantes et résiste mieux aux attaques par injection de prompts dans des contextes d’agents autonomes.

Le modèle présente toutefois un taux de comportements inappropriés plus élevé qu’Opus 4.8 et que Claude Mythos Preview dans l’audit automatisé de comportement d’Anthropic. La société précise qu’elle n’a pas spécialement entraîné Sonnet 5 pour les missions de cybersécurité et qu’elle a activé par défaut des protections réseau.

Les modèles Sonnet ont contribué à définir le marché naissant des agents d’IA, en particulier avec Claude Sonnet 3.5, 3.6 et 3.7. Les progrès récents s’étaient davantage concentrés sur les systèmes de niveau Opus, ce qui clarifie le rôle principal de Sonnet 5 : ramener un comportement d’agent plus puissant dans une classe de modèles plus petite.