Claude Sonnet 5 défie Opus 4.8, mais le coût des jetons complique les calculs

Claude Sonnet 5 défie Opus 4.8, mais le coût des jetons complique les calculs

Anthropic a lancé Claude Sonnet 5, un nouveau modèle d’IA qui, selon l’entreprise, rapproche les systèmes de la gamme Sonnet de Claude Opus 4.8 pour le travail d’agent.

Points clés :

  • Anthropic affirme que Claude Sonnet 5 améliore le raisonnement, l’utilisation d’outils, la programmation et le travail de connaissance par rapport à Sonnet 4.6.
  • Le modèle affiche des tarifs inférieurs à ceux d’Opus 4.8, mais un changement de tokenizer peut augmenter le nombre de jetons.
  • Les premiers tests montrent un comportement d’agent plus robuste, tandis que certains développeurs s’interrogent sur le coût réel de son exécution.

Claude Sonnet

Anthropic a décrit Claude Sonnet 5 comme son « modèle Sonnet le plus agentique à ce jour », expliquant qu’il peut planifier, utiliser des navigateurs et des terminaux, et travailler avec davantage d’autonomie que les précédentes versions de Sonnet.

L’entreprise indique que le modèle réduit l’écart avec Claude Opus 4.8 tout en conservant un prix affiché plus bas. Sonnet 5 est facturé 3 $ par million de jetons en entrée et 15 $ par million de jetons en sortie, contre 5 $ et 25 $ pour Opus 4.8.

Anthropic propose un tarif de lancement jusqu’au 31 août 2026, avec une entrée à 2 $ par million de jetons et une sortie à 10 $ par million de jetons. La tarification standard reprendra après cette date.

L’entreprise a également indiqué avoir augmenté les limites de débit pour Chat, Cowork, Claude Code et la plateforme Claude, car les modes à plus haut « niveau d’effort » peuvent consommer davantage de jetons.

À lire aussi : OpenAI corrige Codex après que des développeurs ont épuisé leurs limites hebdomadaires en 2 jours

Coûts chez Anthropic

La question du prix est complexe. Anthropic explique que Sonnet 5 utilise un nouveau tokenizer, similaire au changement introduit avec Claude Opus 4.7, et qu’une même entrée peut désormais correspondre à environ 1,0 à 1,35 fois plus de jetons.

Ce changement contribue à expliquer pourquoi certains développeurs se demandent si Sonnet 5 est réellement moins cher à l’usage. Artificial Analysis a estimé le coût d’exploitation du modèle à 2,29 $ par tâche, soit environ le double de Sonnet 4.6 et environ 15 % de plus qu’Opus 4.8.

L’évaluation de sécurité d’Anthropic a constaté des taux plus faibles d’hallucinations et de comportements obséquieux que pour Sonnet 4.6. L’entreprise indique également que Sonnet 5 a mieux rejeté les requêtes malveillantes et mieux résisté aux attaques par injection de prompt dans des contextes d’agents autonomes.

Le modèle présentait toutefois un taux de comportement inapproprié plus élevé qu’Opus 4.8 et que Claude Mythos Preview dans l’audit automatisé de comportement d’Anthropic. L’entreprise précise ne pas avoir spécifiquement entraîné Sonnet 5 pour les tâches de cybersécurité et avoir activé par défaut des garde-fous de sécurité réseau.

Les modèles Sonnet ont contribué à définir le marché initial des agents d’IA, en particulier avec Claude Sonnet 3.5, 3.6 et 3.7. Les progrès récents s’étaient surtout concentrés sur les systèmes de niveau Opus, ce qui clarifie le rôle principal de Sonnet 5 : réintroduire un comportement d’agent plus puissant dans une classe de modèles plus petite.

À lire ensuite : Les marchés baissiers du crypto se terminent lorsque 5 forces s’alignent, selon Fidelity

Avertissement et avertissement sur les risques : Les informations fournies dans cet article sont à des fins éducatives et informatives uniquement et sont basées sur l'opinion de l'auteur. Elles ne constituent pas des conseils financiers, d'investissement, juridiques ou fiscaux. Les actifs de cryptomonnaie sont très volatils et sujets à des risques élevés, y compris le risque de perdre tout ou une partie substantielle de votre investissement. Le trading ou la détention d'actifs crypto peut ne pas convenir à tous les investisseurs. Les opinions exprimées dans cet article sont uniquement celles de l'auteur/des auteurs et ne représentent pas la politique officielle ou la position de Yellow, de ses fondateurs ou de ses dirigeants. Effectuez toujours vos propres recherches approfondies (D.Y.O.R.) et consultez un professionnel financier agréé avant de prendre toute décision d'investissement.
Dernières nouvelles
Voir toutes les nouvelles