Claude Sonnet 5 desafia o Opus 4.8, mas custos de tokens complicam a conta

Claude Sonnet 5 desafia o Opus 4.8, mas custos de tokens complicam a conta

Anthropic lançou o Claude Sonnet 5, um novo modelo de IA que, segundo a empresa, aproxima sistemas de nível Sonnet do Claude Opus 4.8 em trabalho de agente.

Principais pontos:

  • A Anthropic diz que o Claude Sonnet 5 melhora raciocínio, uso de ferramentas, programação e trabalho de conhecimento em relação ao Sonnet 4.6.
  • O modelo tem tarifas de lista menores que o Opus 4.8, mas uma mudança no tokenizador pode aumentar a contagem de tokens.
  • Testes iniciais mostram comportamento de agente mais forte, enquanto alguns desenvolvedores questionaram o custo real de executá-lo.

Claude Sonnet

A Anthropic descreveu o Claude Sonnet 5 como seu “modelo Sonnet mais agente até hoje”, dizendo que ele pode planejar, usar navegadores e terminais e trabalhar com mais autonomia do que versões anteriores do Sonnet.

A empresa disse que o modelo reduz a diferença em relação ao Claude Opus 4.8, mantendo um preço de lista mais baixo. O Sonnet 5 custa US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída, em comparação com US$ 5 e US$ 25 para o Opus 4.8.

A Anthropic está oferecendo uma tarifa introdutória até 31 de agosto de 2026, com entrada a US$ 2 por milhão de tokens e saída a US$ 10 por milhão de tokens. Após essa data, volta a valer a tabela padrão.

A empresa também afirmou que aumentou os limites de taxa para Chat, Cowork, Claude Code e a plataforma Claude porque modos de “nível de esforço” mais alto podem consumir mais tokens.

Veja também: OpenAI corrige o Codex após desenvolvedores estourarem limites semanais em 2 dias

Custos da Anthropic

A questão do preço não é simples. A Anthropic informou que o Sonnet 5 usa um novo tokenizador, semelhante à mudança introduzida com o Claude Opus 4.7, e que a mesma entrada pode corresponder a cerca de 1,0 a 1,35 vez mais tokens.

Essa mudança ajuda a explicar por que alguns desenvolvedores questionaram se o Sonnet 5 é realmente mais barato na prática. A Artificial Analysis estimou o custo operacional do modelo em US$ 2,29 por tarefa, cerca do dobro do Sonnet 4.6 e aproximadamente 15% acima do Opus 4.8.

A revisão de segurança da Anthropic encontrou taxas menores de alucinações e de comportamento servil em comparação ao Sonnet 4.6. A empresa também disse que o Sonnet 5 rejeitou pedidos maliciosos com mais eficácia e resistiu melhor a ataques de injeção de prompt em cenários de agentes autônomos.

O modelo ainda apresentou uma taxa mais alta de comportamento inadequado do que o Opus 4.8 e o Claude Mythos Preview na auditoria automatizada de comportamento da Anthropic. A empresa afirmou que não treinou especificamente o Sonnet 5 para trabalho em cibersegurança e que habilitou proteções de segurança de rede por padrão.

Os modelos Sonnet ajudaram a definir o mercado inicial de agentes de IA, especialmente com o Claude Sonnet 3.5, 3.6 e 3.7. Ganhos mais recentes haviam se concentrado em sistemas de nível Opus, o que torna claro o principal papel do Sonnet 5: trazer de volta um comportamento de agente mais forte para uma classe de modelo menor.

Leia a seguir: Mercados de baixa de cripto acabam quando 5 forças se alinham, diz a Fidelity

Disclaimer e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e baseiam-se na opinião do autor. Não constituem aconselhamento financeiro, de investimento, legal ou fiscal. Os ativos de criptomoeda são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou deter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou executivos. Sempre conduza a sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Claude Sonnet 5 desafia o Opus 4.8, mas custos de tokens complicam a conta | Yellow.com