OpenAI lança GPT-5.5, supera Opus 4.7 em tarefas de agentes e em 14 benchmarks

OpenAI lança GPT-5.5, supera Opus 4.7 em tarefas de agentes e em 14 benchmarks

OpenAI lançou o GPT-5.5 em 23 de abril, apresentando o modelo, codinome "Spud", como seu sistema mais avançado até agora para trabalho autônomo e de múltiplas etapas.

Impulso de programação agentiva com o GPT-5.5

O lançamento lands ocorre exatamente uma semana depois de a Anthropic pushed Claude Opus 4.7 chegar à disponibilidade geral, preparando um confronto direto em cargas de trabalho de agentes, segundo a TechCrunch e a Fortune.

O GPT-5.5 foi projetado para planejar, executar ferramentas, verificar sua própria saída e iterar sem a necessidade de prompts constantes.

O presidente Greg Brockman o chamou de "uma nova classe de inteligência" em uma ligação com repórteres, descrevendo-o como um passo em direção a "uma computação mais agentiva e intuitiva".

O modelo está sendo disponibilizado para ChatGPT Plus, Pro, Business e Enterprise, com uma variante Pro mais robusta também ativa. Os preços da API começam em US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens de saída em uma janela de contexto de um milhão de tokens.

Also Read: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Diferença de benchmark para o Opus 4.7

Os números da própria OpenAI, que o VentureBeat flagged como estado da arte em 14 avaliações, colocam o GPT-5.5 em 82,7% no Terminal-Bench 2.0, bem à frente dos 69,4% do Opus 4.7.

No FrontierMath Tiers 1 a 3, o novo modelo alcançou 51,7%, contra 43,8% do carro-chefe da Anthropic.

As pontuações de uso de computador ficaram mais próximas, com o GPT-5.5 em 78,7% no OSWorld-Verified contra 78,0% do Opus 4.7, embora o GPT-5.5 Pro tenha se destacado em navegação, com 90,1% contra 79,3%.

Avaliadores ainda atribuem ao Opus 4.7 uma escrita de pesquisa mais forte e melhor seguimento de instruções, além de visão em resolução mais alta, em cerca de 3,75 megapixels.

O ritmo continua tightening. O GPT-5.5 chega seis semanas após o GPT-5.4. A Anthropic lançou o Opus 4.6 em fevereiro antes do Opus 4.7, enquanto o Google manteve o Gemini 3.1 Pro na mesma faixa corporativa.

Read Next: TRON Connects $85B USDT Network To LI.FI In Cross-Chain DeFi Push

Disclaimer e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e baseiam-se na opinião do autor. Não constituem aconselhamento financeiro, de investimento, legal ou fiscal. Os ativos de criptomoeda são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou deter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou executivos. Sempre conduza a sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
OpenAI lança GPT-5.5, supera Opus 4.7 em tarefas de agentes e em 14 benchmarks | Yellow.com