OpenAI lança GPT-5.5, supera Opus 4.7 em tarefas de agentes e 14 benchmarks

OpenAI lança GPT-5.5, supera Opus 4.7 em tarefas de agentes e 14 benchmarks

OpenAI lançou o GPT-5.5 em 23 de abril, apresentando o modelo, codinome "Spud", como seu sistema mais avançado até agora para trabalho autônomo e de múltiplas etapas.

Investida de codificação agentic do GPT-5.5

O lançamento lands ocorre exatamente uma semana depois de a Anthropic pushed Claude Opus 4.7 entrar em disponibilidade geral, preparando um confronto direto em cargas de trabalho de agentes, segundo TechCrunch e Fortune.

O GPT-5.5 foi criado para planejar, acionar ferramentas, checar a própria saída e iterar sem necessidade de prompts constantes.

O presidente Greg Brockman o chamou de "uma nova classe de inteligência" em uma ligação com repórteres, descrevendo-o como um passo em direção a "uma computação mais agentic e intuitiva".

O modelo está sendo disponibilizado para ChatGPT Plus, Pro, Business e Enterprise, com uma variante Pro mais robusta também ativa. Os preços da API começam em US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens de saída em uma janela de contexto de um milhão de tokens.

Também leia: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Diferença de benchmarks em relação ao Opus 4.7

Os próprios números da OpenAI, que a VentureBeat flagged destacou como estado da arte em 14 avaliações, colocam o GPT-5.5 em 82,7% no Terminal-Bench 2.0, bem acima dos 69,4% do Opus 4.7.

No FrontierMath Tiers 1 a 3, o novo modelo atingiu 51,7%, contra 43,8% do principal modelo da Anthropic.

As pontuações de uso de computador ficaram mais próximas, com o GPT-5.5 em 78,7% no OSWorld-Verified, contra 78,0% do Opus 4.7, embora o GPT-5.5 Pro tenha se destacado em navegação, com 90,1% contra 79,3%.

Avaliadores ainda creditam ao Opus 4.7 uma escrita de pesquisa mais forte e melhor obediência a instruções, além de visão de maior resolução, em cerca de 3,75 megapixels.

O ritmo continua tightening. O GPT-5.5 chega seis semanas após o GPT-5.4. A Anthropic lançou o Opus 4.6 em fevereiro antes do Opus 4.7, enquanto o Google mantém o Gemini 3.1 Pro no mesmo segmento corporativo.

Leia a seguir: TRON Connects $85B USDT Network To LI.FI In Cross-Chain DeFi Push

Isenção de responsabilidade e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e são baseadas na opinião do autor. Elas não constituem aconselhamento financeiro, de investimento, jurídico ou tributário. Ativos de criptomoedas são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou manter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou seus executivos. Sempre conduza sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
OpenAI lança GPT-5.5, supera Opus 4.7 em tarefas de agentes e 14 benchmarks | Yellow.com