Fable 5 superou o GPT 5.5 antes que ordem dos EUA tirasse o modelo do ar

Fable 5 superou o GPT 5.5 antes que ordem dos EUA tirasse o modelo do ar

Anthropic’s Fable 5 superou brevemente o OpenAI’s GPT 5.5 em grandes benchmarks de IA antes que uma ordem de controle de exportação dos EUA em 12 de junho o tirasse do ar.

Pontos principais:

  • Fable 5 ficou à frente do GPT 5.5 no Chatbot Arena, SWE-Bench Pro e principais testes de código.
  • O modelo ficou disponível por apenas três dias antes de o governo dos EUA ordenar que a Anthropic o desativasse.
  • O GPT 5.5 agora é o modelo disponível mais forte por padrão, não porque tenha superado o Fable 5.

Fable 5 foi desligado

O Fable 5 se tornou o modelo público de IA mais capaz após seu lançamento em 9 de junho, superando o GPT 5.5 em grandes benchmarks antes de a intervenção do governo dos EUA três dias depois.

O modelo ficou em primeiro lugar no Chatbot Arena, enquanto o GPT 5.5 ficou em quarto. No SWE-Bench Pro, o Fable 5 marcou 80,3%, contra 58,6% do GPT 5.5, uma diferença de quase 22 pontos em tarefas reais de engenharia de software.

A liderança também foi clara em testes de programação. O Fable 5 marcou 1.665 no Code Arena, 98 pontos de Elo acima do GPT 5.5, e alcançou 29,3% no FrontierCode Diamond, em que o GPT 5.5 chegou a 5,7%.

O GPT 5.5 tinha uma vantagem mais estreita em termos práticos de posicionamento. Ele custa US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens de saída, enquanto o Fable 5 custava US$ 10 e US$ 50, tornando o modelo da OpenAI mais barato para uso em grande escala.

O Fable 5 também oferecia uma janela de contexto de um milhão de tokens e 128.000 tokens de saída. A Anthropic o havia disponibilizado para assinantes Pro, Max, Team e Enterprise sem custo extra até 22 de junho, antes de a ordem encerrar esse período antecipadamente.

Também leia: Is AI Becoming A Real Advantage In Court? Ask The Lawyer Who Just Beat Meta

GPT 5.5 é o rei

O desligamento veio após uma diretiva de controle de exportação de 12 de junho que citava uma vulnerabilidade de jailbreak no Fable 5 e na família de modelos Mythos 5. A Anthropic contestou a conclusão, dizendo que o problema era menor, já conhecido e também reproduzível no GPT 5.5 sem métodos especiais de contorno.

O resultado é incomum para o mercado de IA.

Desenvolvedores perderam acesso ao modelo que liderava as tabelas de benchmark, enquanto o GPT 5.5 se tornou a melhor opção disponível porque seu rival mais próximo foi removido.

Essa diferença importa principalmente para fluxos de trabalho de programação. Um intervalo de 22 pontos no SWE-Bench Pro significa a diferença entre um modelo que resolve cerca de quatro em cada cinco problemas reais em bases de código e outro que lida com algo mais próximo de três em cinco.

A breve passagem do Fable 5 também mostrou a rapidez com que a fronteira pode avançar. O GPT 5.5 foi lançado no fim de abril com o codinome interno “Spud”, mas sua liderança durou apenas até a Anthropic abrir o acesso público a um sistema de classe Mythos mais forte em junho.

Leia a seguir: Anthropic Refused To Patch Claude Fable's Jailbreak, So The US Banned It, David Sacks Says

Isenção de responsabilidade e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e são baseadas na opinião do autor. Elas não constituem aconselhamento financeiro, de investimento, jurídico ou tributário. Ativos de criptomoedas são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou manter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou seus executivos. Sempre conduza sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Fable 5 superou o GPT 5.5 antes que ordem dos EUA tirasse o modelo do ar | Yellow.com