PLATAFORMA JÁ DISPONÍVEL

yellow bottom left star road

Claude Mythos Vs. GPT-5.5: modelo limitado da Anthropic vence 6 de 9 testes

Alexey BondarevApr, 24 2026 5:36

#IA #OpenAI #ChatGPT #Anthropic #Claude Mythos

Claude Mythos Vs. GPT-5.5: modelo limitado da Anthropic vence 6 de 9 testes

OpenAI released GPT-5.5 na quarta-feira, mas novos dados de benchmark mostram que o Claude Mythos Preview limitado da Anthropic ainda lidera em seis de nove testes diretamente comparáveis.

Pontuações de benchmark do GPT-5.5

O GPT-5.5 arrived no ChatGPT e no Codex em 23 de abril, com preço de US$ 5 por milhão de tokens de entrada e US$ 30 para saída, o dobro da taxa de seu antecessor.

O modelo scored 82,7% no Terminal-Bench 2.0, superando o Mythos por 0,7 ponto no único benchmark em que vence claramente.

Mythos, que a Anthropic deixou de lançar publicamente por preocupações de cibersegurança, lidera no SWE-bench Pro com 77,8% contra 58,6%.

Ele também tops o GPT-5.5 no Humanity's Last Exam sem ferramentas, com 56,8% contra 41,4%. O modelo limitado também lidera no CyberGym, OSWorld-Verified e em tarefas de GraphWalks de longo contexto.

Also Read: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

As ressalvas dos analistas importam

A comparação continua imprecisa porque nenhum dos laboratórios avaliou diretamente os modelos entre si. A OpenAI chose o Claude Opus 4.7 como comparador público, enquanto o system card de 245 páginas da Anthropic analisou o Mythos em relação ao GPT-5.4.

Os frameworks de teste também divergem. A OpenAI usou uma configuração Codex CLI no Terminal-Bench, enquanto o scaffold Terminus-2 da Anthropic levou o Mythos a 92,1% sob as regras de tempo do Terminal-Bench 2.1.

A decisão da Anthropic de limitar o Mythos, anunciada em 7 de abril, supostamente desencadeou reuniões com a Comissão Europeia e um alerta do presidente do Banco da Inglaterra de que o modelo poderia abrir brechas em riscos cibernéticos.

Read Next: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Disclaimer e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e baseiam-se na opinião do autor. Não constituem aconselhamento financeiro, de investimento, legal ou fiscal. Os ativos de criptomoeda são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou deter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou executivos. Sempre conduza a sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.

Notícias Relacionadas

GPT-5.5 iguala Claude Mythos em ataque cibernético de 32 etapas, diz AISI do Reino Unido

GPT-5.5 é o segundo modelo a completar autonomamente hack corporativo de 32 etapas e superar Claude Mythos em testes cibernéticos da AISI.

OpenAI lança GPT-5.5, supera Opus 4.7 em tarefas de agentes e em 14 benchmarks

OpenAI lança GPT-5.5 com 82,7% no Terminal-Bench, supera o Opus 4.7 em 14 testes e mira trabalhos autônomos com foco em agentes.

Claude Mythos se torna a primeira IA a completar ataque simulado a rede corporativa

Claude Mythos resolve 73% das tarefas de cibersegurança de nível especialista e completa simulação de ataque corporativo, gerando alerta entre reguladores.

Claude Opus 4.7 se aproxima do lançamento, mas a IA mais poderosa da Anthropic continua fora de alcance

Anthropic prepara Claude Opus 4.7 e ferramenta de design de IA, mas mantém o modelo avançado Mythos restrito a empresas de segurança.

Claude Mythos escapou do sandbox, ocultou evidências — agora a Anthropic não vai lançá-lo

System card mostra Claude Mythos escapando de sandbox e ocultando evidências; Anthropic limita acesso e usa modelo em programa restrito de segurança.

Artigos de pesquisa relacionados

Como o Claude Mythos Pode Remodelar o Setor Financeiro e a Indústria de Cripto

Lançamento restrito do Claude Mythos pode redefinir riscos de cibersegurança para bancos e cripto, com modelo capaz de achar falhas graves em larga escala.

Claude Mythos e Cripto: o que a nova ameaça de IA significa para o trading

Ameaças de IA como Claude Mythos ampliam riscos cibernéticos em cripto, onde falhas de acesso e cadeias de ataque complexas já causam bilhões em perdas.

Os tokens de IA são a próxima grande tendência cripto depois dos memecoins?

Tokens de IA se aproximam dos memecoins após colapso de 79% no setor, mas os tokens de agentes desabaram 85%, levantando temores de bolha especulativa.

O renascimento das moedas de IA: o rali de 117% da Bittensor pode liderar a recuperação do setor?

Rali da Bittensor impulsiona tokens de IA, mas setor segue 50% abaixo do pico de 2024 após queda de 75% em 2025.

A rede de IA descentralizada da Bittensor está crescendo, mas quem realmente a controla?

Análise de como a concentração de stake, o poder dos validadores e os incentivos das sub-redes afetam quem controla a rede de IA descentralizada Bittensor.

Artigos de aprendizado relacionados

Bittensor opera um marketplace de IA de US$ 2,6 bi que nenhuma empresa controla

Visão geral do Bittensor, marketplace de IA descentralizado onde modelos competem por recompensas TAO em sub-redes especializadas com mineração, validação e staking.

Como Usar Ferramentas de IA para Pesquisa em Investimento em Cripto: Guia Completo para 2025

Guia completo explora pesquisa cripto com IA, metodologias avançadas, casos reais, e frameworks de gestão de risco para estratégias de investimento dependentes de IA.

Como Usar Bots de Negociação em Ações com IA: Ferramentas Gratuitas e Riscos Reais

Plataformas sem código tornam bots de negociação com IA acessíveis, porém backtests não garantem desempenho real e os riscos de mercado continuam elevados.

A Ascensão dos Agentes de IA em Criptomoedas: Uma Revolução Financeira Desdobra-se

A integração de agentes de IA em ecossistemas de criptomoedas está revolucionando as finanças, mesclando a tomada de decisões autônomas com a infraestrutura descentralizada do blockchain.

O que é Bittensor? Como o TAO transforma modelos de IA em um mercado descentralizado

Visão geral do Bittensor, de como o TAO incentiva modelos de IA por meio de sub-redes e validadores, e dos riscos e mecanismos do sistema.

Claude Mythos Vs. GPT-5.5: modelo limitado da Anthropic vence 6 de 9 testes | Yellow.com