Como o Claude Mythos e o GPT-5.5 reescreveram silenciosamente a matemática da defesa cibernética

Como o Claude Mythos e o GPT-5.5 reescreveram silenciosamente a matemática da defesa cibernética

Anthropic's Claude Mythos Preview e OpenAI's GPT-5.5, dois modelos de IA de fronteira, concluíram tarefas cibernéticas autônomas em um ritmo que deixou para trás as previsões existentes de capacidade, relataram pesquisadores na quarta‑feira.

Modelos de fronteira ultrapassam a tendência

Claude Mythos Preview e GPT-5.5 outperformed a tendência de duplicação que o AI Security Institute do Reino Unido vinha acompanhando desde o fim de 2024.

O AISI havia estimado, no início deste ano, que o horizonte de tempo para atingir 80% de confiabilidade em tarefas cibernéticas estava dobrando aproximadamente a cada cinco meses, abaixo da marca de oito meses registrada em novembro de 2025. Um ponto de controle mais recente do Mythos Preview solved “The Last Ones”, um ataque simulado de rede corporativa em 32 etapas, em 6 de 10 tentativas, e concluiu “Cooling Tower” em 3 de 10. O GPT-5.5 concluiu “The Last Ones” em 3 de 10 tentativas.

Foi a primeira vez que qualquer modelo completou ambos os conjuntos de testes do AISI.

Also Read: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided

Alerta de “Vulnpocalipse” da Palo Alto

A Palo Alto Networks reported conclusões semelhantes em seus próprios testes.

A empresa analisou mais de 130 produtos no último mês e encontrou 75 vulnerabilidades legítimas, mais de sete vezes sua contagem mensal típica, todas agora corrigidas.

Lee Klarich, diretor de tecnologia da empresa, disse que as organizações têm uma janela estreita antes que adversários alcancem capacidades semelhantes.

Ele estimou uma “janela estreita de três a cinco meses para que as organizações superem os adversários”.

O AISI alertou que sua amostra ainda é pequena e que as tarefas mais difíceis têm dados humanos de comparação limitados. Mesmo assim, o instituto afirmou que retirar qualquer modelo individual da análise altera a estimativa de tempo de duplicação em menos de um mês. A METR, uma organização sem fins lucrativos que tracks IA em tarefas de software, chegou a uma estimativa quase idêntica, de cerca de quatro meses.

Curva de capacidade se acentua

A Anthropic limitou o lançamento inicial do Mythos no mês passado a um grupo seleto que inclui Palo Alto Networks, CrowdStrike, Amazon, Apple e JPMorgan.

A OpenAI veio em seguida com seu modelo GPT-5.5-Cyber e sua iniciativa de segurança cibernética Daybreak.

O ritmo de mudança se acentuou de forma brusca nos últimos 18 meses. O AISI reduziu seu período projetado de duplicação de oito meses para 4,7 meses em fevereiro de 2026, e o comprimiu novamente após esta última rodada. A nova estimativa recalculada agora se aproxima de quatro meses, espelhando a leitura da METR em tarefas de engenharia de software.

Read Next: Coinbase Opens $100K USDC Loans Against Solana Token Holdings

Disclaimer e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e baseiam-se na opinião do autor. Não constituem aconselhamento financeiro, de investimento, legal ou fiscal. Os ativos de criptomoeda são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou deter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou executivos. Sempre conduza a sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Como o Claude Mythos e o GPT-5.5 reescreveram silenciosamente a matemática da defesa cibernética | Yellow.com