Anthropic's Claude Mythos Preview e OpenAI's GPT-5.5, dois modelos de IA de fronteira, concluíram tarefas cibernéticas autônomas em um ritmo que deixou para trás as previsões existentes de capacidade, relataram pesquisadores na quarta‑feira.
Modelos de fronteira superam a tendência
Claude Mythos Preview e GPT-5.5 outperformed a tendência de duplicação que o AI Security Institute do Reino Unido vinha acompanhando desde o fim de 2024.
O AISI havia estimado, no início deste ano, que o horizonte de tempo para 80% de confiabilidade em ciberataques estava dobrando aproximadamente a cada cinco meses, ante oito meses em novembro de 2025. Um checkpoint mais recente do Mythos Preview solved “The Last Ones”, um ataque simulado a rede corporativa em 32 etapas, em 6 de 10 tentativas, e concluiu “Cooling Tower” em 3 de 10. O GPT-5.5 concluiu “The Last Ones” em 3 de 10 tentativas.
Foi a primeira vez que qualquer modelo havia completado ambos os intervalos do AISI.
Also Read: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided
Alerta de “vulnpocalipse” da Palo Alto
A Palo Alto Networks reported conclusões semelhantes em seus próprios testes.
A empresa examinou mais de 130 produtos no último mês e descobriu 75 vulnerabilidades legítimas, mais de sete vezes sua contagem mensal típica, todas agora corrigidas.
Lee Klarich, diretor de tecnologia da empresa, disse que as organizações têm uma janela estreita antes que adversários obtenham capacidades semelhantes.
Ele estimou uma “estreita janela de três a cinco meses para que as organizações superem o adversário”.
O AISI advertiu que sua amostra ainda é pequena e que as tarefas mais difíceis têm dados humanos de comparação limitados. Mesmo assim, o instituto afirmou que remover qualquer modelo da análise altera a estimativa de tempo de duplicação em menos de um mês. A METR, organização sem fins lucrativos que tracks IA em tarefas de software, chegou a um valor quase idêntico de cerca de quatro meses.
Curva de capacidade se acentua
A Anthropic limitou o lançamento inicial do Mythos no mês passado a um grupo seleto que incluía Palo Alto Networks, CrowdStrike, Amazon, Apple e JPMorgan.
A OpenAI veio em seguida com seu modelo GPT-5.5-Cyber e a iniciativa de segurança cibernética Daybreak.
O ritmo da mudança se acentuou drasticamente nos últimos 18 meses. O AISI reduziu seu período projetado de duplicação de oito meses para 4,7 meses em fevereiro de 2026, e o reduziu novamente após esta última rodada. A nova estimativa agora está mais próxima de quatro meses, espelhando a leitura da METR em tarefas de engenharia de software.
Read Next: Coinbase Opens $100K USDC Loans Against Solana Token Holdings





