Yellow.com

Anthropic's Claude Mythos Preview e OpenAI's GPT-5.5, dois modelos de IA de fronteira, concluíram tarefas cibernéticas autônomas em um ritmo que deixou para trás as previsões existentes de capacidade, relataram pesquisadores na quarta‑feira.

Modelos de fronteira ultrapassam a tendência

Claude Mythos Preview e GPT-5.5 outperformed a tendência de duplicação que o AI Security Institute do Reino Unido vinha acompanhando desde o fim de 2024.

O AISI havia estimado, no início deste ano, que o horizonte de tempo para atingir 80% de confiabilidade em tarefas cibernéticas estava dobrando aproximadamente a cada cinco meses, abaixo da marca de oito meses registrada em novembro de 2025. Um ponto de controle mais recente do Mythos Preview solved “The Last Ones”, um ataque simulado de rede corporativa em 32 etapas, em 6 de 10 tentativas, e concluiu “Cooling Tower” em 3 de 10. O GPT-5.5 concluiu “The Last Ones” em 3 de 10 tentativas.

Foi a primeira vez que qualquer modelo completou ambos os conjuntos de testes do AISI.

Also Read: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided

Alerta de “Vulnpocalipse” da Palo Alto

A Palo Alto Networks reported conclusões semelhantes em seus próprios testes.

A empresa analisou mais de 130 produtos no último mês e encontrou 75 vulnerabilidades legítimas, mais de sete vezes sua contagem mensal típica, todas agora corrigidas.

Lee Klarich, diretor de tecnologia da empresa, disse que as organizações têm uma janela estreita antes que adversários alcancem capacidades semelhantes.

Ele estimou uma “janela estreita de três a cinco meses para que as organizações superem os adversários”.

O AISI alertou que sua amostra ainda é pequena e que as tarefas mais difíceis têm dados humanos de comparação limitados. Mesmo assim, o instituto afirmou que retirar qualquer modelo individual da análise altera a estimativa de tempo de duplicação em menos de um mês. A METR, uma organização sem fins lucrativos que tracks IA em tarefas de software, chegou a uma estimativa quase idêntica, de cerca de quatro meses.

Curva de capacidade se acentua

A Anthropic limitou o lançamento inicial do Mythos no mês passado a um grupo seleto que inclui Palo Alto Networks, CrowdStrike, Amazon, Apple e JPMorgan.

A OpenAI veio em seguida com seu modelo GPT-5.5-Cyber e sua iniciativa de segurança cibernética Daybreak.

O ritmo de mudança se acentuou de forma brusca nos últimos 18 meses. O AISI reduziu seu período projetado de duplicação de oito meses para 4,7 meses em fevereiro de 2026, e o comprimiu novamente após esta última rodada. A nova estimativa recalculada agora se aproxima de quatro meses, espelhando a leitura da METR em tarefas de engenharia de software.

Alexey Bondarev

Alexey Bondarev é o Head of Content na Yellow.com, tendo reportado sobre cripto nos últimos 10 anos. Ele se especializa em artigos aprofundados de Research e Learn, com foco em reportagens analíticas, contexto de mercado e nas grandes forças que moldam o universo cripto, desde a era da IA e tecnologias de segurança até a inovação em fintech. Ele acredita que tudo o que é digital em breve superará tudo o que é analógico e está trabalhando arduamente para ajudar a tornar isso realidade.

Como o Claude Mythos e o GPT-5.5 reescreveram silenciosamente a matemática da defesa cibernética

Modelos de fronteira ultrapassam a tendência

Alerta de “Vulnpocalipse” da Palo Alto

Curva de capacidade se acentua

Alexey Bondarev