Claude Mythos se torna a primeira IA a completar ataque simulado a rede corporativa

Anthropic's Claude Mythos Preview became the first AI model to complete a full simulated corporate network attack, resolvendo 73% das tarefas de cibersegurança em nível especialista que nenhum sistema de IA anterior conseguiu concluir, de acordo com o UK AI Security Institute (AISI).

Avaliação cibernética do AISI

O AISI, um órgão de pesquisa dentro do Departamento de Ciência, Inovação e Tecnologia do governo do Reino Unido, ran duas baterias de testes no modelo depois que a Anthropic o anunciou em 7 de abril.

A empresa optou por não lançar o Claude Mythos amplamente, em vez disso granting acesso limitado a empresas de pesquisa em segurança.

Em avaliações de capture the flag, o Claude Mythos atingiu uma taxa de sucesso de 73% em tarefas de nível especialista.

Nenhum modelo havia resolvido qualquer uma dessas tarefas antes de abril de 2025. O AISI também criou uma simulação de ataque a rede corporativa em 32 etapas chamada "The Last Ones", projetada para levar cerca de 20 horas para profissionais humanos. O Claude Mythos concluiu a simulação completa em 3 de 10 tentativas e teve média de 22 de 32 etapas, em comparação com 16 para o Claude Opus 4.6, o segundo melhor desempenho.

"O sucesso do Mythos Preview em um cyber range indica que ele é pelo menos capaz de atacar autonomamente sistemas empresariais pequenos, fracamente defendidos e vulneráveis onde já se obteve acesso à rede", disse o AISI.

Also Read: Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns

Exploits de dia zero

A própria equipe de red team da Anthropic descobriu que o Claude Mythos consegue detectar e explorar vulnerabilidades de dia zero em todos os principais sistemas operacionais e nos principais navegadores da web quando um usuário o instrui explicitamente. A empresa afirmou que mais de 99% das vulnerabilidades descobertas permanecem sem correção.

"Estamos limitados no que podemos relatar aqui. Seria irresponsável divulgar detalhes sobre elas", disse a Anthropic.

As capacidades do modelo já reached círculos de formulação de políticas.

Segundo a Reuters, o secretário do Tesouro dos EUA Scott Bessent e o presidente do Federal Reserve, Jerome Powell, held uma reunião urgente com CEOs de grandes bancos para discutir possíveis riscos cibernéticos ligados ao modelo.

Resposta de segurança da Anthropic

A Anthropic lançou o Project Glasswing junto com o anúncio do modelo, descrevendo-o como um esforço para usar o Claude Mythos para ajudar a proteger softwares críticos. A empresa enquadrou a iniciativa como preparação para uma era em que as equipes de segurança precisam se manter à frente de atacantes equipados com IA. O AISI recomendou que as organizações priorizem medidas fundamentais de cibersegurança, incluindo aplicação regular de patches, controles de acesso rígidos, endurecimento de configuração e registros abrangentes.

O anúncio de 7 de abril veio após meses de crescente preocupação com o papel da IA na cibersegurança. Modelos de fronteira anteriores haviam demonstrado capacidades ofensivas limitadas, mas nenhum havia superado benchmarks de CTF em nível especialista ou concluído simulações de ataque em múltiplas etapas antes do Claude Mythos.