Anthropic Claude Mythos Preview became the first AI model to complete a full simulated corporate network attack, resolvendo 73% das tarefas de cibersegurança em nível especialista que nenhum sistema de IA anterior conseguiu solucionar, segundo o UK AI Security Institute (AISI).
Avaliação de Cibersegurança do AISI
O AISI, um órgão de pesquisa dentro do Departamento de Ciência, Inovação e Tecnologia do governo do Reino Unido, ran duas baterias de testes no modelo após o anúncio da Anthropic em 7 de abril.
A empresa decidiu não lançar o Claude Mythos amplamente, optando por granting acesso limitado a empresas de pesquisa em segurança.
Em avaliações de capture the flag, o Claude Mythos atingiu uma taxa de sucesso de 73% em tarefas de nível especialista.
Nenhum modelo havia resolvido qualquer uma dessas tarefas antes de abril de 2025. O AISI também desenvolveu uma simulação de ataque à rede corporativa em 32 etapas chamada "The Last Ones", projetada para levar cerca de 20 horas para profissionais humanos. O Claude Mythos concluiu a simulação completa em 3 de 10 tentativas e atingiu em média 22 das 32 etapas, em comparação com 16 do Claude Opus 4.6, o segundo melhor desempenho.
"O sucesso do Mythos Preview em um cyber range indica que ele é ao menos capaz de atacar de forma autônoma sistemas corporativos pequenos, fracamente defendidos e vulneráveis nos quais já se obteve acesso à rede", afirmou o AISI.
Also Read: Crypto Funds Pull $1.1B In Best Week Since January As Risk Appetite Returns
Exploits de dia zero
A própria equipe de red team da Anthropic descobriu que o Claude Mythos consegue detectar e explorar vulnerabilidades de dia zero em todos os principais sistemas operacionais e navegadores web líderes quando o usuário o instrui explicitamente. A empresa afirmou que mais de 99% das vulnerabilidades descobertas permanecem sem correção.
"Estamos limitados no que podemos relatar aqui. Seria irresponsável divulgar detalhes sobre elas", disse a Anthropic.
As capacidades do modelo já reached os círculos de formulação de políticas.
Segundo a Reuters, o Secretário do Tesouro dos EUA Scott Bessent e o presidente do Federal Reserve, Jerome Powell, held uma reunião de urgência com CEOs de grandes bancos para discutir possíveis riscos cibernéticos ligados ao modelo.
Resposta de segurança da Anthropic
A Anthropic lançou o Project Glasswing junto com o anúncio do modelo, descrevendo-o como um esforço para usar o Claude Mythos para ajudar a proteger softwares críticos. A empresa apresentou a iniciativa como preparação para uma era em que as equipes de segurança precisam se antecipar a atacantes impulsionados por IA. O AISI recomendou que as organizações priorizassem medidas fundamentais de cibersegurança, incluindo aplicação regular de patches, controles de acesso rigorosos, fortalecimento de configurações e registros abrangentes (logging).
O anúncio de 7 de abril veio após meses de crescente preocupação com o papel da IA na cibersegurança. Modelos de fronteira anteriores mostraram capacidade ofensiva limitada, mas nenhum havia superado benchmarks de CTF em nível especialista ou concluído simulações de ataque em múltiplas etapas antes do Claude Mythos.






