Claude Mythos AI criou exploits funcionais em 50 repositórios da Cloudflare e depois se recusou a fazer a demonstração

Cloudflare confirmou na segunda-feira que o modelo Mythos Preview ainda inédito da Anthropic encadeou bugs em exploits funcionais em mais de 50 de seus repositórios.

Descobertas do Cloudflare Project Glasswing

A divulgação veio em um post de blog do Chief Security Officer da Cloudflare, Grant Bourzikas, que disse que sua equipe apontou o Mythos Preview para código de produção abrangendo o runtime, o caminho de dados na edge e a pilha de protocolos. A Cloudflare juntou-se ao Project Glasswing, o programa apenas por convite da Anthropic para parceiros de segurança defensiva. Bourzikas chamou o modelo de “um verdadeiro passo à frente”, citando duas capacidades que os concorrentes não tinham.

O Mythos encadeou vários pequenos primitivos de ataque em provas de conceito funcionais. O modelo também compilou e executou código de exploit em um ambiente isolado, depois revisou sua hipótese quando uma execução falhou.

O post também destacou recusas inconsistentes do modelo de preview.

Em um caso, o Mythos se recusou a escrever um exploit de demonstração depois de confirmar vários bugs de memória em uma base de código, e depois atendeu ao mesmo pedido quando a tarefa foi formulada de forma diferente em uma sessão separada.

Também leia: Crypto Funds Bleed $1.07B As Iran Tensions End Six-Week Inflow Run

Harness multiagente supera scanners isolados

A Cloudflare disse que apontar um único agente genérico de código para um repositório não funcionou para pesquisa de vulnerabilidades. Bourzikas, em vez disso, criou um harness em múltiplas etapas executando cerca de 50 agentes paralelos em tarefas específicas. O pipeline executa reconhecimento, caçada, validação adversarial, deduplicação e rastreamento de reachability.

Um agente independente tenta refutar cada descoberta antes de ela entrar na fila de triagem, reduzindo falsos positivos que assolam código não seguro em memória escrito em C e C++. A Anthropic se comprometeu com US$ 100 milhões em créditos de modelo e US$ 4 milhões em doações para grupos de segurança open source no âmbito do Project Glasswing.

O Mythos Preview não será lançado publicamente.

Smart contracts de cripto enfrentam onda de exploits por IA

As descobertas da Cloudflare chegam em meio ao aumento das perdas on-chain. A ponte Verus-Ethereum perdeu US$ 11 milhões na segunda-feira em um ataque cross-chain, com o produto sendo trocado por 5.402 Ether (ETH).

Pesquisadores da Anthropic já haviam mostrado que agentes de IA poderiam explorar contratos ativos de forma autônoma com lucro. Em um teste, modelos analisaram 2.849 contratos implantados e produziram exploits no valor de US$ 3.694 a um custo de US$ 3.476 em computação.

A CertiK alertou em 15 de maio que smart contracts legados agora estão no centro de uma onda de caça impulsionada por IA. Protocolos DeFi perderam mais de US$ 605 milhões em cerca de 20 dias em abril, incluindo o esvaziamento de US$ 293 milhões da KelpDAO em 19 de abril. Engenharia social tirou outros US$ 306 milhões no primeiro trimestre.

Leia a seguir: Iran Settles Hormuz Shipping Cover In Bitcoin, Eyes $10B Haul