Claude Mythos AI criou exploits funcionais em 50 repositórios da Cloudflare, depois se recusou a demonstrá-los

Claude Mythos AI criou exploits funcionais em 50 repositórios da Cloudflare, depois se recusou a demonstrá-los

Cloudflare confirmou na segunda-feira que o modelo Mythos Preview inédito da Anthropic encadeou bugs em exploits funcionais em mais de 50 de seus repositórios.

Resultados do Cloudflare Project Glasswing

A revelação veio em um post no blog do Chief Security Officer da Cloudflare, Grant Bourzikas, que disse que sua equipe apontou o Mythos Preview para código de produção que abrangia o runtime, o data path de borda e a pilha de protocolos. A Cloudflare entrou no Project Glasswing, o programa apenas por convite da Anthropic para parceiros de segurança defensiva. Bourzikas chamou o modelo de “um verdadeiro avanço”, citando duas capacidades que os concorrentes não tinham.

O Mythos encadeou vários pequenos primitivos de ataque em provas de conceito funcionais. O modelo também compilou e executou código de exploit em um ambiente isolado e, em seguida, revisou sua hipótese quando uma execução falhou.

O post também destacou recusas inconsistentes do modelo de prévia.

Em um caso, o Mythos se recusou a escrever um exploit de demonstração depois de confirmar vários bugs de memória em uma base de código e depois atendeu ao mesmo pedido quando a tarefa foi formulada de forma diferente em uma sessão separada.

Veja também: Crypto Funds Bleed $1.07B As Iran Tensions End Six-Week Inflow Run

Harness multiagente supera scanners isolados

A Cloudflare disse que apontar um agente genérico de programação para um repositório não funcionou para pesquisa de vulnerabilidades. Bourzikas, em vez disso, criou um harness em múltiplas etapas executando cerca de 50 agentes paralelos em tarefas específicas. O pipeline executa reconhecimento, busca, validação adversária, desduplicação e rastreamento de reachability.

Um agente independente tenta refutar cada achado antes de ele entrar na fila de triagem, reduzindo falsos positivos que atormentam código inseguro em termos de memória escrito em C e C++. A Anthropic se comprometeu com US$ 100 milhões em créditos de modelo e US$ 4 milhões em doações para grupos de segurança open source sob o Project Glasswing.

O Mythos Preview não será lançado publicamente.

Contratos inteligentes cripto enfrentam onda de exploits por IA

As descobertas da Cloudflare chegam em meio ao aumento das perdas on-chain. A ponte Verus-Ethereum perdeu US$ 11 milhões na segunda-feira em um ataque cross-chain, com o produto sendo convertido em 5.402 Ether (ETH).

Pesquisadores da Anthropic já mostraram que agentes de IA podem explorar autonomamente contratos ativos com lucro. Em um teste, modelos examinaram 2.849 contratos implantados e produziram exploits no valor de US$ 3.694 usando US$ 3.476 em computação.

A CertiK alertou em 15 de maio que contratos inteligentes legados agora estão no centro de uma onda de caça impulsionada por IA. Protocolos DeFi perderam mais de US$ 605 milhões em cerca de 20 dias em abril, incluindo o dreno de $293 milhões da KelpDAO em 19 de abril. A engenharia social tirou outros US$ 306 milhões no primeiro trimestre.

Leia a seguir: Iran Settles Hormuz Shipping Cover In Bitcoin, Eyes $10B Haul

Isenção de responsabilidade e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e são baseadas na opinião do autor. Elas não constituem aconselhamento financeiro, de investimento, jurídico ou tributário. Ativos de criptomoedas são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou manter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou seus executivos. Sempre conduza sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Claude Mythos AI criou exploits funcionais em 50 repositórios da Cloudflare, depois se recusou a demonstrá-los | Yellow.com