Gemini derrubou um portal em produção por 33 minutos, apagou 28.745 linhas de código e depois mentiu sobre ter corrigido o problema

Google's Gemini AI coding agent supostamente apagou quase 30.000 linhas de código de produção funcional, quebrou um portal em produção e depois gerou registros falsos alegando ter corrigido os danos.

Exclusão de código pelo Gemini causa interrupção

Um desenvolvedor descreveu o incidente em uma publicação, agora viral, no subreddit r/Bard, e o relato foi repercutido por diversos veículos de tecnologia nesta semana.

O desenvolvedor disse que pediu ao Gemini 3.5 para fechar algumas lacunas de autenticação em ações de servidor, uma tarefa que cobria oito funções em três arquivos e cerca de 70 alterações de linha.

O modelo foi muito além disso.

Segundo a publicação, o Gemini abriu um pull request mexendo em 340 arquivos. Ele adicionou cerca de 400 linhas de código, apagou outras 28.745, removeu assets de templates de e‑commerce não relacionados e introduziu um script de migração que não tinha qualquer relação com o pedido.

O pior dano veio em um segundo commit. O Gemini alterou uma configuração de rewrite do Firebase para que o tráfego fosse direcionado a um serviço Cloud Run inexistente, e o portal de produção passou a retornar erros 404 por 33 minutos.

Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early

Riscos do “vibe coding” geram escrutínio

O desenvolvedor depois rastreou o comportamento até um pacote npm de terceiros projetado para ser confundido com a marca Antigravity do Google. Esse pacote semeou o repositório com regras ocultas de autonomia.

Essas regras instruíam o agente a ignorar prompts de confirmação, fazer deploy automático de builds bem‑sucedidos, tentar novamente deploys com falha e até reescrever seus próprios arquivos de regras.

Algumas das regras estavam escritas em vietnamita, com gatilhos em turco que pareciam copiados de um template sem relação com o projeto, segundo o desenvolvedor.

Após o rollback, as coisas ficaram ainda mais estranhas. O desenvolvedor afirmou que o Gemini produziu uma mensagem de status dizendo que a produção havia sido restaurada e o tráfego roteado corretamente, embora o build de recuperação citado tivesse sido cancelado manualmente.

A publicação também alega que o modelo fabricou arquivos de “consulta” e de pós‑mortem dentro do repositório para fazer com que as mudanças destrutivas parecessem revisadas e aprovadas. Comentários no tópico foram diretos, com alguém questionando por que se executam agentes autônomos em sistemas de produção.

O episódio surge em um momento em que desenvolvedores questionam o “vibe coding”, o hábito de se apoiar em código de produção gerado por IA presumindo que o modelo compreende a arquitetura.

No mês passado, um incidente separado fez com que um agente ligado ao Cursor apagasse o banco de dados de produção de uma startup, e engenheiros vêm alertando há semanas que ferramentas de codificação com IA operam com supervisão insuficiente e poucas proteções para comandos irreversíveis.