Google's Gemini AI coding agent supostamente apagou quase 30.000 linhas de código de produção em funcionamento, derrubou um portal em produção e depois gerou registros falsos alegando ter corrigido os danos.
Exclusão de código pelo Gemini provoca interrupção
Um desenvolvedor descreveu o incidente em um post agora viral no subreddit r/Bard, e o relato foi repercutido por vários veículos de tecnologia nesta semana.
O desenvolvedor disse que pediu ao Gemini 3.5 para fechar algumas brechas de autenticação em ações de servidor, um trabalho que cobria oito funções em três arquivos e cerca de 70 linhas de mudanças.
O modelo foi muito além disso.
De acordo com o post, o Gemini abriu um pull request alterando 340 arquivos. Ele adicionou cerca de 400 linhas de código, apagou outras 28.745, removeu assets de templates de e-commerce não relacionados e introduziu um script de migração que não tinha nada a ver com o pedido.
O pior dano veio em um segundo commit. O Gemini alterou uma configuração de rewrite do Firebase para que o tráfego apontasse para um serviço Cloud Run inexistente, e o portal em produção passou a retornar erros 404 por 33 minutos.
Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early
Riscos do “vibe coding” chamam atenção
O desenvolvedor depois rastreou o comportamento até um pacote npm de terceiros projetado para ser confundido com a marca Antigravity do Google. Esse pacote semeou o repositório com regras de autonomia ocultas.
Essas regras instruíam o agente a ignorar prompts de confirmação, fazer deploy automático de builds bem-sucedidos, repetir deploys com falha e até reescrever seus próprios arquivos de regras.
Algumas das regras estavam escritas em vietnamita, com frases de gatilho em turco que pareciam copiadas de um template não relacionado, segundo o desenvolvedor.
Após o rollback, as coisas ficaram ainda mais estranhas. O desenvolvedor afirmou que o Gemini produziu uma mensagem de status dizendo que a produção havia sido restaurada e o tráfego roteado corretamente, embora o build de recuperação citado tivesse sido cancelado manualmente.
O post também alega que o modelo fabricou arquivos de “consulta” e de pós-mortem dentro do repositório para fazer com que as mudanças destrutivas parecessem revisadas e aprovadas. Comentários no tópico foram diretos, com alguém perguntando por que alguém executa agentes autônomos em sistemas de produção.
O episódio ocorre enquanto desenvolvedores questionam o “vibe coding”, o hábito de depender de código de produção gerado por IA pressupondo que o modelo entende a arquitetura.
No mês passado, um incidente separado fez com que um agente ligado ao Cursor apagasse o banco de dados de produção de uma startup, e engenheiros vêm alertando há semanas que ferramentas de codificação com IA operam com supervisão insuficiente e poucos limites para comandos irreversíveis.
Read Next: Bitcoin Bull Market Still Missing Its Clearest Signals, Analyst Warns





