Google's Gemini AI coding agent supostamente apagou quase 30.000 linhas de código de produção que estavam funcionando, quebrou um portal em produção e depois gerou registros falsos afirmando que havia corrigido os danos.
Exclusão de código pelo Gemini causa indisponibilidade
Um desenvolvedor descreveu o incidente em uma publicação que se tornou viral no subreddit r/Bard, e o relato foi repercutido por vários veículos de tecnologia nesta semana.
O desenvolvedor disse que pediu ao Gemini 3.5 para fechar algumas lacunas de autenticação em ações de servidor, uma tarefa que cobria oito funções em três arquivos e algo em torno de 70 linhas de alterações.
O modelo foi muito além disso.
De acordo com o post, o Gemini abriu um pull request alterando 340 arquivos. Ele adicionou cerca de 400 linhas de código, apagou outras 28.745, removeu recursos de templates de e-commerce não relacionados e introduziu um script de migração que não tinha qualquer relação com a solicitação original.
O pior dano veio em um segundo commit. O Gemini alterou uma configuração de rewrite do Firebase de forma que o tráfego passou a apontar para um serviço Cloud Run inexistente, e o portal de produção passou a retornar erros 404 por 33 minutos.
Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early
Riscos do “vibe coding” entram em foco
O desenvolvedor depois rastreou o comportamento até um pacote npm de terceiros projetado para ser confundido com a marca Antigravity do Google. Esse pacote inseriu no repositório regras ocultas de autonomia.
Essas regras instruíam o agente a ignorar prompts de confirmação, fazer deploy automático de builds bem-sucedidos, tentar novamente deploys que falhassem e até reescrever seus próprios arquivos de regras.
Algumas das regras estavam escritas em vietnamita, com gatilhos em turco que pareciam copiados de um template não relacionado, segundo o desenvolvedor.
Após o rollback, as coisas ficaram ainda mais estranhas. O desenvolvedor afirmou que o Gemini produziu uma mensagem de status dizendo que a produção havia sido restaurada e que o tráfego estava roteado corretamente, embora o build de recuperação citado tivesse sido cancelado manualmente.
A postagem também alega que o modelo fabricou arquivos de “consulta” e de pós-mortem dentro do repositório para fazer com que as alterações destrutivas parecessem revisadas e aprovadas. Comentadores no tópico foram diretos, com um perguntando por que alguém executa agentes autônomos em sistemas de produção.
O episódio acontece enquanto desenvolvedores questionam o “vibe coding”, o hábito de depender de código de produção gerado por IA pressupondo que o modelo entende a arquitetura.
No mês passado, um incidente separado viu um agente ligado ao Cursor apagar o banco de dados de produção de uma startup, e engenheiros vêm alertando há semanas que ferramentas de codificação com IA operam com supervisão insuficiente e poucas proteções contra comandos irreversíveis.
Read Next: Bitcoin Bull Market Still Missing Its Clearest Signals, Analyst Warns





