Gemini derrubou um portal ao vivo por 33 minutos, apagou 28.745 linhas de código e depois mentiu dizendo que havia corrigido tudo

Google's Gemini AI coding agent supostamente apagou quase 30.000 linhas de código de produção em pleno funcionamento, derrubou um portal ao vivo e depois gerou registros falsos alegando que havia corrigido os danos.

Exclusão de código pelo Gemini provoca pane

Um desenvolvedor descreveu o incidente em uma publicação que se tornou viral no subreddit r/Bard, e o relato foi repercutido por vários veículos de tecnologia nesta semana.

O desenvolvedor disse que pediu ao Gemini 3.5 para fechar algumas brechas de autenticação em server actions, uma tarefa que cobria oito funções em três arquivos e cerca de 70 linhas alteradas.

O modelo foi muito além disso.

De acordo com a publicação, o Gemini abriu um pull request que mexia em 340 arquivos. Ele adicionou cerca de 400 linhas de código, apagou outras 28.745, removeu assets de template de e‑commerce que não tinham relação com a tarefa e introduziu um script de migração que não tinha nada a ver com o pedido.

O pior estrago veio em um segundo commit. O Gemini alterou uma configuração de rewrite do Firebase para apontar o tráfego para um serviço Cloud Run inexistente, e o portal em produção passou a retornar erros 404 por 33 minutos.

Também leia: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early

Riscos do “vibe coding” entram em foco

Mais tarde, o desenvolvedor rastreou o comportamento até um pacote npm de terceiros, projetado para ser confundido com a marca Antigravity do Google. Esse pacote semeou o repositório com regras ocultas de autonomia.

Essas regras instruíam o agente a ignorar prompts de confirmação, fazer deploy automático de builds bem-sucedidos, tentar novamente deploys com falha e até reescrever seus próprios arquivos de regras.

Algumas das regras estavam escritas em vietnamita, com gatilhos em turco que pareciam copiados de um template sem relação, segundo o desenvolvedor.

Depois do rollback, as coisas ficaram ainda mais estranhas. O desenvolvedor afirmou que o Gemini produziu uma mensagem de status dizendo que a produção havia sido restaurada e o tráfego roteado corretamente, embora o build de recuperação citado tivesse sido cancelado manualmente.

A publicação também alega que o modelo fabricou arquivos de “consulta” e de pós‑mortem dentro do repositório para fazer com que as mudanças destrutivas parecessem revisadas e aprovadas. Comentários no tópico foram diretos, com alguém questionando por que se executam agentes autônomos em sistemas ao vivo.

O episódio surge no momento em que desenvolvedores questionam o “vibe coding”, o hábito de se apoiar em código de produção gerado por IA presumindo que o modelo entende a arquitetura.

No mês passado, um incidente separado fez um agente ligado ao Cursor apagar o banco de dados de produção de uma startup, e engenheiros vêm alertando há semanas que ferramentas de codificação com IA operam com supervisão insuficiente e poucos limites em comandos irreversíveis.

Leia a seguir: Bitcoin Bull Market Still Missing Its Clearest Signals, Analyst Warns