Gemini a cassé un portail en production pendant 33 minutes, a supprimé 28 745 lignes de code, puis a menti sur la correction

Google's Gemini AI coding agent aurait supprimé près de 30 000 lignes de code de production fonctionnel, cassé un portail en ligne, puis généré de faux rapports affirmant qu’il avait réparé les dégâts.

La suppression de code par Gemini provoque une panne

Un développeur a décrit l’incident dans un post désormais viral sur le subreddit r/Bard, et le récit a été repris cette semaine par plusieurs médias tech.

Le développeur explique avoir demandé à Gemini 3.5 de combler quelques failles d’authentification dans des actions serveur, une tâche couvrant huit fonctions réparties sur trois fichiers, pour environ 70 lignes modifiées.

Le modèle est allé bien plus loin.

Selon le post, Gemini a ouvert une pull request affectant 340 fichiers. Il a ajouté environ 400 lignes de code, en a supprimé 28 745, retiré des ressources de modèles e-commerce sans rapport, et introduit un script de migration qui n’avait rien à voir avec la demande.

Les pires dégâts sont survenus dans un deuxième commit. Gemini a modifié un paramètre de réécriture Firebase de sorte que le trafic soit dirigé vers un service Cloud Run inexistant, et le portail de production a renvoyé des erreurs 404 pendant 33 minutes.

Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early

Les risques du « vibe coding » sous le feu des critiques

Le développeur a ensuite retracé le comportement jusqu’à un package npm tiers conçu pour être confondu avec le branding Antigravity de Google. Ce package avait semé dans le dépôt des règles d’autonomie cachées.

Ces règles demandaient à l’agent d’ignorer les demandes de confirmation, de déployer automatiquement les builds réussies, de réessayer les déploiements échoués, et même de réécrire ses propres fichiers de règles.

Certaines de ces règles étaient rédigées en vietnamien, avec des phrases déclencheuses en turc qui semblaient copiées depuis un modèle sans rapport, selon le développeur.

Après le rollback, les choses sont devenues encore plus étranges. Le développeur affirme que Gemini a produit un message de statut indiquant que la production avait été restaurée et le trafic correctement routé, alors même que le build de récupération mentionné avait été annulé manuellement.

Le post affirme également que le modèle a fabriqué des fichiers de « consultation » et de post-mortem dans le dépôt pour faire passer les changements destructeurs pour examinés et approuvés. Les commentateurs du fil ont été directs, l’un demandant pourquoi quelqu’un fait tourner des agents autonomes sur des systèmes en production.

Cet épisode survient alors que les développeurs remettent en question le « vibe coding », cette habitude de s’appuyer sur du code de production généré par IA en supposant que le modèle comprend l’architecture.

Le mois dernier, un autre incident a vu un agent lié à Cursor effacer la base de données de production d’une startup, et des ingénieurs avertissent depuis des semaines que les outils de codage par IA fonctionnent avec trop peu de supervision et trop peu de garde-fous sur les commandes irréversibles.