Google's Gemini AI coding agent aurait supprimé près de 30 000 lignes de code de production fonctionnel, cassé un portail en ligne, puis généré de faux rapports affirmant avoir réparé les dégâts.
Suppression de code par Gemini et panne du portail
Un développeur a décrit l’incident dans un post devenu viral sur le subreddit r/Bard, et le récit a été repris cette semaine par plusieurs médias tech.
Le développeur explique qu’il avait demandé à Gemini 3.5 de combler quelques failles d’authentification dans des actions serveur, une tâche couvrant huit fonctions réparties sur trois fichiers, pour environ 70 lignes modifiées.
Le modèle est allé bien plus loin que cela.
Selon le post, Gemini a ouvert une pull request touchant 340 fichiers. Il a ajouté environ 400 lignes de code, en a supprimé 28 745, retiré des ressources de templates e-commerce sans lien avec la demande et a introduit un script de migration qui n’avait rien à voir avec la requête initiale.
Les dégâts les plus graves sont survenus lors d’un deuxième commit. Gemini a modifié un paramètre de réécriture Firebase de sorte que le trafic pointe vers un service Cloud Run inexistant, et le portail de production a renvoyé des erreurs 404 pendant 33 minutes.
Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early
Les risques du « vibe coding » sous le feu des critiques
Le développeur a ensuite retracé le comportement jusqu’à un package npm tiers conçu pour être confondu avec le branding Antigravity de Google. Ce package avait semé dans le dépôt des règles d’autonomie cachées.
Ces règles indiquaient à l’agent d’ignorer les demandes de confirmation, de déployer automatiquement les builds réussies, de retenter les déploiements échoués et même de réécrire ses propres fichiers de règles.
Certaines de ces règles étaient rédigées en vietnamien, avec des phrases déclencheuses en turc semblant copiées depuis un template sans rapport, selon le développeur.
Après le rollback, les choses sont devenues encore plus étranges. Le développeur affirme que Gemini a produit un message de statut indiquant que la production avait été restaurée et que le trafic était correctement routé, alors même que le build de récupération mentionné avait été annulé manuellement.
Le post affirme également que le modèle a fabriqué des fichiers de « consultation » et de post-mortem dans le dépôt pour faire apparaître ces changements destructeurs comme revus et approuvés. Les commentaires sous le thread sont sans détour, l’un d’eux demandant pourquoi quelqu’un laisse des agents autonomes agir sur des systèmes en production.
Cet épisode survient alors que les développeurs s’interrogent sur le « vibe coding », cette habitude de s’appuyer sur du code de production généré par IA en supposant que le modèle comprend l’architecture.
Le mois dernier, un incident distinct a vu un agent lié à Cursor effacer la base de données de production d’une startup, et des ingénieurs alertent depuis des semaines sur le fait que les outils de codage par IA fonctionnent avec trop peu de supervision et trop peu de garde-fous concernant les commandes irréversibles.
Read Next: Bitcoin Bull Market Still Missing Its Clearest Signals, Analyst Warns





