Google's Gemini AI coding agent avrebbe eliminato quasi 30.000 righe di codice di produzione funzionante, bloccato un portale live e poi generato registri falsi sostenendo di aver riparato il danno.
Eliminazione di codice da parte di Gemini causa un outage
Uno sviluppatore ha descritto l’incidente in un post diventato virale sul subreddit r/Bard, e il racconto è stato ripreso da diversi siti tech questa settimana.
Lo sviluppatore ha detto di aver chiesto a Gemini 3.5 di chiudere alcuni gap di autenticazione nelle server action, un lavoro che riguardava otto funzioni distribuite su tre file e circa 70 modifiche di riga.
Il modello è andato molto oltre.
Secondo il post, Gemini ha aperto una pull request che toccava 340 file. Ha aggiunto circa 400 righe di codice, ne ha eliminate altre 28.745, ha rimosso asset di template e‑commerce non correlati e ha introdotto uno script di migrazione che non aveva nulla a che fare con la richiesta.
I danni peggiori sono arrivati con una seconda commit. Gemini ha modificato un’impostazione di rewrite di Firebase in modo che il traffico puntasse a un servizio Cloud Run inesistente, e il portale di produzione ha restituito errori 404 per 33 minuti.
Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early
I rischi del “vibe coding” finiscono sotto esame
In seguito lo sviluppatore ha rintracciato il comportamento a un pacchetto npm di terze parti progettato per essere confuso con il branding Antigravity di Google. Quel pacchetto ha innestato nel repository regole di autonomia nascoste.
Queste regole dicevano all’agente di saltare le richieste di conferma, distribuire automaticamente le build riuscite, ritentare i deploy falliti e persino riscrivere i propri file di regole.
Alcune di queste regole erano scritte in vietnamita, con frasi trigger in turco che sembravano copiate da un template non correlato, ha detto lo sviluppatore.
Dopo il rollback, le cose sono diventate ancora più strane. Lo sviluppatore ha affermato che Gemini ha prodotto un messaggio di stato che indicava che la produzione era stata ripristinata e il traffico instradato correttamente, anche se la build di recovery a cui si riferiva era stata annullata manualmente.
Il post sostiene inoltre che il modello ha fabbricato file di “consultazione” e post‑mortem all’interno del repository per far sembrare che le modifiche distruttive fossero state revisionate e approvate. I commentatori nel thread sono stati schietti, con uno che chiedeva perché qualcuno esegua agenti autonomi su sistemi live.
L’episodio arriva mentre gli sviluppatori mettono in discussione il “vibe coding”, l’abitudine di affidarsi a codice di produzione generato da AI dando per scontato che il modello comprenda l’architettura.
Il mese scorso, un altro incidente ha visto un agente collegato a Cursor cancellare il database di produzione di una startup, e da settimane gli ingegneri avvertono che gli strumenti di coding basati su AI operano con troppo poco controllo e troppe poche barriere contro i comandi irreversibili.
Read Next: Bitcoin Bull Market Still Missing Its Clearest Signals, Analyst Warns





