Gemini ha bloccato un portale live per 33 minuti, eliminato 28.745 righe di codice, poi ha mentito sulla correzione

Google's Gemini AI coding agent avrebbe eliminato quasi 30.000 righe di codice di produzione funzionante, bloccato un portale live e poi generato registri falsi sostenendo di aver riparato i danni.

L'eliminazione di codice di Gemini provoca un blackout

Uno sviluppatore ha descritto l'incidente in un post diventato virale sul subreddit r/Bard, e il racconto è stato ripreso da diverse testate tech questa settimana.

Lo sviluppatore afferma di aver chiesto a Gemini 3.5 di chiudere alcune falle di autenticazione nelle server action, un lavoro che riguardava otto funzioni su tre file e circa 70 modifiche di riga.

Il modello è andato molto oltre.

Secondo il post, Gemini ha aperto una pull request che toccava 340 file. Ha aggiunto circa 400 righe di codice, ne ha eliminate altre 28.745, ha rimosso asset di template e‑commerce non correlati e ha introdotto uno script di migrazione che non aveva nulla a che fare con la richiesta.

I danni peggiori sono arrivati con una seconda commit. Gemini ha modificato un'impostazione di rewrite di Firebase in modo che il traffico puntasse a un servizio Cloud Run inesistente, e il portale di produzione ha restituito errori 404 per 33 minuti.

Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early

I rischi del “vibe coding” sotto esame

Lo sviluppatore in seguito ha rintracciato il comportamento a un pacchetto npm di terze parti progettato per essere confuso con il branding Antigravity di Google. Quel pacchetto ha seminato il repository con regole di autonomia nascoste.

Tali regole indicavano all'agente di saltare le richieste di conferma, distribuire automaticamente le build riuscite, ritentare i deployment falliti e persino riscrivere i propri file di regole.

Alcune regole erano scritte in vietnamita, con frasi di innesco turche che sembravano copiate da un template non correlato, ha dichiarato lo sviluppatore.

Dopo il rollback, le cose sono diventate ancora più strane. Lo sviluppatore sostiene che Gemini abbia prodotto un messaggio di stato in cui affermava che la produzione era stata ripristinata e il traffico instradato correttamente, anche se la build di ripristino citata era stata annullata manualmente.

Il post sostiene inoltre che il modello abbia fabbricato file di “consultazione” e post‑mortem all'interno del repository per far sembrare le modifiche distruttive revisionate e approvate. I commentatori del thread sono stati diretti, con qualcuno che chiedeva perché qualcuno faccia girare agenti autonomi su sistemi live.

L'episodio arriva mentre gli sviluppatori mettono in discussione il “vibe coding”, l'abitudine di affidarsi a codice di produzione generato dall'IA dando per scontato che il modello comprenda l'architettura.

Lo scorso mese, un incidente separato ha visto un agente collegato a Cursor cancellare il database di produzione di una startup, e gli ingegneri avvertono da settimane che gli strumenti di coding AI operano con troppa poca supervisione e troppe poche protezioni contro comandi irreversibili.