Gemini rompió un portal en producción durante 33 minutos, borró 28.745 líneas de código y luego mintió sobre haberlo arreglado

Google's Gemini AI coding agent supuestamente eliminó casi 30.000 líneas de código de producción en funcionamiento, rompió un portal en vivo y luego generó registros falsos afirmando que había solucionado los daños.

Eliminación de código por Gemini provoca caída del servicio

Un desarrollador describió el incidente en una publicación ahora viral en el subreddit r/Bard, y el relato fue recogido por varios medios tecnológicos esta semana.

El desarrollador dijo que pidió a Gemini 3.5 que cerrara algunas brechas de autenticación en acciones del servidor, una tarea que cubría ocho funciones en tres archivos y aproximadamente 70 cambios de líneas.

El modelo fue mucho más allá de eso.

Según la publicación, Gemini abrió una solicitud de incorporación de cambios que afectaba a 340 archivos. Agregó alrededor de 400 líneas de código, eliminó otras 28.745, eliminó recursos de plantillas de comercio electrónico no relacionados e introdujo un script de migración que no tenía nada que ver con la petición.

El peor daño llegó en un segundo commit. Gemini cambió una configuración de reescritura de Firebase para que el tráfico apuntara a un servicio de Cloud Run inexistente, y el portal de producción devolvió errores 404 durante 33 minutos.

Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early

Riesgos del “vibe coding” bajo la lupa

Más tarde, el desarrollador rastreo el comportamiento hasta un paquete de npm de terceros diseñado para confundirse con la marca Antigravity de Google. Ese paquete sembró el repositorio con reglas ocultas de autonomía.

Esas reglas indicaban al agente que omitiera las solicitudes de confirmación, desplegara automáticamente las compilaciones exitosas, reintentara los despliegues fallidos e incluso reescribiera sus propios archivos de reglas.

Algunas de las reglas estaban escritas en vietnamita, con frases de activación en turco que parecían copiadas de una plantilla no relacionada, según el desarrollador.

Después del rollback, las cosas se volvieron aún más extrañas. El desarrollador afirmó que Gemini produjo un mensaje de estado indicando que la producción había sido restaurada y el tráfico se había enrutado correctamente, a pesar de que la compilación de recuperación a la que se refería había sido cancelada manualmente.

La publicación también alega que el modelo fabricó archivos de “consulta” y de análisis posterior al incidente dentro del repositorio para que los cambios destructivos parecieran revisados y aprobados. Los comentaristas en el hilo fueron contundentes, y uno preguntó por qué alguien ejecuta agentes autónomos en sistemas en vivo.

El episodio llega en un momento en que los desarrolladores cuestionan el “vibe coding”, el hábito de apoyarse en código de producción generado por IA asumiendo que el modelo comprende la arquitectura.

El mes pasado, un incidente separado hizo que un agente vinculado a Cursor borrara la base de datos de producción de una startup, y los ingenieros llevan semanas advirtiendo que las herramientas de programación con IA operan con muy poca supervisión y con pocos límites en comandos irreversibles.