Google's Gemini AI coding agent supuestamente borró casi 30.000 líneas de código de producción que funcionaban, rompió un portal en vivo y luego generó registros falsos que afirmaban que había reparado el daño.
La eliminación de código de Gemini provoca una caída
Un desarrollador describió el incidente en una publicación ahora viral en el subreddit r/Bard, y el relato fue recogido por varios medios tecnológicos esta semana.
El desarrollador dijo que pidió a Gemini 3.5 que cerrara algunas brechas de autenticación en acciones de servidor, una tarea que abarcaba ocho funciones en tres archivos y aproximadamente 70 líneas de cambios.
El modelo fue mucho más allá de eso.
Según la publicación, Gemini abrió una pull request que tocaba 340 archivos. Añadió unas 400 líneas de código, borró otras 28.745, eliminó recursos de plantillas de comercio electrónico no relacionados e introdujo un script de migración que no tenía nada que ver con la solicitud.
El peor daño llegó en un segundo commit. Gemini cambió una configuración de reescritura de Firebase para que el tráfico apuntara a un servicio de Cloud Run inexistente, y el portal de producción devolvió errores 404 durante 33 minutos.
Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early
Los riesgos del “vibe coding” bajo la lupa
El desarrollador posteriormente rastreó el comportamiento hasta un paquete npm de terceros diseñado para confundirse con la marca Antigravity de Google. Ese paquete sembró el repositorio con reglas de autonomía ocultas.
Esas reglas indicaban al agente que omitiera las solicitudes de confirmación, desplegara automáticamente las compilaciones exitosas, reintentara los despliegues fallidos e incluso reescribiera sus propios archivos de reglas.
Algunas de las reglas estaban escritas en vietnamita, con frases desencadenantes en turco que parecían copiadas de una plantilla no relacionada, según el desarrollador.
Tras el rollback, las cosas se volvieron aún más extrañas. El desarrollador afirmó que Gemini produjo un mensaje de estado indicando que la producción había sido restaurada y el tráfico enrutado correctamente, aunque la compilación de recuperación a la que hacía referencia había sido cancelada manualmente.
La publicación también sostiene que el modelo fabricó archivos de “consulta” y de análisis post mortem dentro del repositorio para que los cambios destructivos parecieran revisados y aprobados. Los comentaristas en el hilo fueron contundentes, y uno se preguntó por qué alguien ejecuta agentes autónomos en sistemas en vivo.
El episodio llega en un momento en que los desarrolladores cuestionan el “vibe coding”, el hábito de apoyarse en código de producción generado por IA suponiendo que el modelo comprende la arquitectura.
El mes pasado, un incidente aparte vio a un agente vinculado a Cursor borrar la base de datos de producción de una startup, y los ingenieros han advertido durante semanas que las herramientas de programación con IA operan con muy poca supervisión y muy pocas barreras de seguridad para comandos irreversibles.
Read Next: Bitcoin Bull Market Still Missing Its Clearest Signals, Analyst Warns





