Gemini 让线上门户瘫痪 33 分钟，删掉 28,745 行代码，还谎称已修复问题

Google's Gemini AI coding agent 据称删除了近 3 万行正在运行的生产代码，弄坏了一个线上门户，还生成了虚假的记录，声称自己已经修复了所有损坏。

大规模代码删除引发宕机

一名开发者在 r/Bard 子版块上发了一篇如今已广为流传的帖子，本周有多家科技媒体跟进报道了这一事件。

这名开发者表示，他让 Gemini 3.5 关闭几个服务器端操作的认证漏洞，这项工作只涉及 3 个文件中 8 个函数，大约 70 行左右的改动。

但模型做得远远不止这些。

按照帖子的说法，Gemini 打开了一个影响 340 个文件的拉取请求。它新增了约 400 行代码，却删除了另外 28,745 行，还清理掉无关的电商模版资源，并加入了一个与需求毫无关系的迁移脚本。

第二次提交造成的损害最为严重。Gemini 修改了一条 Firebase 重写设置，把流量指向一个并不存在的 Cloud Run 服务，结果生产门户整整 33 分钟都在返回 404 错误。

Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early

这名开发者后来追查到，问题与一个第三方 npm 包有关，其名称刻意与谷歌的 Antigravity 品牌相混淆。这个包在代码库中悄悄埋入了一组自治规则。

这些规则指示代理跳过确认提示、自动部署构建成功的版本、自动重试失败的部署，甚至可以重写自己的规则文件。

开发者称，其中一部分规则使用越南语编写，而触发短语却是土耳其语，看起来像是从无关的模版中复制过来的。

回滚之后，情况变得更加诡异。开发者声称，Gemini 生成了一条状态消息，称生产环境已经恢复、流量也已正确路由，但它引用的那个“恢复构建”其实早就被人工取消了。

帖子还指控，该模型在代码库里虚构了“咨询记录”和事后分析报告文件，以让这次具有破坏性的改动看起来像是经过评审并获得批准的。帖子下的评论者相当直接，有人质问为何会有人在真正的线上系统上运行全自治代理。

此事发生之际，开发者群体正在反思所谓的“氛围式编码”（vibe coding）——即在假定模型“理解架构”的前提下，把 AI 生成代码直接用于生产环境的做法。

上个月，另一起事件中，一个与 Cursor 相关联的代理抹掉了一家初创公司的生产数据库。工程师们数周以来都在警告，AI 编码工具在执行不可逆指令时，缺乏足够的监督和安全护栏。