Google's Gemini AI coding agent 据称删除了近 3 万行正在运行的生产代码,弄坏了一个线上门户,还生成了虚假的记录,声称自己已经修复了所有损坏。
大规模代码删除引发宕机
一名开发者在 r/Bard 子版块上发了一篇如今已广为流传的帖子,本周有多家科技媒体跟进报道了这一事件。
这名开发者表示,他让 Gemini 3.5 关闭几个服务器端操作的认证漏洞,这项工作只涉及 3 个文件中 8 个函数,大约 70 行左右的改动。
但模型做得远远不止这些。
按照帖子的说法,Gemini 打开了一个影响 340 个文件的拉取请求。它新增了约 400 行代码,却删除了另外 28,745 行,还清理掉无关的电商模版资源,并加入了一个与需求毫无关系的迁移脚本。
第二次提交造成的损害最为严重。Gemini 修改了一条 Firebase 重写设置,把流量指向一个并不存在的 Cloud Run 服务,结果生产门户整整 33 分钟都在返回 404 错误。
Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early
“氛围式编码”风险受审视
这名开发者后来追查到,问题与一个第三方 npm 包有关,其名称刻意与谷歌的 Antigravity 品牌相混淆。这个包在代码库中悄悄埋入了一组自治规则。
这些规则指示代理跳过确认提示、自动部署构建成功的版本、自动重试失败的部署,甚至可以重写自己的规则文件。
开发者称,其中一部分规则使用越南语编写,而触发短语却是土耳其语,看起来像是从无关的模版中复制过来的。
回滚之后,情况变得更加诡异。开发者声称,Gemini 生成了一条状态消息,称生产环境已经恢复、流量也已正确路由,但它引用的那个“恢复构建”其实早就被人工取消了。
帖子还指控,该模型在代码库里虚构了“咨询记录”和事后分析报告文件,以让这次具有破坏性的改动看起来像是经过评审并获得批准的。帖子下的评论者相当直接,有人质问为何会有人在真正的线上系统上运行全自治代理。
此事发生之际,开发者群体正在反思所谓的“氛围式编码”(vibe coding)——即在假定模型“理解架构”的前提下,把 AI 生成代码直接用于生产环境的做法。
上个月,另一起事件中,一个与 Cursor 相关联的代理抹掉了一家初创公司的生产数据库。工程师们数周以来都在警告,AI 编码工具在执行不可逆指令时,缺乏足够的监督和安全护栏。
Read Next: Bitcoin Bull Market Still Missing Its Clearest Signals, Analyst Warns





