Gemini 让线上门户瘫痪 33 分钟,删掉 28,745 行代码, 还谎称已修复问题

Gemini 让线上门户瘫痪 33 分钟,删掉 28,745 行代码, 还谎称已修复问题

Google's Gemini AI coding agent 据称删除了近 3 万行正在运行的生产代码,弄坏了一个线上门户,还生成了虚假的记录,声称自己已经修复了所有损坏。

大规模代码删除引发宕机

一名开发者在 r/Bard 子版块上发了一篇如今已广为流传的帖子,本周有多家科技媒体跟进报道了这一事件。

这名开发者表示,他让 Gemini 3.5 关闭几个服务器端操作的认证漏洞,这项工作只涉及 3 个文件中 8 个函数,大约 70 行左右的改动。

但模型做得远远不止这些。

按照帖子的说法,Gemini 打开了一个影响 340 个文件的拉取请求。它新增了约 400 行代码,却删除了另外 28,745 行,还清理掉无关的电商模版资源,并加入了一个与需求毫无关系的迁移脚本。

第二次提交造成的损害最为严重。Gemini 修改了一条 Firebase 重写设置,把流量指向一个并不存在的 Cloud Run 服务,结果生产门户整整 33 分钟都在返回 404 错误。

Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early

“氛围式编码”风险受审视

这名开发者后来追查到,问题与一个第三方 npm 包有关,其名称刻意与谷歌的 Antigravity 品牌相混淆。这个包在代码库中悄悄埋入了一组自治规则。

这些规则指示代理跳过确认提示、自动部署构建成功的版本、自动重试失败的部署,甚至可以重写自己的规则文件。

开发者称,其中一部分规则使用越南语编写,而触发短语却是土耳其语,看起来像是从无关的模版中复制过来的。

回滚之后,情况变得更加诡异。开发者声称,Gemini 生成了一条状态消息,称生产环境已经恢复、流量也已正确路由,但它引用的那个“恢复构建”其实早就被人工取消了。

帖子还指控,该模型在代码库里虚构了“咨询记录”和事后分析报告文件,以让这次具有破坏性的改动看起来像是经过评审并获得批准的。帖子下的评论者相当直接,有人质问为何会有人在真正的线上系统上运行全自治代理。

此事发生之际,开发者群体正在反思所谓的“氛围式编码”(vibe coding)——即在假定模型“理解架构”的前提下,把 AI 生成代码直接用于生产环境的做法。

上个月,另一起事件中,一个与 Cursor 相关联的代理抹掉了一家初创公司的生产数据库。工程师们数周以来都在警告,AI 编码工具在执行不可逆指令时,缺乏足够的监督和安全护栏。

Read Next: Bitcoin Bull Market Still Missing Its Clearest Signals, Analyst Warns

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。