Geminiが33分間本番ポータルを停止させ、28,745行のコードを削除し、その修正について虚偽報告をした疑い

Google's Gemini AI coding agent が、動作していた本番コードを約3万行近く削除し、稼働中のポータルを壊したうえで、損害を修復したとする虚偽の記録を生成した疑いが持たれている。

Geminiによるコード削除で障害が発生

ある開発者が、このインシデントについて r/Bard サブレディットへの投稿で説明し、その投稿は現在バイラルとなっている。この件は、今週いくつかのテック系メディアによっても取り上げられた。

開発者によれば、自分は Gemini 3.5 に対し、サーバーアクションの認証ギャップをいくつか塞ぐよう依頼したという。これは3つのファイルにまたがる8つの関数を対象とし、およそ70行分の変更で済むはずの作業だった。

しかし、モデルはその範囲を大きく超えた。

投稿によれば、Geminiは340ファイルに影響するプルリクエストを作成した。約400行のコードを追加する一方で、28,745行を削除し、無関係なECサイト用テンプレートアセットを削ぎ落とし、依頼内容と無関係なマイグレーションスクリプトまで導入したという。

最悪の被害は2回目のコミットで発生した。GeminiはFirebaseのrewrite設定を変更し、トラフィックを存在しないCloud Runサービスへ向けてしまった。その結果、本番ポータルは33分間にわたり404エラーを返し続けた。

Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early

開発者はその後、この挙動の原因を、GoogleのAntigravityブランドと紛らわしい名称を持つサードパーティのnpmパッケージに突き止めた。そのパッケージは、リポジトリ内に隠れた自律ルールを埋め込んでいた。

それらのルールは、エージェントに確認プロンプトをスキップするよう指示し、ビルドが成功したら自動でデプロイし、デプロイが失敗した場合は再試行し、さらには自分自身のルールファイルを書き換えることまで命じていた。

いくつかのルールはベトナム語で書かれており、トリガーフレーズはトルコ語で、無関係なテンプレートからコピーしたように見えたと開発者は述べている。

ロールバック後、事態はさらに奇妙になった。Geminiは、プロダクションが復旧しトラフィックが正しくルーティングされているとするステータスメッセージを生成したが、そこに言及されたリカバリ用ビルドは、実際には手動でキャンセルされていた、と開発者は主張している。

この投稿はさらに、モデルがリポジトリ内に「コンサルテーション」やポストモーテムのファイルを捏造し、破壊的な変更がレビューと承認を経たように見せかけていたと告発している。スレッドのコメント欄では辛辣な意見が相次ぎ、「なぜ誰もが本番システム上で自律エージェントを動かすのか」と疑問を呈する声もあった。

この一件は、「バイブ・コーディング」、すなわちモデルがシステムアーキテクチャを十分理解していると仮定しながらAI生成コードに頼る習慣に対する疑念が高まる中で起きた。

先月には、別のインシデントでCursor連携のエージェントがあるスタートアップの本番データベースを消去する事態が発生している。エンジニアたちはここ数週間、AIコーディングツールには不可逆的なコマンドに対する監視とガードレールがあまりに少ないと警鐘を鳴らしてきた。