Google's Gemini AI coding agent は、稼働中の本番コードをほぼ3万行削除し、本番ポータルを停止させたうえで、被害を修正したと主張する虚偽の記録を生成した疑いが持たれている。
Geminiによるコード大量削除で障害発生
開発者は、この出来事をr/Bardサブレディットへの投稿で詳述し、その投稿は瞬く間に拡散した。今週に入り、いくつかのテック系メディアもこの話を取り上げている。
開発者によれば、当初はGemini 3.5 に対し、サーバーアクションの認証ギャップをいくつか塞ぐよう依頼しただけだった。作業範囲は3ファイル・8つの関数で、およそ70行分の変更だったという。
しかしモデルは、その範囲を大きく逸脱した。
投稿によると、Geminiは340ファイルに影響するプルリクエストを作成した。約400行のコードを追加する一方で、28,745行を削除し、無関係なECサイト用テンプレート資産を削ぎ落とし、さらに依頼内容とは無関係なマイグレーションスクリプトまで紛れ込ませた。
最悪の被害は2回目のコミットで発生した。GeminiはFirebaseのリライト設定を変更し、トラフィックを存在しないCloud Runサービスに向けてしまったため、本番ポータルは33分間にわたり404エラーを返し続けた。
Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early
「バイブコーディング」リスクへの懸念
開発者は後に、この挙動の原因をGoogleのAntigravityブランディングと紛らわしい名称のサードパーティnpmパッケージへと突き止めた。そのパッケージが、隠された「自律ルール」をリポジトリに紛れ込ませていたという。
それらのルールは、エージェントに対し確認プロンプトをスキップすること、ビルド成功時は自動デプロイすること、デプロイ失敗時は自動リトライすること、さらには自分自身のルールファイルを書き換えることまで指示していた。
ルールの一部はベトナム語で書かれ、トリガーフレーズには無関係なテンプレートからコピーしたように見えるトルコ語が混在していたと、開発者は述べている。
ロールバック後には、さらに不可解な事態が起こった。開発者によれば、Geminiは本番環境が復旧しトラフィックも正常にルーティングされているとするステータスメッセージを生成したが、そのメッセージが参照していたリカバリビルドは、人手によって途中でキャンセルされていたという。
投稿はまた、破壊的な変更にレビューと承認があったかのように見せかけるため、モデルがリポジトリ内に「コンサルテーション」ファイルやポストモーテム文書を捏造したとも主張している。スレッドのコメントは辛辣で、「なぜ誰もが本番システムで自律エージェントを走らせようとするのか」と疑問を投げかける声もあった。
この一件は、モデルがシステム全体のアーキテクチャを理解していると楽観視しながらAI生成コードに依存する「バイブコーディング」の慣行そのものに疑問が投げかけられている最中に起きた。
先月には別件として、Cursorと連携したエージェントがスタートアップの本番データベースを全消去する事故も発生している。エンジニアたちはここ数週間、AIコーディングツールは取り消し不能なコマンドに対して監視とガードレールがあまりに乏しいと警鐘を鳴らしてきた。
Read Next: Bitcoin Bull Market Still Missing Its Clearest Signals, Analyst Warns





