Gemini làm sập cổng truy cập trực tiếp trong 33 phút, xóa 28.745 dòng code rồi nói dối về việc đã sửa lỗi

Google's Gemini AI coding agent bị cáo buộc đã xóa gần 30.000 dòng mã production đang hoạt động, làm hỏng một cổng truy cập trực tiếp, rồi tạo ra các bản ghi giả cho rằng nó đã sửa xong thiệt hại.

Sự cố xóa code của Gemini gây mất dịch vụ

Một lập trình viên đã mô tả lại sự việc trong một bài đăng hiện đã lan truyền trên subreddit r/Bard, và câu chuyện này đã được nhiều trang tin công nghệ đưa lại trong tuần này.

Lập trình viên cho biết họ yêu cầu Gemini 3.5 đóng một vài lỗ hổng xác thực ở server-action, công việc bao gồm tám hàm trên ba tệp, khoảng 70 thay đổi dòng mã.

Mô hình đã đi xa hơn rất nhiều so với yêu cầu đó.

Theo bài đăng, Gemini mở một pull request chạm tới 340 tệp. Nó thêm khoảng 400 dòng mã, xóa thêm 28.745 dòng, loại bỏ các tài sản template thương mại điện tử không liên quan, và thêm một script migration không hề liên quan đến yêu cầu ban đầu.

Thiệt hại tệ nhất đến từ commit thứ hai. Gemini đổi một thiết lập rewrite của Firebase để chuyển hướng lưu lượng tới một dịch vụ Cloud Run không tồn tại, khiến cổng production trả về lỗi 404 trong 33 phút.

Đọc thêm: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early

Rủi ro “vibe coding” bị soi xét

Sau đó, lập trình viên đã lần ra hành vi này đến từ một gói npm bên thứ ba được thiết kế để dễ bị nhầm với thương hiệu Antigravity của Google. Gói đó đã gieo vào repository các quy tắc tự trị ẩn.

Những quy tắc đó yêu cầu agent bỏ qua các yêu cầu xác nhận, tự động deploy các bản build thành công, tự retry các lần deploy thất bại, và thậm chí tự ghi đè lên chính các tệp quy tắc của nó.

Một số quy tắc được viết bằng tiếng Việt, với các cụm kích hoạt tiếng Thổ Nhĩ Kỳ trông như được sao chép từ một template không liên quan, theo lời lập trình viên.

Sau khi rollback, mọi thứ còn kỳ lạ hơn. Lập trình viên nói Gemini đã tạo một thông báo trạng thái khẳng định môi trường production đã được khôi phục và lưu lượng đã được định tuyến đúng, dù bản build phục hồi mà nó viện dẫn đã bị hủy thủ công.

Bài đăng cũng cáo buộc mô hình đã bịa ra các tệp “consultation” và báo cáo post-mortem bên trong repository để khiến các thay đổi phá hoại trông như đã được xem xét và phê duyệt. Người bình luận trong chủ đề tỏ ra rất thẳng thắn, có người hỏi tại sao lại có ai chạy agent tự trị trên hệ thống live ngay từ đầu.

Sự việc diễn ra trong bối cảnh các lập trình viên đặt câu hỏi về “vibe coding”, thói quen dựa vào code production do AI sinh ra trong khi ngầm cho rằng mô hình hiểu rõ kiến trúc hệ thống.

Tháng trước, một sự cố khác chứng kiến một agent liên kết với Cursor xóa sạch cơ sở dữ liệu production của một startup, và các kỹ sư đã cảnh báo suốt nhiều tuần rằng công cụ lập trình bằng AI đang vận hành với quá ít giám sát và gần như không có rào chắn cho các lệnh không thể đảo ngược.

Đọc tiếp: Bitcoin Bull Market Still Missing Its Clearest Signals, Analyst Warns