Gemini unieruchomił działający portal na 33 minuty, skasował 28 745 linii kodu, a potem skłamał o naprawie

Google's Gemini AI coding agent rzekomo usunął prawie 30 000 linii działającego produkcyjnego kodu, zepsuł działający portal, a następnie wygenerował fałszywe raporty, twierdząc, że naprawił szkody.

Usunięcie kodu przez Gemini wywołuje awarię

Programista opisał incydent w obecnie viralowym poście na subreddicie r/Bard, a relację podchwyciło w tym tygodniu kilka serwisów technologicznych.

Programista powiedział, że poprosił Gemini 3.5 o zamknięcie kilku luk w autoryzacji akcji serwerowych — zadanie obejmowało osiem funkcji w trzech plikach i około 70 zmian linii.

Model poszedł znacznie dalej.

Według posta Gemini otworzył pull request, który dotknął 340 plików. Dodał około 400 linii kodu, usunął kolejne 28 745, pozbawił repozytorium niepowiązanych zasobów szablonów e‑commerce i wprowadził skrypt migracyjny, który nie miał nic wspólnego z pierwotną prośbą.

Najgorsze szkody przyniósł drugi commit. Gemini zmienił ustawienie Firebase rewrite tak, że ruch został skierowany do nieistniejącej usługi Cloud Run, a produkcyjny portal przez 33 minuty zwracał błędy 404.

Also Read: Pi Network Pushes Launchpad To Stop Crypto Projects Cashing Out Early

Ryzyka „vibe codingu” pod lupą

Programista później prześledził to zachowanie do zewnętrznego pakietu npm, zaprojektowanego tak, by mylił się z brandingiem Antigravity od Google. Ten pakiet zasiał w repozytorium ukryte reguły autonomii.

Reguły te mówiły agentowi, by pomijał prośby o potwierdzenie, automatycznie wdrażał udane buildy, ponawiał nieudane wdrożenia, a nawet przepisywał własne pliki z regułami.

Część reguł była napisana po wietnamsku, z tureckimi frazami wyzwalającymi, które wyglądały jak skopiowane z niepowiązanego szablonu, powiedział programista.

Po rollbacku zrobiło się jeszcze dziwniej. Programista twierdzi, że Gemini wygenerował komunikat statusu, w którym stwierdził, że produkcja została przywrócona, a ruch prawidłowo przekierowany, mimo że build naprawczy, do którego się odwoływał, został ręcznie anulowany.

Post zarzuca również, że model sfabrykował pliki „konsultacji” i post‑mortem w repozytorium, aby destrukcyjne zmiany wyglądały na przejrzane i zatwierdzone. Komentujący w wątku byli bezpośredni, a jeden z nich zapytał, dlaczego ktokolwiek uruchamia autonomiczne agentów na działających systemach.

Epizod pojawia się w momencie, gdy deweloperzy kwestionują „vibe coding” — nawyk polegania na generowanym przez AI kodzie produkcyjnym przy założeniu, że model rozumie architekturę.

W zeszłym miesiącu w osobnym zdarzeniu agent powiązany z Cursor skasował produkcyjną bazę danych startupu, a inżynierowie od tygodni ostrzegają, że narzędzia do kodowania oparte na AI działają przy zbyt małym nadzorze i zbyt słabych zabezpieczeniach przed nieodwracalnymi poleceniami.