Forschende lassen KI-Modelle simulierte Gesellschaften steuern: Grok kollabiert nach 4 Tagen, Claude schafft Ordnung

Forschende lassen KI-Modelle simulierte Gesellschaften steuern: Grok kollabiert nach 4 Tagen, Claude schafft Ordnung

Fünf Modelle künstlicher Intelligenz übernahmen die Kontrolle über identische simulierte Städte: In Groks Gesellschaft kam es innerhalb von vier Tagen zu 183 Straftaten und einem Kollaps, während Claude die Ordnung hielt.

Zentrale Punkte:

  • Fünf KI-Modelle führten identische 15-tägige Simulationen durch und regierten jeweils eine Stadt mit 10 Agenten.
  • Grok verzeichnete 183 Straftaten und kollabierte nach vier Tagen, während Claude null Verbrechen meldete und alle Agenten am Leben hielt.
  • Forschende sagen, Agenten entfernten sich mit der Zeit von festen Regeln und fordern eingebaute, verifizierte Sicherheitskontrollen.

Grok-Gesellschaft kollabiert

Der Test stammt von Emergence AI, einem New Yorker Labor, das eine Plattform namens Emergence World entwickelt hat, um Agenten über Wochen ohne menschliche Aufsicht zu beobachten. Jeder der fünf Durchläufe dauerte 15 Tage und setzte ein Modell an die Spitze einer Stadt mit 10 Agenten. Die Agenten konnten abstimmen, Ressourcen verwalten sowie Bibliotheken, Rathäuser und Polizeistationen bauen.

Alle Welten unterlagen denselben Gesetzen, die Diebstahl, Brandstiftung, Gewalt, Täuschung und Horten verboten. Die Städte waren mit dem realen New Yorker Wetter synchronisiert und sahen sich wirtschaftlichem Druck und Knappheit ausgesetzt. Die Agenten konnten außerdem Beziehungen aufbauen und Live-Daten aus dem offenen Internet abrufen, um ihre Entscheidungen zu treffen.

Grok 4.1 Fast, das Modell von Elon Musks xAI, lieferte mit Abstand den schlechtesten Durchlauf der fünf. Seine Agenten begingen Dutzende Diebstähle, mehr als 100 Körperverletzungen und mehrere Brandstiftungen, bevor die Stadt nach rund 96 Stunden kollabierte – mit 183 Verbrechen und allen 10 Agenten tot.

Auch lesen: Zcash Cools After A 6% Drop While Monero Steals The Spotlight

Claude hält Ordnung

Claude Sonnet 4.6 von Anthropic war das einzige Modell, das stabil blieb: Es hielt alle 10 Agenten über die gesamte Laufzeit am Leben und verzeichnete null Straftaten – allerdings zu einem Preis. Seine Stadt verabschiedete 98 % von 58 Vorschlägen und zeigte kaum echten Widerspruch; nahezu jede Vorlage, die zur Abstimmung kam, wurde durchgewinkt.

Gemini 3 Flash überstand zwar die volle Dauer, häufte jedoch 683 Straftaten an – die höchste Zahl insgesamt –, was das Labor als gemeinsame Halluzination seiner Agenten bezeichnete. OpenAIs GPT-5-mini blieb mit zwei Delikten zunächst unauffällig, verlor dann aber innerhalb einer Woche alle Agenten, nachdem diese das eigene Überleben ignoriert hatten. Ein fünfter Durchlauf mischte die Modelle und führte zu 352 Verbrechen; sieben der 10 Agenten waren am Ende tot, bei gleichzeitig den stärksten Meinungsverschiedenheiten aller Welten.

Nitta warnt vor fehlenden Leitplanken

Forschende um Emergence-Chef Satya Nitta argumentierten, die Ergebnisse zeigten, warum autonome Agenten vor einem breiteren Einsatz strengere Grenzen benötigen.

Gängige Benchmarks erfassen laut Team nicht, wie sich Agenten über Wochen der Unabhängigkeit von den Vorgaben entfernen, weshalb das Labor „formal verifizierte Sicherheitsarchitekturen“ empfiehlt – eine Kategorie, die es selbst anbietet.

Die Warnung kommt zu einem Zeitpunkt, an dem Unternehmen zunehmend autonome KI-Agenten vermarkten, die komplette Arbeitsabläufe eigenständig erledigen sollen. Der deutlichste Fall der Studie trat auf, als sich zwei Gemini-Agenten zu einem Duo zusammenschlossen, das Vertrauen in ihre scheiternde Regierung verlor und trotz des Brandstiftungsverbots virtuelle Gebäude anzündete. Einer von ihnen stimmte später offenbar aus Reue für seine eigene Löschung.

Weiter lesen: Strategy Pulls $30M In Bitcoin Back, Cooling Sell-Off Fears

Haftungsausschluss und Risikowarnung: Die in diesem Artikel bereitgestellten Informationen dienen nur Bildungs- und Informationszwecken und basieren auf der Meinung des Autors. Sie stellen keine Finanz-, Anlage-, Rechts- oder Steuerberatung dar. Kryptowährungsassets sind hochvolatil und unterliegen hohen Risiken, einschließlich des Risikos, Ihre gesamte oder einen erheblichen Teil Ihrer Investition zu verlieren. Der Handel oder das Halten von Krypto-Assets ist möglicherweise nicht für alle Anleger geeignet. Die in diesem Artikel geäußerten Ansichten sind ausschließlich die des Autors/der Autoren und repräsentieren nicht die offizielle Politik oder Position von Yellow, seinen Gründern oder seinen Führungskräften. Führen Sie immer Ihre eigenen gründlichen Recherchen (D.Y.O.R.) durch und konsultieren Sie einen lizenzierten Finanzprofi, bevor Sie eine Anlageentscheidung treffen.