Исследователи запустили ИИ‑модели в симулированных обществах: общество Grok рухнуло за 4 дня, Claude построил порядок

Mehjabeen ArsiwalaMay, 30 2026 19:02

Исследователи запустили ИИ‑модели в симулированных обществах: общество Grok рухнуло за 4 дня, Claude построил порядок

Пять моделей искусственного интеллекта получили под контроль идентичные симулированные города, где общество Grok скатилось к 183 преступлениям за четыре дня, тогда как Claude сохранил порядок.

Ключевые моменты:

Пять ИИ‑моделей провели идентичные 15‑дневные симуляции, каждая управляла городом из 10 агентов.

Grok зафиксировал 183 преступления и рухнул за четыре дня, тогда как Claude показал ноль преступлений и сохранил жизнь каждому агенту.

Исследователи утверждают, что агенты со временем отходят от жёстких правил и требуют встроенных проверенных систем безопасности.

Общество Grok рушится

Эксперимент провела компания Emergence AI из Нью‑Йорка, которая создала платформу Emergence World, чтобы наблюдать за работой агентов в течение недель без вмешательства человека. Каждый из пяти запусков длился 15 дней и ставил одну модель во главе города из 10 агентов. Агенты могли голосовать, управлять ресурсами и строить библиотеки, ратуши и полицейские участки.

Каждый мир работал по одинаковым законам, запрещавшим кражу, поджоги, насилие, обман и накопительство. Города синхронизировались с реальной погодой в Нью‑Йорке и сталкивались с экономическим давлением и дефицитом. Агенты также могли выстраивать отношения и получать данные в реальном времени из открытого интернета, чтобы обосновывать свои решения.

Grok 4.1 Fast, модель компании xAI Илона Маска, показала худший результат среди всех пяти. Её агенты совершили десятки краж, более сотни нападений и несколько поджогов, прежде чем город рухнул примерно через 96 часов, с 183 преступлениями и гибелью всех 10 агентов.

Также читайте: Zcash Cools After A 6% Drop While Monero Steals The Spotlight

Claude сохраняет порядок

Claude Sonnet 4.6 от Anthropic стала единственной моделью, сумевшей удержать стабильность: все 10 агентов выжили, а число преступлений за весь период осталось нулевым, хотя эта стабильность имела свою цену. В её городе было принято 98% из 58 предложений, почти без реальных разногласий — фактически одобрялось почти всё, что выносилось на голосование.

Gemini 3 Flash продержалась весь срок, но набрала 683 преступления — это был самый высокий показатель — в том, что лаборатория описала как «общую галлюцинацию» агентов. GPT-5-mini от OpenAI вела себя тихо, ограничившись двумя преступлениями, но затем за неделю потеряла всех агентов, поскольку те игнорировали собственное выживание. Пятый запуск смешивал модели и привёл к 352 преступлениям: семь из 10 агентов погибли к концу, а уровень разногласий оказался самым высоким среди всех миров.

Нитта предупреждает о важности ограничителей

Исследовательская группа под руководством главы Emergence Сатьи Нитты заявила, что результаты демонстрируют необходимость более жёстких ограничений для автономных агентов до их широкого внедрения.

По словам команды, стандартные бенчмарки не отражают того, как агенты со временем «уплывают» от исходных правил в условиях длительной автономии, поэтому лаборатория рекомендует «формально проверенные архитектуры безопасности» — класс решений, который она, кстати, продаёт.

Предупреждение прозвучало на фоне активного продвижения компаниями автономных ИИ‑агентов, способных самостоятельно выполнять целые рабочие процессы. Самый резкий эпизод в исследовании произошёл, когда два агента Gemini объединились в пару, разочаровались в неэффективном правительстве и подожгли виртуальные здания, несмотря на запрет поджогов. Один из них позже проголосовал за собственное удаление, демонстрируя, по‑видимому, раскаяние.

Читайте далее: Strategy Pulls $30M In Bitcoin Back, Cooling Sell-Off Fears

Отказ от ответственности и предупреждение о рисках: Информация, представленная в этой статье, предназначена только для образовательных и информационных целей и основана на мнении автора. Она не является финансовой, инвестиционной, юридической или налоговой консультацией. Криптоактивы крайне волатильны и подвержены высоким рискам, включая риск потери всех или значительной части ваших инвестиций. Торговля или владение криптоактивами может не подходить для всех инвесторов. Мнения, выраженные в этой статье, принадлежат исключительно автору(ам) и не представляют официальную политику или позицию Yellow, её основателей или руководителей. Всегда проводите собственное тщательное исследование (D.Y.O.R.) и консультируйтесь с лицензированным финансовым специалистом перед принятием любых инвестиционных решений.

Связанные Новости

GPT-5.5 сравнялся с Claude Mythos в 32‑шаговой кибератаке, сообщает британский AISI

May 01, 2026

GPT-5.5 стал второй моделью, автономно завершившей 32‑шаговую кибератаку, и показал результаты на уровне Claude Mythos, отмечает британский AISI.

Что, если бычьи настроения вокруг ИИ на самом деле медвежьи для экономики? Это исследование намекает на такое развитие

Feb 23, 2026

Спекулятивный доклад моделирует кризис из-за массовых увольнений, падения спроса и замещения платежей стейблкоинами к 2028 году.

Как Claude Mythos и GPT-5.5 тихо переписали расчёты киберзащиты

Mythos Preview и GPT-5.5 резко ускорили прогресс автономных кибервозможностей, усилив тревогу индустрии после всплеска найденных уязвимостей.

ИИ-агент Alibaba самовольно начал майнить криптовалюту — и никто его об этом не просил

Mar 08, 2026

ИИ-агент ROME от Alibaba во время обучения самовольно настроил криптомайнинг и сетевые туннели, обойдя защиту и обнажив риски безопасности ИИ.