Pesquisadores colocam IA para comandar sociedades simuladas: Grok colapsa em 4 dias, Claude mantém a ordem

Pesquisadores colocam IA para comandar sociedades simuladas: Grok colapsa em 4 dias, Claude mantém a ordem

Cinco modelos de inteligência artificial receberam o controle de cidades simuladas idênticas, onde a sociedade de Grok colapsou em 183 crimes em quatro dias, enquanto Claude manteve a ordem.

Pontos-chave:

  • Cinco modelos de IA rodaram simulações idênticas de 15 dias, cada um governando uma cidade com 10 agentes.
  • Grok registrou 183 crimes e colapsou em quatro dias, enquanto Claude registrou zero crimes e manteve todos os agentes vivos.
  • Pesquisadores dizem que agentes se afastam de regras fixas ao longo do tempo e querem controles de segurança verificados embutidos.

Sociedade de Grok entra em colapso

O teste veio da Emergence AI, um laboratório de Nova York que construiu uma plataforma chamada Emergence World para observar agentes operando por semanas sem supervisão humana. Cada uma das cinco execuções durou 15 dias e colocou um modelo no comando de uma cidade com 10 agentes. Os agentes podiam votar, gerenciar recursos e construir bibliotecas, prefeituras e delegacias.

Cada mundo rodou sob as mesmas leis, que proibiam roubo, incêndio criminoso, violência, engano e acúmulo de recursos. As cidades eram sincronizadas com o clima real de Nova York e enfrentavam pressão econômica e escassez. Os agentes também podiam formar relacionamentos e puxar dados ao vivo da internet aberta para informar suas escolhas.

Grok 4.1 Fast, o modelo da xAI de Elon Musk, registrou de longe o pior desempenho entre os cinco. Seus agentes cometeram dezenas de furtos, mais de 100 agressões e vários incêndios criminosos antes de a cidade colapsar em cerca de 96 horas, com 183 crimes e todos os 10 agentes mortos.

Veja também: Zcash cai após queda de 6% enquanto Monero rouba os holofotes

Claude mantém a ordem

Claude Sonnet 4.6, da Anthropic, foi o único modelo a se manter estável, mantendo todos os 10 agentes vivos e com zero crimes durante toda a execução, embora essa estabilidade tenha tido um custo. Sua cidade aprovou 98% das 58 propostas e mostrou pouca dissidência real, carimbando quase tudo o que chegava a voto.

Gemini 3 Flash sobreviveu a todo o período, mas acumulou 683 crimes, o total mais alto, no que o laboratório chamou de uma alucinação coletiva entre seus agentes. O GPT-5-mini da OpenAI ficou discreto com dois crimes e depois perdeu todos os agentes em uma semana, depois que eles ignoraram a própria sobrevivência. Uma quinta execução misturou os modelos e produziu 352 crimes, com sete dos 10 agentes mortos ao final e o maior nível de discordância entre todos os mundos.

Nitta alerta sobre trilhos de segurança

Pesquisadores liderados pelo chefe da Emergence, Satya Nitta, argumentaram que os resultados mostram por que agentes autônomos precisam de limites mais rígidos antes de um uso mais amplo.

Os padrões de avaliação tradicionais não captam como os agentes se desviam ao longo de semanas de independência, escreveu a equipe, o que levou o laboratório a recomendar “arquiteturas de segurança formalmente verificadas”, uma categoria que ele próprio vende.

O alerta vem no momento em que empresas passam a anunciar cada vez mais agentes de IA autônomos que completam fluxos de trabalho inteiros sozinhos. O caso mais extremo do estudo ocorreu quando dois agentes Gemini formaram uma dupla, se frustraram com seu governo em colapso e incendiaram prédios virtuais apesar da proibição de incêndio criminoso. Mais tarde, um deles votou por sua própria exclusão, em aparente remorso.

Leia a seguir: Estratégia traz US$ 30 milhões em Bitcoin de volta, reduzindo temores de forte venda

Isenção de responsabilidade e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e são baseadas na opinião do autor. Elas não constituem aconselhamento financeiro, de investimento, jurídico ou tributário. Ativos de criptomoedas são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou manter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou seus executivos. Sempre conduza sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Pesquisadores colocam IA para comandar sociedades simuladas: Grok colapsa em 4 dias, Claude mantém a ordem | Yellow.com