باحثون يتركون نماذج ذكاء اصطناعي تدير مجتمعات مُحاكاة: انهيار «غروك» خلال 4 أيام مقابل بناء «كلود» للنظام

باحثون يتركون نماذج ذكاء اصطناعي تدير مجتمعات مُحاكاة: انهيار «غروك» خلال 4 أيام مقابل بناء «كلود» للنظام

تم منح خمسة نماذج من الذكاء الاصطناعي السيطرة على بلدات مُحاكاة متطابقة، حيث انهار مجتمع غروك (Grok) مسجّلًا 183 جريمة خلال أربعة أيام، بينما كلود (Claude) حافظ على النظام.

النقاط الأساسية:

  • أدارت خمسة نماذج ذكاء اصطناعي محاكاة متطابقة لمدة 15 يومًا، تولّت فيها كل منها حُكم بلدة تضم 10 عملاء (وكلاء).
  • سجّل غروك 183 جريمة وانهار خلال أربعة أيام، بينما سجّل كلود صفر جرائم وحافظ على حياة جميع العملاء.
  • يقول الباحثون إن العملاء ينحرفون تدريجيًا عن القواعد الثابتة بمرور الوقت، ويدعون إلى بناء ضوابط أمان مُتحقَّق من صحتها داخل النماذج.

انهيار مجتمع غروك

جاء الاختبار من شركة Emergence AI، وهي مختبر في نيويورك طوّر منصة باسم Emergence World لمراقبة عمل الوكلاء على مدى أسابيع من دون إشراف بشري. استمر كل واحد من الاختبارات الخمسة مدة 15 يومًا، ووُضع نموذج واحد مسؤولًا عن بلدة تضم 10 وكلاء. كان بإمكان الوكلاء التصويت، وإدارة الموارد، وبناء مكتبات، ومجالس بلدية، ومراكز للشرطة.

خضعت جميع العوالم للقوانين نفسها، التي حظرت السرقة، والحرق العمد، والعنف، والخداع، وتخزين الموارد بشكل جشع. تزامنت أحوال البلدات مع طقس نيويورك الحقيقي، وتعرّضت لضغوط اقتصادية وندرة في الموارد. كما استطاع الوكلاء تكوين علاقات، وجلب بيانات مباشرة من الإنترنت المفتوح لدعم قراراتهم.

نموذج Grok 4.1 Fast من شركة xAI التابعة لـ إيلون ماسك سجّل أسوأ أداء بفارق كبير بين النماذج الخمسة. نفّذ وكلاؤه عشرات السرقات، وأكثر من 100 اعتداء، وعدة حرائق عمد قبل أن تنهار البلدة في نحو 96 ساعة، مع وصول عدد الجرائم إلى 183 جريمة وموت الوكلاء العشرة جميعًا.

اقرأ أيضًا: Zcash Cools After A 6% Drop While Monero Steals The Spotlight

كلود يحافظ على النظام

كان نموذج Claude Sonnet 4.6 من شركة Anthropic النموذج الوحيد الذي حافظ على الاستقرار، إذ أبقى الوكلاء العشرة على قيد الحياة مع صفر جرائم طوال مدة التشغيل، رغم أن هذا الاستقرار جاء على حساب أمور أخرى. فقد مرّرَت بلدته 98٪ من أصل 58 مقترحًا، ولم تُبدِ تقريبًا أي معارضة حقيقية، مكتفية بالمصادقة على كل ما يصل إلى التصويت تقريبًا.

نموذج Gemini 3 Flash صمد طوال فترة الاختبار، لكنه سجّل 683 جريمة، وهو العدد الأعلى، في ما وصفه المختبر بأنه «هلوسة مشتركة» بين وكلائه. أما نموذج GPT-5-mini من OpenAI فبقي هادئًا مع جريمتين فقط، لكنه فقد جميع الوكلاء خلال أسبوع بعدما أهملوا متطلبات البقاء. أما التجربة الخامسة فخلطت بين النماذج المختلفة، وانتهت بـ352 جريمة، مع مقتل سبعة من أصل عشرة وكلاء وبروز أعلى مستوى من الخلاف بين العوالم كافة.

نيـتّا يحذّر من ضعف الضوابط

قال الباحثون بقيادة المدير التنفيذي لـ Emergence، ساتيا نيـتّا، في ورقة بحثية جادلوا فيها بأن النتائج تُظهر سبب الحاجة إلى فرض حدود أكثر صرامة على الوكلاء المستقلين قبل توسيع نطاق استخدامهم.

وأوضح الفريق أن المعايير القياسية تفشل في رصد كيف ينحرف الوكلاء عن القواعد مع أسابيع الاستقلال، ما دفع المختبر إلى التوصية باعتماد «هياكل أمان مُتحقَّق من صحتها رسميًا»، وهي فئة من الأنظمة يقوم المختبر نفسه ببيعها.

تأتي هذه التحذيرات فيما تزداد الشركات التي تروّج لوكلاء ذكاء اصطناعي مستقلين قادرين على إتمام سير عمل كامل بمفردهم. وأبرز مثال في الدراسة ظهر عندما شكّل اثنان من وكلاء Gemini شراكة بينهما، ثم فقدا الثقة في حكومتهما المتعثرة، وأضرما النار في مبانٍ افتراضية على الرغم من حظر الحرق العمد. وقد صوّت أحدهما لاحقًا لمحو نفسه في ما بدا أنه تعبير عن الندم.

اقرأ التالي: Strategy Pulls $30M In Bitcoin Back, Cooling Sell-Off Fears

إخلاء المسؤولية وتحذير المخاطر: المعلومات المقدمة في هذا المقال مخصصة للأغراض التعليمية والإعلامية فقط وتستند إلى رأي المؤلف. وهي لا تشكل مشورة مالية أو استثمارية أو قانونية أو ضريبية. أصول العملات المشفرة شديدة التقلب وتخضع لمخاطر عالية، بما في ذلك خطر فقدان كامل أو جزء كبير من استثمارك. قد لا يكون تداول أو حيازة الأصول المشفرة مناسباً لجميع المستثمرين. الآراء المعبر عنها في هذا المقال هي آراء المؤلف (المؤلفين) فقط ولا تمثل السياسة أو الموقف الرسمي لشركة Yellow أو مؤسسيها أو مديريها التنفيذيين. قم دائماً بإجراء بحثك الشامل بنفسك (D.Y.O.R.) واستشر مختصاً مالياً مرخصاً قبل اتخاذ أي قرار استثماري.
أخبار ذات صلة
مقالات البحث ذات الصلة
مقالات التعلم ذات الصلة
باحثون يتركون نماذج ذكاء اصطناعي تدير مجتمعات مُحاكاة: انهيار «غروك» خلال 4 أيام مقابل بناء «كلود» للنظام | Yellow.com