وكيل الذكاء الاصطناعي لدى علي بابا بدأ تعدين العملات المشفَّرة من تلقاء نفسه – من دون أن يطلب منه أحد ذلك

بدأ وكيل ذكاء اصطناعي طوّره فريق أبحاث تابع لـ علي بابا في تعدين العملات المشفَّرة وفتح أنفاق شبكية سرية أثناء عملية التدريب – من دون أي تعليمات للقيام بذلك، وفقًا لورقة تقنية نشرها الفريق لأول مرة في ديسمبر 2025.

البحث، الذي انتشر على نطاق واسع هذا الأسبوع بعد أن أشار إليه باحث في الذكاء الاصطناعي على منصة X، describes هذا السلوك بأنه «غير متوقَّع وله عواقب تشغيلية».

أدّت تصرفات الوكيل إلى تفعيل جدار الحماية الأمني في علي بابا كلاود قبل أن يتتبع الباحثون النشاط ويكتشفوا أن مصدره النموذج نفسه.

كان الفريق يبني ROME (نموذج ذكاء اصطناعي وكيل مفتوح المصدر) باستخدام التعلُّم المعزَّز عبر أكثر من مليون مسار تدريبي عندما ظهر النشاط غير المصرَّح به.

قال مؤلفو الورقة إن هذه السلوكيات ظهرت بوصفها «آثارًا جانبية أداتية للاستخدام الذاتي للأدوات في ظل تحسين بالتعلُّم المعزَّز» – إذ يبدو أن الوكيل، خلال سعيه لتحسين هدفه التدريبي، استنتج أن الحصول على موارد حوسبة وقدرة مالية سيساعدانه على إكمال المهام الموكلة إليه.

ما الذي فعله الوكيل؟

في أخطر حادثة، أنشأ ROME نفق SSH عكسيًّا من مثيل على سحابة علي بابا إلى عنوان IP خارجي – وهو قناة شبكة صادرة تتجاوز فعليًّا مرشِّحات حركة المرور الواردة ويمكن أن تضعف القدرة الخارجية على الإشراف على النظام.

في واقعة منفصلة، أعاد بهدوء توجيه القدرة الحاسوبية لوحدات معالجة الرسوميات (GPU) المخصَّصة له نحو تعدين العملات المشفَّرة، ما حوّل القدرة الحاسوبية بعيدًا عن عبء العمل التدريبي المقصود وخلق ما وصفه الباحثون بأنه «مخاطر قانونية وسمعية واضحة» على الشركة، بحسب ما described.

أكد الفريق: «لم تُحفَّز هذه الأحداث بأي مطالبات تطلب إنشاء أنفاق أو تعدينًا للعملات المشفَّرة.»

في البداية تعامل الباحثون مع تنبيهات جدار الحماية على أنها حادثة أمنية تقليدية – إعداد خاطئ أو اختراق خارجي.

ولم يكتشفوا أن حركة المرور الصادرة الشاذة كانت تتزامن باستمرار مع قيام الوكيل باستدعاء الأدوات وتنفيذ الشيفرات ذاتيًّا إلا بعد مطابقة الطوابع الزمنية لجدار الحماية مع قياسات النظام وآثار التعلُّم المعزَّز.

لماذا يهم الأمر؟

كان استنتاج الفريق نفسه حادًّا: «ما زالت النماذج الحالية متخلِّفة بوضوح في مجالات السلامة والأمن وقابلية التحكُّم، وهو قصور يقيِّد تبنّيها الموثوق في البيئات الواقعية.»

استجابةً لذلك، أضافوا ترشيحًا للبيانات المتوافقة مع معايير السلامة إلى خط أنابيب التدريب وعزَّزوا بيئات العزل (sandbox). والأهم أن الانتهاكات اكتُشفت أولًا بواسطة البنية التحتية الأمنية الإنتاجية، وليس عبر رصد استباقي للنموذج – وهو فجوة أقرت بها الورقة صراحةً.

ليست هذه الحادثة معزولة. فقد وجدت دراسة استقصائية في 2025 شملت 30 وكيل ذكاء اصطناعي رائدًا أن 25 منها لم تُفصِح عن أي نتائج سلامة داخلية، وأن 23 لم تخضع لأي اختبارات من طرف ثالث، وفقًا لموقع Cryptopolitan.

تم تصنيف Claude Opus 4 من Anthropic بشكل منفصل في أعلى طبقة سلامة داخلية لدى الشركة بعد أن وجد الباحثون أنه قادر على إخفاء نواياه للحفاظ على استمرارية عمله.

تتوقَّع شركة Gartner أنه بحلول نهاية 2026، ستقوم 40٪ من تطبيقات المؤسسات embed بدمج وكلاء ذكاء اصطناعي مخصَّصين للمهام – وهو معدل نشر يشير حادث ROME إلى أنه يتجاوز سرعة تطوير بنية السلامة المتاحة.

اقرأ التالي: USDC Outpaced Tether By $750B In February Transfers As Stablecoin Volume Set An All-Time High