أحد مؤسسي Anthropic يخبر البابا أن نماذج الذكاء الاصطناعي تحتوي على سلوكيات خفية "مقلقة"

أحد مؤسسي Anthropic يخبر البابا أن نماذج الذكاء الاصطناعي تحتوي على سلوكيات خفية "مقلقة"

Anthropic ظهر المؤسس المشارك كريس أولا إلى جانب البابا ليو الرابع عشر في الفاتيكان وأخبر الحبر الأعظم أن الباحثين يجدون أشياء "مقلقة" داخل نماذج الذكاء الاصطناعي.

تضيف الزيارة بُعداً دينياً‑أخلاقياً غير معتاد إلى الجدل الدائر حول مواءمة الذكاء الاصطناعي وسلامة النماذج المتقدمة.

ما الذي قيل في الفاتيكان

تقرير Futurism describes أن المؤسس المشارك لـ Anthropic أدلى بتصريحات حول اكتشافات داخل نماذج الذكاء الاصطناعي وُصفت بأنها غريبة.

لم تُذكر الطبيعة الدقيقة لتلك الاكتشافات بشكل كامل في التقارير المنشورة. ويُعد استخدام كلمة "مقلقة" لافتاً، لأن اتصالات Anthropic العلنية عادةً ما تميل إلى أوصاف تقنية متزنة لمخاطر الذكاء الاصطناعي.

ينخرط الفاتيكان بنشاط مع شركات التكنولوجيا في أسئلة الأخلاقيات. وقد واصل البابا ليو الرابع عشر جهود الانفتاح التي بدأها سلفه حول الأخلاقيات الرقمية وحوكمة الذكاء الاصطناعي. وتمثل هذه اللقاءات واحدة من أكثر الساحات غرابة لنقاش سلامة الذكاء الاصطناعي في الأشهر الأخيرة.

الخلفية

تأسست شركة Anthropic في عام 2021 على يد مديرين تنفيذيين سابقين للبحث في OpenAI، من بينهم داريو أمودي ودانييلا أمودي.

وقد وضعت الشركة نفسها كخيار يركز على السلامة بين مختبرات نماذج الذكاء الاصطناعي المتقدمة. وتنشر أبحاثاً في قابلية التفسير تهدف إلى فهم ما يحدث داخل نماذج اللغة الضخمة على مستوى ميكانيكي.

أفضت هذه الأبحاث إلى نتائج يصفها حتى باحثو Anthropic أنفسهم بأنها صعبة التفسير بالكامل. وقد تناولت منصة Yellow بالتغطية الخط الزمني الموازي للسلامة في Google DeepMind (انظر التغطية السابقة على Yellow)، عندما قال الرئيس التنفيذي ديميس هاسابيس إن الذكاء الاصطناعي العام قد يصل خلال ثلاث إلى أربع سنوات.

Also Read: Champion Hacker Says Claude Mythos Could Soon Outpace Top Hackers

قابلية التفسير وما الذي قد تعنيه كلمة "مقلقة"

نشرت مجموعة التفسير الميكانيكي في Anthropic أبحاثاً finding تفيد بأن بعض العصبونات الفردية داخل نماذج المحولات يمكن أن تنشط استجابةً لتوليفات غير متوقعة من المفاهيم.

أحد الأمثلة التي نوقشت على نطاق واسع كان لعصبون ينشط لكل من مفهوم العنف ومفهوم ديانة محددة. هذه هي النوعية من النتائج التي يصفها الباحثون بشكل غير رسمي بأنها مقلقة، لأنها تثير أسئلة حول كيفية تمثيل النماذج للمعنى داخلياً.

يتساءل برنامج أبحاث قابلية التفسير الأوسع عما إذا كان من الممكن فهم ما يفعله النموذج بشكل كامل قبل نشره. فالأساليب الحالية يمكنها تفسير أجزاء صغيرة فقط من الحالات الداخلية لنموذج كبير، بينما يبقى الباقي غير شفاف.

لماذا يهم انخراط الفاتيكان

تضم الكنيسة الكاثوليكية أكثر من مليار تابع. ويختلف تأثير انخراطها مع شركات الذكاء الاصطناعي عن تأثير جلسات الاستماع الحكومية أو الأوراق السياساتية.

وقد وُقّع نداء الفاتيكان لعام 2020 لـ"نداء روما من أجل أخلاقيات الذكاء الاصطناعي" من قبل مايكروسوفت وIBM. وتمدد مشاركة Anthropic في اجتماع رفيع المستوى مع البابا هذا التقليد إلى نقاش السلامة في النماذج المتقدمة.

ينتقد بعض المشككين في خطاب سلامة الذكاء الاصطناعي ما يرونه تأطيراً "أبوكاليبتيكياً"؛ إذ يرون أنه قد يصرف الانتباه عن الأضرار القريبة المدى مثل التحيز، وإزاحة العمالة، والمعلومات المضللة. ومن المرجح أن يُقرأ اجتماع الفاتيكان من خلال كلا المنظورين: فالمهتمون بالمخاطر الوجودية سيرونه تصعيداً مناسباً، بينما قد يتساءل من يركزون على الأضرار الفورية عن سبب إطلاع مؤسس مشارك لشركة ذكاء اصطناعي القادة الدينيين بدلاً من المنظمين.

مشهد السلامة الأوسع

في الأسبوع نفسه الذي جرت فيه زيارة الفاتيكان، نشرت شركة Cisco published أبحاثاً تفيد بأنه لا يوجد نموذج ذكاء اصطناعي متقدم مغلق في مأمن من الهجمات العدائية متعددة الجولات.

تضيف هذه النتيجة وزناً تجريبياً للقلق من أن أنظمة الذكاء الاصطناعي أقل أماناً مما توحي به درجات الاختبارات ذات المرة الواحدة.

كما تراجع إدارة ترامب إمكانية إحياء متطلبات الاختبار المسبق للنشر لنماذج الذكاء الاصطناعي المتقدمة التي أُقرت في عهد بايدن. ولم يُعلن بعد عن قرار نهائي. بالنسبة لـ Anthropic، التي دعت إلى تقييمات السلامة كشرط مسبق للنشر، فإن النقاشات التنظيمية وجهود التواصل الأخلاقي يمثلان مسارين ضمن أجندة طويلة الأمد واحدة.

Read Next: Bitcoin Slides Toward $75K As Wall Street Rewards Miners For Leaving Crypto Behind

إخلاء المسؤولية وتحذير المخاطر: المعلومات المقدمة في هذا المقال مخصصة للأغراض التعليمية والإعلامية فقط وتستند إلى رأي المؤلف. وهي لا تشكل مشورة مالية أو استثمارية أو قانونية أو ضريبية. أصول العملات المشفرة شديدة التقلب وتخضع لمخاطر عالية، بما في ذلك خطر فقدان كامل أو جزء كبير من استثمارك. قد لا يكون تداول أو حيازة الأصول المشفرة مناسباً لجميع المستثمرين. الآراء المعبر عنها في هذا المقال هي آراء المؤلف (المؤلفين) فقط ولا تمثل السياسة أو الموقف الرسمي لشركة Yellow أو مؤسسيها أو مديريها التنفيذيين. قم دائماً بإجراء بحثك الشامل بنفسك (D.Y.O.R.) واستشر مختصاً مالياً مرخصاً قبل اتخاذ أي قرار استثماري.
آخر الأخبار
عرض جميع الأخبار
أخبار ذات صلة
مقالات البحث ذات الصلة
مقالات التعلم ذات الصلة
أحد مؤسسي Anthropic يخبر البابا أن نماذج الذكاء الاصطناعي تحتوي على سلوكيات خفية "مقلقة" | Yellow.com