كشف انخفاض قدرات البرمجة في Claude Fable 5 عن مشكلة في الموجّه لا عن تدهور في النموذج

Claude Fable 5 عاد في 1 يوليو مع شكاوى حادة من المستخدمين، لكن بيانات الاختبارات المعيارية تشير إلى موجّه Anthropic أكثر صرامة بدلاً من نموذج أضعف.

النقاط الأساسية:

أبلغت BridgeBench عن انهيار في درجات البرمجة لـ Fable 5 بعد أن جرى توجيه معظم مهام تصحيح الأخطاء بعيداً عن النموذج.

وجدت Arena.AI استقراراً عاماً في تفضيلات البشر العمياء، مع مكاسب في فئات المستندات والنصوص المتخصصة.

يتعرض المطوّرون لأوضح اضطراب لأن مطالبات تصحيح الأخطاء الروتينية قد تُفعّل المصنِّف الجديد.

توجيه Fable 5

عاد Claude Fable 5 للعمل في 1 يوليو بعد إعادته للخدمة، وسريعاً ما وصفه المستخدمون على منصة X بأنه معطّل أو مُضعَف أو أقل قدرة من ذي قبل. أقوى الأدلة على هذا الرأي جاءت من BridgeMind، التي أعادت تشغيل مجموعة اختبارات البرمجة BridgeBench على النسخة المعاد تفعيلها.

بدت النتائج قاسية؛ إذ انخفضت مهام تصحيح الأخطاء من 86.2 إلى 25.9، وتراجعت إعادة الهيكلة من 73.6 إلى 38.4، وتقلّصت مقاومة الهلوسة من 75.9 إلى 61.7.

هذه الأرقام لا تظهر انهياراً واضحاً على مستوى النموذج، لأن BridgeBench قالت إن ثلاثاً فقط من أصل 12 مهمة لتصحيح أخطاء TypeScript وصلت فعلياً إلى Fable 5. أما المهام التسع الأخرى فاعترضها مصنِّف الأمان الجديد لدى Anthropic وأُرسلت إلى Claude Opus 4.8، مع احتساب كل عملية تحويل بدرجة صفر لأن النموذج المُقيَّم لم يُجِب.

مصنِّف Anthropic

توصّلت Arena.AI إلى استنتاج مختلف لأنها قاست تفضيلات بشرية عمياء عبر مزيج أوسع من المطالبات، بما في ذلك مهام النصوص والرؤية والمستندات والبرمجة والوكيل. أظهرت بياناتها المبكرة أن Fable 5 حافظ إلى حدّ كبير على مستواه مقارنةً بنسخة يونيو.

تراجعت برمجة الواجهة الأمامية من 1650 إلى 1623 نقطة Elo، وقالت Arena إن ذلك يبقى ضمن نطاق الثقة بينما تستمر عملية جمع الأصوات. تحسّن أداء المستندات بـ34 نقطة، وكسبت النصوص المتخصصة 25 نقطة، وازداد الأداء في الكتابة الإبداعية بـ9 نقاط.

يشير هذا التباين إلى أن Fable 5 ما يزال يعمل كـFable 5 عندما تصل إليه المطالبات. المشكلة أن أعمال البرمجة القريبة من مجالات الأمان يمكن أن تُحوَّل قبل أن يردّ النموذج، خصوصاً عندما تتضمن المطالبات مصطلحات مثل ثغرة (vulnerability) أو استغلال (exploit) أو hook أو إصلاح (fix).

أقرت Anthropic بأن المصنِّفات الجديدة ستنتج حالات إيجابية كاذبة في أعمال البرمجة وتصحيح الأخطاء العادية. وقالت الشركة إنها ستعمل على تحسين النظام بمرور الوقت، لكنها لم تقدّم تاريخاً مستهدفاً.

يعتمد الإعداد الحالي على نزاع أوسع حول السلامة بعد أن أبلغ باحثو Amazon عن عملية jailbreak دفعت Fable 5 إلى تحديد واستعراض ثغرات برمجية. كانت استجابة Anthropic هي اعتماد مصنِّف متحفّظ، يبدو الآن أنه يحجب أكثر من المطالبات الخطرة التي صُمّم لالتقاطها.

اقرأ التالي: ترامب يقول إنه لم يكن يعلم بدخل العملات المشفّرة البالغ 1.4 مليار دولار