تفوّق نموذج كلود Mythos للذكاء الاصطناعي في تدقيق الشيفرة على المنافسين، ويتراجع بسبب سعر أعلى بنحو 5 مرات

نموذج Anthropic's Mythos للذكاء الاصطناعي يتفوق على الأنظمة المنافسة في العثور على ثغرات البرمجيات، لكن معايير مستقلة جديدة تكشف عن حُكم أقل قوة وتكاليف تشغيل مرتفعة.

تفوّق Mythos Preview في تدقيق الشيفرة المصدرية

أكدت شركة الأمن الهجومي XBOW هذا الادعاء الرئيسي confirmed. جمعت الشركة فريقاً من 10 خبراء لتقييم النموذج عبر معايير واختبارات سير العمل والتكاملات.

قالت XBOW إن Mythos Preview "يمثّل قفزة كبيرة مقارنة بجميع النماذج الحالية، بغض النظر عن المزوّد". قام المختبرون بتشغيل النموذج على تطبيقات مفتوحة المصدر ثابتة تحتوي على ثغرات معروفة.

خفّض Mythos نسبة النتائج السلبية الكاذبة بنسبة 42% مقارنة بـ Opus 4.6، وارتفع الخفض إلى 55% بعد منح النموذج حق الوصول إلى الشيفرة المصدرية، كما reported موقع The Decoder. برع النموذج في الاختبارات التي تجمع بين التشغيل الحي والوصول إلى الشيفرة. لكنه كان أقل موثوقية عند الاكتفاء بالشيفرة المصدرية وحدها.

Also Read: XRP ETFs Hit Record $1.39B But Token Loses 4th Spot To BNB

تساؤلات التكلفة تحدّ من تفوّق Anthropic

أشارت Anthropic إلى أن Mythos Preview سيكون أعلى تكلفة بنحو 5 مرات من نموذج Opus، وهو أصلاً من أغلى الخيارات في السوق. هذه الزيادة دفعت XBOW لاختبار ما إذا كان بإمكان منافس أرخص مجاراة Mythos عبر منحه وقت تشغيل أكبر.

وكانت الإجابة نعم. ففي ميزانية رموز ثابتة لاكتشاف ثغرات الويب، تفوّق Mythos على Opus 4.6 لكنه خسر أمام نموذج OpenAI's GPT-5.5، الذي سجلته XBOW recorded بمعدل أخطاء فائتة يبلغ 10%. وأشارت XBOW إلى أن النموذج "ليس غير كفؤ إلى حد كبير" إذا كان الهدف هو الدقة، لكنه لا يُعتبر الأفضل في فئته عند إدخال عامل التكلفة في الحساب.

توصي الشركة الآن بتشغيل مزيج من النماذج بدلاً من الاعتماد على نموذج واحد.

أداء Mythos للذكاء الاصطناعي في السياق

أظهر Mythos حُكماً متبايناً؛ إذ كان أفضل من أسلافه في رفض الإيجابيات الكاذبة، لكنه أحياناً يستبعد حالات حقيقية عندما لا تلبّي الأدلة معاييره الشكلية. وكان الهندسة العكسية وتحليل الشيفرات الأصلية من بين أقوى مهاراته، مع قدرته على فرز النتائج القادمة من أنظمة منافسة.

كشفت Anthropic عن Mythos لأول مرة في أوائل أبريل، مع تقييد الوصول إلى نحو 50 شريكاً، وتقديم الإطلاق كخطوة نوعية في قدرات الذكاء الاصطناعي في الأمن السيبراني. وقال معهد أمن الذكاء الاصطناعي في المملكة المتحدة لاحقاً إن كلاً من Mythos وGPT-5.5 قد "تجاوزا بشكل كبير" توقعاته المتسارعة. وتقدّر الوكالة الآن أن القدرات السيبرانية تتضاعف كل 4.7 أشهر، انخفاضاً من تقدير سابق بلغ ثمانية أشهر وُضع في نوفمبر 2025.