نموذج Mythos من Anthropic للذكاء الاصطناعي يتفوّق على الأنظمة المنافسة في اكتشاف ثغرات البرمجيات، لكن اختبارات مستقلة جديدة تكشف عن حُكم أقل قوة وتكاليف تشغيل مرتفعة.
نسخة Mythos Preview تتصدّر تدقيق الشيفرة المصدرية
شركة الأمن الهجومي XBOW أكّدت الادعاء الرئيسي. جمعت الشركة فريقاً من 10 خبراء لتقييم النموذج عبر اختبارات معيارية وسير عمل وعمليات تكامل.
قالت XBOW إن Mythos Preview "يمثل قفزة كبيرة مقارنة بجميع النماذج الحالية، بغض النظر عن المزوّد". اختبر الفريق النموذج على تطبيقات مفتوحة المصدر مجمَّدة تحتوي على ثغرات معروفة.
خفّض Mythos معدل السلبيات الكاذبة بنسبة 42% مقارنةً بـ Opus 4.6، ووصل الخفض إلى 55% عند منح النموذج إمكانية الوصول إلى الشيفرة المصدرية، كما أفاد موقع The Decoder. تميّز النموذج في اختبارات الجمع بين التنفيذ الحي والشيفرة المصدرية، لكنه كان أقل موثوقية عند الاعتماد على الشيفرة وحدها.
أيضاً اقرأ: XRP ETFs Hit Record $1.39B But Token Loses 4th Spot To BNB
تكلفة التشغيل تحدّ من أفضلية Anthropic
أشارت Anthropic إلى أن نسخة Mythos Preview ستكون أغلى بنحو خمس مرات من نموذج Opus، وهو بالفعل من بين الخيارات الأعلى سعراً في السوق. هذه الزيادة دفعت XBOW لاختبار ما إذا كان بإمكان منافس أرخص مجاراة Mythos إذا مُنح وقت تشغيل أطول.
كانت الإجابة نعم. في ميزانية رموز ثابتة لاكتشاف ثغرات الويب، تفوّق Mythos على Opus 4.6 لكنه خسر أمام GPT-5.5 من OpenAI، الذي سجّلته XBOW بمعدل أخطاء يبلغ 10%. أشارت XBOW إلى أن النموذج "ليس غير فعّال بشدة" إذا كانت الدقة هي الهدف، لكنه لا يُعتبر الأفضل عندما تُؤخذ التكلفة في الحسبان.
توصي الشركة الآن بتشغيل مزيج من النماذج بدلاً من الاعتماد على نموذج واحد.
أداء Mythos AI في السياق
أظهر Mythos حكماً متبايناً؛ إذ كان أفضل من النماذج السابقة في رفض الإيجابيات الكاذبة، لكنه أحياناً يرفض نتائج صحيحة عندما لا تستوفي الأدلة معاييره الشكلية. برز في الهندسة العكسية وتحليل الشيفرة الأصلية بين أقوى مهاراته، مع قدرته على فرز النتائج الصادرة عن الأنظمة المنافسة.
كشفت Anthropic عن Mythos لأول مرة في أوائل أبريل، مع تقييد الوصول إلى نحو 50 شريكاً وطرح الإصدار كخطوة نوعية في قدرات الذكاء الاصطناعي في مجال الأمن السيبراني. لاحقاً قالت معهد أمن الذكاء الاصطناعي في المملكة المتحدة إن كلّاً من Mythos وGPT-5.5 قد "تجاوزا بشكل كبير" توقعاته المسرّعة. وتقدّر الوكالة الآن أن القدرات السيبرانية تتضاعف كل 4.7 أشهر، انخفاضاً من تقدير سابق بلغ ثمانية أشهر وُضع في نوفمبر 2025.
اقرأ التالي: Hyperliquid Rejects Wall Street's Manipulation Claims As HYPE Drops 14%





