GPT-5.5 يضاهي Claude Mythos في هجوم إلكتروني من 32 خطوة، وفقاً لتقرير معهد أمن الذكاء الاصطناعي في المملكة المتحدة

أحدث نموذج من OpenAI، المسمى GPT-5.5، قادر ذاتياً على ربط سلسلة من 32 خطوة في corporate network breach وكسر لغز هندسة عكسية مدته 12 ساعة في نحو 10 دقائق.

نتائج تقييم معهد أمن الذكاء الاصطناعي AISI

نشر معهد أمن الذكاء الاصطناعي في المملكة المتحدة، وهو جهة بحثية ضمن وزارة العلوم والابتكار والتكنولوجيا البريطانية، published تقييمه يوم الخميس.

وجد الباحثون أن GPT-5.5 هو ثاني نموذج فقط ينجح بالكامل في حل "The Last Ones"، وهي محاكاة متعددة المراحل بُنيت بالتعاون مع SpecterOps. وقد completed السلسلة في محاولتين من أصل عشر محاولات.

كان أول نموذج اجتاز الاختبار هو Anthropic's Claude Mythos Preview، الذي حقق النجاح في ثلاث محاولات من أصل عشر. ويقدّر المعهد أن الخبير البشري سيحتاج إلى نحو 20 ساعة لإنهاء سلسلة الهجوم نفسها عبر أربع شبكات فرعية وحوالي 20 مضيفاً.

في المهام على مستوى الخبراء، scored GPT-5.5 معدل نجاح قدره 71.4%، متقدماً بفارق بسيط على Mythos Preview الذي حقق 68.6%، ومتجاوزاً بفارق كبير GPT-5.4 الذي سجل 52.4%.

أيضاً اقرأ: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning

مخاطر كسر الحواجز والاستجابة التنظيمية

أشار معهد أمن الذكاء الاصطناعي إلى وجود أسلوب كسر قيود شامل (جيلبريك) يتجاوز آليات الحماية في النموذج عبر كل استعلامات الهجوم الإلكتروني الخبيثة التي جرى اختبارها. استغرق تطوير هذا الاستغلال ست ساعات من جهود فرق الاختبار الهجومي المتخصصة، كما منعت مشكلة في الإعدادات من التحقق من إصلاح OpenAI للثغرة.

وحذّرت الوكالة من أن مهارات الهجوم السيبراني الهجومية باتت تظهر الآن كنتيجة جانبية للتحسن الأوسع في قدرات الاستدلال والاستقلالية.

في أبريل، أظهر تقييم المعهد لـ Mythos Preview marked the first time any frontier model finished the corporate attack بالكامل من البداية إلى النهاية، ما يجعل من أداء GPT-5.5 تأكيداً على وجود اتجاه متواصل بدلاً من قفزة منفردة.

اقرأ بعد ذلك: Crypto VC Funding Crashes To $659M In April, A 2-Year Low