أحدث نموذج من OpenAI، وهو GPT-5.5، يمكنه بشكل مستقل ربط سلسلة من 32 خطوة لاختراق شبكة شركة واختراق لغز عكسي للهندسة يستغرق 12 ساعة في نحو 10 دقائق فقط.
نتائج تقييم الأمن السيبراني من AISI
نشر معهد أمن الذكاء الاصطناعي في المملكة المتحدة، وهو هيئة بحثية ضمن وزارة العلوم والابتكار والتكنولوجيا البريطانية، تقييمه يوم الخميس.
وجد الباحثون أن GPT-5.5 هو ثاني نموذج فقط ينجح بالكامل في حل "The Last Ones"، وهي محاكاة متعددة المراحل بُنيت بالتعاون مع شركة SpecterOps. وقد أكمل سلسلة الهجوم في محاولتين من أصل عشر محاولات.
كان أول نموذج يجتاز الاختبار هو النموذج التجريبي Claude Mythos من Anthropic، والذي نجح في ثلاث محاولات من أصل عشر. ويقدّر معهد AISI أن خبيراً بشرياً سيحتاج إلى نحو 20 ساعة لإكمال سلسلة القتل نفسها عبر أربعة شبكات فرعية وحوالي 20 جهازاً مضيفاً.
في المهام من مستوى الخبراء، سجّل GPT-5.5 نسبة نجاح بلغت 71.4%، متقدماً بفارق بسيط على نموذج Mythos Preview الذي حقق 68.6% ومتجاوزاً بفارق واضح GPT-5.4 الذي سجّل 52.4%.
اقرأ أيضاً: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning
مخاطر كسر القيود (Jailbreak) والاستجابة التنظيمية
أشار معهد AISI إلى وجود عملية كسر قيود عامة (universal jailbreak) تجاوزت آليات الحماية في النموذج في كل استعلامات الاختراق الخبيثة التي جرى اختبارها. وقد استغرق تطوير هذه الثغرة ست ساعات من عمل فرق الهجوم الأحمر المتخصصة، كما أن مشكلة في الإعدادات منعت التحقق من إصلاح OpenAI للثغرة.
وحذرت الوكالة من أن مهارات الهجوم السيبراني الهجومية تبدو الآن وكأنها تظهر كنتيجة جانبية للتحسن الأوسع في قدرات الاستدلال والاستقلالية لدى النماذج.
في أبريل، أظهر تقييم AISI لـ Mythos Preview أنه أول نموذج متقدم يكمل هجوم الشركة من البداية إلى النهاية، ما يجعل أداء GPT-5.5 تأكيداً لاتجاه متصاعد أكثر من كونه قفزة مفاجئة منفردة.
اقرأ التالي: Crypto VC Funding Crashes To $659M In April, A 2-Year Low





