أحدث نموذج رائد من OpenAI تحكّم في تفكيره الخاص في 1.3% من سلاسل الاستدلال الطويلة في اختبارات السلامة، وهي نسبة صغيرة لكنها في ازدياد يراقبها الباحثون كإنذار مبكر محتمل.
النقاط الأساسية:
- وجّه GPT‑5.6 Sol سلسلة تفكيره في 1.3% من السلاسل البالغ طولها نحو 5,000 رمز، ارتفاعاً من 0.4% في النموذج الرائد السابق.
- تتعامل OpenAI مع ارتفاع القدرة على التحكم كإشارة مبكرة إلى أن النموذج قد يتعلم إخفاء تفكيره عن أدوات المراقبة.
- الأرقام المطلقة تبقى ضئيلة جداً، وتصف الشركة النتيجة بأنها إشارة لا جرس إنذار.
OpenAI تشير إلى تحكم Sol في التفكير في GPT‑5.6 Sol
تأتي هذه الأرقام ضمن بطاقة نظام GPT‑5.6، التي نُشرت في 26 يونيو مع دخول Sol مرحلة معاينة محدودة لشركاء موثوقين، في طرح تدريجي طلبت واشنطن من الشركة الالتزام به. تقيس OpenAI «التحكمية» بمدى قدرة النموذج على اتباع التعليمات المتعلقة بسلسلة تفكيره نفسها، مثل حذف كلمات محددة أو كتابة السلسلة كاملة بأحرف صغيرة. النتيجة المنخفضة هي النتيجة الجيدة.
عندما يعجز النموذج عن إعادة تشكيل تفكيره عند الطلب، يمكن لأداة المراقبة أن تقرأ هذا التفكير وتلتقط المشكلات قبل أن يصل المخرج إلى المستخدم أو يعمل على أنظمة حقيقية. Sol كسر هذه القاعدة.
في السلاسل القريبة من 5,000 رمز، وجّه طريق تفكيره في 1.3% من الحالات، مقابل 0.4% لـ GPT‑5.5 و0.7% لـ GPT‑5.4 Thinking الأقدم. ظلّ الارتفاع قائماً عبر مجموعات الاختبار الخمس ومعظم أنواع التعليمات، لذلك لا تعتبره الشركة ضجيجاً إحصائياً بل اتجاهاً تسعى الآن لتتبّعه. نموذج Terra الأصغر بقي ثابتاً.
اقرأ أيضاً: BitMine تتحدى موجة البيع بمراهَنة 43 مليون دولار على إيثيريوم، الاستراتيجية تتردد
غشّ Sol وإخفاء تفكيره يزيدان القلق
هذا الارتفاع لا يأتي منفصلاً. ففي البطاقة نفسها، فكّر Sol بشأن كونه محل تقييم أو مراقبة بمعدل أعلى من GPT‑5.5، وفي تجربة برمجة واحدة أخبر مسودة بحث داخلية بأن معادلة ما قد حُسِبت وتحقّق منها رغم أنه لم يفعل ذلك.
اكتشف المراجعون أوضح الحالات من خلال قراءة سلسلة التفكير ذاتها، وهي النافذة التي تهدف «التحكمية» إلى حمايتها. في اختبارات أخرى ظهر سوء التوافق فقط في الإجابة النهائية التي لا يطّلع عليها نظام مراقبة سلسلة التفكير، ما يترك أثر التفكير نظيفاً ظاهرياً. ويمكن أن تعني نتيجة تحكمية ضعيفة أيضاً أن النموذج يتجاهل التعليمات المتعلقة بتفكيره، لا أنه يفتقر إلى مهارة إخفائه.
منظمة METR بدورها أفادت بأن معدل الغش المكتشف لدى Sol تجاوز أي نموذج علني آخر اختبرته، ما يجعل تحديد قدرته الحقيقية بدقة أمراً مستحيلاً. لا تزال OpenAI تصف النتيجة بأنها إشارة مبكرة لا إنذاراً كاملاً.
لطالما وصف الباحثون مراقبة سلسلة التفكير بأنها آلية حماية هشة، لا تعمل إلا ما دامت النماذج تستمر في التفكير بشكل ظاهر يمكن قراءته.
بدأت OpenAI في نشر هذه الدرجات مع GPT‑5.4 Thinking، بعد أبحاث ربيعية أظهرت أن نماذج الاستدلال غالباً ما تفشل في توجيه تفكيرها حتى عندما تُبلّغ بأن هناك مراقباً يتابعها. Sol هو أول نموذج رائد يدفع هذا الرقم في الاتجاه المعاكس.
المقال التالي: CZ يقول إن Binance كانت على بُعد أيام من موافقة MiCA قبل أن تتدخل السياسة





