Anthropic أطلقت Claude Opus 4.8 يوم الخميس، مقدِّمة النموذج المحدَّث على أنه أكثر صدقاً وأقل ميلاً لاختلاق الحقائق مقارنة بالإصدار السابق.
النقاط الرئيسية:
- أنثروبيك طرحت كلود أوبوس 4.8 يوم الخميس، ووصفت الصدق بأنه أبرز مكاسبه.
- تقول الشركة إن النموذج أقل عرضة بنحو أربع مرات لتمرير عيوب الشيفرة دون اكتشافها.
- يعمل وضع السرعة الآن أسرع بـ 2.5 مرة وتكلفته أقل بثلاث مرات من قبل.
أنثروبيك تسوّق لمصداقية أوبوس 4.8
الشركة كشفت عن النموذج يوم الخميس، وقدّمته كتطور تدريجي على أوبوس 4.7 وليس كإعادة ابتكار كاملة، مع ارتفاع معظم نتائج الاختبارات المعيارية بشكل طفيف فقط. في اختبار البرمجة SWE-Bench Pro، سجّل نتيجة 69.2%، ارتفاعاً من 64.3% للإصدار السابق، ومتقدماً على نموذج OpenAI المسمى GPT-5.5 الذي حقق 58.6%.
وقد تركز الاهتمام على الصدق. تقول أنثروبيك إن نماذج الذكاء الاصطناعي غالباً ما تقفز إلى استنتاجات وتدّعي تحقيق تقدم استناداً إلى أدلة ضعيفة، وإن المختبرين الأوائل وجدوا أن الإصدار 4.8 أسرع في الاعتراف بالشك أثناء المهام الطويلة غير الخاضعة للرقابة. وتشير اختبارات الشركة إلى أن النموذج أقل عرضة بنحو أربع مرات من 4.7 لتمرير عيوب الشيفرة دون التنبيه إليها، كما أظهرت.
الترقية طُرحت مع عناصر تحكم جديدة، من بينها إعداد يتيح للمستخدمين ضبط مدى الجهد الذي يبذله النموذج في تنفيذ المهمة، وهو متاح الآن في كل الخطط. كما خفّضت أنثروبيك سعر وضع السرعة، حيث يعمل النموذج بسرعة تبلغ 2.5 ضعف السرعة العادية، إلى ثلث تكلفة النماذج السابقة.
اطلع أيضاً على: Kalshi Wins CFTC Approval For First U.S. Bitcoin Perpetual Futures
بريتشارد يدعم قدرة أوبوس 4.8 على الحكم
قال توم بريتشارد، وهو مهندس برمجيات في Shopify، في تصريحات لأنثروبيك إن نسخة البرمجة من النموذج تُظهر قدرة أفضل كثيراً على الحكم. وأوضح أن النموذج "يطرح الأسئلة الصحيحة، ويكتشف أخطاءه بنفسه"، ويعارض الخطط عندما تبدو ضعيفة. بالنسبة للفرق التي عانت من وكلاء ذكاء اصطناعي قاموا بمسح قواعد بيانات إنتاجية حية، فإن هذا النوع من الوعود قد يكون له وزن حقيقي.
لكن لم يقتنع الجميع.
على موقع ريديت، شكك كثير من المستخدمين في الرسوم البيانية للاختبارات المعيارية، ووصف بعضهم المزاج العام بأنه غياب للثقة فيها، بينما خشي آخرون فقدان أوبوس 4.6 الأقدم الذي ما زالوا يفضلونه لأعمالهم اليومية.
أوبوس 4.8 يتوّج طفرة أنثروبيك
جاء الإطلاق في لحظة مهمة للمختبر. فقد ارتفعت قيمة أنثروبيك لتتجاوز تقريباً علامة 965 مليار دولار التي تقترب منها OpenAI، بعد جولة تمويل جديدة اعتُبرت من بين الأكبر في قطاع التكنولوجيا. ويتوقع كثير من المستثمرين على نطاق واسع أن تسعى الشركة إلى طرح عام لاحق هذا العام.
كما اختتم الإصدار سلسلة سريعة من الترقيات، إذ وصل أوبوس 4.7 إلى المستخدمين قبل شهر واحد فقط تقريباً وسط شكوك مماثلة بشأن الاختبارات المعيارية. ومنذ ذلك الحين، بدأت أنثروبيك تلمّح إلى Mythos، وهو نموذج أقوى بكثير تحتفظ به بعيداً عن الجمهور بسبب مخاوف تتعلق بالأمن السيبراني.
اقرأ أيضاً: Dogecoin Reserves Edge Up To 28B As Whale Support Stays Weak





