اقتراب إطلاق Claude Opus 4.7 لكن أقوى نماذج أنثروبيك للذكاء الاصطناعي لا تزال خارج المتناول

أنثروبيك تستعد لإطلاق Claude Opus 4.7 وأداة تصميم مدعومة بالذكاء الاصطناعي لبناء مواقع الويب والعروض التقديمية، في خطوة هزّت أسهم Adobe وWix وFigma يوم الاثنين.

تفاصيل إطلاق Opus 4.7

ذكرت The Information reported في 14 أبريل أن المنتجين قد يطرحان في أقرب وقت هذا الأسبوع، مستندةً إلى شخص مطلع على الخطط. تقبل أداة التصميم التعليمات النصية باللغة الإنجليزية البسيطة وتستهدف المطورين وغير المتخصصين التقنيين على حد سواء.

هذا puts شركة أنثروبيك في منافسة مباشرة مع شركات ناشئة مثل Gamma وStitch من غوغل.

ولا يعد Opus 4.7 حتى النموذج الأكثر تقدماً لدى أنثروبيك.

هذا اللقب يذهب إلى Claude Mythos، نظام يركز على الأمن السيبراني توزّعه الشركة فقط على شركات أمنية مختارة عبر Project Glasswing مع إبقائه بعيداً عن متناول الجمهور العام.

Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked

أزمة معايير تقييم الذكاء الاصطناعي وMythos

أعلنت OpenAI مؤخراً أن معيار SWE-bench Verified، أبرز معيار لاختبار قدرات البرمجة، أصبح "ملوثاً" بعد اكتشاف أن النماذج المتقدمة حفظت حلول اختباراته خلال مرحلة التدريب. ومع ذلك، ما تزال المختبرات تستشهد بهذه الاختبارات نفسها عند مقارنة النماذج.

أبرز تقييم منفصل ARC-AGI-3 الفجوة بين أنظمة الذكاء الاصطناعي والتفكير البشري؛ إذ حقق Gemini نسبة 0.37% وGPT-5.4 نسبة 0.26%، بينما وصل أداء البشر إلى 100%. ومن دون بطاقة نموذج تفصيلية من أنثروبيك، يبقى من الصعب التحقق بشكل مستقل من الادعاءات المتعلقة بتحسينات Opus 4.7.

قيّم معهد أمن الذكاء الاصطناعي في المملكة المتحدة مؤخراً evaluated Mythos Preview ووجد أنه قادر على تنفيذ هجمات سيبرانية معقدة بشكل ذاتي بمعدلات لم يصل إليها أي نموذج آخر. وقد أصبح أول نموذج ذكاء اصطناعي ينجز "The Last Ones"، وهي محاكاة لهجوم من 32 خطوة على شبكة شركة، تستغرق عادة 20 ساعة من فرق الاختبار البشرية.