الأخبار تعلم بحث الترتيب النظام البيئي

المنصة متاحة الآن

yellow bottom left star road

ابدأ الآن

نموذج كلاود ميثوس مقابل GPT-5.5: النموذج المحجوب من أنثروبيك يفوز في 6 من أصل 9 اختبارات

Alexey BondarevApr, 24 2026 5:36

#الذكاء الاصطناعي #أوبن أي آي #شات جي بي تي #Anthropic #أسطورة كلود

نموذج كلاود ميثوس مقابل GPT-5.5: النموذج المحجوب من أنثروبيك يفوز في 6 من أصل 9 اختبارات

OpenAI released GPT-5.5 يوم الأربعاء، لكن بيانات قياس جديدة تُظهر أن Anthropic's gated Claude Mythos Preview لا يزال متقدماً في ستة من أصل تسعة اختبارات قابلة للمقارنة بشكل مباشر.

نتائج اختبارات GPT-5.5

GPT-5.5 arrived في ChatGPT وCodex في 23 أبريل، بسعر 5 دولارات لكل مليون رمز إدخال و30 دولاراً للإخراج، أي ضعف سعر سابقه.

النموذج scored نسبة 82.7% في Terminal-Bench 2.0، متقدماً على Mythos بفارق 0.7 نقطة في معيار الاختبار الوحيد الذي يفوز فيه بوضوح.

Mythos, which Anthropic withheld from public release over cybersecurity concerns، يتصدر اختبار SWE-bench Pro بنسبة 77.8% مقابل 58.6%.

كما أنه tops GPT-5.5 في اختبار Humanity's Last Exam بدون أدوات، محققاً 56.8% مقابل 41.4%. النموذج المحجوب يتقدم أيضاً في اختبارات CyberGym وOSWorld-Verified ومهام GraphWalks طويلة السياق.

Also Read: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

تحفّظات المحللين مهمة

لا يزال القياس غير دقيق لأن أياً من المختبرين لم يختبر النماذج مباشرة ضد بعضها البعض. OpenAI chose Claude Opus 4.7 كنموذج مقارن معلن، بينما قدّم الكتيب التقني المكوَّن من 245 صفحة من Anthropic مقارنة Mythos مع GPT-5.4.

كما تختلف أطر الاختبار. استخدمت OpenAI إعداد واجهة سطر أوامر Codex على Terminal-Bench، بينما استخدم هيكل Terminus-2 لدى Anthropic لدفع Mythos إلى نسبة 92.1% وفق قواعد التوقيت الخاصة بـ Terminal-Bench 2.1.

قرار Anthropic بحجب Mythos، الذي أُعلن في 7 أبريل، أدى وفقاً للتقارير إلى اجتماعات مع المفوضية الأوروبية وتحذير من محافظ بنك إنجلترا من أن النموذج قد يفتح باباً واسعاً لمخاطر الأمن السيبراني.

Read Next: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

إخلاء المسؤولية وتحذير المخاطر: المعلومات المقدمة في هذا المقال مخصصة للأغراض التعليمية والإعلامية فقط وتستند إلى رأي المؤلف. وهي لا تشكل مشورة مالية أو استثمارية أو قانونية أو ضريبية. أصول العملات المشفرة شديدة التقلب وتخضع لمخاطر عالية، بما في ذلك خطر فقدان كامل أو جزء كبير من استثمارك. قد لا يكون تداول أو حيازة الأصول المشفرة مناسباً لجميع المستثمرين. الآراء المعبر عنها في هذا المقال هي آراء المؤلف (المؤلفين) فقط ولا تمثل السياسة أو الموقف الرسمي لشركة Yellow أو مؤسسيها أو مديريها التنفيذيين. قم دائماً بإجراء بحثك الشامل بنفسك (D.Y.O.R.) واستشر مختصاً مالياً مرخصاً قبل اتخاذ أي قرار استثماري.

آخر الأخبار

عرض جميع الأخبار

غوغل تحذر من أن قواعد الذكاء الاصطناعي الأوروبية قد تكشف بيانات حساسة على أندرويد

منذ 6 دقيقة

بروكسل تضغط لفتح أندرويد وiOS أمام مساعدين منافسين، فيما تحذر غوغل وآبل من مخاطر على خصوصية المستخدمين وأمن البيانات.

مدقّقو XRPL يرفضون خفضاً جديداً للاحتياطي مع تصاعد الجدل حول أمن الشبكة

منذ ساعة واحدة

خلاف داخل مجتمع XRP حول خفض احتياطي الحسابات بين دعم خفض حواجز الدخول والتحذير من إضعاف الحماية أمام الرسائل المزعجة وإساءة استخدام الموارد.

تذبذب مؤشر داو جونز يختبر رواية انفصال بيتكوين عن الأسهم التقليدية

منذ 6 ساعة

تراجع أسهم الذكاء الاصطناعي وارتفاع النفط يضغطان على داو جونز، بينما تحافظ صناديق بيتكوين الفورية على تدفقات قوية كأصل تحوطي محتمل.

أخبار ذات صلة

أوبنAI تطلق GPT-5.5 متفوِّقاً على Opus 4.7 في مهام الوكلاء و14 معياراً

أوبنAI تطلق GPT-5.5 بقدرات وكيلة متقدمة ونتائج قياسية على 14 معياراً، متفوِّقاً على Claude Opus 4.7 خاصة في اختبارات Terminal-Bench وFrontierMath.

GPT-5.6 سول في مواجهة كلود فابل 5: معايير البرمجة تُظهر سباقاً منقسماً

مقارنة بين GPT-5.6 سول وكلود فابل 5 في كفاءة البرمجة، الأسعار، وتوفر الوصول، مع تفوق متفاوت على معايير Terminal-Bench وSWE-Bench Pro.

GPT-5.5 يضاهي Claude Mythos في هجوم إلكتروني من 32 خطوة، وفقاً لتقرير معهد أمن الذكاء الاصطناعي في المملكة المتحدة

GPT-5.5 ينجح ذاتياً في محاكاة اختراق شركات من 32 خطوة ويتفوّق على Claude Mythos في بعض اختبارات الأمن السيبراني، ما يثير مخاوف جديدة.

تفوق Fable 5 على GPT 5.5 قبل أن يأمره قرار أمريكي بالتوقف عن العمل

تفوق Fable 5 مؤقتًا على GPT 5.5 قبل أن توقفه أوامر أمريكية، مما جعل GPT 5.5 الأقوى المتاح بحكم غياب منافسه، ويبرز أثر التنظيم على سباق النماذج.

تفوّق نموذج كلود Mythos للذكاء الاصطناعي في تدقيق الشيفرة على المنافسين، ويتراجع بسبب سعر أعلى بنحو 5 مرات

اختبارات XBOW تظهر تفوّق Mythos في اكتشاف ثغرات الشيفرة وتقليل الأخطاء، لكن تكلفة تشغيله الأعلى بنحو 5 مرات تحد من ميزته أمام المنافسين.

مقالات البحث ذات الصلة

كيف يمكن لClaude Mythos أن يعيد تشكيل قطاعي المال والعملات المشفّرة

Claude Mythos نموذج متقدم لاكتشاف الثغرات، متاح عبر مشروع Glasswing لشركاء محددين، ما يغيّر مشهد الأمن السيبراني ويقلق البنوك والكريبتو.

42 ولاية تحقق بالفعل مع شركة OpenAI بينما تترقب وول ستريت طرحها العام الأولي

42 ولاية أمريكية تحقق مع OpenAI بعد طلب طرح عام أولي بقيمة 852 مليار دولار، ما يهدد بتأخير الإدراج ويعيد تشكيل تنظيم شركات الذكاء الاصطناعي.

أسطورة كلود والعملات المشفّرة: ما الذي يعنيه التهديد الجديد للذكاء الاصطناعي لتداول الأصول الرقمية

كشف Claude Mythos آلاف ثغرات اليوم الصفري، مهدداً صناعة الكريبتو التي خسرت 3.3 مليار دولار في 2025، ودافعاً البورصات الكبرى للاستثمار بأمن سيبراني مدعوم بالذكاء الاصطناعي.

انتعاش عملات الذكاء الاصطناعي: هل يمكن لارتفاع بيتينسور بنسبة 117% أن يقود عودة القطاع؟

انتعاش قوي لبيتنسور يقود موجة لعملات الذكاء الاصطناعي، وسط تعافٍ جزئي بعد هبوط 2025 واستمرار الجدل حول جدوى أطروحة الاستثمار.

هل تُعدّ رموز الذكاء الاصطناعي اتجاه الكريبتو الكبير التالي بعد الميم كوينز؟

رموز الذكاء الاصطناعي تقترب من الميم كوينز بعد انهيار الأخيرة، مدعومة ببنية تحتية حاسوبية حقيقية واهتمام مؤسسي، رغم انهيار رموز الوكلاء.

مقالات التعلم ذات الصلة

شبكة ألّورا تشرح كيف تكتسب نماذج الذكاء الاصطناعي الثقة على السلسلة

توضح المقالة كيف تستخدم شبكات الاستدلال اللامركزي عدة نماذج متنافسة من أجل تنبؤات أكثر دقة وموثوقية لتطبيقات التشفير وDeFi على السلسلة.

هل يمكن للذكاء الاصطناعي اللامركزي الحفاظ على سرية مُدخلاتك؟

تستكشف المقالة كيف تتيح شبكات الذكاء الاصطناعي اللامركزية مثل Venice تشغيل النماذج مع حماية سرية المُدخلات، ودور الرموز والشبكات في ذلك.

أسواق بيانات الذكاء الاصطناعي اللامركزية تنطلق الآن، إليك ما تحتاج إلى معرفته

تشرح المقالة كيف تمكّن أسواق بيانات الذكاء الاصطناعي اللامركزية المستخدمين من كسب عملات مشفّرة مقابل بياناتهم مع الحفاظ على الخصوصية عبر التحقق والتخزين اللامركزي.

لماذا لا يمكن لوكلاء الذكاء الاصطناعي التوسع دون طبقة بلوكتشين خاصة بهم

يشرح النص لماذا لا تناسب المحافظ التقليدية وكلاء الذكاء الاصطناعي، وكيف تبني شبكات مثل NEAR وBittensor بنية تحتية خاصة لحل مشكلات الهوية والغاز والتنفيذ.

لماذا تعالج MegaETH الكتل أسرع من معظم التطبيقات عند التحديث

نظرة على MegaETH كحل طبقة ثانية لإيثريوم يستهدف تنفيذًا فوريًا بزمن كتل ميلي ثانية واحدة وسعة 100 ألف معاملة في الثانية وتداعياته على التطبيقات.

نموذج كلاود ميثوس مقابل GPT-5.5: النموذج المحجوب من أنثروبيك يفوز في 6 من أصل 9 اختبارات | Yellow