Claude Mythos Vs. GPT-5.5: Gated Anthropic Model 9 Testin 6'sını Kazanıyor

Claude Mythos Vs. GPT-5.5: Gated Anthropic Model 9 Testin 6'sını Kazanıyor

OpenAI released GPT-5.5 Çarşamba günü yayımlandı, ancak yeni kıyaslama verileri Anthropic'in kapılı Claude Mythos Preview modelinin hâlâ dokuz doğrudan karşılaştırılabilir testin altısında önde olduğunu gösteriyor.

GPT-5.5 Kıyaslama Puanları

GPT-5.5, ChatGPT ve Codex içinde 23 Nisan’da piyasaya arrived ve milyon giriş token’ı başına 5 dolar, çıkış için 30 dolar fiyatlandırıldı; bu, selefinin ücretinin iki katı.

Model, Terminal-Bench 2.0’da scored %82,7 puan alarak, açıkça kazandığı tek kıyaslamada Mythos’un 0,7 puan önüne geçti.

Mythos, which Anthropic withheld from public release over cybersecurity concerns, siber güvenlik endişeleri nedeniyle Anthropic tarafından kamuya açılmadı ve SWE-bench Pro’da %58,6’ya karşı %77,8 ile önde.

Ayrıca, GPT-5.5’i Humanity's Last Exam testinde araçsız senaryoda tops ederek %41,4’e karşı %56,8 puan alıyor. Kapılı model, CyberGym, OSWorld-Verified ve uzun bağlamlı GraphWalks görevlerinde de önde.

Ayrıca Oku: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

Analist Uyarıları Önemli

Karşılaştırma tam olarak net değil, çünkü hiçbir laboratuvar modelleri doğrudan birbirlerine karşı kıyaslamadı. OpenAI, kamuya açık karşılaştırma olarak chose Claude Opus 4.7’yi seçerken, Anthropic’in 245 sayfalık sistem kartı Mythos’u GPT-5.4’e karşı çalıştırdı.

Test çerçeveleri de farklılaşıyor. OpenAI, Terminal-Bench üzerinde bir Codex CLI kurulumu kullanırken, Anthropic’in Terminus-2 çatısı Mythos’u Terminal-Bench 2.1 zamanlama kuralları altında %92,1’e kadar çıkardı.

Anthropic’in 7 Nisan’da duyurulan Mythos’u kapılı tutma kararı, reportedly Avrupa Komisyonu ile toplantıları ve İngiltere Merkez Bankası başkanından modelin siber riskleri açığa çıkarabileceğine dair bir uyarıyı tetikledi.

Sıradaki Haber: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Feragatname ve Risk Uyarısı: Bu makalede sağlanan bilgiler yalnızca eğitici ve bilgilendirici amaçlıdır ve yazarın görüşüne dayanmaktadır. Mali, yatırım, hukuki veya vergi tavsiyesi teşkil etmez. Kripto para varlıkları son derece değişkendir ve yatırımınızın tamamını veya önemli bir kısmını kaybetme riski dahil olmak üzere yüksek riske tabidir. Kripto varlık ticareti veya tutma tüm yatırımcılar için uygun olmayabilir. Bu makalede ifade edilen görüşler yalnızca yazara aittir ve Yellow, kurucuları veya yöneticilerinin resmi politikasını veya pozisyonunu temsil etmez. Her zaman kendi kapsamlı araştırmanızı yapın (D.Y.O.R.) ve herhangi bir yatırım kararı vermeden önce lisanslı bir finansal uzmanla görüşün.
Claude Mythos Vs. GPT-5.5: Gated Anthropic Model 9 Testin 6'sını Kazanıyor | Yellow.com