OpenAI released GPT-5.5 Çarşamba günü yayımlandı, ancak yeni kıyaslama verileri Anthropic'in kapılı Claude Mythos Preview modelinin hâlâ dokuz doğrudan karşılaştırılabilir testin altısında önde olduğunu gösteriyor.
GPT-5.5 Kıyaslama Puanları
GPT-5.5, ChatGPT ve Codex içinde 23 Nisan’da piyasaya arrived ve milyon giriş token’ı başına 5 dolar, çıkış için 30 dolar fiyatlandırıldı; bu, selefinin ücretinin iki katı.
Model, Terminal-Bench 2.0’da scored %82,7 puan alarak, açıkça kazandığı tek kıyaslamada Mythos’un 0,7 puan önüne geçti.
Mythos, which Anthropic withheld from public release over cybersecurity concerns, siber güvenlik endişeleri nedeniyle Anthropic tarafından kamuya açılmadı ve SWE-bench Pro’da %58,6’ya karşı %77,8 ile önde.
Ayrıca, GPT-5.5’i Humanity's Last Exam testinde araçsız senaryoda tops ederek %41,4’e karşı %56,8 puan alıyor. Kapılı model, CyberGym, OSWorld-Verified ve uzun bağlamlı GraphWalks görevlerinde de önde.
Ayrıca Oku: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report
Analist Uyarıları Önemli
Karşılaştırma tam olarak net değil, çünkü hiçbir laboratuvar modelleri doğrudan birbirlerine karşı kıyaslamadı. OpenAI, kamuya açık karşılaştırma olarak chose Claude Opus 4.7’yi seçerken, Anthropic’in 245 sayfalık sistem kartı Mythos’u GPT-5.4’e karşı çalıştırdı.
Test çerçeveleri de farklılaşıyor. OpenAI, Terminal-Bench üzerinde bir Codex CLI kurulumu kullanırken, Anthropic’in Terminus-2 çatısı Mythos’u Terminal-Bench 2.1 zamanlama kuralları altında %92,1’e kadar çıkardı.
Anthropic’in 7 Nisan’da duyurulan Mythos’u kapılı tutma kararı, reportedly Avrupa Komisyonu ile toplantıları ve İngiltere Merkez Bankası başkanından modelin siber riskleri açığa çıkarabileceğine dair bir uyarıyı tetikledi.
Sıradaki Haber: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move






