Haberler Öğren Araştırma Sıralama Ekosistem

yellow bottom left star road

Claude Mythos Vs. GPT-5.5: Gated Anthropic Model 9 Testin 6'sını Kazanıyor

Alexey BondarevApr, 24 2026 5:36

#Yapay Zeka #OpenAI #ChatGPT #Anthropic #Claude Mythos

Claude Mythos Vs. GPT-5.5: Gated Anthropic Model 9 Testin 6'sını Kazanıyor

OpenAI released GPT-5.5 Çarşamba günü yayımlandı, ancak yeni kıyaslama verileri Anthropic'in kapılı Claude Mythos Preview modelinin hâlâ dokuz doğrudan karşılaştırılabilir testin altısında önde olduğunu gösteriyor.

GPT-5.5 Kıyaslama Puanları

GPT-5.5, ChatGPT ve Codex içinde 23 Nisan’da piyasaya arrived ve milyon giriş token’ı başına 5 dolar, çıkış için 30 dolar fiyatlandırıldı; bu, selefinin ücretinin iki katı.

Model, Terminal-Bench 2.0’da scored %82,7 puan alarak, açıkça kazandığı tek kıyaslamada Mythos’un 0,7 puan önüne geçti.

Mythos, which Anthropic withheld from public release over cybersecurity concerns, siber güvenlik endişeleri nedeniyle Anthropic tarafından kamuya açılmadı ve SWE-bench Pro’da %58,6’ya karşı %77,8 ile önde.

Ayrıca, GPT-5.5’i Humanity's Last Exam testinde araçsız senaryoda tops ederek %41,4’e karşı %56,8 puan alıyor. Kapılı model, CyberGym, OSWorld-Verified ve uzun bağlamlı GraphWalks görevlerinde de önde.

Ayrıca Oku: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

Analist Uyarıları Önemli

Karşılaştırma tam olarak net değil, çünkü hiçbir laboratuvar modelleri doğrudan birbirlerine karşı kıyaslamadı. OpenAI, kamuya açık karşılaştırma olarak chose Claude Opus 4.7’yi seçerken, Anthropic’in 245 sayfalık sistem kartı Mythos’u GPT-5.4’e karşı çalıştırdı.

Test çerçeveleri de farklılaşıyor. OpenAI, Terminal-Bench üzerinde bir Codex CLI kurulumu kullanırken, Anthropic’in Terminus-2 çatısı Mythos’u Terminal-Bench 2.1 zamanlama kuralları altında %92,1’e kadar çıkardı.

Anthropic’in 7 Nisan’da duyurulan Mythos’u kapılı tutma kararı, reportedly Avrupa Komisyonu ile toplantıları ve İngiltere Merkez Bankası başkanından modelin siber riskleri açığa çıkarabileceğine dair bir uyarıyı tetikledi.

Sıradaki Haber: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Feragatname ve Risk Uyarısı: Bu makalede sağlanan bilgiler yalnızca eğitici ve bilgilendirici amaçlıdır ve yazarın görüşüne dayanmaktadır. Mali, yatırım, hukuki veya vergi tavsiyesi teşkil etmez. Kripto para varlıkları son derece değişkendir ve yatırımınızın tamamını veya önemli bir kısmını kaybetme riski dahil olmak üzere yüksek riske tabidir. Kripto varlık ticareti veya tutma tüm yatırımcılar için uygun olmayabilir. Bu makalede ifade edilen görüşler yalnızca yazara aittir ve Yellow, kurucuları veya yöneticilerinin resmi politikasını veya pozisyonunu temsil etmez. Her zaman kendi kapsamlı araştırmanızı yapın (D.Y.O.R.) ve herhangi bir yatırım kararı vermeden önce lisanslı bir finansal uzmanla görüşün.

İlgili Haberler

OpenAI GPT-5.5'i Yayınladı, Ajan Görevlerinde ve 14 Kıyaslamada Opus 4.7'yi Geride Bıraktı

OpenAI, ajan görevleri için geliştirilmiş GPT-5.5'i yayımladı; model çok adımlı çalışma, araç kullanımı ve öz-denetimde Opus 4.7'nin önüne geçiyor.

GPT-5.5, 32 Adımlı Siber Saldırıda Claude Mythos ile Aynı Seviyeye Geldi, İngiltere AISI Raporladı

GPT-5.5, 32 adımlı kurumsal siber saldırı simülasyonunu ve 12 saatlik tersine mühendislik bulmacasını hızla çözüp Claude Mythos’la aynı seviyeye geldi.

ABD Emri Fable 5'i Çevrimdışı Etmeden Önce Fable 5, GPT 5.5'i Geçti

ABD emri öncesi kıyaslamalarda Fable 5, GPT 5.5'i geçti; şimdi GPT 5.5 en güçlü model. Düzenleme, teknik üstünlüğü hızla gölgede bıraktı.

Claude Opus 4.8 Zeka Endeksinde Zirvede, Ancak Mythos Saldırı Güvenliğinde Öne Çıkıyor

Anthropic'in Opus 4.8 modeli zeka endeksinde öne geçse de, Mythos kod istismarı ve siber görevlerde çok daha üstün kalıyor; bu yüzden sıkı biçimde kısıtlı.

Claude Fable 5, Opus'un İki Katına Mal Oluyor Ama 22 Haziran'a Kadar Ücretsiz Kalıyor

Claude Fable 5, milyon token başına 10 dolara çıkan fiyatıyla Opus 4.8'in iki katı, ancak Pro, Max ve Team planlarında 22 Haziran'a kadar ücretsiz.

İlgili Araştırma Makaleleri

Claude Mythos Finans ve Kripto Endüstrisini Nasıl Yeniden Şekillendirebilir

Claude Mythos, kapalı erişimli saldırı odaklı bir siber yapay zeka modeli olarak, bankalar ve kripto piyasaları için risk ve güvenlik dengesini değiştiriyor.

Claude Mythos ve Kripto: Yeni Yapay Zeka Tehdidi İşlem İçin Ne Anlama Geliyor?

Claude Mythos binlerce sıfırıncı gün açığı buldu; 3,3 milyar dolarlık 2025 kripto hack’lerini ağırlaştırabilir, küçük DeFi’ler geride kalabilir.

42 Eyalet OpenAI'yi Zaten Soruştururken Wall Street Halka Arzı İzliyor

42 eyalet OpenAI’yi IPO öncesi tüketici koruma ve güvenlik çerçevesinde inceliyor; kâr amacı gütmeyen yapıdan dönüşüm ve veri kullanımı en kritik başlıklar.

Memecoin’lerden Sonra Bir Sonraki Büyük Kripto Trendi Yapay Zekâ Token’leri mi?

Yapay zekâ token’leri hızla büyüyüp memecoin’lere yaklaştı; ancak özellikle AI ajan token’lerinde sert düşüşler, yeni bir balon riski tartışmasını tetikledi.

2025'te GPT İşlem Botları ile AI Kripto Para İşlemleri: Tam Kılavuz

AI kripto ticaretinde devrim yaratan GPT sistemleri günlük işlem hacminin %40'ını yönetiyor, elit fonlara benzer stratejiler sunuyor.

İlgili Öğrenme Makaleleri

Yapay Zekâ Veri Pazar Yerleri Yayına Giriyor, Bilmeniz Gerekenler

Merkeziyetsiz yapay zekâ veri pazar yerleri, kişisel verileri kripto ile geliştiricilere satarak aracı kârını azaltıp katkı sağlayanı öne çıkarıyor.

Hiçbir Şirketin Kontrol Etmediği 2,6 Milyar Dolarlık Bir Yapay Zekâ Pazaryerini Bittensor Çalıştırıyor

Bittensor, TAO ile ödüllendirilen, alt ağlara bölünmüş merkeziyetsiz bir yapay zekâ pazarıdır; modeller rekabet eder, doğrulayıcılar kaliteyi skorlar.

Yapay Zekâ Aracıları Neden Kendi Blockchain Katmanları Olmadan Ölçeklenemez

YZ aracıları insan odaklı cüzdanlarla çalışamaz; kimlik, gas ve imza katmanında yeni zincir içi altyapı gerekir, odak tokenlerde değil altyapıda.

AI Araçlarını Kripto Yatırım Araştırmaları İçin Kullanma: 2025 Tam Kılavuzu

ChatGPT, Claude ve özel araçlarla AI destekli kripto araştırmalarında ustalaşın. 2025 için gelişmiş stratejiler, risk yönetimi ...

Merkeziyetsiz Yapay Zekâ İstemlerinizi Gizli Tutabilir mi?

Merkeziyetsiz, gizlilik odaklı yapay zekâ ağları, istemleri düğümler arasında şifreli/parçalı işleyerek gizli tutuyor; VVV token da bu ağı teşvik ediyor.

Claude Mythos Vs. GPT-5.5: Gated Anthropic Model 9 Testin 6'sını Kazanıyor | Yellow