Berita Belajar Penelitian Peringkat Ekosistem

PLATFORM SUDAH LIVE

yellow bottom left star road

Claude Mythos Vs. GPT-5.5: Model Tertutup Anthropic Menang di 6 dari 9 Tes

Alexey BondarevApr, 24 2026 5:36

#Kecerdasan Buatan #OpenAI #ChatGPT #Anthropic #Claude Mythos

Claude Mythos Vs. GPT-5.5: Model Tertutup Anthropic Menang di 6 dari 9 Tes

OpenAI released GPT-5.5 pada hari Rabu, tetapi data tolok ukur terbaru menunjukkan Anthropic's gated Claude Mythos Preview tetap memimpin pada enam dari sembilan tes yang dapat dibandingkan secara langsung.

Skor Tolok Ukur GPT-5.5

GPT-5.5 arrived di ChatGPT dan Codex pada 23 April, dengan harga $5 per satu juta token input dan $30 untuk output, dua kali lipat dari pendahulunya.

Model tersebut scored 82,7% pada Terminal-Bench 2.0, mengungguli Mythos sebesar 0,7 poin pada satu-satunya tolok ukur di mana ia jelas menang.

Mythos, which Anthropic withheld from public release over cybersecurity concerns, memimpin di SWE-bench Pro dengan 77,8% dibanding 58,6%.

Mythos juga tops GPT-5.5 pada Humanity's Last Exam tanpa tools, meraih skor 56,8% dibanding 41,4%. Model tertutup ini juga unggul di CyberGym, OSWorld-Verified, dan tugas konteks panjang GraphWalks.

Also Read: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

Catatan Penting dari Analis

Perbandingan ini tetap tidak presisi karena tidak ada laboratorium yang menguji tolok ukur kedua model secara langsung satu sama lain. OpenAI chose Claude Opus 4.7 sebagai pembanding publiknya, sementara kartu sistem Anthropic setebal 245 halaman membandingkan Mythos dengan GPT-5.4.

Rangka pengujian juga berbeda. OpenAI menggunakan pengaturan CLI Codex pada Terminal-Bench, sementara Terminus-2 milik Anthropic mendorong Mythos hingga 92,1% di bawah aturan waktu Terminal-Bench 2.1.

Keputusan Anthropic untuk membatasi akses Mythos, yang diumumkan 7 April, dilaporkan memicu pertemuan dengan Komisi Eropa dan peringatan dari gubernur Bank of England bahwa model tersebut dapat membuka risiko siber secara luas.

Read Next: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Penafian dan Peringatan Risiko: Informasi yang diberikan dalam artikel ini hanya untuk tujuan edukasi dan informasi dan berdasarkan opini penulis. Ini tidak merupakan saran keuangan, investasi, hukum, atau pajak. Aset kripto sangat fluktuatif dan mengalami risiko tinggi, termasuk risiko kehilangan seluruh atau sebagian besar investasi Anda. Trading atau memegang aset kripto mungkin tidak cocok untuk semua investor. Pandangan yang dinyatakan dalam artikel ini adalah pandangan penulis saja dan tidak mewakili kebijakan resmi atau posisi Yellow, pendirinya, atau eksekutifnya. Selalu lakukan riset menyeluruh Anda sendiri (D.Y.O.R.) dan konsultasikan dengan profesional keuangan berlisensi sebelum membuat keputusan investasi apapun.

Berita Terkait

Claude Opus 4.8 Ungguli Gemini dan GPT di Berbagai Uji Koding

Anthropic merilis Claude Opus 4.8 yang diklaim mengungguli GPT-5.5 dan Gemini 3.1 Pro di sejumlah tolok ukur koding, dengan mode cepat lebih murah.

GPT-5.5 Menyamai Claude Mythos Dalam Serangan Siber 32 Langkah, Laporan AISI Inggris

GPT-5.5 jadi model kedua yang menuntaskan simulasi peretasan 32 langkah dan mengungguli Claude Mythos dalam uji siber AISI Inggris.

Claude Mythos AI Kalahkan Pesaing dalam Audit Kode, Kalah di Harga 5X Lebih Mahal

Uji XBOW: Mythos unggul audit kode dan kurangi bug terlewat sampai 42%, tapi biaya 5x Opus membuatnya kalah saing saat faktor harga diperhitungkan.

Bagaimana Claude Mythos dan GPT-5.5 Diam-Diam Mengubah Perhitungan Pertahanan Siber

Mythos dan GPT-5.5 melampaui tren peningkatan kemampuan siber AISI, sementara Palo Alto menemukan lonjakan celah baru yang menekan batas waktu pertahanan.

OpenAI Merilis GPT-5.5, Ungguli Opus 4.7 Pada Tugas Agen dan 14 Benchmark

OpenAI merilis GPT-5.5 dengan skor Terminal-Bench 82,7%, unggul atas Opus 4.7; fokus pada tugas agen, perencanaan, penggunaan alat, serta evaluasi mandiri.

Artikel Penelitian Terkait

Bagaimana Claude Mythos Dapat Membentuk Ulang Industri Keuangan dan Kripto

Dampak Claude Mythos pada keamanan siber, stabilitas keuangan, dan infrastruktur kripto, dengan akses terbatas lewat Project Glasswing.

Claude Mythos dan Kripto: Apa Ancaman AI Baru Ini Bagi Trading

Claude Mythos temukan ribuan zero-day, paparkan bursa dan DeFi pada risiko serangan AI saat industri kripto sudah rugi miliaran dolar akibat peretasan.

Apakah Token AI Menjadi Tren Kripto Besar Berikutnya Setelah Memecoin?

Token AI mengejar memecoin meski keduanya anjlok tajam; infrastruktur nyata dan minat institusional dorong sektor, tapi risiko gelembung tetap besar.

42 Negara Bagian Sudah Menyelidiki OpenAI Sementara Wall Street Membidik IPO-nya

42 jaksa agung negara bagian memanggil OpenAI segera setelah pengajuan IPO $852 miliar, menambah ketidakpastian regulasi atas valuasi dan jadwal pencatatan.

Kebangkitan Koin AI: Mampukah Reli 117% Bittensor Menggerakkan Comeback Sektor?

Reli 117% Bittensor memicu lonjakan token AI 42% sehari, namun valuasi sektor masih jauh di bawah puncak 2024 usai kejatuhan 75% di 2025.

Artikel Pembelajaran Terkait

Marketplace Data AI Terdesentralisasi Mulai Hadir, Inilah Yang Perlu Anda Ketahui

Marketplace data AI terdesentralisasi membayar Anda dengan kripto saat data Anda melatih model. Begini cara kerja, verifikasi, dan perlindungan privasinya.

Bisakah AI Terdesentralisasi Menjaga Prompt Anda Tetap Privat?

Jaringan AI privat terdesentralisasi seperti Venice memungkinkan inferensi AI tanpa satu pihak pun melihat penuh prompt atau respons, menggunakan kriptografi, TEE, dan token VVV.

Cara Menggunakan Alat AI untuk Riset Investasi Kripto: Panduan Lengkap 2025

Riset kripto berbasis AI telah mengalami transformasi besar dengan AI, menciptakan peluang tak tertandingi untuk investor ritel.

Cara Menggunakan Bot Trading Saham AI: Alat Gratis dan Risiko Nyata

Panduan bot trading saham AI tanpa kode, alat gratis yang bisa dipakai pemula, langkah aman memulai, dan risiko nyata yang sering disamarkan.

Mengapa Agen AI Tidak Dapat Skala Tanpa Lapisan Blockchain Sendiri

Agen AI butuh infrastruktur on-chain khusus: akun agen terprogram, eksekusi tanpa gas, dan routing intent lintas rantai, bukan dompet kripto biasa.

Claude Mythos Vs. GPT-5.5: Model Tertutup Anthropic Menang di 6 dari 9 Tes | Yellow