PLATFORM SUDAH LIVE

yellow bottom left star road

OpenAI Merilis GPT-5.5, Ungguli Opus 4.7 Pada Tugas Agen dan 14 Benchmark

Camille MeulienApr, 23 2026 19:14

#Kecerdasan Buatan #OpenAI

OpenAI Merilis GPT-5.5, Ungguli Opus 4.7 Pada Tugas Agen dan 14 Benchmark

OpenAI merilis GPT-5.5 pada 23 April, memposisikan model bernama sandi "Spud" ini sebagai sistem paling tajam mereka sejauh ini untuk pekerjaan otonom multi-langkah.

Dorongan Koding Agen GPT-5.5

Peluncuran ini lands tepat satu minggu setelah Anthropic pushed Claude Opus 4.7 ke ketersediaan umum, menyiapkan duel langsung pada beban kerja agen, menurut TechCrunch dan Fortune.

GPT-5.5 dibuat untuk merencanakan, menjalankan tool, memeriksa keluarannya sendiri, dan melakukan iterasi tanpa perlu prompt terus-menerus.

Presiden Greg Brockman menyebutnya sebagai "kelas kecerdasan baru" dalam panggilan dengan jurnalis, menggambarkannya sebagai langkah menuju "komputasi yang lebih agenik dan intuitif."

Model ini diluncurkan ke ChatGPT Plus, Pro, Business, dan Enterprise, dengan varian Pro yang lebih bertenaga juga sudah tersedia. Harga API dimulai dari $5 per satu juta token masukan dan $30 per satu juta token keluaran dengan jendela konteks satu juta token.

Juga Baca: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Kesenjangan Benchmark Opus 4.7

Angka internal OpenAI, yang oleh VentureBeat flagged disebut sebagai yang terdepan pada 14 evaluasi, menempatkan GPT-5.5 di 82,7% pada Terminal-Bench 2.0, jauh di atas 69,4% milik Opus 4.7.

Pada FrontierMath Tier 1 sampai 3, model baru ini mencapai 51,7%, dibanding 43,8% untuk model utama Anthropic.

Skor penggunaan komputer lebih ketat, dengan GPT-5.5 di 78,7% pada OSWorld-Verified berbanding Opus 4.7 di 78,0%, meski GPT-5.5 Pro unggul jelas pada browsing di 90,1% dibanding 79,3%.

Pengulas masih menilai Opus 4.7 unggul dalam penulisan riset dan ketaatan instruksi yang lebih rapat, serta kemampuan visi beresolusi lebih tinggi sekitar 3,75 megapiksel.

Irama rilis terus tightening. GPT-5.5 hadir enam minggu setelah GPT-5.4. Anthropic merilis Opus 4.6 pada Februari sebelum Opus 4.7, sementara Google mempertahankan Gemini 3.1 Pro di segmen enterprise yang sama.

Baca Selanjutnya: TRON Connects $85B USDT Network To LI.FI In Cross-Chain DeFi Push

Penafian dan Peringatan Risiko: Informasi yang diberikan dalam artikel ini hanya untuk tujuan edukasi dan informasi dan berdasarkan opini penulis. Ini tidak merupakan saran keuangan, investasi, hukum, atau pajak. Aset kripto sangat fluktuatif dan mengalami risiko tinggi, termasuk risiko kehilangan seluruh atau sebagian besar investasi Anda. Trading atau memegang aset kripto mungkin tidak cocok untuk semua investor. Pandangan yang dinyatakan dalam artikel ini adalah pandangan penulis saja dan tidak mewakili kebijakan resmi atau posisi Yellow, pendirinya, atau eksekutifnya. Selalu lakukan riset menyeluruh Anda sendiri (D.Y.O.R.) dan konsultasikan dengan profesional keuangan berlisensi sebelum membuat keputusan investasi apapun.

Berita Terkait

Claude Mythos Vs. GPT-5.5: Model Tertutup Anthropic Menang di 6 dari 9 Tes

Claude Mythos tertutup Anthropic mengalahkan GPT-5.5 OpenAI pada enam dari sembilan tolok ukur langsung dibandingkan.

GPT-5.5 Menyamai Claude Mythos Dalam Serangan Siber 32 Langkah, Laporan AISI Inggris

GPT-5.5 jadi model kedua yang menuntaskan simulasi peretasan 32 langkah dan mengungguli Claude Mythos dalam uji siber AISI Inggris.

Gemini 3.5 Flash Hanya 2 Poin di Bawah Claude Opus 4.7 dengan Biaya Sepertiga

Google merilis Gemini 3.5 Flash, menyaingi Claude Opus 4.7 dan GPT-5.5 dengan skor tinggi dan harga sekitar sepertiga biaya per token.

Apakah Daybreak Milik OpenAI Memulai Perlombaan Senjata Keamanan Siber Berbasis AI?

Daybreak dari OpenAI memadukan GPT-5.5 dan Codex untuk otomatisasi pertahanan siber, bersaing dengan Glasswing Anthropic sambil menggandeng raksasa keamanan.

Claude Opus 4.7 Segera Diluncurkan Namun AI Terkuat Anthropic Masih Terbatas Akses

Anthropic menyiapkan Claude Opus 4.7 dan alat desain AI, sementara model terbatas Mythos memecahkan rekor keamanan siber.

Artikel Penelitian Terkait

Bagaimana Claude Mythos Dapat Membentuk Ulang Industri Keuangan dan Kripto

Dampak Claude Mythos pada keamanan siber, stabilitas keuangan, dan infrastruktur kripto, dengan akses terbatas lewat Project Glasswing.

Perdagangan Kripto AI: Panduan Lengkap untuk Bot Trading GPT di Tahun 2025

Revolusi kecerdasan buatan telah mengubah perdagangan kripto, dengan sistem bertenaga GPT sekarang mengelola 40% volume perdagangan harian.

Apakah Token AI Menjadi Tren Kripto Besar Berikutnya Setelah Memecoin?

Token AI mengejar memecoin meski keduanya anjlok tajam; infrastruktur nyata dan minat institusional dorong sektor, tapi risiko gelembung tetap besar.

Claude Mythos dan Kripto: Apa Ancaman AI Baru Ini Bagi Trading

Claude Mythos temukan ribuan zero-day, paparkan bursa dan DeFi pada risiko serangan AI saat industri kripto sudah rugi miliaran dolar akibat peretasan.

Kebangkitan Koin AI: Mampukah Reli 117% Bittensor Menggerakkan Comeback Sektor?

Reli 117% Bittensor memicu lonjakan token AI 42% sehari, namun valuasi sektor masih jauh di bawah puncak 2024 usai kejatuhan 75% di 2025.

Artikel Pembelajaran Terkait

Cara Menggunakan Alat AI untuk Riset Investasi Kripto: Panduan Lengkap 2025

Riset kripto berbasis AI telah mengalami transformasi besar dengan AI, menciptakan peluang tak tertandingi untuk investor ritel.

Bittensor Menjalankan Marketplace AI Senilai $2,6 Miliar Tanpa Kontrol Perusahaan Mana Pun

Bittensor adalah marketplace AI terdesentralisasi tempat penambang dan validator bersaing mendapatkan TAO, mengelola subnet khusus, dan mempertaruhkan token.

Cara Menggunakan Bot Trading Saham AI: Alat Gratis dan Risiko Nyata

Panduan bot trading saham AI tanpa kode, alat gratis yang bisa dipakai pemula, langkah aman memulai, dan risiko nyata yang sering disamarkan.

Kebangkitan Agen AI dalam Cryptocurrency: Revolusi Keuangan Sedang Terungkap

Integrasi agen AI ke dalam ekosistem cryptocurrency merevolusi keuangan dengan menggabungkan pengambilan keputusan otonom dengan infrastruktur terdesentralisasi blockchain.

Membangun Bot AI Kripto Anda Sendiri: Panduan Lengkap Pengembang untuk 2024-2025

Rangkuman tidak tersedia.

OpenAI Merilis GPT-5.5, Ungguli Opus 4.7 Pada Tugas Agen dan 14 Benchmark | Yellow.com