OpenAI Merilis GPT-5.5, Ungguli Opus 4.7 Pada Tugas Agen dan 14 Benchmark

OpenAI Merilis GPT-5.5, Ungguli Opus 4.7 Pada Tugas Agen dan 14 Benchmark

OpenAI merilis GPT-5.5 pada 23 April, memposisikan model bernama sandi "Spud" ini sebagai sistem paling tajam mereka sejauh ini untuk pekerjaan otonom multi-langkah.

Dorongan Koding Agen GPT-5.5

Peluncuran ini lands tepat satu minggu setelah Anthropic pushed Claude Opus 4.7 ke ketersediaan umum, menyiapkan duel langsung pada beban kerja agen, menurut TechCrunch dan Fortune.

GPT-5.5 dibuat untuk merencanakan, menjalankan tool, memeriksa keluarannya sendiri, dan melakukan iterasi tanpa perlu prompt terus-menerus.

Presiden Greg Brockman menyebutnya sebagai "kelas kecerdasan baru" dalam panggilan dengan jurnalis, menggambarkannya sebagai langkah menuju "komputasi yang lebih agenik dan intuitif."

Model ini diluncurkan ke ChatGPT Plus, Pro, Business, dan Enterprise, dengan varian Pro yang lebih bertenaga juga sudah tersedia. Harga API dimulai dari $5 per satu juta token masukan dan $30 per satu juta token keluaran dengan jendela konteks satu juta token.

Juga Baca: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Kesenjangan Benchmark Opus 4.7

Angka internal OpenAI, yang oleh VentureBeat flagged disebut sebagai yang terdepan pada 14 evaluasi, menempatkan GPT-5.5 di 82,7% pada Terminal-Bench 2.0, jauh di atas 69,4% milik Opus 4.7.

Pada FrontierMath Tier 1 sampai 3, model baru ini mencapai 51,7%, dibanding 43,8% untuk model utama Anthropic.

Skor penggunaan komputer lebih ketat, dengan GPT-5.5 di 78,7% pada OSWorld-Verified berbanding Opus 4.7 di 78,0%, meski GPT-5.5 Pro unggul jelas pada browsing di 90,1% dibanding 79,3%.

Pengulas masih menilai Opus 4.7 unggul dalam penulisan riset dan ketaatan instruksi yang lebih rapat, serta kemampuan visi beresolusi lebih tinggi sekitar 3,75 megapiksel.

Irama rilis terus tightening. GPT-5.5 hadir enam minggu setelah GPT-5.4. Anthropic merilis Opus 4.6 pada Februari sebelum Opus 4.7, sementara Google mempertahankan Gemini 3.1 Pro di segmen enterprise yang sama.

Baca Selanjutnya: TRON Connects $85B USDT Network To LI.FI In Cross-Chain DeFi Push

Penafian dan Peringatan Risiko: Informasi yang diberikan dalam artikel ini hanya untuk tujuan edukasi dan informasi dan berdasarkan opini penulis. Ini tidak merupakan saran keuangan, investasi, hukum, atau pajak. Aset kripto sangat fluktuatif dan mengalami risiko tinggi, termasuk risiko kehilangan seluruh atau sebagian besar investasi Anda. Trading atau memegang aset kripto mungkin tidak cocok untuk semua investor. Pandangan yang dinyatakan dalam artikel ini adalah pandangan penulis saja dan tidak mewakili kebijakan resmi atau posisi Yellow, pendirinya, atau eksekutifnya. Selalu lakukan riset menyeluruh Anda sendiri (D.Y.O.R.) dan konsultasikan dengan profesional keuangan berlisensi sebelum membuat keputusan investasi apapun.
OpenAI Merilis GPT-5.5, Ungguli Opus 4.7 Pada Tugas Agen dan 14 Benchmark | Yellow.com