OpenAI merilis GPT-5.5 pada 23 April, memposisikan model bernama sandi "Spud" ini sebagai sistem paling tajam mereka sejauh ini untuk pekerjaan otonom multi-langkah.
Dorongan Koding Agen GPT-5.5
Peluncuran ini lands tepat satu minggu setelah Anthropic pushed Claude Opus 4.7 ke ketersediaan umum, menyiapkan duel langsung pada beban kerja agen, menurut TechCrunch dan Fortune.
GPT-5.5 dibuat untuk merencanakan, menjalankan tool, memeriksa keluarannya sendiri, dan melakukan iterasi tanpa perlu prompt terus-menerus.
Presiden Greg Brockman menyebutnya sebagai "kelas kecerdasan baru" dalam panggilan dengan jurnalis, menggambarkannya sebagai langkah menuju "komputasi yang lebih agenik dan intuitif."
Model ini diluncurkan ke ChatGPT Plus, Pro, Business, dan Enterprise, dengan varian Pro yang lebih bertenaga juga sudah tersedia. Harga API dimulai dari $5 per satu juta token masukan dan $30 per satu juta token keluaran dengan jendela konteks satu juta token.
Juga Baca: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move
Kesenjangan Benchmark Opus 4.7
Angka internal OpenAI, yang oleh VentureBeat flagged disebut sebagai yang terdepan pada 14 evaluasi, menempatkan GPT-5.5 di 82,7% pada Terminal-Bench 2.0, jauh di atas 69,4% milik Opus 4.7.
Pada FrontierMath Tier 1 sampai 3, model baru ini mencapai 51,7%, dibanding 43,8% untuk model utama Anthropic.
Skor penggunaan komputer lebih ketat, dengan GPT-5.5 di 78,7% pada OSWorld-Verified berbanding Opus 4.7 di 78,0%, meski GPT-5.5 Pro unggul jelas pada browsing di 90,1% dibanding 79,3%.
Pengulas masih menilai Opus 4.7 unggul dalam penulisan riset dan ketaatan instruksi yang lebih rapat, serta kemampuan visi beresolusi lebih tinggi sekitar 3,75 megapiksel.
Irama rilis terus tightening. GPT-5.5 hadir enam minggu setelah GPT-5.4. Anthropic merilis Opus 4.6 pada Februari sebelum Opus 4.7, sementara Google mempertahankan Gemini 3.1 Pro di segmen enterprise yang sama.
Baca Selanjutnya: TRON Connects $85B USDT Network To LI.FI In Cross-Chain DeFi Push






