OpenAI випускає GPT-5.5, що перевершує Opus 4.7 в агентних задачах і на 14 бенчмарках

OpenAI випустила GPT-5.5 23 квітня, позиціонуючи модель з кодовою назвою «Spud» як свою найточнішу систему для автономної багатокрокової роботи.

Агентичний ривок GPT-5.5 у кодуванні

Випуск lands відбувся рівно через тиждень після того, як Anthropic pushed Claude Opus 4.7 у загальну доступність, створюючи пряме протистояння в агентних робочих навантаженнях, за даними TechCrunch та Fortune.

GPT-5.5 створений для планування, запуску інструментів, перевірки власного результату та ітерацій без постійних підказок.

Президент Грег Брокман назвав її «новим класом інтелекту» під час дзвінка з репортерами, описуючи як крок до «більш агентичних і інтуїтивних обчислень».

Модель впроваджується в ChatGPT Plus, Pro, Business та Enterprise; також доступний потужніший Pro-варіант. Ціни API стартують від $5 за мільйон вхідних токенів і $30 за мільйон вихідних токенів при контекстному вікні в один мільйон токенів.

Також читайте: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Розрив у бенчмарках з Opus 4.7

За даними самої OpenAI, які VentureBeat flagged як найкращі в галузі на 14 оцінюваннях, GPT-5.5 набирає 82,7% у Terminal-Bench 2.0, значно випереджаючи 69,4% у Opus 4.7.

На FrontierMath рівнів 1–3 нова модель досягла 51,7% проти 43,8% у флагмана Anthropic.

Результати в тестах «computer-use» ближчі: GPT-5.5 показав 78,7% на OSWorld-Verified проти 78,0% у Opus 4.7, хоча GPT-5.5 Pro значно випередив у браузингу — 90,1% проти 79,3%.

Оглядачі досі віддають Opus 4.7 перевагу в дослідницькому письмі та точнішому слідуванні інструкціям, а також відзначають вищу роздільну здатність зору — приблизно 3,75 мегапікселя.

Темпи релізів tightening лише зростають. GPT-5.5 з’явився через шість тижнів після GPT-5.4. Anthropic випустила Opus 4.6 у лютому перед Opus 4.7, тоді як Google утримує Gemini 3.1 Pro в тому ж корпоративному сегменті.

Читайте далі: TRON Connects $85B USDT Network To LI.FI In Cross-Chain DeFi Push