OpenAI lancia GPT-5.5, supera Opus 4.7 nei compiti per agenti e in 14 benchmark

OpenAI lancia GPT-5.5, supera Opus 4.7 nei compiti per agenti e in 14 benchmark

OpenAI ha rilasciato GPT-5.5 il 23 aprile, presentando il modello, nome in codice "Spud", come il suo sistema più avanzato per lavori autonomi e multi‑step.

Spinta agentica di coding con GPT-5.5

Il lancio lands arriva esattamente una settimana dopo che Anthropic ha pushed Claude Opus 4.7 in disponibilità generale, preparando uno scontro diretto sui carichi di lavoro per agenti, secondo TechCrunch e Fortune.

GPT-5.5 è progettato per pianificare, usare strumenti, verificare il proprio output e iterare senza sollecitazioni continue.

Il presidente Greg Brockman lo ha definito "una nuova classe di intelligenza" in una call con i giornalisti, presentandolo come un passo verso "un computing più agentico e intuitivo".

Il modello viene distribuito su ChatGPT Plus, Pro, Business ed Enterprise, con anche una variante Pro più potente già disponibile. I prezzi API partono da 5 dollari per milione di token in input e 30 dollari per milione di token in output su una finestra di contesto da un milione di token.

Also Read: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Il divario nei benchmark con Opus 4.7

I numeri interni di OpenAI, che VentureBeat ha flagged come stato dell’arte su 14 valutazioni, collocano GPT-5.5 all’82,7% su Terminal-Bench 2.0, ben al di sopra del 69,4% di Opus 4.7.

Su FrontierMath Tiers 1–3, il nuovo modello ha raggiunto il 51,7%, contro il 43,8% del modello di punta di Anthropic.

I punteggi sull’uso del computer sono più ravvicinati, con GPT-5.5 al 78,7% su OSWorld-Verified contro il 78,0% di Opus 4.7, anche se GPT-5.5 Pro si stacca nettamente nella navigazione web con il 90,1% rispetto al 79,3%.

I recensori continuano comunque ad attribuire a Opus 4.7 una scrittura di ricerca più solida e una migliore aderenza alle istruzioni, oltre a una visione con risoluzione più alta, circa 3,75 megapixel.

Il ritmo continua a tightening. GPT-5.5 arriva sei settimane dopo GPT-5.4. Anthropic ha lanciato Opus 4.6 a febbraio prima di Opus 4.7, mentre Google ha mantenuto Gemini 3.1 Pro nella stessa fascia enterprise.

Read Next: TRON Connects $85B USDT Network To LI.FI In Cross-Chain DeFi Push

Disclaimer e avvertenza sui rischi: Le informazioni fornite in questo articolo sono solo per scopi educativi e informativi e sono basate sull'opinione dell'autore. Non costituiscono consulenza finanziaria, di investimento, legale o fiscale. Gli asset di criptovaluta sono altamente volatili e soggetti ad alto rischio, incluso il rischio di perdere tutto o una parte sostanziale del tuo investimento. Il trading o il possesso di asset crypto potrebbe non essere adatto a tutti gli investitori. Le opinioni espresse in questo articolo sono esclusivamente quelle dell'autore/autori e non rappresentano la politica ufficiale o la posizione di Yellow, dei suoi fondatori o dei suoi dirigenti. Conduci sempre la tua ricerca approfondita (D.Y.O.R.) e consulta un professionista finanziario autorizzato prima di prendere qualsiasi decisione di investimento.