OpenAI a lancé GPT-5.5 le 23 avril, présentant ce modèle, nom de code « Spud », comme son système le plus pointu à ce jour pour le travail autonome et multi‑étapes.
Offensive agentique de GPT-5.5 en programmation
La sortie lands intervient exactement une semaine après qu’Anthropic a pushed Claude Opus 4.7 en disponibilité générale, ouvrant un face‑à‑face direct sur les charges de travail d’agents, selon TechCrunch et Fortune.
GPT-5.5 est conçu pour planifier, utiliser des outils, vérifier sa propre production et itérer sans sollicitations constantes.
Le président Greg Brockman l’a qualifié de « nouvelle classe d’intelligence » lors d’un appel avec des journalistes, le présentant comme une étape vers « une informatique plus agentique et intuitive ».
Le modèle est déployé sur ChatGPT Plus, Pro, Business et Enterprise, avec une variante Pro plus puissante également disponible. Les tarifs API commencent à 5 $ par million de tokens d’entrée et 30 $ par million de tokens de sortie, sur une fenêtre de contexte d’un million de tokens.
À lire aussi : Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move
L’écart de benchmark avec Opus 4.7
Les propres chiffres d’OpenAI, que VentureBeat a flagged comme l’état de l’art sur 14 évaluations, placent GPT-5.5 à 82,7 % sur Terminal-Bench 2.0, nettement devant les 69,4 % d’Opus 4.7.
Sur FrontierMath, niveaux 1 à 3, le nouveau modèle atteint 51,7 %, contre 43,8 % pour le modèle phare d’Anthropic.
Les scores d’utilisation de l’ordinateur sont plus serrés, avec GPT-5.5 à 78,7 % sur OSWorld-Verified contre 78,0 % pour Opus 4.7, même si GPT-5.5 Pro creuse l’écart en navigation Web, à 90,1 % contre 79,3 %.
Les testeurs continuent néanmoins de créditer Opus 4.7 d’une meilleure rédaction de recherche et d’un suivi des instructions plus strict, ainsi que d’une vision à plus haute résolution, autour de 3,75 mégapixels.
Le rythme continue de tightening. GPT-5.5 arrive six semaines après GPT-5.4. Anthropic a publié Opus 4.6 en février avant Opus 4.7, tandis que Google maintient Gemini 3.1 Pro dans le même segment entreprise.
À lire ensuite : TRON Connects $85B USDT Network To LI.FI In Cross-Chain DeFi Push






