Les modèles GPT-5.6 les plus puissants d’OpenAI arrivent derrière une porte verrouillée

Les modèles GPT-5.6 les plus puissants d’OpenAI arrivent derrière une porte verrouillée

OpenAI a présenté en avant-première sa famille de trois modèles GPT-5.6 vendredi, associant de nets gains en codage, biologie et cybersécurité à un accès pour l’instant limité à un petit cercle de partenaires.

Points clés :

  • GPT-5.6 arrive en une famille à trois niveaux, avec Sol comme vaisseau amiral, Terra comme option équilibrée et Luna conçue pour la vitesse.
  • De nouveaux modes max et ultra permettent à Sol de raisonner plus longtemps et de répartir les tâches difficiles entre des sous-agents parallèles.
  • OpenAI classe les trois niveaux à haut risque pour la cyber et la biologie, maintenant un large accès en attente.

La famille GPT-5.6 vise le codage et la cybersécurité

L’entreprise a dévoilé Sol comme son modèle le plus puissant à ce jour, Terra comme niveau équilibré pour un usage quotidien, facturé à environ la moitié du prix de son prédécesseur, et Luna comme option la plus rapide à 1 $ par million de jetons d’entrée. Un nouveau schéma de nommage utilise désormais le chiffre pour marquer la génération d’un modèle, tandis que les noms correspondent à des niveaux de capacité durables. Chaque niveau peut évoluer à son propre rythme, offrant aux développeurs un choix plus clair entre vitesse, profondeur et prix.

GPT-5.6 inaugure aussi deux façons de pousser Sol plus loin sur les tâches longues et à étapes multiples. Un réglage max accorde au modèle plus de temps de réflexion, tandis qu’un mode ultra répartit les travaux complexes entre des sous-agents qui s’exécutent en parallèle avant de fusionner leurs résultats.

OpenAI prévoit également de faire tourner Sol sur des puces Cerebras jusqu’à 750 jetons par seconde en juillet.

Sol a établi un nouveau record sur Terminal-Bench 2.1, un test de travail en ligne de commande qui exige planification et coordination d’outils. En analyse génomique, il a dépassé légèrement GPT-5.5 tout en consommant moins de jetons.

Sur un banc d’essai d’exploits, Sol a égalé la version Preview de Mythos d’Anthropic en utilisant environ un tiers des jetons de sortie.

À lire aussi : Le record de portefeuilles de Chainlink fait du rebond de 9 $ de LINK le test principal

Le niveau de risque ChatGPT redessine l’accès à l’IA

OpenAI a classé les trois modèles comme à haut risque pour les usages malveillants à la fois cyber et biologiques, une première pour ses niveaux plus petits et moins chers. Aucun d’eux, a indiqué l’entreprise, n’a atteint le niveau critique qui déclencherait ses restrictions les plus sévères, et Sol s’est montré meilleur pour trouver et corriger des failles que pour mener des attaques complètes.

Cette évaluation aide à expliquer pourquoi l’accès reste pour l’instant restreint. Environ 20 organisations agréées par le gouvernement peuvent exécuter les modèles pendant la phase de préversion, avec un déploiement plus large vers ChatGPT, Codex et l’API annoncé pour les semaines à venir. Le chercheur en cybersécurité Alex Stamos a averti que le cloisonnement des outils de pointe pourrait donner un avantage aux rivaux étrangers dans la course à l’IA.

Ce lancement couronne une année de durcissement des contrôles cyber chez l’entreprise, depuis les premières protections sur GPT-5.2 en décembre dernier jusqu’aux classifieurs plus stricts sur GPT-5.5. Pour GPT-5.6, OpenAI affirme avoir consacré plus de 700 000 heures GPU équivalentes A100 au red teaming automatisé seul.

À lire ensuite : XRP tombe près de 1 $ tandis que les acheteurs d’ETF testent un marché au comptant fragile

Avertissement et avertissement sur les risques : Les informations fournies dans cet article sont à des fins éducatives et informatives uniquement et sont basées sur l'opinion de l'auteur. Elles ne constituent pas des conseils financiers, d'investissement, juridiques ou fiscaux. Les actifs de cryptomonnaie sont très volatils et sujets à des risques élevés, y compris le risque de perdre tout ou une partie substantielle de votre investissement. Le trading ou la détention d'actifs crypto peut ne pas convenir à tous les investisseurs. Les opinions exprimées dans cet article sont uniquement celles de l'auteur/des auteurs et ne représentent pas la politique officielle ou la position de Yellow, de ses fondateurs ou de ses dirigeants. Effectuez toujours vos propres recherches approfondies (D.Y.O.R.) et consultez un professionnel financier agréé avant de prendre toute décision d'investissement.