OpenAI se dirige vers un contrôle de type Apple sur sa pile d’IA, tandis que son projet de puce personnalisée met à l’épreuve la domination matérielle de Nvidia.
Points clés :
- OpenAI et Broadcom ont partagé de nouveaux détails sur Jalapeño, un processeur d’inférence personnalisé conçu pour les charges de travail d’IA.
- La puce s’inscrit dans une stratégie plus large, et pas seulement dans un effort pour réduire la dépendance à Nvidia.
- Les grandes entreprises d’IA conçoivent des puces sur mesure, l’infrastructure devenant centrale dans la concurrence.
Puce d’OpenAI
Le travail d’OpenAI avec Broadcom sur Jalapeño a attiré l’attention car Nvidia reste le principal fournisseur de matériel derrière une grande partie du boom de l’IA.
Le processeur est destiné à l’inférence, l’étape qui suit l’entraînement d’un modèle, lorsqu’il commence à répondre aux utilisateurs. L’entraînement crée le modèle. L’inférence alimente les requêtes quotidiennes qui définissent l’expérience utilisateur.
Cette distinction est importante, car ces interactions se produisent à une échelle énorme. Chaque amélioration en vitesse, en consommation d’énergie ou en mise en réseau peut réduire les coûts tout en rendant les systèmes d’IA plus réactifs.
L’initiative suggère aussi qu’OpenAI s’inspire de la stratégie d’Apple. Apple a renforcé son pouvoir sur ses produits en concevant ensemble les éléments matériels clés et les logiciels, au lieu d’adapter ses systèmes à des processeurs externes.
OpenAI semble appliquer cette logique à l’IA. Une puce conçue autour de ses propres modèles pourrait donner à l’entreprise davantage de contrôle sur les performances de ChatGPT et des futurs systèmes.
Nous en sommes encore au début. OpenAI n’a pas présenté un déploiement massif comme imminent, et la puce doit être considérée comme le début d’une longue stratégie d’infrastructure.
À lire aussi : Mark Chen d’OpenAI affirme que l’IA capable de mener ses propres recherches se rapproche
Pression sur Nvidia
Nvidia n’a guère de raison de paniquer à court terme. Ses processeurs soutiennent encore une grande partie de l’infrastructure d’IA actuelle, et la demande reste forte dans tout le secteur.
Mais le projet de puce d’OpenAI s’inscrit dans une tendance plus large. Google a développé ses Tensor Processing Units, Amazon a conçu Trainium et Inferentia, Microsoft a investi dans des puces d’IA, et Meta a développé ses propres accélérateurs.
La conclusion commune est claire. À mesure que l’IA devient plus importante pour ces entreprises, aucune ne souhaite dépendre entièrement de la feuille de route matérielle d’un tiers.
Le passage d’Apple à ses propres processeurs n’a pas détruit Intel du jour au lendemain. Il a toutefois donné à Apple plus de contrôle sur les prix, les performances et l’orientation de ses produits en remplaçant les composants externes.
Un changement similaire pourrait redessiner l’infrastructure de l’IA. OpenAI a également indiqué que ses propres modèles avaient permis d’accélérer certaines étapes de l’ingénierie lors du développement de la puce, créant une boucle de rétroaction entre le logiciel d’IA et le matériel futur.
Cette boucle pourrait gagner en importance à mesure que la conception de puces se complexifie. L’entreprise qui contrôle davantage la machine sous-jacente pourrait y gagner des avantages, même lorsque les classements de modèles évoluent.
La grande leçon tirée d’Apple est que l’intégration peut devenir un fossé défensif à long terme. Le projet Jalapeño d’OpenAI laisse entendre qu’elle veut contrôler non seulement les modèles, mais aussi les systèmes qui les distribuent.
À lire ensuite : BingX s’associe à Save the Children pour soutenir les enfants à risque dans les Balkans occidentaux





