Pourquoi Gradient pense que les modèles à mille milliards de paramètres n’appartiendront pas à OpenAI ou Google à l’avenir

il y a 1 heure
Pourquoi Gradient pense que les modèles à mille milliards de paramètres n’appartiendront pas à OpenAI ou Google à l’avenir

Le PDG de Gradient, Eric Yang, pense que le prochain grand tournant de l’intelligence artificielle ne viendra pas de modèles propriétaires plus grands ni de more powerful data centers.

Selon lui, il sera déclenché par un changement fondamental dans la façon dont les modèles sont entraînés : répartir l’entraînement sur un réseau mondial et sans permission de ressources de calcul plutôt qu’au sein d’un seul superordinateur d’entreprise.

S’exprimant au sujet du travail de Gradient dans une interview avec Yellow.com, Yang a expliqué que les laboratoires d’IA dominants actuels comme OpenAI, Google, Anthropic, xAI reposent sur l’hypothèse que les modèles de fondation ne peuvent être entraînés qu’au sein d’infrastructures massives et centralisées.

« L’IA bénéficie tellement de la centralisation que personne n’a été capable d’entraîner de grands modèles à travers plusieurs centres de données », a‑t‑il déclaré. Gradient parie que cette hypothèse est sur le point de s’effondrer.

Yang affirme que Gradient a déjà mené avec succès des sessions d’entraînement par apprentissage par renforcement réparties sur des centres de données indépendants, avec des performances comparables aux flux de travail RLHF centralisés.

Selon lui, cela ouvre la voie à quelque chose que l’on pensait auparavant impossible : l’affinage de modèles à mille milliards de paramètres, non pas par une seule entreprise, mais par des milliers de fournisseurs de calcul répartis dans le monde entier.

À lire aussi : As Bitcoin Evolves Into A Global Economy, A Hidden Battle Emerges Behind Closed Doors

Les implications économiques sont tout aussi importantes. Yang décrit un marché mondial « fondé sur les primes » où les opérateurs de GPU, les centres de données et même de petits fournisseurs d’infrastructure indépendants se disputent la possibilité de fournir du calcul pour les tâches d’entraînement.

Les contributeurs sont récompensés pour avoir fourni de la puissance de calcul au prix le plus bas disponible, tandis que les coûts d’entraînement deviennent inférieurs à ceux des solutions centralisées qui dominent actuellement le marché.

Il estime également que l’infrastructure d’IA décentralisée offre des avantages significatifs en matière de sécurité et de confiance.

Si l’inférence peut être effectuée entièrement sur du matériel appartenant aux utilisateurs — MacBook, ordinateurs de bureau, GPU domestiques ou configurations hybrides — alors les données personnelles ne quittent jamais l’appareil.

« Aujourd’hui, nous fuyons beaucoup plus de données sensibles vers les systèmes d’IA que nous n’en avons jamais envoyées à Google », a‑t‑il déclaré. « Un modèle souverain fonctionnant localement change cela. »

Yang soutient que cette transparence peut s’étendre à l’entraînement lui‑même.

Si la provenance des données d’entraînement est enregistrée on‑chain, les utilisateurs peuvent voir quels environnements et quels contributeurs ont façonné le modèle, un antidote, selon lui, aux biais et au contrôle éditorial opaque observés dans les systèmes centralisés.

À ses yeux, le paysage futur de l’IA ne sera pas dominé par un seul grand modèle, mais par « une mer de modèles spécialisés » entraînés et détenus de manière collaborative.

« Chaque entreprise utilisera l’IA comme elle utilise aujourd’hui l’analytique », a déclaré Yang. « Quand cela arrivera, un réseau mondial décentralisé de calcul deviendra le seul modèle qui passe à l’échelle. »

À lire ensuite : The Aster ETF Hoax That Fooled Even Top Crypto Influencers

Avertissement et avertissement sur les risques : Les informations fournies dans cet article sont à des fins éducatives et informatives uniquement et sont basées sur l'opinion de l'auteur. Elles ne constituent pas des conseils financiers, d'investissement, juridiques ou fiscaux. Les actifs de cryptomonnaie sont très volatils et sujets à des risques élevés, y compris le risque de perdre tout ou une partie substantielle de votre investissement. Le trading ou la détention d'actifs crypto peut ne pas convenir à tous les investisseurs. Les opinions exprimées dans cet article sont uniquement celles de l'auteur/des auteurs et ne représentent pas la politique officielle ou la position de Yellow, de ses fondateurs ou de ses dirigeants. Effectuez toujours vos propres recherches approfondies (D.Y.O.R.) et consultez un professionnel financier agréé avant de prendre toute décision d'investissement.
Dernières nouvelles
Voir toutes les nouvelles