App Store
Portafoglio

Perché Gradient pensa che in futuro i modelli da mille miliardi di parametri non apparterranno a OpenAI o Google

Perché Gradient pensa che in futuro i modelli da mille miliardi di parametri non apparterranno a OpenAI o Google

Il CEO di Gradient, Eric Yang, ritiene che il prossimo grande cambiamento nell’intelligenza artificiale non arriverà da modelli proprietari più grandi o da more powerful data centers.

Sostiene invece che sarà guidato da un cambiamento fondamentale nel modo in cui i modelli vengono addestrati: distribuire l’addestramento su una rete globale e permissionless di calcolo anziché all’interno delle mura di un unico supercomputer aziendale.

Parlando del lavoro di Gradient in un’intervista con Yellow.com, Yang ha affermato che i laboratori di IA dominanti di oggi come OpenAI, Google, Anthropic, xAI si basano sull’assunzione che i foundation model possano essere addestrati solo all’interno di un’infrastruttura massiva e centralizzata.

«L’IA trae così tanto vantaggio dalla centralizzazione che nessuno è riuscito ad addestrare grandi modelli su più data center», ha detto. Gradient sta scommettendo che questa assunzione stia per crollare.

Yang afferma che Gradient ha già effettuato con successo esecuzioni di addestramento tramite reinforcement learning distribuite tra data center indipendenti, con prestazioni che rivaleggiano con i workflow RLHF centralizzati.

Secondo lui questo apre la porta a qualcosa che prima era considerato impossibile: il post-training di modelli da mille miliardi di parametri condotto non da un’unica azienda, ma da migliaia di fornitori di calcolo in tutto il mondo.

Da leggere anche: As Bitcoin Evolves Into A Global Economy, A Hidden Battle Emerges Behind Closed Doors

Le implicazioni economiche sono altrettanto significative. Yang descrive un marketplace globale “basato sulle bounty” in cui operatori di GPU, data center e persino piccoli fornitori di infrastrutture indipendenti competono per contribuire con potenza di calcolo ai job di addestramento.

I contributori guadagnano ricompense fornendo calcolo al prezzo più basso disponibile, mentre i costi di addestramento scendono al di sotto delle alternative centralizzate che attualmente dominano il mercato.

Ritiene inoltre che l’infrastruttura di IA decentralizzata offra vantaggi significativi in termini di sicurezza e fiducia.

Se l’inferenza può essere eseguita interamente su hardware di proprietà dell’utente, MacBook, desktop, GPU domestiche o configurazioni ibride, allora i dati personali non lasciano mai il dispositivo.

«Oggi riversiamo nei sistemi di IA molti più dati sensibili di quanti ne abbiamo mai dati a Google», ha detto. «Un modello sovrano eseguito in locale cambia questa dinamica».

Yang sostiene che questa trasparenza possa estendersi anche all’addestramento stesso.

Se la provenienza dei dati di training viene registrata on-chain, gli utenti possono vedere quali ambienti e contributori hanno plasmato il modello, un antidoto, dice, ai bias e al controllo editoriale opaco che si vede nei sistemi centralizzati.

A suo avviso, il panorama dell’IA finale non sarà dominato da un unico grande modello, ma da “un mare di modelli specializzati” addestrati e posseduti in modo collaborativo.

«Ogni azienda utilizzerà l’IA così come oggi utilizza l’analitica», ha detto Yang. «Quando ciò accadrà, una rete globale di calcolo decentralizzata diventerà l’unico modello che può scalare».

Da leggere dopo: The Aster ETF Hoax That Fooled Even Top Crypto Influencers

Disclaimer e avvertenza sui rischi: Le informazioni fornite in questo articolo sono solo per scopi educativi e informativi e sono basate sull'opinione dell'autore. Non costituiscono consulenza finanziaria, di investimento, legale o fiscale. Gli asset di criptovaluta sono altamente volatili e soggetti ad alto rischio, incluso il rischio di perdere tutto o una parte sostanziale del tuo investimento. Il trading o il possesso di asset crypto potrebbe non essere adatto a tutti gli investitori. Le opinioni espresse in questo articolo sono esclusivamente quelle dell'autore/autori e non rappresentano la politica ufficiale o la posizione di Yellow, dei suoi fondatori o dei suoi dirigenti. Conduci sempre la tua ricerca approfondita (D.Y.O.R.) e consulta un professionista finanziario autorizzato prima di prendere qualsiasi decisione di investimento.
Perché Gradient pensa che in futuro i modelli da mille miliardi di parametri non apparterranno a OpenAI o Google | Yellow.com