App Store
Portafoglio

Perché Render Network sostiene che il vero collo di bottiglia dell'IA non è la carenza di GPU ma il calcolo sprecato

Perché Render Network sostiene che il vero collo di bottiglia dell'IA non è la carenza di GPU ma il calcolo sprecato

Un presupposto radicato nell’industria dell’IA è che la crescita sarà presto limitata da una carenza globale di GPU di fascia alta.

Eppure il vincolo che sta plasmando la prossima fase di sviluppo dell’IA potrebbe dipendere meno dalla scarsità assoluta e più dall’inefficienza strutturale.

Secondo Render Network e Trevor Harries-Jones, gran parte della capacità di calcolo mondiale non viene utilizzata affatto, una discrepanza che lui considera più importante dei limiti di offerta.

La carenza di GPU fraintesa

«Il quaranta per cento delle GPU nel mondo è inattivo», ha detto a Yellow.com in un’intervista, a margine dell’evento Breakpoint di Solana. «La gente presume che ci sia una carenza, ma in realtà c’è un eccesso di GPU abbastanza performanti da gestire rendering e lavori di IA».

Harries-Jones sostiene che, sebbene la domanda per chip adatti all’addestramento, come le H100 di Nvidia, resti intensa, l’addestramento rappresenta solo una piccola frazione dei carichi di lavoro di IA nel mondo reale.

«L’addestramento è in realtà solo una percentuale molto piccola dell’utilizzo dell’IA», osserva. «L’inferenza occupa l’80 per cento».

Questo squilibrio, suggerisce, apre la porta a hardware consumer, GPU di fascia più bassa e nuove classi di processori come LPU, TPU e ASIC, che possono assorbire molto più carico di calcolo globale di quanto molti immaginino.

Un secondo cambiamento che evidenzia è la convergenza tra i flussi di lavoro 3D tradizionali e i formati di asset nativi per l’IA emergenti.

I creator spingono l’IA verso pipeline di livello cinematografico

Tecniche come il Gaussian splatting, che preserva la struttura 3D sottostante invece di generare fotogrammi 2D appiattiti, e l’emergere dei world model stanno iniziando ad avvicinare i sistemi di IA alla pipeline di produzione cinematografica.

Questi sviluppi sono importanti perché rendono gli output dell’IA utilizzabili all’interno delle toolchain professionali esistenti, invece di restare formati di novità isolati.

La dimensione dei modelli rimane una sfida, ma Harries-Jones prevede che quantizzazione e compressione dei modelli continueranno a ridurre i sistemi open-weight fino a farli girare comodamente su dispositivi consumer.

Modelli più piccoli, afferma, sono essenziali per le reti decentralizzate che si basano su RAM e banda distribuite anziché su cluster hyperscale.

Also Read: Data Shows Bitcoin Enters 'Cost-Basis Cycle' Era As ETFs Redefine Market Structure

Dove molti si aspettano che la complessità crescente dei modelli spinga i costi verso l’alto, lui ritiene che prevarrà la dinamica opposta.

I progressi nell’addestramento, come i recenti sforzi sui modelli cinesi che hanno privilegiato l’efficienza rispetto alla scala, indicano un futuro in cui l’IA diventa più economica anche mentre l’utilizzo accelera.

«Man mano che il costo diminuisce», dice, «vedrai emergere sempre più casi d’uso».

Piuttosto che scarsità di calcolo, Harries-Jones prevede un ciclo in stile paradosso di Jevons: il calo dei costi genera più domanda, e una domanda maggiore incentiva sistemi ancora più efficienti.

Si aspetta inoltre che il calcolo ibrido, un mix di carichi di lavoro on-device, su rete locale e su cloud centralizzato, definisca la prossima fase del settore.

Simile al modello di intelligenza distribuita di Apple, ambienti diversi gestiranno compiti diversi in base a latenza, privacy, sensibilità e scala.

I carichi di lavoro mission-critical richiederanno ancora data center conformi, ma quelli non sensibili o batch potranno sempre più girare su reti decentralizzate. I progressi nella crittografia potrebbero alla lunga ampliare quel perimetro.

Un’imminente ondata di contenuti 3D-first

Nel lungo periodo, vede in corso un cambiamento molto più ampio: la diffusione mainstream del 3D, alimentata dall’IA.

Harries-Jones si aspetta che la prossima era dell’IA rivolta ai consumatori ruoti attorno a contenuti immersivi e nativi 3D piuttosto che testo o immagini piatte.

«Consumeremo più contenuti 3D che mai», afferma, indicando i primi segnali dall’hardware immersivo e la rapida evoluzione degli strumenti 3D-IA.

I tradizionali colli di bottiglia della motion graphic, flussi di lavoro altamente tecnici accessibili solo a esperti di nicchia, potrebbero lasciare spazio a strumenti che permetteranno a milioni di utenti di produrre scene di livello cinematografico.

I creator, un tempo restii all’IA, ora stanno sperimentando direttamente queste pipeline, accelerando il ritmo di perfezionamento degli strumenti e plasmando l’evoluzione dei flussi di lavoro ibridi.

Il loro feedback, sostiene, probabilmente influenzerà la direzione del settore tanto quanto le tendenze hardware.

Read Next: Why Gradient Thinks Trillion-Parameter Models Won’t Belong To OpenAI or Google In The Future

Disclaimer e avvertenza sui rischi: Le informazioni fornite in questo articolo sono solo per scopi educativi e informativi e sono basate sull'opinione dell'autore. Non costituiscono consulenza finanziaria, di investimento, legale o fiscale. Gli asset di criptovaluta sono altamente volatili e soggetti ad alto rischio, incluso il rischio di perdere tutto o una parte sostanziale del tuo investimento. Il trading o il possesso di asset crypto potrebbe non essere adatto a tutti gli investitori. Le opinioni espresse in questo articolo sono esclusivamente quelle dell'autore/autori e non rappresentano la politica ufficiale o la posizione di Yellow, dei suoi fondatori o dei suoi dirigenti. Conduci sempre la tua ricerca approfondita (D.Y.O.R.) e consulta un professionista finanziario autorizzato prima di prendere qualsiasi decisione di investimento.
Perché Render Network sostiene che il vero collo di bottiglia dell'IA non è la carenza di GPU ma il calcolo sprecato | Yellow.com