Loja de Aplicativos
Carteira

Por que a Render Network diz que o verdadeiro gargalo da IA não é a falta de GPUs, e sim o desperdício de computação

há 1 hora
Por que a Render Network diz que o verdadeiro gargalo da IA não é a falta de GPUs, e sim o desperdício de computação

Uma suposição persistente em toda a indústria de IA é que o crescimento em breve será limitado por uma escassez global de GPUs de alto desempenho.

No entanto, a limitação que molda a próxima fase do desenvolvimento de IA pode estar menos relacionada à escassez absoluta e mais à ineficiência estrutural.

Segundo Trevor Harries-Jones, da Render Network, a maior parte da capacidade de computação do mundo não está sendo usada, um descompasso que ele considera mais importante do que as restrições de oferta.

A escassez de GPUs mal compreendida

“Quarenta por cento das GPUs do mundo estão ociosas”, ele disse ao Yellow.com em uma entrevista, à margem do evento Breakpoint da Solana. “As pessoas presumem que há escassez, mas na verdade há um excesso de GPUs com desempenho suficiente para fazer trabalhos de renderização e de IA.”

Harries-Jones argumenta que, embora a demanda por chips voltados a treinamento, como o H100 da Nvidia, continue intensa, o treinamento em si representa apenas uma pequena fração das cargas de trabalho reais de IA.

“O treinamento é, na verdade, apenas uma porcentagem muito pequena do uso de IA”, ele observa. “A inferência responde por 80%.”

Esse desequilíbrio, ele sugere, abre espaço para que hardwares de consumo, GPUs de entrada e novas classes de processadores, como LPUs, TPUs e ASICs, absorvam muito mais da carga global de computação do que muitos imaginam.

Uma segunda mudança que ele destaca é a convergência entre fluxos de trabalho 3D tradicionais e formatos de ativos nativos de IA emergentes.

Criadores empurram a IA para pipelines em nível cinematográfico

Técnicas como Gaussian splatting, que preserva a estrutura 3D subjacente em vez de gerar quadros 2D achatados, e o surgimento de world models estão começando a aproximar os sistemas de IA do pipeline de produção cinematográfica.

Esses desenvolvimentos são importantes porque tornam as saídas de IA utilizáveis em ferramentas profissionais já existentes, em vez de permanecerem como formatos curiosos e isolados.

O tamanho dos modelos continua sendo um desafio, mas Harries-Jones espera que a quantização e a compressão de modelos continuem reduzindo os sistemas de pesos abertos até que rodem confortavelmente em dispositivos de consumo.

Modelos menores, diz ele, são essenciais para redes descentralizadas que dependem de RAM e largura de banda distribuídas, em vez de megacentros de dados em hiperescala.

Also Read: Data Shows Bitcoin Enters 'Cost-Basis Cycle' Era As ETFs Redefine Market Structure

Enquanto muitos esperam que a crescente complexidade dos modelos faça os custos subirem, ele acredita que a dinâmica oposta vai prevalecer.

Avanços em treinamento, como esforços recentes de modelos chineses que priorizaram eficiência em vez de escala, apontam para um futuro em que a IA se torna mais barata mesmo à medida que o uso acelera.

“À medida que o custo diminui”, ele diz, “você vai ver cada vez mais casos de uso surgirem.”

Em vez de escassez de computação, Harries-Jones prevê um ciclo ao estilo do paradoxo de Jevons: custos em queda criam mais demanda, e mais demanda incentiva sistemas ainda mais eficientes.

Ele também espera que a computação híbrida, uma mistura de cargas de trabalho em dispositivo, em rede local e em nuvem centralizada, defina a próxima etapa da indústria.

De forma semelhante ao modelo de inteligência distribuída da Apple, ambientes diferentes vão lidar com tarefas distintas, dependendo de latência, privacidade, sensibilidade e escala.

Cargas de trabalho críticas ainda vão exigir data centers em conformidade regulatória, mas tarefas não sensíveis ou em lote poderão, cada vez mais, rodar em redes descentralizadas. Avanços em criptografia podem eventualmente expandir esse limite.

Uma próxima onda de conteúdo 3D-first

A longo prazo, ele enxerga uma mudança muito mais ampla em andamento: a popularização do 3D, impulsionada por IA.

Harries-Jones espera que a próxima era da IA voltada ao consumidor gire em torno de conteúdo imersivo e nativo em 3D, em vez de texto ou imagens planas.

“Vamos consumir mais conteúdo 3D do que nunca”, ele diz, apontando para sinais iniciais vindos de hardwares imersivos e da rápida evolução das ferramentas de IA para 3D.

Os gargalos tradicionais do motion graphics — fluxos de trabalho altamente técnicos, acessíveis apenas a especialistas de nicho — podem dar lugar a ferramentas que permitam a milhões de usuários produzir cenas em nível cinematográfico.

Criadores que antes resistiam à IA agora estão experimentando diretamente esses pipelines, acelerando o ritmo de refinamento das ferramentas e moldando como os fluxos de trabalho híbridos evoluem.

O feedback deles, ele argumenta, provavelmente vai influenciar a direção da indústria tanto quanto as tendências de hardware.

Read Next: Why Gradient Thinks Trillion-Parameter Models Won’t Belong To OpenAI or Google In The Future

Disclaimer e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e baseiam-se na opinião do autor. Não constituem aconselhamento financeiro, de investimento, legal ou fiscal. Os ativos de criptomoeda são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou deter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou executivos. Sempre conduza a sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Últimas Notícias
Mostrar Todas as Notícias
Por que a Render Network diz que o verdadeiro gargalo da IA não é a falta de GPUs, e sim o desperdício de computação | Yellow.com