Loja de Aplicativos
Carteira

Por que a Render Network diz que o verdadeiro gargalo da IA não é a falta de GPUs, e sim o desperdício de computação

há 1 hora
Por que a Render Network diz que o verdadeiro gargalo da IA não é a falta de GPUs, e sim o desperdício de computação

Um pressuposto persistente em toda a indústria de IA é que o crescimento em breve será limitado por uma escassez global de GPUs de alto desempenho.

No entanto, a restrição que molda a próxima fase do desenvolvimento de IA pode ter menos a ver com escassez absoluta e mais com ineficiência estrutural.

Segundo Render Network’s Trevor Harries-Jones, a maior parte da capacidade computacional do mundo não está sendo usada, uma desconexão que ele vê como mais importante do que as restrições de oferta.

A escassez de GPU mal compreendida

“Quarenta por cento das GPUs do mundo estão ociosas”, ele disse ao Yellow.com em uma entrevista, à margem do evento Breakpoint da Solana. “As pessoas presumem que há escassez, mas na verdade há um excesso de GPUs com desempenho suficiente para fazer trabalhos de renderização e de IA.”

Harries-Jones argumenta que, embora a demanda por chips voltados a treinamento, como o H100 da Nvidia, continue intensa, o treinamento em si representa apenas uma pequena fração das cargas de trabalho de IA no mundo real.

“O treinamento é, na verdade, apenas uma porcentagem muito pequena do uso de IA”, observa. “A inferência ocupa 80 por cento.”

Esse desequilíbrio, ele sugere, abre espaço para que hardware de consumo, GPUs de entrada e novas classes de processadores como LPUs, TPUs e ASICs absorvam muito mais da carga computacional global do que muitos supõem.

Uma segunda mudança que ele destaca é a convergência dos fluxos de trabalho 3D tradicionais com formatos de ativos nativos de IA emergentes.

Criadores empurram a IA para pipelines em nível cinematográfico

Técnicas como Gaussian splatting, que preserva a estrutura 3D subjacente em vez de gerar quadros 2D achatados, e o surgimento de world models estão começando a aproximar os sistemas de IA do pipeline de produção cinematográfica.

Esses avanços importam porque tornam as saídas de IA utilizáveis dentro de cadeias de ferramentas profissionais já existentes, em vez de permanecerem como formatos de novidade isolados.

O tamanho dos modelos continua sendo um desafio, mas Harries-Jones espera que a quantização e a compressão de modelos continuem encolhendo sistemas de pesos abertos até que rodem confortavelmente em dispositivos de consumo.

Modelos menores, diz ele, são essenciais para redes descentralizadas que dependem de RAM e largura de banda distribuídas, em vez de clusters em hiperescalas.

Also Read: Data Shows Bitcoin Enters 'Cost-Basis Cycle' Era As ETFs Redefine Market Structure

Enquanto muitos esperam que a crescente complexidade dos modelos empurre os custos para cima, ele acredita que a dinâmica oposta prevalecerá.

Avanços em treinamento, como os esforços recentes de modelos chineses que priorizaram eficiência em vez de escala, apontam para um futuro em que a IA se torna mais barata mesmo com o uso acelerando.

“À medida que o custo diminui”, ele diz, “você vai ver surgir cada vez mais casos de uso.”

Em vez de escassez de computação, Harries-Jones prevê um ciclo ao estilo paradoxo de Jevons: custos em queda criam mais demanda, e mais demanda incentiva sistemas ainda mais eficientes.

Ele também espera que a computação híbrida, uma mistura de cargas de trabalho em dispositivo, em redes locais e em nuvens centralizadas, defina a próxima etapa da indústria.

De forma semelhante ao modelo de inteligência distribuída da Apple, ambientes diferentes lidarão com tarefas distintas, dependendo de latência, privacidade, sensibilidade e escala.

Cargas de trabalho de missão crítica ainda precisarão de data centers em conformidade, mas tarefas não sensíveis ou em lote podem rodar cada vez mais em redes descentralizadas. Avanços em criptografia podem eventualmente expandir esse limite.

Uma próxima onda de conteúdo 3D em primeiro lugar

No longo prazo, ele vê uma mudança muito mais ampla em curso: a popularização do 3D, impulsionada pela IA.

Harries-Jones espera que a próxima era da IA voltada ao consumidor gire em torno de conteúdo imersivo e nativo em 3D, em vez de texto ou imagens planas.

“Vamos consumir mais conteúdo 3D do que nunca”, diz ele, apontando para sinais iniciais vindos de hardware imersivo e da rápida evolução das ferramentas de IA 3D.

Os gargalos tradicionais de motion graphics, fluxos de trabalho altamente técnicos acessíveis apenas a especialistas de nicho, podem dar lugar a ferramentas que permitem a milhões de usuários produzir cenas em nível cinematográfico.

Criadores, antes resistentes à IA, agora estão experimentando diretamente esses pipelines, acelerando o ritmo de refinamento das ferramentas e moldando como os fluxos de trabalho híbridos evoluem.

O feedback deles, ele argumenta, provavelmente influenciará a direção da indústria tanto quanto as tendências de hardware.

Read Next: Why Gradient Thinks Trillion-Parameter Models Won’t Belong To OpenAI or Google In The Future

Isenção de responsabilidade e aviso de risco: As informações fornecidas neste artigo são apenas para fins educacionais e informativos e são baseadas na opinião do autor. Elas não constituem aconselhamento financeiro, de investimento, jurídico ou tributário. Ativos de criptomoedas são altamente voláteis e sujeitos a alto risco, incluindo o risco de perder todo ou uma quantia substancial do seu investimento. Negociar ou manter ativos cripto pode não ser adequado para todos os investidores. As opiniões expressas neste artigo são exclusivamente do(s) autor(es) e não representam a política oficial ou posição da Yellow, seus fundadores ou seus executivos. Sempre conduza sua própria pesquisa minuciosa (D.Y.O.R.) e consulte um profissional financeiro licenciado antes de tomar qualquer decisão de investimento.
Últimas Notícias
Mostrar Todas as Notícias
Por que a Render Network diz que o verdadeiro gargalo da IA não é a falta de GPUs, e sim o desperdício de computação | Yellow.com