Por qué Render Network afirma que el verdadero cuello de botella de la IA no es la escasez de GPU, sino el cómputo desperdiciado

hace 1 hora
Por qué Render Network afirma que el verdadero cuello de botella de la IA no es la escasez de GPU, sino el cómputo desperdiciado

Una suposición persistente en toda la industria de la IA es que el crecimiento pronto se verá limitado por una escasez global de GPU de gama alta.

Sin embargo, la restricción que moldea la próxima fase del desarrollo de la IA puede tener menos que ver con la escasez absoluta que con la ineficiencia estructural.

Según Render Network y Trevor Harries-Jones, la mayor parte de la capacidad de cómputo del mundo no se está utilizando en absoluto, una desconexión que considera más importante que las limitaciones de oferta.

La escasez de GPU mal entendida

«El cuarenta por ciento de las GPU del mundo están inactivas», dijo a Yellow.com en una entrevista, al margen del evento Breakpoint de Solana. «La gente asume que hay una escasez, pero en realidad hay un exceso de GPU lo bastante potentes para hacer trabajos de renderizado y de IA».

Harries-Jones sostiene que, aunque la demanda de chips de entrenamiento de alto nivel como el H100 de Nvidia sigue siendo intensa, el entrenamiento en sí representa solo una pequeña fracción de las cargas de trabajo reales de la IA.

«El entrenamiento es en realidad solo un porcentaje muy pequeño del uso de la IA», señala. «La inferencia ocupa el 80 por ciento».

Esa desproporción, sugiere, abre la puerta para que el hardware de consumo, las GPU de gama baja y nuevas clases de procesadores como las LPU, TPU y ASIC absorban mucha más carga de cómputo global de lo que muchos suponen.

Un segundo cambio que destaca es la convergencia de los flujos de trabajo 3D tradicionales con los formatos de activos nativos de IA emergentes.

Los creadores empujan la IA hacia pipelines de nivel cinematográfico

Técnicas como el Gaussian splatting, que preserva la estructura 3D subyacente en lugar de generar fotogramas 2D planos, y la aparición de world models están empezando a acercar los sistemas de IA al pipeline de producción cinematográfica.

Estos avances importan porque hacen que las salidas de la IA sean utilizables dentro de las cadenas de herramientas profesionales existentes en lugar de quedar como formatos novedosos aislados.

El tamaño de los modelos sigue siendo un reto, pero Harries-Jones espera que la cuantización y la compresión de modelos sigan reduciendo los sistemas de pesos abiertos hasta que se ejecuten cómodamente en dispositivos de consumo.

Los modelos más pequeños, dice, son esenciales para las redes descentralizadas que dependen de RAM y ancho de banda distribuidos en lugar de clústeres hiperescalados.

Also Read: Data Shows Bitcoin Enters 'Cost-Basis Cycle' Era As ETFs Redefine Market Structure

Donde muchos esperan que la creciente complejidad de los modelos impulse los costos al alza, él cree que dominará la dinámica opuesta.

Los avances en entrenamiento, como los esfuerzos recientes con modelos chinos que priorizaron la eficiencia sobre la escala, apuntan a un futuro en el que la IA se abarata incluso cuando se acelera su uso.

«A medida que el costo disminuya», dice, «vas a ver que surgen cada vez más casos de uso».

En lugar de escasez de cómputo, Harries-Jones anticipa un ciclo tipo paradoja de Jevons: la caída de costos crea más demanda, y más demanda incentiva sistemas aún más eficientes.

También espera que el cómputo híbrido, una mezcla de cargas de trabajo en el dispositivo, en redes locales y en nubes centralizadas, defina la próxima etapa de la industria.

Similar al modelo de inteligencia distribuida de Apple, distintos entornos manejarán diferentes tareas según la latencia, la privacidad, la sensibilidad y la escala.

Las cargas de trabajo de misión crítica seguirán requiriendo centros de datos conformes, pero las tareas no sensibles o por lotes podrán ejecutarse cada vez más en redes descentralizadas. Los avances en cifrado podrían ampliar finalmente ese límite.

Una ola inminente de contenido 3D-first

A más largo plazo, ve en marcha un cambio mucho más amplio: la generalización del 3D, impulsada por la IA.

Harries-Jones espera que la próxima era de la IA orientada al consumidor gire en torno a contenido inmersivo y nativo en 3D en lugar de texto o imágenes planas.

«Vamos a consumir más contenido 3D que nunca», afirma, señalando las primeras señales del hardware inmersivo y la rápida evolución de las herramientas de IA para 3D.

Los cuellos de botella tradicionales de los motion graphics, flujos de trabajo altamente técnicos accesibles solo a expertos de nicho, pueden dar paso a herramientas que permitan a millones de usuarios producir escenas de calidad cinematográfica.

Los creadores, antes reacios a la IA, ahora experimentan directamente con estos pipelines, acelerando el ritmo de refinamiento de las herramientas y dando forma a cómo evolucionan los flujos de trabajo híbridos.

Su retroalimentación, sostiene, probablemente influya en la dirección de la industria tanto como las tendencias de hardware.

Read Next: Why Gradient Thinks Trillion-Parameter Models Won’t Belong To OpenAI or Google In The Future

Descargo de responsabilidad y advertencia de riesgos: La información proporcionada en este artículo es solo para propósitos educativos e informativos y se basa en la opinión del autor. No constituye asesoramiento financiero, de inversión, legal o fiscal. Los activos de criptomonedas son altamente volátiles y están sujetos a alto riesgo, incluido el riesgo de perder toda o una cantidad sustancial de su inversión. Operar o mantener activos cripto puede no ser adecuado para todos los inversores. Las opiniones expresadas en este artículo son únicamente las del autor/autores y no representan la política oficial o posición de Yellow, sus fundadores o sus ejecutivos. Siempre realice su propia investigación exhaustiva (D.Y.O.R.) y consulte a un profesional financiero licenciado antes de tomar cualquier decisión de inversión.
Últimas noticias
Ver todas las noticias
Por qué Render Network afirma que el verdadero cuello de botella de la IA no es la escasez de GPU, sino el cómputo desperdiciado | Yellow.com