Магазин додатків
Гаманець

Чому Render Network вважає, що справжнє вузьке місце ІІ — не нестача GPU, а марнування обчислювальних ресурсів

Чому Render Network вважає, що справжнє вузьке місце ІІ — не нестача GPU, а марнування обчислювальних ресурсів

Стійке припущення в індустрії штучного інтелекту полягає в тому, що зростання незабаром буде обмежене глобальною нестачею потужних GPU.

Однак обмеження, яке формує наступну фазу розвитку ІІ, може полягати не стільки в абсолютному дефіциті, скільки у структурній неефективності.

За словами Тревора Гарріса-Джонса з Render Network, більша частина світових обчислювальних потужностей взагалі не використовується — і цей розрив він вважає важливішим за обмеження пропозиції.

Неправильно зрозумілий дефіцит GPU

«Сорок відсотків GPU у світі простоюють», — сказав він в інтерв’ю Yellow.com на полях Breakpoint-заходу від Solana. «Люди думають, що є дефіцит, але насправді існує надлишок GPU, які достатньо продуктивні для рендерингу та ІІ-завдань».

Гарріс-Джонс стверджує, що хоча попит на чипи рівня тренування, такі як H100 від Nvidia, залишається високим, саме тренування становить лише невелику частку реальних навантажень ІІ.

«Тренування — це насправді лише дуже малий відсоток використання ІІ», — зазначає він. «Інференс займає 80 відсотків».

Цей дисбаланс, на його думку, відкриває шлях для споживчого заліза, нижчорівневих GPU та нових класів процесорів — таких як LPU, TPU й ASIC — абсорбувати значно більшу частину глобального обчислювального навантаження, ніж зазвичай вважають.

Друга зміна, на яку він звертає увагу, — це зближення традиційних 3D-потоків роботи з новими ІІ-нативними форматами активів.

Креатори штовхають ІІ до кінематографічних пайплайнів

Такі техніки, як Gaussian splatting, що зберігає базову 3D-структуру замість генерації пласких 2D-кадрів, а також поява world models, починають наближати системи ІІ до кіновиробничого пайплайну.

Ці розробки важливі тим, що вони роблять результати роботи ІІ придатними для використання в існуючих професійних інструментаріях, а не залишають їх окремими, малопридатними форматами-новинками.

Розмір моделей все ще залишається викликом, але Гарріс-Джонс очікує, що квантизація та стискання моделей і надалі зменшуватимуть open-weight системи до тих пір, поки вони комфортно працюватимуть на споживчих пристроях.

Менші моделі, каже він, є критично важливими для децентралізованих мереж, які покладаються на розподілену RAM та пропускну здатність, а не на гіпермасштабні кластери.

Also Read: Data Shows Bitcoin Enters 'Cost-Basis Cycle' Era As ETFs Redefine Market Structure

Попри очікування багатьох, що зростаюча складність моделей підштовхне витрати вгору, він вірить у протилежну динаміку.

Прориви в навчанні, такі як нещодавні китайські моделі, де пріоритет було віддано ефективності, а не масштабу, вказують на майбутнє, у якому ІІ стає дешевшим, навіть коли обсяги використання зростають.

«У міру того як вартість знижується, — каже він, — ви побачите все більше й більше нових сценаріїв використання».

Замість нестачі обчислювальних ресурсів Гарріс-Джонс очікує циклу за парадоксом Джевонса: зниження вартості породжує більший попит, а більший попит стимулює ще ефективніші системи.

Він також прогнозує, що гібридні обчислення — суміш on-device, локальних мережевих і централізованих хмарних навантажень — визначатимуть наступний етап розвитку індустрії.

Подібно до моделі розподіленого інтелекту Apple, різні середовища оброблятимуть різні завдання залежно від затримки, конфіденційності, чутливості та масштабу.

Критично важливі навантаження й надалі вимагатимуть сертифікованих дата-центрів, але некритичні чи пакетні завдання дедалі частіше зможуть виконуватися в децентралізованих мережах. Прориви в галузі шифрування з часом можуть розширити цю межу.

Майбутня хвиля 3D-first контенту

У довшій перспективі він бачить значно ширший зсув: масове поширення 3D, підживлене ІІ.

Гарріс-Джонс очікує, що наступна ера споживчого ІІ буде обертатися навколо занурювального, нативно 3D-контенту, а не тексту чи пласких зображень.

«Ми споживатимемо більше 3D-контенту, ніж будь-коли раніше», — каже він, посилаючись на ранні сигнали з боку занурювального заліза й швидку еволюцію 3D-ІІ-інструментів.

Традиційні вузькі місця motion graphics — високо технічні робочі процеси, доступні лише вузьким фахівцям — можуть поступитися місцем інструментам, які дозволять мільйонам користувачів створювати сцени кінематографічної якості.

Креатори, які спершу опиралися ІІ, тепер безпосередньо експериментують із цими пайплайнами, прискорюючи темп удосконалення інструментів і формуючи те, як розвиватимуться гібридні робочі процеси.

Їхній зворотний зв’язок, на його думку, ймовірно, впливатиме на напрямок розвитку індустрії не менше, ніж тренди в апаратному забезпеченні.

Read Next: Why Gradient Thinks Trillion-Parameter Models Won’t Belong To OpenAI or Google In The Future

Відмова від відповідальності та попередження про ризики: Інформація, надана в цій статті, призначена лише для освітніх та інформаційних цілей і базується на думці автора. Вона не є фінансовою, інвестиційною, правовою чи податковою консультацією. Криптоактиви є надзвичайно волатильними та піддаються високому ризику, включаючи ризик втрати всіх або значної частини ваших інвестицій. Торгівля або утримання криптоактивів може не підходити для всіх інвесторів. Думки, висловлені в цій статті, належать виключно автору(ам) і не представляють офіційну політику чи позицію Yellow, її засновників або керівників. Завжди проводьте власне ретельне дослідження (D.Y.O.R.) та консультуйтесь з ліцензованим фінансовим фахівцем перед прийняттям будь-яких інвестиційних рішень.