Стійке припущення в індустрії штучного інтелекту полягає в тому, що зростання незабаром буде обмежене глобальною нестачею потужних GPU.
Однак обмеження, яке формує наступну фазу розвитку ІІ, може полягати не стільки в абсолютному дефіциті, скільки у структурній неефективності.
За словами Тревора Гарріса-Джонса з Render Network, більша частина світових обчислювальних потужностей взагалі не використовується — і цей розрив він вважає важливішим за обмеження пропозиції.
Неправильно зрозумілий дефіцит GPU
«Сорок відсотків GPU у світі простоюють», — сказав він в інтерв’ю Yellow.com на полях Breakpoint-заходу від Solana. «Люди думають, що є дефіцит, але насправді існує надлишок GPU, які достатньо продуктивні для рендерингу та ІІ-завдань».
Гарріс-Джонс стверджує, що хоча попит на чипи рівня тренування, такі як H100 від Nvidia, залишається високим, саме тренування становить лише невелику частку реальних навантажень ІІ.
«Тренування — це насправді лише дуже малий відсоток використання ІІ», — зазначає він. «Інференс займає 80 відсотків».
Цей дисбаланс, на його думку, відкриває шлях для споживчого заліза, нижчорівневих GPU та нових класів процесорів — таких як LPU, TPU й ASIC — абсорбувати значно більшу частину глобального обчислювального навантаження, ніж зазвичай вважають.
Друга зміна, на яку він звертає увагу, — це зближення традиційних 3D-потоків роботи з новими ІІ-нативними форматами активів.
Креатори штовхають ІІ до кінематографічних пайплайнів
Такі техніки, як Gaussian splatting, що зберігає базову 3D-структуру замість генерації пласких 2D-кадрів, а також поява world models, починають наближати системи ІІ до кіновиробничого пайплайну.
Ці розробки важливі тим, що вони роблять результати роботи ІІ придатними для використання в існуючих професійних інструментаріях, а не залишають їх окремими, малопридатними форматами-новинками.
Розмір моделей все ще залишається викликом, але Гарріс-Джонс очікує, що квантизація та стискання моделей і надалі зменшуватимуть open-weight системи до тих пір, поки вони комфортно працюватимуть на споживчих пристроях.
Менші моделі, каже він, є критично важливими для децентралізованих мереж, які покладаються на розподілену RAM та пропускну здатність, а не на гіпермасштабні кластери.
Also Read: Data Shows Bitcoin Enters 'Cost-Basis Cycle' Era As ETFs Redefine Market Structure
Попри очікування багатьох, що зростаюча складність моделей підштовхне витрати вгору, він вірить у протилежну динаміку.
Прориви в навчанні, такі як нещодавні китайські моделі, де пріоритет було віддано ефективності, а не масштабу, вказують на майбутнє, у якому ІІ стає дешевшим, навіть коли обсяги використання зростають.
«У міру того як вартість знижується, — каже він, — ви побачите все більше й більше нових сценаріїв використання».
Замість нестачі обчислювальних ресурсів Гарріс-Джонс очікує циклу за парадоксом Джевонса: зниження вартості породжує більший попит, а більший попит стимулює ще ефективніші системи.
Він також прогнозує, що гібридні обчислення — суміш on-device, локальних мережевих і централізованих хмарних навантажень — визначатимуть наступний етап розвитку індустрії.
Подібно до моделі розподіленого інтелекту Apple, різні середовища оброблятимуть різні завдання залежно від затримки, конфіденційності, чутливості та масштабу.
Критично важливі навантаження й надалі вимагатимуть сертифікованих дата-центрів, але некритичні чи пакетні завдання дедалі частіше зможуть виконуватися в децентралізованих мережах. Прориви в галузі шифрування з часом можуть розширити цю межу.
Майбутня хвиля 3D-first контенту
У довшій перспективі він бачить значно ширший зсув: масове поширення 3D, підживлене ІІ.
Гарріс-Джонс очікує, що наступна ера споживчого ІІ буде обертатися навколо занурювального, нативно 3D-контенту, а не тексту чи пласких зображень.
«Ми споживатимемо більше 3D-контенту, ніж будь-коли раніше», — каже він, посилаючись на ранні сигнали з боку занурювального заліза й швидку еволюцію 3D-ІІ-інструментів.
Традиційні вузькі місця motion graphics — високо технічні робочі процеси, доступні лише вузьким фахівцям — можуть поступитися місцем інструментам, які дозволять мільйонам користувачів створювати сцени кінематографічної якості.
Креатори, які спершу опиралися ІІ, тепер безпосередньо експериментують із цими пайплайнами, прискорюючи темп удосконалення інструментів і формуючи те, як розвиватимуться гібридні робочі процеси.
Їхній зворотний зв’язок, на його думку, ймовірно, впливатиме на напрямок розвитку індустрії не менше, ніж тренди в апаратному забезпеченні.
Read Next: Why Gradient Thinks Trillion-Parameter Models Won’t Belong To OpenAI or Google In The Future

