Vì sao Render Network cho rằng nút thắt thật sự của AI không phải thiếu GPU mà là năng lực tính toán bị lãng phí

profile-murtuza-merchant
Murtuza Merchant2 giờ trước
Vì sao Render Network cho rằng nút thắt thật sự của AI không phải thiếu GPU mà là năng lực tính toán bị lãng phí

Một giả định dai dẳng trong ngành AI là tăng trưởng sớm muộn cũng sẽ bị kìm hãm bởi tình trạng thiếu GPU cao cấp trên toàn cầu.

Tuy nhiên, ràng buộc định hình giai đoạn phát triển tiếp theo của AI có thể ít liên quan đến sự khan hiếm tuyệt đối hơn là sự kém hiệu quả mang tính cấu trúc.

Theo Trevor Harries-Jones của Render Network, phần lớn năng lực tính toán của thế giới hiện không được sử dụng, một khoảng cách mà ông xem là quan trọng hơn nhiều so với giới hạn về nguồn cung.

Sự thiếu hụt GPU bị hiểu sai

“Bốn mươi phần trăm GPU trên thế giới đang nhàn rỗi,” ông nói với Yellow.com trong một cuộc phỏng vấn bên lề sự kiện Breakpoint của Solana. “Mọi người cho rằng đang thiếu hụt, nhưng thực tế là đang có dư thừa GPU đủ mạnh để xử lý các tác vụ render và AI.”

Harries-Jones lập luận rằng dù nhu cầu với các chip phục vụ huấn luyện như H100 của Nvidia vẫn cực kỳ cao, bản thân việc huấn luyện chỉ chiếm một phần rất nhỏ trong khối lượng công việc AI ngoài đời thực.

“Huấn luyện thực ra chỉ là một tỷ lệ rất nhỏ trong mức sử dụng AI,” ông lưu ý. “Suy luận (inference) chiếm tới 80%.”

Ông cho rằng sự mất cân đối đó mở ra cơ hội cho phần cứng người dùng, GPU tầm thấp hơn và các lớp chip mới như LPU, TPU và ASIC hấp thụ nhiều tải tính toán toàn cầu hơn nhiều so với những gì người ta vẫn nghĩ.

Sự dịch chuyển thứ hai mà ông nêu bật là sự hội tụ giữa quy trình làm việc 3D truyền thống với các định dạng tài sản gốc AI đang nổi lên.

Người sáng tạo đẩy AI tiến gần pipeline điện ảnh

Các kỹ thuật như Gaussian splatting, vốn giữ lại cấu trúc 3D bên dưới thay vì tạo ra các khung hình 2D phẳng, cùng với sự xuất hiện của các world model đang kéo hệ thống AI xích lại gần hơn pipeline sản xuất điện ảnh.

Những phát triển này quan trọng vì chúng khiến đầu ra AI có thể sử dụng được trong các chuỗi công cụ chuyên nghiệp sẵn có, thay vì chỉ tồn tại như các định dạng “đồ chơi” tách biệt.

Kích thước mô hình vẫn là một thách thức, nhưng Harries-Jones kỳ vọng kỹ thuật lượng tử hóa (quantization) và nén mô hình sẽ tiếp tục thu nhỏ các hệ thống open-weight cho tới khi chúng chạy ổn định trên thiết bị tiêu dùng.

Ông nói, mô hình nhỏ hơn là yếu tố cốt lõi với các mạng lưới phi tập trung, vốn dựa vào RAM và băng thông phân tán thay vì các cụm hyperscale.

Also Read: Data Shows Bitcoin Enters 'Cost-Basis Cycle' Era As ETFs Redefine Market Structure

Trong khi nhiều người kỳ vọng độ phức tạp tăng lên của mô hình sẽ đẩy chi phí cao hơn, ông lại tin động lực ngược lại mới là xu hướng chủ đạo.

Các đột phá trong huấn luyện, chẳng hạn như những nỗ lực gần đây từ các nhóm mô hình Trung Quốc ưu tiên hiệu suất hơn là quy mô, đang gợi mở tương lai nơi AI trở nên rẻ hơn ngay cả khi mức sử dụng tăng tốc.

“Khi chi phí giảm xuống,” ông nói, “bạn sẽ thấy ngày càng nhiều trường hợp sử dụng xuất hiện.”

Thay vì sự khan hiếm tính toán, Harries-Jones dự đoán một chu kỳ kiểu nghịch lý Jevons: chi phí giảm tạo ra nhiều nhu cầu hơn, còn nhu cầu tăng lại khuyến khích các hệ thống ngày càng hiệu quả hơn.

Ông cũng kỳ vọng mô hình tính toán lai (hybrid compute), kết hợp giữa xử lý trên thiết bị, trong mạng cục bộ và trên đám mây tập trung, sẽ định hình giai đoạn tiếp theo của ngành.

Tương tự mô hình “trí tuệ phân tán” của Apple, các môi trường khác nhau sẽ xử lý các tác vụ khác nhau tùy theo độ trễ, quyền riêng tư, mức độ nhạy cảm và quy mô.

Những khối lượng công việc có tính sống còn vẫn sẽ cần các trung tâm dữ liệu tuân thủ chặt chẽ, nhưng các tác vụ không nhạy cảm hoặc xử lý theo lô ngày càng có thể chạy trên mạng lưới phi tập trung. Các tiến bộ về mã hóa có thể dần mở rộng ranh giới này.

Làn sóng nội dung 3D-first sắp đến

Về dài hạn, ông nhìn thấy một sự chuyển dịch rộng lớn hơn: 3D trở thành dòng chủ lưu, được AI thúc đẩy.

Harries-Jones kỳ vọng kỷ nguyên tiếp theo của AI hướng tới người dùng sẽ xoay quanh nội dung nhập vai, gốc 3D hơn là văn bản hoặc hình ảnh phẳng.

“Chúng ta sẽ tiêu thụ nội dung 3D nhiều hơn bao giờ hết,” ông nói, chỉ ra các tín hiệu sớm từ phần cứng nhập vai và tốc độ phát triển nhanh của bộ công cụ 3D-AI.

Những nút thắt truyền thống của motion graphics – các quy trình làm việc kỹ thuật cao chỉ dành cho số ít chuyên gia – có thể sẽ nhường chỗ cho các công cụ cho phép hàng triệu người dùng tạo ra cảnh quay đạt chuẩn điện ảnh.

Những người sáng tạo, trước đây còn dè dặt với AI, giờ đang trực tiếp thử nghiệm với các pipeline này, tăng tốc quá trình hoàn thiện công cụ và định hình cách các quy trình lai tiến hóa.

Ông lập luận rằng phản hồi của họ nhiều khả năng sẽ ảnh hưởng đến hướng đi của ngành không kém gì các xu hướng phần cứng.

Read Next: Why Gradient Thinks Trillion-Parameter Models Won’t Belong To OpenAI or Google In The Future

Tuyên bố miễn trừ trách nhiệm và cảnh báo rủi ro: Thông tin được cung cấp trong bài viết này chỉ dành cho mục đích giáo dục và thông tin, dựa trên ý kiến của tác giả. Nó không cấu thành lời khuyên tài chính, đầu tư, pháp lý hoặc thuế. Tài sản tiền mã hóa có tính biến động cao và chịu rủi ro cao, bao gồm rủi ro mất tất cả hoặc một phần lớn khoản đầu tư của bạn. Giao dịch hoặc nắm giữ tài sản crypto có thể không phù hợp với tất cả nhà đầu tư. Những quan điểm được bày tỏ trong bài viết này hoàn toàn là của (các) tác giả và không đại diện cho chính sách chính thức hoặc lập trường của Yellow, những người sáng lập hoặc giám đốc điều hành. Luôn tiến hành nghiên cứu kỹ lưỡng của riêng bạn (D.Y.O.R.) và tham khảo ý kiến chuyên gia tài chính được cấp phép trước khi đưa ra bất kỳ quyết định đầu tư nào.
Tin tức mới nhất
Xem tất cả tin tức