Mô hình open-weight Trung Quốc GLM-5.2 hiện nằm trong số ba mô hình mạnh nhất thế giới, thu hẹp khoảng cách với Claude Mythos của Anthropic và ChatGPT của OpenAI với chỉ một phần nhỏ chi phí.
Các điểm chính:
- GLM-5.2 nằm trong top ba mô hình ngôn ngữ lớn hàng đầu thế giới trên các bảng điểm độc lập.
- Hệ thống open-weight vận hành với chi phí chỉ bằng khoảng một phần mười so với các mô hình Mỹ dẫn đầu.
- Việc ra mắt diễn ra vài ngày sau khi Washington buộc Anthropic phải rút các hệ thống Mythos và Fable khỏi mạng.
GLM-5.2 bước vào nhóm dẫn đầu toàn cầu
Z.ai, nhà phát triển tại Bắc Kinh từng được biết đến với tên Zhipu AI, đã ra mắt GLM-5.2 vào giữa tháng 6, chỉ vài ngày sau khi chính phủ Mỹ yêu cầu Anthropic vô hiệu hóa hai hệ thống mạnh nhất của mình. Nhóm kiểm thử độc lập tại Artificial Analysis đã xếp hạng mô hình open-weight này đứng thứ ba thế giới trên một bảng điểm về công việc thực tế, có giá trị kinh tế, sau hai hệ thống của Anthropic và vượt trên mọi mô hình từ OpenAI và Google.
Kết quả này đã khiến nhiều kỹ sư sửng sốt, những người từng cho rằng các lệnh hạn chế chip sẽ nới rộng khoảng cách chứ không thu hẹp nó, ngay cả khi Mythos và Fable vẫn bị “đóng băng”.
Khoảng cách về giá cũng ấn tượng không kém. GLM-5.2 được định giá khoảng 1,40 USD cho mỗi triệu token đầu vào, so với khoảng 15 USD cho Claude Opus 4.8, và bất kỳ ai cũng có thể tải mô hình về, chỉnh sửa và chạy trên phần cứng riêng, với cửa sổ 1 triệu token được thiết kế cho các tác vụ dài, nhiều bước.
Chính tính mở đó, hơn là sức mạnh thuần túy, đang thuyết phục các nhà phát triển khắp Thung lũng Silicon, những người trước đây coi các hệ thống của Mỹ là lựa chọn nghiêm túc duy nhất cho môi trường sản xuất.
Đọc thêm: Bitcoin rơi xuống dưới 59.000 USD khi lo ngại lãi suất Fed quay lại thị trường crypto
Khoảng cách ở tuyến đầu thu hẹp khi chi phí lao dốc
Với các công ty đang tìm cách cắt giảm hóa đơn AI, khoản tiết kiệm rất khó bỏ qua.
Một nhóm đang trả gần 10.000 USD mỗi tháng cho một hệ thống đóng có thể xử lý khối lượng công việc tương đương với chỉ một phần nhỏ chi phí đó trên mô hình Trung Quốc. Mô hình này chạy trên chip nội địa, vì công ty đã thích ứng phần mềm của mình sau khi các lệnh hạn chế mới nhất cắt quyền tiếp cận phần cứng Nvidia cao cấp.
Nhà sáng lập Z.ai, Đường Kiệt (Tang Jie), đã phản bác nhận định cho rằng phải mất thêm một năm nữa mới đạt được trạng thái “ngang hàng” thực sự, khẳng định thời điểm đó sẽ đến sớm hơn nhiều. Elon Musk, tham gia cùng cuộc trao đổi công khai, dự đoán mốc này vào đầu năm sau, đồng thời cảnh báo rằng các chiến thắng trên bảng điểm không phải lúc nào cũng chuyển hóa thành tính hữu dụng trong đời sống hằng ngày.
Nhiều trở ngại thực tế vẫn tồn tại. Những bài kiểm tra lập luận khó nhất vẫn nghiêng về phía các phòng thí nghiệm Mỹ, và các công ty Mỹ đã cáo buộc đối thủ Trung Quốc vận hành hàng chục nghìn tài khoản giả và gần 29 triệu truy vấn để thu thập đầu ra của mô hình, huấn luyện các bản sao giá rẻ hơn.
Một số nhà phát triển cũng do dự khi phải đưa dữ liệu nhạy cảm đi qua các máy chủ đặt tại Trung Quốc.
Sự trỗi dậy của Trung Quốc đã được xây dựng từ một thời gian. Khoảng 18 tháng trước, DeepSeek đã khiến Thung lũng Silicon bất ngờ khi bắt kịp các hệ thống Mỹ với chỉ một phần nhỏ chi phí, và các mô hình mở từ nước này kể từ đó đã vượt qua các bản phát hành miễn phí của Google và Meta, mở đường cho bước nhảy mới nhất tiến tới tuyến đầu.
Đọc tiếp: AAVE vượt trội Bitcoin khi câu chuyện DeFi lending quay trở lại





