OpenAI ra mắt GPT-5.5, vượt Opus 4.7 trong tác vụ agent và 14 bài đánh giá chuẩn

Camille MeulienApr, 23 2026 19:14
OpenAI ra mắt GPT-5.5, vượt Opus 4.7 trong tác vụ agent và 14 bài đánh giá chuẩn

OpenAI đã phát hành GPT-5.5 vào ngày 23/4, giới thiệu mô hình có tên mã "Spud" là hệ thống sắc bén nhất của hãng cho công việc tự động, nhiều bước.

GPT-5.5 thúc đẩy lập trình theo hướng agent

Đợt phát hành lands đúng một tuần sau khi Anthropic pushed Claude Opus 4.7 ra mắt rộng rãi, thiết lập cuộc đối đầu trực tiếp trên khối lượng công việc cho agent, theo TechCrunch và Fortune.

GPT-5.5 được xây dựng để lập kế hoạch, chạy công cụ, tự kiểm tra đầu ra và lặp lại mà không cần nhắc lệnh liên tục.

Chủ tịch Greg Brockman gọi đây là "một lớp trí tuệ mới" trong cuộc gọi với giới báo chí, xem nó như một bước tiến tới "máy tính mang tính agent và trực quan hơn".

Mô hình được triển khai cho ChatGPT Plus, Pro, Business và Enterprise, với biến thể Pro mạnh hơn cũng đã hoạt động. Giá API bắt đầu từ 5 USD cho mỗi triệu token đầu vào và 30 USD cho mỗi triệu token đầu ra trong cửa sổ ngữ cảnh một triệu token.

Cũng nên đọc: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Khoảng cách benchmark với Opus 4.7

Các con số do chính OpenAI công bố, được VentureBeat flagged là dẫn đầu trên 14 bài đánh giá, đặt GPT-5.5 ở mức 82,7% trên Terminal-Bench 2.0, cao hơn đáng kể so với mức 69,4% của Opus 4.7.

Ở FrontierMath Tier 1 đến 3, mô hình mới đạt 51,7%, so với 43,8% của mẫu chủ lực từ Anthropic.

Điểm số về khả năng sử dụng máy tính sít sao hơn, với GPT-5.5 đạt 78,7% trên OSWorld-Verified so với 78,0% của Opus 4.7, dù GPT-5.5 Pro vượt trội rõ rệt trong duyệt web với 90,1% so với 79,3%.

Giới đánh giá vẫn cho rằng Opus 4.7 mạnh hơn ở mảng viết nghiên cứu và tuân thủ hướng dẫn chặt chẽ, cùng khả năng thị giác độ phân giải cao hơn khoảng 3,75 megapixel.

Nhịp độ phát hành đang tightening. GPT-5.5 xuất hiện chỉ sáu tuần sau GPT-5.4. Anthropic tung Opus 4.6 vào tháng 2 trước Opus 4.7, trong khi Google vẫn giữ Gemini 3.1 Pro trong cùng phân khúc doanh nghiệp.

Đọc tiếp: TRON Connects $85B USDT Network To LI.FI In Cross-Chain DeFi Push

Tuyên bố miễn trừ trách nhiệm và cảnh báo rủi ro: Thông tin được cung cấp trong bài viết này chỉ dành cho mục đích giáo dục và thông tin, dựa trên ý kiến của tác giả. Nó không cấu thành lời khuyên tài chính, đầu tư, pháp lý hoặc thuế. Tài sản tiền mã hóa có tính biến động cao và chịu rủi ro cao, bao gồm rủi ro mất tất cả hoặc một phần lớn khoản đầu tư của bạn. Giao dịch hoặc nắm giữ tài sản crypto có thể không phù hợp với tất cả nhà đầu tư. Những quan điểm được bày tỏ trong bài viết này hoàn toàn là của (các) tác giả và không đại diện cho chính sách chính thức hoặc lập trường của Yellow, những người sáng lập hoặc giám đốc điều hành. Luôn tiến hành nghiên cứu kỹ lưỡng của riêng bạn (D.Y.O.R.) và tham khảo ý kiến chuyên gia tài chính được cấp phép trước khi đưa ra bất kỳ quyết định đầu tư nào.
Tin tức mới nhất
Xem tất cả tin tức
Bài viết học tập liên quan
OpenAI ra mắt GPT-5.5, vượt Opus 4.7 trong tác vụ agent và 14 bài đánh giá chuẩn | Yellow.com