Gemini 3.5 Flash kém Claude Opus 4.7 hai điểm nhưng chỉ bằng một phần ba chi phí

Google phát hành Gemini 3.5 Flash tại I/O, đạt 55 điểm trên Intelligence Index của Artificial Analysis, tiến rất gần các đối thủ từ Anthropic và OpenAI.

Giá Gemini Flash

Mô hình được triển khai ra sử dụng rộng rãi trên Gemini API, Google AI Studio, Antigravity, Vertex AI và AI Mode trong Search. Giá là 1,50 USD cho mỗi một triệu token đầu vào và 9,00 USD cho mỗi một triệu token đầu ra, tức khoảng một phần ba so với mức GPT-5.5 đang tính là 5,00 USD và 30,00 USD. Anthropic tính 5 USD và 25 USD cho mỗi một triệu token đầu vào và đầu ra cho Claude Opus 4.7, khiến mức giá mới của Google cũng chỉ khoảng một phần ba mức đó.

Independent benchmarker Artificial Analysis placed mô hình ở mức 55 điểm trên thang điểm trí tuệ tổng hợp của họ, cao hơn chín điểm so với Gemini 3 Flash đời cũ.

Điều này đặt nó ở cách Claude Opus 4.7 hai điểm và cách GPT-5.5 năm điểm.

Bản phát hành này được đưa lên làm mô hình mặc định trong ứng dụng Gemini và trong AI Mode trên toàn cầu.

Cũng nên đọc: Twenty One Capital Becomes Tether's Bitcoin Arm As SoftBank Walks Away

Bản Pro sắp ra mắt

Google cho biết một phiên bản Pro đang được sử dụng nội bộ và sẽ ra mắt vào tháng tới. Nếu Flash đã đạt 55 điểm, thì bản Pro nhiều khả năng sẽ tiến vào vùng frontier hiện do Claude Opus 4.7 và GPT-5.5 chiếm giữ.

Giám đốc công nghệ của DeepMind, Koray Kavukcuoglu, nói với báo chí rằng mô hình Flash “vượt trội hơn mô hình frontier mới nhất của chúng tôi, 3.1 Pro, trên gần như mọi bảng điểm chuẩn.” Google báo cáo các điểm số 76,2% trên Terminal-Bench 2.1, 83,6% trên MCP Atlas, và 1.656 Elo trên GDPval-AA, tất cả đều vượt flagship tháng Hai.

Áp lực từ đối thủ

Đợt ra mắt diễn ra vào lúc người dùng đang phản đối các flagship giá cao. Anthropic phát hành Claude Opus 4.7 ngày 16/4, và chỉ trong 48 giờ các nhà phát triển đã ghi nhận mức “đốt token” cao hơn 1,5 đến 3 lần so với Opus 4.6 cùng với các báo cáo về đầu ra sai nhưng rất tự tin. OpenAI đã tăng gấp đôi giá API cho flagship của mình với bản GPT-5.5, kéo theo những chỉ trích tương tự từ khách hàng API.

Công cụ nhà phát triển của Google đã dần mất vị thế trước Claude Code và Codex của OpenAI trong cuối 2025 và đầu 2026, với Gemini 3.1 Pro nhận được phản hồi cộng đồng trái chiều dù điểm số trên bài báo rất ấn tượng. Người dùng báo cáo hành vi thiếu ổn định trong các khung thử nghiệm bên thứ ba, cho rằng giọng hội thoại có phần “lạnh lùng, lâm sàng” hơn trong các bài test định tính.

Cách đặt tên Flash trước đây từng ám chỉ một dòng mô hình nhỏ hơn, rẻ hơn. Với việc 3.5 Flash hiện đang vượt mặt flagship Pro trước đó trên các bộ bài kiểm tra lập trình và agent, ranh giới đó dường như đang mờ dần trong danh mục mô hình của Google.

Đọc tiếp: Security Experts Pour Cold Water On Claude Mythos Hacking Apocalypse