Google 在 I/O 大會上推出 Gemini 3.5 Flash,在 Artificial Analysis 的 Intelligence Index 中取得 55 分,與Anthropic 和 OpenAI 對手的差距已相當接近。
Gemini Flash 定價
該模型已正式上線,可透過 Gemini API、Google AI Studio、Antigravity、Vertex AI,以及搜尋中的 AI Mode 使用。定價為每一百萬個輸入 token 1.50 美元、每一百萬個輸出 token 9.00 美元,大約是 GPT-5.5(輸入 5.00 美元、輸出 30.00 美元)收費的三分之一。Anthropic 的 Claude Opus 4.7 則是每一百萬個輸入與輸出 token 分別收取 5 美元和 25 美元,令 Google 這個新等級的定價同樣約為其三分之一。
獨立評測機構 Artificial Analysis 將 該模型的綜合智能分數評為 55 分,比舊款 Gemini 3 Flash 高出 9 分。
這使它只比 Claude Opus 4.7 低 2 分,比 GPT-5.5 低 5 分。
這次發佈同時令它成為 Gemini App 與全球 AI Mode 的預設模型。
延伸閱讀:Twenty One Capital Becomes Tether's Bitcoin Arm As SoftBank Walks Away
Pro 等級即將登場
Google 表示,一款 Pro 版本目前已在內部使用,並將於下個月推出。若 Flash 已經能拿到 55 分,Pro 版本很可能會推進到目前由 Claude Opus 4.7 和 GPT-5.5 佔據的前沿區間。
DeepMind 技術總監 Koray Kavukcuoglu 向記者表示,Flash 模型「在幾乎所有基準測試上,都超越我們最新的前沿模型 3.1 Pro。」Google 公佈 的成績包括:Terminal-Bench 2.1 得分 76.2%、MCP Atlas 得分 83.6%、GDPval-AA Elo 分數 1,656,全部都超過今年二月的旗艦模型。
競爭壓力
這次發佈正值使用者對高價旗艦模型的反彈期。Anthropic 於 4 月 16 日推出 Claude Opus 4.7,在 48 小時內就有開發者回報 token 耗用較 Opus 4.6 高出 1.5 至 3 倍,同時出現高自信卻錯誤的輸出。OpenAI 在推出 GPT-5.5 的同時,將旗艦 API 價格加倍,引起 API 客戶類似的批評。
在 2025 年底到 2026 年初期間,Google 的開發者工具逐步被 Claude Code 與 OpenAI 的 Codex 蠶食市佔。儘管 Gemini 3.1 Pro 在論文成績上相當亮眼,但社群評價卻好壞參半。使用者在第三方測試框架中回報其表現不穩,並指其對話風格在質性測試中顯得較為冷淡、臨床化。
過去「Flash」命名慣例代表較便宜、較小的模型等級。但隨著 3.5 Flash 在程式與 Agent 能力套件上的得分,超越前一代 Pro 旗艦,這種等級區隔在 Google 的產品線中顯然正逐漸消失。
Read Next: Security Experts Pour Cold Water On Claude Mythos Hacking Apocalypse





