Google released Gemini 3.5 Flash at I/O,在 Artificial Analysis 的 Intelligence Index 上拿下 55 分,與rivals from Anthropic and OpenAI的差距已相當接近。
Gemini Flash 定價
該模型已shipped至 Gemini API、Google AI Studio、Antigravity、Vertex AI,以及搜尋中的 AI Mode,一般用戶皆可使用。定價為每百萬輸入 Token 1.50 美元、每百萬輸出 Token 9.00 美元,大約是 GPT-5.5(輸入 5.00 美元、輸出 30.00 美元)費率的三分之一。Anthropic 對 Claude Opus 4.7 的定價則是每百萬輸入與輸出 Token 分別為 5 與 25 美元,Google 此次新級距同樣約為其三分之一水準。
獨立跑分機構 Artificial Analysis placed 該模型的綜合智能分數為 55,比舊版 Gemini 3 Flash 高出 9 分。
這也讓它距離 Claude Opus 4.7 僅差 2 分,距 GPT-5.5 則是 5 分。
新版本已成為 Gemini App 與全球 AI Mode 的預設模型。
延伸閱讀: Twenty One Capital Becomes Tether's Bitcoin Arm As SoftBank Walks Away
Pro 級版本在即
Google 表示,一個 Pro 版本目前已在內部使用,預計將於下個月arrive。若 Flash 已經能拿到 55 分,Pro 版本很可能會進入目前由 Claude Opus 4.7 與 GPT-5.5 佔據的「前沿」區間。
DeepMind 技術長 Koray Kavukcuoglu 告訴媒體,Flash 模型「在幾乎所有基準測試上都優於我們最新的前沿模型 3.1 Pro」。Google reported 的成績包括 Terminal-Bench 2.1 的 76.2%、MCP Atlas 的 83.6%,以及 GDPval-AA 的 Elo 1,656,全部超過二月的旗艦版本。
競品壓力
此次發佈正值市場對高價旗艦模型反彈之際。Anthropic shipped Claude Opus 4.7 於 4 月 16 日上線後,不到 48 小時,開發者就紀錄到 Token 消耗比 Opus 4.6 高出 1.5 到 3 倍,同時出現帶有高度自信但明顯錯誤輸出的回報。OpenAI 則在 GPT-5.5 release 時把旗艦 API 價格翻倍,招致 API 客戶類似批評。
2025 年底到 2026 年初,Google 的開發者工具在市佔上持續落後於 Claude Code 與 OpenAI 的 Codex,Gemini 3.1 Pro 儘管論文成績亮眼,社群評價卻好壞參半。使用者回報在第三方工具中的表現不穩,質化測試中也指出其對話風格偏向冷靜、臨床式的語氣。
過去「Flash」命名慣例代表的是較便宜、較小的模型級距。然而,隨著 3.5 Flash 在程式與 Agent 測試中超越前一代 Pro 旗艦,這種等級區隔在 Google 的產品線中似乎正逐漸消失。
下一篇: Security Experts Pour Cold Water On Claude Mythos Hacking Apocalypse





