Gemini 3.5 Flash 分數僅落後 Claude Opus 4.7 兩點 價格卻只需三分之一

Gemini 3.5 Flash 分數僅落後 Claude Opus 4.7 兩點 價格卻只需三分之一

Google 在 I/O 大會上推出 Gemini 3.5 Flash,在 Artificial Analysis 的 Intelligence Index 中取得 55 分,與AnthropicOpenAI 對手的差距已相當接近。

Gemini Flash 定價

該模型已正式上線,可透過 Gemini API、Google AI Studio、Antigravity、Vertex AI,以及搜尋中的 AI Mode 使用。定價為每一百萬個輸入 token 1.50 美元、每一百萬個輸出 token 9.00 美元,大約是 GPT-5.5(輸入 5.00 美元、輸出 30.00 美元)收費的三分之一。Anthropic 的 Claude Opus 4.7 則是每一百萬個輸入與輸出 token 分別收取 5 美元和 25 美元,令 Google 這個新等級的定價同樣約為其三分之一。

獨立評測機構 Artificial Analysis 該模型的綜合智能分數評為 55 分,比舊款 Gemini 3 Flash 高出 9 分。

這使它只比 Claude Opus 4.7 低 2 分,比 GPT-5.5 低 5 分。

這次發佈同時令它成為 Gemini App 與全球 AI Mode 的預設模型。

延伸閱讀:Twenty One Capital Becomes Tether's Bitcoin Arm As SoftBank Walks Away

Pro 等級即將登場

Google 表示,一款 Pro 版本目前已在內部使用,並將於下個月推出。若 Flash 已經能拿到 55 分,Pro 版本很可能會推進到目前由 Claude Opus 4.7 和 GPT-5.5 佔據的前沿區間。

DeepMind 技術總監 Koray Kavukcuoglu 向記者表示,Flash 模型「在幾乎所有基準測試上,都超越我們最新的前沿模型 3.1 Pro。」Google 公佈 的成績包括:Terminal-Bench 2.1 得分 76.2%、MCP Atlas 得分 83.6%、GDPval-AA Elo 分數 1,656,全部都超過今年二月的旗艦模型。

競爭壓力

這次發佈正值使用者對高價旗艦模型的反彈期。Anthropic 於 4 月 16 日推出 Claude Opus 4.7,在 48 小時內就有開發者回報 token 耗用較 Opus 4.6 高出 1.5 至 3 倍,同時出現高自信卻錯誤的輸出。OpenAI 在推出 GPT-5.5 的同時,將旗艦 API 價格加倍,引起 API 客戶類似的批評。

在 2025 年底到 2026 年初期間,Google 的開發者工具逐步被 Claude Code 與 OpenAI 的 Codex 蠶食市佔。儘管 Gemini 3.1 Pro 在論文成績上相當亮眼,但社群評價卻好壞參半。使用者在第三方測試框架中回報其表現不穩,並指其對話風格在質性測試中顯得較為冷淡、臨床化。

過去「Flash」命名慣例代表較便宜、較小的模型等級。但隨著 3.5 Flash 在程式與 Agent 能力套件上的得分,超越前一代 Pro 旗艦,這種等級區隔在 Google 的產品線中顯然正逐漸消失。

Read Next: Security Experts Pour Cold Water On Claude Mythos Hacking Apocalypse

免責聲明及風險提示: 本文資訊僅供教育與參考之用,並基於作者意見,並不構成金融、投資、法律或稅務建議。 加密貨幣資產具高度波動性並伴隨高風險,可能導致投資大幅虧損或全部損失,並非適合所有投資者。 文章內容僅代表作者觀點,不代表 Yellow、創辦人或管理層立場。 投資前請務必自行徹底研究(D.Y.O.R.),並諮詢持牌金融專業人士。
Gemini 3.5 Flash 分數僅落後 Claude Opus 4.7 兩點 價格卻只需三分之一 | Yellow.com