Google 在 I/O 上发布了 Gemini 3.5 Flash,在 Artificial Analysis 的 Intelligence Index 上取得 55 分,分数已逼近Anthropic 和 OpenAI 的竞品。
Gemini Flash 定价
该模型已正式发布,在 Gemini API、Google AI Studio、Antigravity、Vertex AI 以及搜索中的 AI Mode 全面提供。定价为每百万输入 token 1.50 美元、每百万输出 token 9.00 美元,约为 GPT-5.5(输入 5.00 美元、输出 30.00 美元)价格的三分之一。Anthropic 对 Claude Opus 4.7 的定价为每百万输入 token 5 美元、每百万输出 token 25 美元,使得 Google 的新档位同样大约只有其三分之一的价格。
独立评测机构 Artificial Analysis 给出 的综合智能得分为 55 分,比更早的 Gemini 3 Flash 高出 9 分。
这让它与 Claude Opus 4.7 仅差 2 分,与 GPT-5.5 仅差 5 分。
该版本已作为 Gemini 应用和全球 AI Mode 的默认模型发布。
延伸阅读:Twenty One Capital Becomes Tether's Bitcoin Arm As SoftBank Walks Away
Pro 版本在即
Google 表示,一个 Pro 版本目前正在内部使用,将于下个月发布。如果 Flash 已经拿到 55 分,那么 Pro 版很可能会进入目前由 Claude Opus 4.7 和 GPT-5.5 占据的前沿区间。
DeepMind 首席技术官 Koray Kavukcuoglu 向记者表示,Flash 模型“在几乎所有基准上都优于我们最新的前沿模型 3.1 Pro”。Google 公布 的成绩包括:Terminal-Bench 2.1 得分 76.2%、MCP Atlas 得分 83.6%、GDPval-AA 等级分 1656,全部超越了 2 月份发布的旗舰。
竞争压力
该发布正值用户对高价旗舰模型产生反弹之际。Anthropic 于 4 月 16 日发布 Claude Opus 4.7,在发布 48 小时内,开发者就记录到其 token 消耗比 Opus 4.6 高出 1.5–3 倍,同时还出现自信但错误输出的反馈。OpenAI 在发布 GPT-5.5 时将旗舰 API 价格翻倍,同样引来 API 客户的批评。
到 2025 年底和 2026 年初,Google 的开发者工具在竞争中持续落后于 Claude Code 和 OpenAI 的 Codex。尽管论文指标不错,Gemini 3.1 Pro 在社区口碑却褒贬不一。用户在第三方测试环境中报告其行为不稳定,在主观测试中对其“过于冷静、临床化”的对话风格有所诟病。
“Flash” 这一命名过去通常意味着更便宜、更小的模型档位。但随着 3.5 Flash 在编码与代理相关评测中超越上一代 Pro 旗舰,这种区隔似乎正在 Google 产品线中逐渐消失。
下篇推荐:Security Experts Pour Cold Water On Claude Mythos Hacking Apocalypse





