Gemini 3.5 Flash 得分仅次于 Claude Opus 4.7 两分，代价却只有其三分之一

Google 在 I/O 上发布了 Gemini 3.5 Flash，在 Artificial Analysis 的 Intelligence Index 上取得 55 分，分数已逼近Anthropic 和 OpenAI 的竞品。

Gemini Flash 定价

该模型已正式发布，在 Gemini API、Google AI Studio、Antigravity、Vertex AI 以及搜索中的 AI Mode 全面提供。定价为每百万输入 token 1.50 美元、每百万输出 token 9.00 美元，约为 GPT-5.5（输入 5.00 美元、输出 30.00 美元）价格的三分之一。Anthropic 对 Claude Opus 4.7 的定价为每百万输入 token 5 美元、每百万输出 token 25 美元，使得 Google 的新档位同样大约只有其三分之一的价格。

独立评测机构 Artificial Analysis 给出的综合智能得分为 55 分，比更早的 Gemini 3 Flash 高出 9 分。

这让它与 Claude Opus 4.7 仅差 2 分，与 GPT-5.5 仅差 5 分。

该版本已作为 Gemini 应用和全球 AI Mode 的默认模型发布。

延伸阅读：Twenty One Capital Becomes Tether's Bitcoin Arm As SoftBank Walks Away

Pro 版本在即

Google 表示，一个 Pro 版本目前正在内部使用，将于下个月发布。如果 Flash 已经拿到 55 分，那么 Pro 版很可能会进入目前由 Claude Opus 4.7 和 GPT-5.5 占据的前沿区间。

DeepMind 首席技术官 Koray Kavukcuoglu 向记者表示，Flash 模型“在几乎所有基准上都优于我们最新的前沿模型 3.1 Pro”。Google 公布的成绩包括：Terminal-Bench 2.1 得分 76.2%、MCP Atlas 得分 83.6%、GDPval-AA 等级分 1656，全部超越了 2 月份发布的旗舰。

竞争压力

该发布正值用户对高价旗舰模型产生反弹之际。Anthropic 于 4 月 16 日发布 Claude Opus 4.7，在发布 48 小时内，开发者就记录到其 token 消耗比 Opus 4.6 高出 1.5–3 倍，同时还出现自信但错误输出的反馈。OpenAI 在发布 GPT-5.5 时将旗舰 API 价格翻倍，同样引来 API 客户的批评。

到 2025 年底和 2026 年初，Google 的开发者工具在竞争中持续落后于 Claude Code 和 OpenAI 的 Codex。尽管论文指标不错，Gemini 3.1 Pro 在社区口碑却褒贬不一。用户在第三方测试环境中报告其行为不稳定，在主观测试中对其“过于冷静、临床化”的对话风格有所诟病。

“Flash” 这一命名过去通常意味着更便宜、更小的模型档位。但随着 3.5 Flash 在编码与代理相关评测中超越上一代 Pro 旗舰，这种区隔似乎正在 Google 产品线中逐渐消失。

Gemini 3.5 Flash 得分仅次于 Claude Opus 4.7 两分， 代价却只有其三分之一

Gemini Flash 定价

Pro 版本在即

竞争压力

Gemini 3.5 Flash 得分仅次于 Claude Opus 4.7 两分，代价却只有其三分之一