Gemini 3.5 Flash 得分仅次于 Claude Opus 4.7 两分, 代价却只有其三分之一

Gemini 3.5 Flash 得分仅次于 Claude Opus 4.7 两分, 代价却只有其三分之一

Google 在 I/O 上发布了 Gemini 3.5 Flash,在 Artificial Analysis 的 Intelligence Index 上取得 55 分,分数已逼近AnthropicOpenAI 的竞品

Gemini Flash 定价

该模型已正式发布,在 Gemini API、Google AI Studio、Antigravity、Vertex AI 以及搜索中的 AI Mode 全面提供。定价为每百万输入 token 1.50 美元、每百万输出 token 9.00 美元,约为 GPT-5.5(输入 5.00 美元、输出 30.00 美元)价格的三分之一。Anthropic 对 Claude Opus 4.7 的定价为每百万输入 token 5 美元、每百万输出 token 25 美元,使得 Google 的新档位同样大约只有其三分之一的价格。

独立评测机构 Artificial Analysis 给出 的综合智能得分为 55 分,比更早的 Gemini 3 Flash 高出 9 分。

这让它与 Claude Opus 4.7 仅差 2 分,与 GPT-5.5 仅差 5 分。

该版本已作为 Gemini 应用和全球 AI Mode 的默认模型发布。

延伸阅读:Twenty One Capital Becomes Tether's Bitcoin Arm As SoftBank Walks Away

Pro 版本在即

Google 表示,一个 Pro 版本目前正在内部使用,将于下个月发布。如果 Flash 已经拿到 55 分,那么 Pro 版很可能会进入目前由 Claude Opus 4.7 和 GPT-5.5 占据的前沿区间。

DeepMind 首席技术官 Koray Kavukcuoglu 向记者表示,Flash 模型“在几乎所有基准上都优于我们最新的前沿模型 3.1 Pro”。Google 公布 的成绩包括:Terminal-Bench 2.1 得分 76.2%、MCP Atlas 得分 83.6%、GDPval-AA 等级分 1656,全部超越了 2 月份发布的旗舰。

竞争压力

该发布正值用户对高价旗舰模型产生反弹之际。Anthropic 于 4 月 16 日发布 Claude Opus 4.7,在发布 48 小时内,开发者就记录到其 token 消耗比 Opus 4.6 高出 1.5–3 倍,同时还出现自信但错误输出的反馈。OpenAI 在发布 GPT-5.5 时将旗舰 API 价格翻倍,同样引来 API 客户的批评。

到 2025 年底和 2026 年初,Google 的开发者工具在竞争中持续落后于 Claude Code 和 OpenAI 的 Codex。尽管论文指标不错,Gemini 3.1 Pro 在社区口碑却褒贬不一。用户在第三方测试环境中报告其行为不稳定,在主观测试中对其“过于冷静、临床化”的对话风格有所诟病。

“Flash” 这一命名过去通常意味着更便宜、更小的模型档位。但随着 3.5 Flash 在编码与代理相关评测中超越上一代 Pro 旗舰,这种区隔似乎正在 Google 产品线中逐渐消失。

下篇推荐:Security Experts Pour Cold Water On Claude Mythos Hacking Apocalypse

免责声明和风险警告: 本文提供的信息仅用于教育和信息目的,基于作者的意见。它不构成财务、投资、法律或税务建议。 加密货币资产具有高度波动性并面临高风险,包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。 本文表达的观点仅为作者的观点,不代表Yellow、其创始人或高管的官方政策或立场。 在做出任何投资决定之前,请务必进行自己的全面研究(D.Y.O.R.)并咨询持牌金融专业人士。
Gemini 3.5 Flash 得分仅次于 Claude Opus 4.7 两分, 代价却只有其三分之一 | Yellow.com