OpenAI 最强 GPT-5.6 模型上架，却被关在“锁着的门”后面

OpenAI 预览了其三款 GPT-5.6 模型家族，将在编程、生物学和网络安全方面的显著提升，与当前仅向少数合作伙伴开放访问的策略绑定在一起。

要点概览：

GPT-5.6 以三层家族形式登场：Sol 为旗舰，Terra 为平衡选择，Luna 主打速度。

新的 max 与 ultra 模式让 Sol 能进行更长时间推理，并将复杂任务拆分给并行子代理处理。

OpenAI 将三款模型在网络与生物领域的风险都评为“高”，因此暂缓全面开放。

GPT-5.6 家族主攻编程与网络安全

公司发布了迄今最强的 Sol，作为旗舰模型；Terra 作为日常使用的平衡层，定价约为前代的一半；而 Luna 则是速度最快的选项，输入端价格为每百万 token 1 美元。全新的命名体系以数字标记模型代际，以名称表示稳定的能力层级。各层可以按各自节奏迭代，让开发者在速度、深度与价格之间有更清晰的选择。

GPT-5.6 还首次为 Sol 提供了两种在长、多步骤任务中“加码”的方式：max 设置为模型争取更多“思考时间”，而 ultra 模式则会将复杂工作拆分给并行运行的子代理，最后再合并其结果。

OpenAI 还计划在 7 月让 Sol 运行在 Cerebras 芯片上，生成速度最高可达每秒 750 个 token。

Sol 在 Terminal-Bench 2.1 上创下新高，这是一项考验命令行任务规划与工具协同能力的测试。在基因组分析中，它略微超越 GPT-5.5，同时消耗更少的 token。

在某个漏洞利用基准中，Sol 使用约三分之一的输出 token，匹配了 Anthropic 的 Mythos Preview 的表现。

延伸阅读：Chainlink 的钱包纪录让 LINK 的 9 美元反弹成关键考验

ChatGPT 风险分级重塑 AI 使用门槛

OpenAI 将这三款模型在网络与生物滥用上的风险全部归入“高风险”，这是首次将较小、较便宜的层级也列入这一档。公司同时表示，没有任何一个模型达到会触发最高级别限制的“临界水平”，而且 Sol 在发现与修复漏洞方面的表现优于执行完整攻击。

这一评级解释了为何目前访问范围依旧狭窄。约 20 家通过政府审批的机构可以在预览期间运行这些模型；更广泛地向 ChatGPT、Codex 以及 API 推出，则被承诺会在数周内到来。安全研究员 Alex Stamos 警告称，将前沿工具关在“高墙”之后，可能会让海外竞争对手在 AI 竞赛中占得先机。

这次发布为公司一年内持续收紧网络安全控制画上阶段性句号：从去年 12 月在 GPT-5.2 上首次部署安全护栏，到 GPT-5.5 使用更严格的分类器。对于 GPT-5.6，OpenAI 表示仅在自动化“红队”测试上，就投入了超过 70 万个 A100 等效 GPU 小时。

下篇阅读：XRP 跌至接近 1 美元，ETF 买家测试现货市场薄弱环节