OpenAI 史上最強 GPT-5.6 模型來了，卻躲在上鎖的門後

OpenAI 在週五預覽了其三款 GPT-5.6 模型家族，在編程、生物與網絡安全方面都有明顯提升，但目前僅向少數合作夥伴開放使用。

重點摘要：

GPT-5.6 以三層家族登場：Sol 為旗艦款，Terra 為均衡選項，Luna 則主打速度。

新增的 max 和 ultra 模式，讓 Sol 能進行更長時間推理，並將高難度任務拆分給多個並行子代理處理。

OpenAI 將三個級別都評為在網絡與生物領域屬高風險，暫緩全面開放。

GPT-5.6 家族主攻編碼與網絡安全工作

公司在發佈中介紹，Sol 是迄今為止最強模型；Terra 是日常使用的均衡層級，定價約為前代的一半；Luna 則是速度最快的選項，每百萬輸入 token 僅需 1 美元。全新的命名方案用數字標示模型世代，名稱則代表穩定的能力層級。各層級可以按照自己的節奏升級，讓開發者能更清楚在速度、深度與價格之間作出選擇。

GPT-5.6 亦首度為 Sol 引入兩種加壓模式，專門應對冗長且多步驟的任務。max 設定會給模型更多「思考時間」，而 ultra 模式則會將複雜工作拆分給多個並行子代理處理，再合併結果。

OpenAI 亦計劃於 7 月在 Cerebras 晶片上運行 Sol，推進速度最高可達每秒 750 個 token。

Sol 在 Terminal-Bench 2.1（需要規劃與工具協調的命令列工作測試）上創下新高分。在基因組分析中，它在耗用更少 token 的情況下，表現略勝 GPT-5.5。

在某個漏洞利用基準測試中，Sol 以約三分之一的輸出 token，達到與 Anthropic 的 Mythos Preview 相近的水準。

延伸閱讀：Chainlink 錢包紀錄讓 LINK 的 9 美元反彈成為關鍵考驗

ChatGPT 風險分級重塑 AI 使用門檻

OpenAI 將三款模型全都歸類為在網絡與生物誤用方面的高風險，這是首次把體積較小、價格較低的層級也列為高風險。公司表示，三款模型都未達到需要啟動最嚴格限制的關鍵級別，而 Sol 在發現與修補漏洞方面的能力，優於執行完整攻擊。

這項評級也解釋了為何目前仍維持狹窄的使用範圍。約 20 間通過政府審核的機構可在預覽期間運行這些模型；更大規模的部署，預計在數週內擴展至 ChatGPT、Codex 與 API。安全研究員 Alex Stamos 警告，將前沿工具鎖在高牆之內，可能讓海外競爭對手在 AI 競賽中取得優勢。

這次發佈為公司一年來日益收緊的網絡安全控制畫下句點：從去年 12 月在 GPT-5.2 上首次加入安全防線，到在 GPT-5.5 上採用更嚴格的分類器。對於 GPT-5.6，OpenAI 稱僅自動化紅隊測試就耗費超過 70 萬個 A100 等效 GPU 小時。

下一篇閱讀：XRP 跌近 1 美元，ETF 買家測試疲弱現貨市場