OpenAI 在週五預覽了其三個 GPT-5.6 模型 的家族組合,在程式編寫、生物學與網絡安全方面都有明顯進步,但目前僅限少數合作夥伴可存取。
重點整理:
- GPT-5.6 以三層家族登場:Sol 為旗艦、Terra 為平衡選項、Luna 則主打速度。
- 新的 max 與 ultra 模式,讓 Sol 能思考更久,並將困難任務拆分給並行子代理處理。
- OpenAI 將三個層級都評為網絡與生物高風險,因此暫緩全面開放存取。
GPT-5.6 家族鎖定程式與網安工作
公司在最新發表中公布 Sol 為迄今最強模型,Terra 為日常使用的平衡層級,定價約為前代的一半;Luna 則是速度最快的選擇,每百萬輸入 token 僅需 1 美元。全新的命名方案以數字標示模型世代,名稱則代表穩定的能力層級。每一層都可以依自身節奏升級,讓開發者在速度、深度與價格之間有更清晰的選擇。
GPT-5.6 也首次提供兩種方式,讓 Sol 在長程、多步驟任務上發揮更大效能。max 設定可讓模型有更多「思考時間」,而 ultra 模式則會將複雜工作拆分 給並行執行的子代理,再彙整結果。
OpenAI 亦計劃在 7 月讓 Sol 跑在 Cerebras 晶片上,速度最高可達每秒 750 個 token。
Sol 在 Terminal-Bench 2.1 上創下 新高分。該測試聚焦終端機操作,需要規劃與工具協調能力。在基因體分析上,它略勝 GPT-5.5 一籌,同時耗用更少 token。
在某個攻擊測試中,Sol 追平 Anthropic 的 Mythos Preview,但僅使用約三分之一的輸出 token。
延伸閱讀:Chainlink 錢包紀錄,將 LINK 的 9 美元反彈推上關鍵考驗
ChatGPT 風險分級重塑 AI 存取方式
OpenAI 將 三個模型全都歸類為網絡與生物濫用的高風險級別,這對其較小、較便宜的層級來說尚屬首次。公司表示,沒有任何一款達到會啟動最嚴格限制的「臨界」等級,而 Sol 在發現並修補漏洞方面的表現也優於執行完整攻擊。
這項評級也說明了為何目前存取仍相當受限。約 20 間經政府審核的機構可在預覽期間運行這些模型,並承諾在數週內擴大至 ChatGPT、Codex 與 API。安全研究員 Alex Stamos 則警告,將前沿工具關在圍牆內,可能讓海外競爭對手在 AI 競賽中取得優勢。
這次發表為公司一年來收緊網安控管畫下段落:從去年 12 月在 GPT-5.2 上首次導入防護措施,到在 GPT-5.5 採用更嚴格的分類器。針對 GPT-5.6,OpenAI 表示僅自動化「紅隊」測試就耗費超過 70 萬個等同 A100 的 GPU 小時。





