OpenAIは3つのGPT-5.6モデルファミリーを金曜日にプレビュー公開し、コーディング、生物学、サイバーセキュリティでの大幅な向上を実現した一方で、現時点でのアクセスは一部パートナーに限定されている。
主なポイント:
- GPT-5.6は3階層構成で登場し、Solがフラッグシップ、Terraがバランス型、Lunaが速度重視モデルとなる。
- 新たなmaxモードとultraモードにより、Solはより長く思考し、困難なタスクを並列実行するサブエージェントに分割できる。
- OpenAIは3階層すべてをサイバーと生物の両面で高リスクと評価し、広範な一般提供を保留している。
GPT-5.6ファミリーはコーディングとサイバー業務を主な対象に
同社は、Solをこれまでで最強のモデルとして発表し、Terraを前世代の約半額で利用できるバランス型の常用ティア、Lunaを100万入力トークンあたり1ドルの最速オプションとして位置づけた。新しい命名規則では、数字がモデル世代を示し、固有名が持続的な能力ティアを表す。各ティアは独自のスケジュールで進化でき、開発者は速度・深さ・価格のバランスをより明確に選べるようになった。
GPT-5.6ではまた、Solに長く多段階のタスクをより強力に処理させる2つの新たな方法が導入された。max設定ではモデルにより多くの思考時間を与え、ultraモードでは複雑な作業を分割し、複数のサブエージェントが並列で実行した後、その結果を統合する。
OpenAIは7月に、Cerebrasチップ上でSolを毎秒最大750トークンで動作させる計画も明らかにしている。
Solは、計画立案とツール連携が求められるコマンドライン作業のテストであるTerminal-Bench 2.1で新たな最高記録を樹立した。ゲノム解析では、消費トークンを抑えつつGPT-5.5をわずかに上回った。
あるエクスプロイト系ベンチマークでは、SolはAnthropicのMythos Previewと同等の成績を示し、出力トークン量はおよそ3分の1にとどまった。
関連記事: Chainlinkのウォレット記録が、LINKの9ドル反発を本格テストに変える
ChatGPTのリスク階層がAIアクセスを再編
OpenAIは、3つのモデルすべてをサイバーおよび生物学的悪用の両面で高リスクと分類した。この評価が、小型・低価格ティアに対して付与されるのは初めてだ。同社によれば、いずれのモデルも最も厳しい制限措置を発動させる「臨界レベル」には達しておらず、Solは完全な攻撃の実行よりも、脆弱性の発見と修正においてより優れた性能を示したという。
この評価が、現時点でアクセスが限定されている理由を説明している。政府の承認を得た約20の組織のみがプレビュー期間中にモデルを実行でき、それ以外の幅広い一般提供は、ChatGPT、Codex、およびAPI向けに数週間以内に拡大される見込みだ。セキュリティ研究者のAlex Stamosは、最前線のツールを囲い込むことが、海外の競合他社にAI競争での優位を与えかねないと警告した。
今回のローンチは、同社におけるサイバー制御強化の1年を締めくくるものでもある。昨年12月のGPT-5.2への初期的なセーフガード導入から、GPT-5.5でのより厳格な分類器の導入へと続いてきた。GPT-5.6に関しては、自動レッドチーミングだけでA100相当GPU時間にして70万時間以上を費やしたとOpenAIは述べている。





