施錠の向こうに登場した OpenAI史上最強の GPT-5.6 モデル

OpenAI は3つの GPT-5.6 モデルファミリーを金曜日にプレビュー公開し、コーディング、生物学、サイバーセキュリティにおける鋭い性能向上を示した一方で、現時点でのアクセスは一部パートナーに限定されている。

重要ポイント:

GPT-5.6 は3階層ファミリーとして登場し、Sol がフラッグシップ、Terra がバランス重視、Luna が速度重視のモデルとなる。

新たな max モードと ultra モードにより、Sol はより長く思考し、困難なタスクを並列サブエージェントに分割できる。

OpenAI は3つすべての階層をサイバー・バイオ分野で高リスクと評価し、広範なアクセスの解禁を見送っている。

GPT-5.6 ファミリーはコーディングとサイバー業務を狙う

同社は、Sol をこれまでで最強のモデルとして発表し、Terra を前世代のほぼ半額で使えるバランス重視の汎用ティア、Luna を 100万入力トークンあたり1ドルの最速オプションと位置付けた。新たな命名ルールでは、数字がモデル世代を示し、名前が恒常的な性能ティアを表す。それぞれのティアは独自のペースで進化できるため、開発者は速度・深さ・価格のバランスをより明確に選べる。

GPT-5.6 では、Sol に長く複数ステップのタスクをより強力にこなさせる2つの方法も初登場した。max 設定ではモデルにより長い思考時間を与え、ultra モードでは、複雑な作業を分割して並列で動くサブエージェントに任せ、その結果を最後に統合する。

OpenAI はまた、7月に Cerebras チップ上で Sol を1秒あたり最大750トークンで動作させる計画も示した。

Sol は、計画立案とツール連携が求められるコマンドライン作業のテストである Terminal-Bench 2.1 で新たな最高スコアを記録した。ゲノム解析では、消費トークン数を抑えつつ GPT-5.5 を上回る成績を収めた。

あるエクスプロイト系ベンチマークでは、Sol は出力トークン量を約3分の1に抑えながら、Anthropic の Mythos Previewと同等の成績を出した。

ChatGPT のリスク階層が AI アクセスを再構成

OpenAI は、3つのモデルすべてをサイバーおよび生物学的悪用の両面で高リスクに分類した。小型で安価なティアに対してこの評価が下されたのは初めてだ。同社によれば、いずれのモデルも、最も厳しい制限を発動させる「臨界レベル」には達しておらず、Sol は攻撃を完全に実行するよりも、脆弱性の発見と修正において優れていたという。

この評価が、現時点でアクセスが限定されたままである理由の一端を説明している。政府による審査を通過した約20の組織だけがプレビュー期間中にモデルを利用でき、数週間以内に ChatGPT、Codex、API への広範な展開が予定されている。セキュリティ研究者の Alex Stamos は、フロンティアツールを壁の内側に囲い込むことで、海外の競合に AI 競争での優位を与えかねないと警告した。

このローンチは、同社がサイバー規制を強化してきた1年の総仕上げでもある。昨年12月の GPT-5.2 への初期セーフガード導入から、GPT-5.5 におけるより厳格な分類器の実装まで流れが続き、GPT-5.6 では自動レッドチーミングだけで A100 同等 GPU 時間にして70万時間以上を費やしたと OpenAI は説明している。

次に読む: XRP が1ドル近辺まで下落、ETF買いが弱い現物市場を試す