施錠の向こうに到着したOpenAI史上最強のGPT-5.6モデル

施錠の向こうに到着したOpenAI史上最強のGPT-5.6モデル

OpenAIは3つのGPT-5.6モデルファミリーを金曜日にプレビュー公開し、コーディング、生物学、サイバーセキュリティでの大幅な向上を実現した一方で、現時点でのアクセスは一部パートナーに限定されている。

主なポイント:

  • GPT-5.6は3階層構成で登場し、Solがフラッグシップ、Terraがバランス型、Lunaが速度重視モデルとなる。
  • 新たなmaxモードとultraモードにより、Solはより長く思考し、困難なタスクを並列実行するサブエージェントに分割できる。
  • OpenAIは3階層すべてをサイバーと生物の両面で高リスクと評価し、広範な一般提供を保留している。

GPT-5.6ファミリーはコーディングとサイバー業務を主な対象に

同社は、Solをこれまでで最強のモデルとして発表し、Terraを前世代の約半額で利用できるバランス型の常用ティア、Lunaを100万入力トークンあたり1ドルの最速オプションとして位置づけた。新しい命名規則では、数字がモデル世代を示し、固有名が持続的な能力ティアを表す。各ティアは独自のスケジュールで進化でき、開発者は速度・深さ・価格のバランスをより明確に選べるようになった。

GPT-5.6ではまた、Solに長く多段階のタスクをより強力に処理させる2つの新たな方法が導入された。max設定ではモデルにより多くの思考時間を与え、ultraモードでは複雑な作業を分割し、複数のサブエージェントが並列で実行した後、その結果を統合する。

OpenAIは7月に、Cerebrasチップ上でSolを毎秒最大750トークンで動作させる計画も明らかにしている。

Solは、計画立案とツール連携が求められるコマンドライン作業のテストであるTerminal-Bench 2.1で新たな最高記録を樹立した。ゲノム解析では、消費トークンを抑えつつGPT-5.5をわずかに上回った。

あるエクスプロイト系ベンチマークでは、SolはAnthropicのMythos Preview同等の成績を示し、出力トークン量はおよそ3分の1にとどまった。

関連記事: Chainlinkのウォレット記録が、LINKの9ドル反発を本格テストに変える

ChatGPTのリスク階層がAIアクセスを再編

OpenAIは、3つのモデルすべてをサイバーおよび生物学的悪用の両面で高リスクと分類した。この評価が、小型・低価格ティアに対して付与されるのは初めてだ。同社によれば、いずれのモデルも最も厳しい制限措置を発動させる「臨界レベル」には達しておらず、Solは完全な攻撃の実行よりも、脆弱性の発見と修正においてより優れた性能を示したという。

この評価が、現時点でアクセスが限定されている理由を説明している。政府の承認を得た約20の組織のみがプレビュー期間中にモデルを実行でき、それ以外の幅広い一般提供は、ChatGPT、Codex、およびAPI向けに数週間以内に拡大される見込みだ。セキュリティ研究者のAlex Stamosは、最前線のツールを囲い込むことが、海外の競合他社にAI競争での優位を与えかねないと警告した

今回のローンチは、同社におけるサイバー制御強化の1年を締めくくるものでもある。昨年12月のGPT-5.2への初期的なセーフガード導入から、GPT-5.5でのより厳格な分類器の導入へと続いてきた。GPT-5.6に関しては、自動レッドチーミングだけでA100相当GPU時間にして70万時間以上を費やしたとOpenAIは述べている。

次に読む: XRPが1ドル近辺まで下落、ETF買いが弱い現物市場を試す

免責事項とリスク警告: この記事で提供される情報は教育および情報提供のみを目的としており、著者の意見に基づいています。金融、投資、法的、または税務上のアドバイスを構成するものではありません。 暗号資産は非常に変動性が高く、投資の全部または相当な部分を失うリスクを含む高いリスクにさらされています。暗号資産の取引または保有は、すべての投資家に適しているとは限りません。 この記事で表明された見解は著者のものであり、Yellow、その創設者、または役員の公式な方針や立場を表すものではありません。 投資決定を行う前に、常にご自身で十分な調査(D.Y.O.R.)を行い、ライセンスを持つ金融専門家にご相談ください。
関連する研究記事