新聞學習研究排名生態系統

平台現已上線

yellow bottom left star road

OpenAI 推出 GPT-5.5，在代理任務與 14 項基準測試上超越 Opus 4.7

Camille MeulienApr, 23 2026 19:14

#人工智能 #OpenAI #Claude Opus

OpenAI 推出 GPT-5.5，在代理任務與 14 項基準測試上超越 Opus 4.7

OpenAI 於 4 月 23 日推出 GPT-5.5，將其代號「Spud」的模型定位為目前在自主、多步驟工作上最敏銳的系統。

GPT-5.5 代理式編碼推進

此次發佈登場時間，正好比 Anthropic 將 Claude Opus 4.7 推向全面可用晚了一週，依據 TechCrunch 與 Fortune 報道，兩者在代理工作負載上正面交鋒。

GPT-5.5 專為規劃、呼叫工具、檢查自身輸出並在無須持續提示下反覆改進而設計。

總裁 Greg Brockman 在與記者的電話會上稱其為「一種全新類型的智慧」，並將其定位為邁向「更具代理性與更直覺的運算」的一步。

該模型將陸續提供給 ChatGPT Plus、Pro、Business 與 Enterprise 用戶，並同時推出更強大的 Pro 版本。API 定價為每百萬輸入權杖 5 美元、每百萬輸出權杖 30 美元，支援一百萬權杖的上下文視窗。

延伸閱讀： Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

Opus 4.7 基準測試差距

依據 OpenAI 公布、且被 VentureBeat 指出為 14 項評測中最新水準的數據，GPT-5.5 在 Terminal-Bench 2.0 取得 82.7% 分數，明顯領先 Opus 4.7 的 69.4%。

在 FrontierMath 第 1 至第 3 層級，新的模型達到 51.7%，而 Anthropic 旗艦模型則為 43.8%。

在電腦操作測試中，雙方差距較小：GPT-5.5 在 OSWorld-Verified 得到 78.7%，Opus 4.7 則為 78.0%；不過在瀏覽任務上，GPT-5.5 Pro 以 90.1% 明顯超前 79.3%。

評測者仍普遍認為，Opus 4.7 在研究寫作與嚴謹遵循指示方面表現較佳，且具備約 3.75 百萬像素的較高視覺解析度。

模型發佈節奏持續加快。GPT-5.5 距離 GPT-5.4 問世僅六週。Anthropic 先在 2 月推出 Opus 4.6，隨後再發佈 Opus 4.7，而 Google 則持續以 Gemini 3.1 Pro 角逐相同企業級市場區間。

下一篇： TRON Connects $85B USDT Network To LI.FI In Cross-Chain DeFi Push

免責聲明及風險提示：本文資訊僅供教育與參考之用，並基於作者意見，並不構成金融、投資、法律或稅務建議。加密貨幣資產具高度波動性並伴隨高風險，可能導致投資大幅虧損或全部損失，並非適合所有投資者。文章內容僅代表作者觀點，不代表 Yellow、創辦人或管理層立場。投資前請務必自行徹底研究（D.Y.O.R.），並諮詢持牌金融專業人士。

相關新聞

Google 推出 Titans，首個能即時更新自身記憶嘅 AI 系統

Google 推出 Titans，令 AI 可即時更新記憶及持續學習，提升長文本處理效能，並有望影響未來 AI 技術發展。

AI模型成功執行數百萬智能合約攻擊，引領新型網絡威脅時代

研究顯示AI可自動尋找及利用區塊鏈漏洞，模擬攻擊金額持續倍增，成為新型網絡威脅。

為何 Gradient 認為未來萬億參數模型不會屬於 OpenAI 或 Google

Yang 預言未來 AI 模型將全球分佈式訓練，打破巨頭壟斷，帶來更透明、安全及低成本的 AI 生態。

AI 巨頭如何改變加密貨幣市場

中國 DeepSeek 令加密貨幣市況大挫，OpenAI 投資及 PerplexityAI 發展推動行業轉向看好 AI 相關幣，前景令人期待。

以太坊推出 ERC-8004 代幣標準為 AI 代理提供鏈上身份

以太坊推 ERC-8004 新標準，讓 AI 代理擁有可攜式鏈上身份與信譽機制，支持跨平台互通與驗證，為機器經濟奠定關鍵基礎。

相關研究文章

AI 概念幣復甦：Bittensor 飆升 117% 能否帶動板塊回歸？

Bittensor 帶動 AI 概念幣強勁反彈，單日板塊漲 42%，但距離 2024 年高位仍腰斬；在宏觀壓力與競爭下，板塊復甦仍存變數。

加密貨幣中的 AI 代理人—深入探討

2025 年初，AI 代理人成為加密界焦點，市值爆增。自主代理不僅能管理資產，還帶動大量資金與創新參與。

你可以放心把加密貨幣交給 AI 嗎？

AI 代理配合「意圖導向」架構，令 DeFi 操作更簡單，但同時帶來安全與自主性的取捨，或將決定未來主流錢包形態。

AI加密貨幣交易：2025年GPT交易機械人完全指南

全方位介紹2025年AI交易機械人趨勢及表現，帶你認識市場數據、平台及GPT智能交易策略。

Claude Mythos 與加密貨幣：新一代 AI 威脅對交易意味著甚麼

Anthropic 的 Claude Mythos 模型因可發掘海量零日漏洞被視為過於危險而不向公眾開放，加密貨幣行業在高額黑客損失下風險驟增。

相關學習文章

加密貨幣中的 AI 代理崛起：金融革命正在展開

AI 代理人正重塑加密金融，提升自動決策與去中心化基礎設施融合，挑戰風險、合規與道德問題。

AI 股票交易機械人點用：免費工具與真實風險

無程式 AI 交易工具令散戶更易落場，但多數只係自動化規則唔係智能。應由模擬交易開始，循序漸進、小注實測並持續監控風險。

如何運用 AI 工具進行加密貨幣投資研究：2025 完全指南

探討 AI 對加密貨幣研究的顛覆性影響，涵蓋實用工具、策略、風險與真實例子，並聚焦 2025 年最新發展。

自建 AI 加密貨幣機械人：2024-2025 全方位開發者指南

全自動化交易系統正重塑加密市場。AI、Python、API 讓個人開發者參與，需留意技術挑戰與監管要求。

去中心化智能：AI 及區塊鏈如何重塑科技

AI 結合區塊鏈帶來前所未有的創新，提升安全及透明度並推動自動化，各行業正因而重塑未來。

OpenAI 推出 GPT-5.5，在代理任務與 14 項基準測試上超越 Opus 4.7 | Yellow