新聞學習研究排名生態系統

平台現已上線

yellow bottom left star road

Claude Mythos 對決 GPT-5.5：受限 Anthropic 模型在 9 項測試中贏下 6 項

Alexey BondarevApr, 24 2026 5:36

#人工智慧 #OpenAI #ChatGPT #Anthropic #Claude 神話

Claude Mythos 對決 GPT-5.5：受限 Anthropic 模型在 9 項測試中贏下 6 項

OpenAI released GPT-5.5 於週三發佈，不過最新基準數據顯示，Anthropic 的受管控 Claude Mythos Preview 仍在 9 個可直接比較的測試中領先 6 項。

GPT-5.5 基準分數

GPT-5.5 arrived 已在 4 月 23 日登陸 ChatGPT 與 Codex，定價為每百萬輸入 Token 5 美元、輸出 30 美元，費率是前一代的兩倍。

該模型在 Terminal-Bench 2.0 上scored 82.7%，僅在這一項明顯獲勝的基準上，以 0.7 個百分點小勝 Mythos。

Mythos, which Anthropic withheld from public release over cybersecurity concerns，在 SWE-bench Pro 的表現為 77.8%，明顯領先 GPT-5.5 的 58.6%。

它在 Humanity's Last Exam（無工具版本）上也tops 遙遙領先 GPT-5.5，得分 56.8%，對比 GPT-5.5 的 41.4%。這款受限模型在 CyberGym、OSWorld-Verified 以及長上下文 GraphWalks 任務上同樣領先。

Also Read: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

分析師提醒的注意事項

這次比較仍不精確，因為兩家實驗室都沒有直接將模型互相比對。OpenAI chose 將 Claude Opus 4.7 作為公開比較對象，而 Anthropic 在其 245 頁的系統卡中，是拿 Mythos 對比 GPT-5.4。

測試框架也不一致。OpenAI 在 Terminal-Bench 上採用了 Codex CLI 設定，而 Anthropic 的 Terminus-2 腳手架，則在 Terminal-Bench 2.1 的計時規則下，將 Mythos 推升到 92.1% 的成績。

Anthropic 在 4 月 7 日宣佈對 Mythos 設置門檻的決定，被指引發了與歐洲委員會的會議，以及英格蘭銀行總裁的警告，認為該模型可能徹底打開網路風險的缺口。

Read Next: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

免責聲明與風險警告：本文提供的資訊僅供教育與參考用途，並基於作者觀點，不構成財務、投資、法律或稅務建議。加密貨幣資產具有高度波動性並伴隨高風險，包括可能損失全部或大部分投資金額。買賣或持有加密資產可能並不適合所有投資者。本文中所表達的觀點僅代表作者立場，不代表 Yellow、其創辦人或管理層的官方政策或意見。請務必自行進行充分研究（D.Y.O.R.），並在做出任何投資決策前諮詢持牌金融專業人士。

相關新聞

Discord 群組疑在 Anthropic 發現前已暗用 Claude Mythos 兩週

少數未授權使用者疑透過第三方廠商環境存取 Anthropic 限制版網安模型 Claude Mythos 約兩週，暴露前沿 AI 供應鏈與帳號管理弱點。

AI模型成功執行數百萬智能合約攻擊，預示新型網路威脅時代來臨

Anthropic發現AI可自主攻擊區塊鏈智能合約，模擬竊得巨款，顯示AI網路威脅日益嚴重。能力與成本效益同步提升。

AI 巨頭如何正在改變加密貨幣市場

AI 和加密貨幣產業正快速融合，OpenAI 投資傳聞及 PerplexityAI 數位資產整合計畫帶動市場樂觀情緒。

以太幣月漲 12% 表現勝過所有前十加密貨幣

以太幣網路交易量與穩定幣供給創新高，新增用戶強勁成長，技術指標與估值模型同現「低估」訊號，顯示中長線仍具上行空間。

Google DeepMind 執行長警示 AI 泡沫風險，代幣市場同步回落

Google DeepMind 執行長 Demis Hassabis 警告部分 AI 領域已進入泡沫階段，估值脫離基本面，同時 AI 加密代幣市值顯著降溫。

相關研究文章

Claude Mythos 與加密貨幣：新一代 AI 威脅對交易意味著什麼

Anthropic 的 Claude Mythos 發現大量零時差漏洞，被認定過於危險而無法公開，迫使加密貨幣產業在 AI 進攻能力激增下加速強化防禦。

AI 代幣復甦：Bittensor 117% 漲勢能否帶動整個板塊回歸？

Bittensor 帶動 AI 代幣強勁反彈，單日板塊飆升 42%，但在 2025 年重挫 75% 後，整體市值仍只是 2024 年高點的一半。

AI 代幣會成為繼迷因幣之後的下一波加密潮流嗎？

AI 代幣市值在 15 個月內迅速逼近迷因幣，背後有實體算力與機構 ETF 申請支撐；但代理人代幣重挫，泡沫風險升高。

你能把加密貨幣交給 AI 打理嗎？

加密貨幣錢包正因 AI 代理與「意圖導向」架構而重塑，讓使用者只需說出目標即可自動跨鏈與 DeFi 互動，同時透過硬體錢包、人機共控與可信執行環境等機制降低風險。

加密貨幣中的 AI 智能代理——深度解析

2025 年初，AI 智能代理於加密貨幣領域爆紅，市值衝破千億美元，引發投資熱潮與平台搶進，成為區塊鏈新趨勢。

相關學習文章

如何使用 AI 股票交易機器人：免費工具與真實風險

無程式碼平台讓散戶能用自然語言打造與部署交易策略，但多數「AI 機器人」其實只是自動化規則。回測難以預測實盤表現，監管機構也已對 AI 交易詐騙與「AI 洗綠」行為發出警告，新手應以模擬交易、提醒訊號與小額資金循序進場。

如何使用 AI 工具進行加密貨幣投資研究：2025 完整指南

AI 推動加密貨幣研究革新，專業交易者與散戶皆能掌握進階策略與風險控管，提升投資成效。

加密貨幣中AI代理的崛起：金融革命正在展開

AI代理革新加密金融，帶來自動決策與區塊鏈融合，同時也引發市場穩定性和安全、道德議題。

加密貨幣 AI 交易機器人：2025 全方位自動化交易指南

本文詳盡解析 AI 交易機器人在加密貨幣市場中的運作、核心原理與進階應用策略，協助新手及資深投資者掌握最新趨勢。

在 DEX 交易前必懂的 10 件事

了解 DEX 激增背後的關鍵機制：AMM 與訂單簿、錢包連結風險、代幣授權漏洞、滑點設定與 MEV 保護，幫助你更安全交易。

Claude Mythos 對決 GPT-5.5：受限 Anthropic 模型在 9 項測試中贏下 6 項 | Yellow