新聞學習研究排名生態系統

平台現已上線

yellow bottom left star road

Claude Mythos 對決 GPT-5.5：受管控 Anthropic 模型在 9 項測試中贏 6 項

Alexey BondarevApr, 24 2026 5:36

#人工智能 #OpenAI #ChatGPT #Anthropic #Claude 神話

Claude Mythos 對決 GPT-5.5：受管控 Anthropic 模型在 9 項測試中贏 6 項

OpenAI released GPT-5.5 於週三發布，但最新的基準測試數據顯示，Anthropic 的受管控 Claude Mythos Preview 在九項可直接比較的測試中，仍有六項領先。

GPT-5.5 基準測試分數

GPT-5.5 arrived 於 4 月 23 日在 ChatGPT 和 Codex 上線，定價為每百萬輸入 token 5 美元、輸出 30 美元，是前一代價格的兩倍。

該模型在 Terminal-Bench 2.0 上scored 取得 82.7% 分數，在這唯一一個明顯獲勝的基準上，以 0.7 分的差距壓過 Mythos。

Mythos, which Anthropic withheld from public release over cybersecurity concerns，在 SWE-bench Pro 上則以 77.8% 領先 GPT-5.5 的 58.6%。

它亦在 Humanity's Last Exam（無工具情境）tops 遙遙領先，得分 56.8%，相比之下 GPT-5.5 為 41.4%。這個受管控模型同時在 CyberGym、OSWorld-Verified，以及長上下文 GraphWalks 任務上佔優。

Also Read: Top Crypto Exchanges Mandate AI Tools, Track Token Use As KPI: Report

分析師提示的限制

比較結果仍然不夠精準，因為兩間實驗室都沒有直接將模型互相比對。OpenAI chose 選擇 Claude Opus 4.7 作為公開比較對象，而 Anthropic 在其 245 頁的系統卡中，則是拿 Mythos 和 GPT-5.4 對比。

測試框架亦有差異。OpenAI 在 Terminal-Bench 上使用 Codex CLI 設定，而 Anthropic 的 Terminus-2 scaffolding 則在 Terminal-Bench 2.1 的計時規則下，將 Mythos 推升至 92.1% 的成績。

Anthropic 在 4 月 7 日宣布決定對 Mythos 設置存取管控後，據報引發與歐盟委員會的會議，以及英格蘭銀行行長的警告，指該模型可能徹底撕開網絡風險防線。

Read Next: Ethereum Nears $2,450 Showdown As Bulls And Bears Split On Next Move

免責聲明及風險提示：本文資訊僅供教育與參考之用，並基於作者意見，並不構成金融、投資、法律或稅務建議。加密貨幣資產具高度波動性並伴隨高風險，可能導致投資大幅虧損或全部損失，並非適合所有投資者。文章內容僅代表作者觀點，不代表 Yellow、創辦人或管理層立場。投資前請務必自行徹底研究（D.Y.O.R.），並諮詢持牌金融專業人士。

相關新聞

Discord 群組在 Anthropic 發現前已存取 Claude Mythos 兩星期

未授權用戶透過第三方供應商環境使用 Anthropic 的受限 Claude Mythos 模型約兩星期，引發對外判帳戶與端點命名安全的關注。

AI模型成功執行數百萬智能合約攻擊，引領新型網絡威脅時代

研究顯示AI可自動尋找及利用區塊鏈漏洞，模擬攻擊金額持續倍增，成為新型網絡威脅。

AI 巨頭如何改變加密貨幣市場

中國 DeepSeek 令加密貨幣市況大挫，OpenAI 投資及 PerplexityAI 發展推動行業轉向看好 AI 相關幣，前景令人期待。

a16z 指出：阻礙 AI 擴展的已不再是智能本身

a16z 指出 AI 已能完成高階工作，但缺乏代理身分驗證、支付與歸屬機制，導致無法規模運作；區塊鏈被視為關鍵信任與經濟基礎。

為何 Gradient 認為未來萬億參數模型不會屬於 OpenAI 或 Google

Yang 預言未來 AI 模型將全球分佈式訓練，打破巨頭壟斷，帶來更透明、安全及低成本的 AI 生態。

相關研究文章

Claude Mythos 與加密貨幣：新一代 AI 威脅對交易意味著甚麼

Anthropic 的 Claude Mythos 模型因可發掘海量零日漏洞被視為過於危險而不向公眾開放，加密貨幣行業在高額黑客損失下風險驟增。

AI 概念幣復甦：Bittensor 飆升 117% 能否帶動板塊回歸？

Bittensor 帶動 AI 概念幣強勁反彈，單日板塊漲 42%，但距離 2024 年高位仍腰斬；在宏觀壓力與競爭下，板塊復甦仍存變數。

AI 代幣會成為迷因幣之後的下一個加密大潮嗎？

AI 代幣從迷因幣市值的十分之一，在 15 個月內追近持平；但包括代理人代幣在內多數項目仍較歷史高位下跌 55–94%。

你可以放心把加密貨幣交給 AI 嗎？

AI 代理配合「意圖導向」架構，令 DeFi 操作更簡單，但同時帶來安全與自主性的取捨，或將決定未來主流錢包形態。

AI 驅動加密貨幣交易：如何將加密新聞變成投資策略

AI 可助你分析新聞、預測價格、掌握市場情緒，並把機會變成交易優勢，助你洞悉加密貨幣市場脈搏。

相關學習文章

如何運用 AI 工具進行加密貨幣投資研究：2025 完全指南

探討 AI 對加密貨幣研究的顛覆性影響，涵蓋實用工具、策略、風險與真實例子，並聚焦 2025 年最新發展。

加密貨幣中的 AI 代理崛起：金融革命正在展開

AI 代理人正重塑加密金融，提升自動決策與去中心化基礎設施融合，挑戰風險、合規與道德問題。

AI 股票交易機械人點用：免費工具與真實風險

無程式 AI 交易工具令散戶更易落場，但多數只係自動化規則唔係智能。應由模擬交易開始，循序漸進、小注實測並持續監控風險。

自建 AI 加密貨幣機械人：2024-2025 全方位開發者指南

全自動化交易系統正重塑加密市場。AI、Python、API 讓個人開發者參與，需留意技術挑戰與監管要求。

2026 年 P2P 加密貨幣交易：如何進化到超越交易所

P2P 交易已從傳統託管平台，進化為跨鏈經紀網絡，提供毫秒級報價更新、原子交換、意圖導向交易及機構級合規與私隱。

Claude Mythos 對決 GPT-5.5：受管控 Anthropic 模型在 9 項測試中贏 6 項 | Yellow