新闻学习研究排名生态系统

平台现已上线

yellow bottom left star road

GPT-5.5 在 32 步网络攻击测试中追平 Claude Mythos，英国 AISI 发布报告

Steven ZeilerMay, 01 2026 19:05

#AI #ChatGPT #克劳德 #Claude Mythos

GPT-5.5 在 32 步网络攻击测试中追平 Claude Mythos，英国 AISI 发布报告

OpenAI 最新模型 GPT-5.5 能够自主串联完成 32 步的企业网络入侵攻击链 corporate network breach，并在大约 10 分钟内破解原本需要 12 小时的逆向工程难题。

AISI 网络安全评估结果

英国科学、创新与技术部旗下研究机构——英国 AI 安全研究院（AI Security Institute，AISI）于周四 published 了这项评估结果。

研究人员发现，GPT-5.5 是仅有的第二个完全解出“The Last Ones”的模型。这是一项与 SpecterOps 合作构建的多阶段模拟。它在 10 次尝试中有 2 次 completed 成功完成整条攻击链。

首个通过该测试的是 Anthropic 的 Claude Mythos 预览版，在 10 次中成功 3 次。AISI 估计，人类网络安全专家要在 4 个子网、约 20 台主机上完成同样的“杀伤链”，大约需要 20 小时。

在“专家级”任务中，GPT-5.5 的通过率 scored 为 71.4%，略高于 Mythos 预览版的 68.6%，并远高于 GPT-5.4 的 52.4%。

Also Read: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning

越狱风险与政策回应

AISI 报告称，其发现了一种“通用越狱”方式，能够在所有测试的恶意网络攻击查询中绕过模型安全防护。这一利用方式由专家红队用 6 小时攻防对抗开发而成，但由于配置问题，未能验证 OpenAI 补丁的有效性。

该机构警告称，进攻性网络攻击能力似乎正作为推理与自主性整体提升的“副产品”自然涌现。

在今年 4 月，AISI 对 Mythos Preview marked the first time any frontier model finished the corporate attack 的评估，标志着首次有前沿模型端到端完成整套企业攻击范围。此次 GPT-5.5 的表现被视为这一趋势的再次印证，而非一次性的飞跃。

Read Next: Crypto VC Funding Crashes To $659M In April, A 2-Year Low

免责声明和风险警告：本文提供的信息仅用于教育和信息目的，基于作者的意见。它不构成财务、投资、法律或税务建议。加密货币资产具有高度波动性并面临高风险，包括失去全部或大部分投资的风险。交易或持有加密资产可能不适合所有投资者。本文表达的观点仅为作者的观点，不代表Yellow、其创始人或高管的官方政策或立场。在做出任何投资决定之前，请务必进行自己的全面研究（D.Y.O.R.）并咨询持牌金融专业人士。

最新新闻

查看所有新闻

Solana与Hyperliquid瓜分八成山寨币ETF成交量

Solana与Hyperliquid ETF包揽近八成山寨币ETF成交量，管理规模与净流入约为对应代币市值2%，显示机构风险偏好正从比特币和以太坊外溢。

谷歌秘密自研 AI 芯片：将 Gemini“写进”硬件，瞄准算力能效提升 10 倍

谷歌内部推进“Frozen v2”AI 芯片项目，将部分 Gemini 架构固化进硬件，目标在 2028 年起提供最高 10 倍能效提升，消息刺激 Alphabet 股价上扬。

巴菲特痛批美股沦为赌场，却豪赌一笔押注在AI上的谷歌母公司

巴菲特一边警告美股“赌场化”，一边亲自主导伯克希尔重仓Alphabet押注AI基础设施，其表态牵动美股与加密资产风险偏好。

相关新闻

Claude Mythos 与 GPT-5.5 如何悄然重写网络防御“算术”

Mythos 预览版与 GPT-5.5 在自主网络攻防基准测试中大幅超预期，推动 AISI 将网络安全能力“翻倍周期”压缩至约四个月。

Claude Mythos 在 10 次尝试中 6 次破解 32 步 AISI 攻击演练

Anthropic 新版 Claude Mythos 在英国 AISI 两大网络攻防靶场上表现跃升，多次成功完成复杂企业与工业控制攻击，引发动防失衡担忧。

Claude Mythos 对决 GPT-5.5：受控 Anthropic 模型在 9 项测试中赢下 6 项

基准数据显示，受控发布的 Claude Mythos 在九项可比测试中赢下六项，但两家实验室测试方法不同，比较仍不精确。

OpenAI 的 Daybreak 是否标志着 AI 网络安全军备竞赛的开端？

OpenAI 推出基于 GPT-5.5 和 Codex 的 Daybreak 网络安全计划，与 Glasswing 竞争，联合多家大型安全与云厂商。

OpenAI 向日本三大银行提供 GPT-5.5 网络防御模型抵御 AI 黑客攻击

OpenAI 通过“网络可信访问”计划向日本三大银行提供 GPT-5.5，用于发现系统漏洞、抵御 AI 网络攻击，形成国家级 AI 防御布局。

相关研究文章

Claude Mythos 与加密货币：全新 AI 威胁对交易意味着什么

Anthropic 的 Claude Mythos 发现数千零日漏洞却因风险过高未公开，在加密行业已损失 33 亿美元背景下，加剧安全与集中化压力。

Claude Mythos 将如何重塑金融与加密行业

Anthropic 的前沿模型 Claude Mythos 通过 Project Glasswing 限制性开放，凸显其在发现高危漏洞上的能力，对银行及加密基础设施安全和市场稳定构成深远影响。

42 个州已对 OpenAI 发起调查，华尔街紧盯其 IPO

42 个州在 OpenAI 提交 8,520 亿美元估值 IPO 后迅速发起调查，聚焦 AI 安全、用户数据与非营利转制，或拖慢上市进程。

AI 赛道复苏：Bittensor 大涨 117% 能否带动板块回归？

Bittensor 带动 AI 代币单日暴涨，但整个板块在 2025 年大跌后仍低于高点一半，AI 叙事能否转为长期投资逻辑仍存疑。

2025–2026 年最大加密货币攻击：究竟哪里出错了

梳理 2025–2026 年重大加密攻击事件：规模创纪录、损失高度集中，关键信任点失守比单纯代码漏洞更致命。

相关学习文章

为什么没有自有区块链层的 AI 代理无法实现规模化

AI 代理正实际管理资金并跨链操作，但传统为人类设计的钱包在密钥托管、Gas 机制和账户模型上都不适配机器。新一代链上基础设施正围绕代理账户、免Gas执行和意图路由重构。

去中心化 AI 能保护你的提示隐私吗？

隐私 AI 网络通过去中心化节点执行推理，避免单一方看到完整提示与回复，并用密码学与硬件安全保障私密性与可验证性。

Bittensor 运行着一家市值 26 亿美元、无人控制的 AI 市场

介绍去中心化 AI 市场 Bittensor：模型在子网中竞争获取 TAO，矿工与验证者分工协作，用户可通过质押与委托参与。

如何利用 AI 工具进行加密投资研究： 2025 完整指南

2025年，AI 驱动的加密货币投资研究带来巨变，为投资者创造了前所未有的机会。

加密货币中AI代理的崛起：金融革命的展开

AI与加密货币的融合正在以自动化决策和区块链基础设施的结合。

GPT-5.5 在 32 步网络攻击测试中追平 Claude Mythos，英国 AISI 发布报告 | Yellow