根据 Anthropic 的最新研究,先进的 AI agents 现在可以自主发现并利用在线区块链智能合约中的漏洞,在模拟环境中生成数百万美元的“被盗”资金。
这些研究结果显示,AI 驱动的网络威胁进入了一个新阶段,自主逐利式攻击在技术上已经可行。
事件概览
在最近的一项项目中,研究人员构建了一个包含 405 份真实智能合约的基准数据集,这些合约在 2020 至 2025 年间曾被攻击。
当研究人员将训练截止于 2025 年 3 月之后才被攻击的合约(即超出模型训练数据范围)输入测试时,AI 代理 Claude Opus 4.5、Claude Sonnet 4.5 和 GPT-5 在模拟中共计开发出价值 460 万美元的攻击利用。
表现最好的模型 Opus 4.5 成功利用了其中 50% 的最新合约,对应约 450 万美元的模拟“被盗资金”。
更关键的是,研究不仅局限于已知漏洞。
在扫描 2,849 份近期部署、尚无已知安全问题的合约时,Sonnet 4.5 和 GPT-5 代理均发现了两个此前未知的零日漏洞。
随后,这些代理生成了可实际运行的攻击脚本,在模拟环境中获得 3,694 美元收入,而 GPT-5 的 API 成本为 3,476 美元。
研究人员表示:“这些代理既发现了两个新的零日漏洞,又生成了价值 3,694 美元的攻击利用”,证明“作为概念验证,盈利性的现实世界自主攻击在技术上是可行的。”
研究揭示了能力提升的惊人加速度。过去一年间,前沿 AI 模型在最新漏洞上的总攻击收益大约每 1.3 个月翻一番。
这种指数级增长主要归因于其在工具使用、错误恢复以及长周期任务执行等代理能力上的提升。
延伸阅读: XRP Ledger Sees Abnormal Transaction Spike Following Spot ETF Launch With $644M In Net Inflows
研究人员强调,智能合约为测试提供了独特环境,因为漏洞能够直接导致可度量的资金盗窃。
由于攻击智能合约与传统软件所需技能类似,包括控制流推理和编程能力,这些结果被视为其更广泛网络攻击经济影响的“具体下界”。
AI 驱动攻击的成本效益尤其令人担忧。
研究显示,让一个代理扫描一份合约寻找漏洞的平均成本仅为 1.22 美元。
虽然目前每次攻击的净利润仍然有限,但研究人员指出,“攻击者可以通过字节码模式、合约部署历史等启发式方法”来提高目标选择效率,从而改善收益。
此外,生成成功攻击的计算成本正在快速下降。
对 Claude 系列模型的分析显示,从 Opus 4 到 Opus 4.5 的代币成本在不到六个月的时间里下降了 70.2%,这意味着与六个月前相比,攻击者在相同算力预算下大约可以获得 3.4 倍的成功攻击次数。为了避免现实世界资产受到影响,研究人员在区块链模拟环境中完成了所有测试。
重要性何在
研究团队已将其基准公开,理由是“攻击者已经有强烈的经济动机自行开发这些工具”,而防御方需要工具来对其合约进行压力测试。
其影响远超区块链安全本身。
支撑智能合约攻击的同类能力——长周期推理、边界分析和迭代式工具使用——同样适用于所有软件系统。
随着 AI agents become more capable and cost-effective,它们正成为威胁开源和闭源软件的新兴力量,尤其是在有高价值数字资产存在的场景中。
下篇阅读: Retail Investors Stay Passive While Bitcoin Whales Double Exchange Deposits, Research Shows

