고급 AI agents는 이제 실시간 블록체인 스마트 컨트랙트의 취약점을 자율적으로 찾아 악용해, 시뮬레이션 기준 수백만 달러 규모의 도난 자금을 생성할 수 있는 것으로, Anthropic의 최신 연구에서 나타났다.
이 findings는 자율적이고 이익을 추구하는 형태의 스마트 컨트랙트 악용이 기술적으로 가능한, AI 주도 사이버 위협의 새로운 국면을 시사한다.
What Happened
최근 프로젝트에서 연구진은 2020년부터 2025년 사이 실제로 악용된 405개의 스마트 컨트랙트로 벤치마크를 구축했다.
이후, 모델의 학습 데이터 시점인 2025년 3월 이후에 해킹된 컨트랙트를 대상으로 테스트한 결과, AI 에이전트 Claude Opus 4.5, Claude Sonnet 4.5, GPT-5는 합산 기준 460만 달러 규모의 시뮬레이션 익스플로잇을 만들어냈다.
가장 성능이 뛰어난 모델인 Opus 4.5는 이들 최신 컨트랙트의 50%를 성공적으로 악용했으며, 이는 약 450만 달러 상당의 시뮬레이션 도난 자금에 해당한다.
중요한 것은, 이번 연구가 이미 알려진 취약점에만 그치지 않았다는 점이다.
연구진이 알려진 보안 이슈가 없는 최근 배포 컨트랙트 2,849개를 스캔했을 때, Sonnet 4.5와 GPT-5 에이전트는 이전에는 보고되지 않았던 제로데이 취약점 두 개를 새로 발견했다.
이후 에이전트는 시뮬레이션 기준 3,694달러 규모의 수익을 창출하는 실제 동작 가능한 익스플로잇을 생성했으며, GPT-5는 API 비용 3,476달러로 이를 달성했다.
연구진은 “에이전트들이 새로운 제로데이 취약점 두 개를 찾아냈고, 3,694달러 규모의 익스플로잇을 만들었다”고 밝히며, 이를 통해 “수익성이 있는 실세계 자율 공격이 기술적으로 가능하다는 개념 증명”이라고 설명했다.
연구 결과는 능력의 가속이 놀라운 수준에 이르렀음을 보여준다. 지난 1년 동안, 최신 AI 모델이 최근 취약점에서 만들어낸 총 익스플로잇 수익은 약 1.3개월마다 두 배씩 증가했다.
이러한 기하급수적 성장은 도구 사용, 오류 복구, 장기 과제 수행 등 에이전트형 능력의 향상에 기인하는 것으로 분석된다.
Also Read: XRP Ledger Sees Abnormal Transaction Spike Following Spot ETF Launch With $644M In Net Inflows
연구진은 스마트 컨트랙트가 취약점이 곧바로 측정 가능한 금전적 피해를 동반한 ‘직접적인 도난’을 허용하기 때문에, 독특한 테스트 베드 역할을 한다고 강조한다.
스마트 컨트랙트와 전통적인 소프트웨어 익스플로잇 모두 제어 흐름 추론과 프로그래밍 숙련도 등 유사한 기술을 요구하기 때문에, 이번 결과는 “AI의 더 넓은 사이버 능력이 초래할 수 있는 경제적 영향에 대한 구체적인 하한선”을 시사한다.
특히 AI 기반 공격의 비용 효율성이 주된 우려로 지목된다.
에이전트가 한 개의 컨트랙트를 스캔해 취약점을 찾는 데 드는 평균 비용은 1.22달러에 불과했다.
현재 익스플로잇 1건당 순이익은 아직 크지 않지만, 연구진은 “공격자들이 바이트코드 패턴, 배포 이력과 같은 휴리스틱을 활용해 타깃 선정 효율을 높임으로써 이 문제를 해결할 수 있다”고 지적한다.
더 나아가, 성공적인 익스플로잇을 생성하는 데 필요한 연산 비용은 빠르게 떨어지고 있다.
Claude 모델 분석에 따르면, Opus 4에서 Opus 4.5로 넘어가는 6개월 미만의 기간 동안 토큰 비용이 70.2% 감소했다. 이는 공격자가 같은 연산 예산으로 6개월 전보다 약 3.4배 더 많은 성공적인 익스플로잇을 확보할 수 있음을 의미한다. 연구진은 잠재적 피해를 차단하기 위해 모든 테스트를 블록체인 시뮬레이터 환경에서 수행해, 실제 자산에는 영향이 없도록 했다.
Why It Matters
연구진은 “공격자들은 이미 이러한 도구를 독자적으로 개발할 강력한 금전적 인센티브를 가지고 있다”며, 방어자들이 자신의 컨트랙트를 스트레스 테스트할 수 있도록 벤치마크를 공개했다고 밝혔다.
이 연구의 함의는 블록체인 보안을 넘어선다.
스마트 컨트랙트 익스플로잇을 가능하게 하는 장기 추론, 경계 조건 분석, 반복적 도구 사용과 같은 능력은 모든 소프트웨어 시스템에 그대로 적용될 수 있다.
AI agents become more capable and cost-effective해질수록, 이들은 귀중한 디지털 자산이 걸려 있는 오픈소스와 독점 소프트웨어 모두에 대해 새로운 유형의 위협으로 부상하고 있다.
Read Next: Retail Investors Stay Passive While Bitcoin Whales Double Exchange Deposits, Research Shows

