고급형 AI agents는 이제 실제 블록체인 스마트 컨트랙트의 취약점을 자율적으로 탐색하고 악용해, 시뮬레이션 상으로 수백만 달러에 달하는 탈취 자금을 만들어낼 수 있는 것으로, 앤트로픽(Anthropic)의 신규 연구에서 드러났다.
이 findings는 자율적이고 이윤을 추구하는 AI 기반 공격이 기술적으로 가능해진 새로운 단계의 사이버 위협이 도래했음을 시사한다.
무엇이 발생했나
최근 한 프로젝트에서 연구진은 2020년부터 2025년 사이 실제로 악용된 405개의 스마트 컨트랙트를 모아 벤치마크를 구축했다.
모델의 학습 데이터 이후 시점인 2025년 3월 이후에 해킹된 컨트랙트를 대상으로 테스트했을 때, AI 에이전트인 Claude Opus 4.5, Claude Sonnet 4.5, GPT-5는 합산 시뮬레이션 상 460만 달러 규모의 익스플로잇을 설계해냈다.
가장 성능이 뛰어난 모델인 Opus 4.5는 이 최근 컨트랙트의 50%를 성공적으로 공격했으며, 이는 450만 달러 상당의 시뮬레이션 탈취 자금에 해당한다.
중요한 점은, 이번 연구가 이미 알려진 취약점에만 그치지 않았다는 것이다.
2020년대 후반에 새로 배포된 2,849개의 컨트랙트를 스캔했을 때, 알려진 보안 이슈가 전혀 없음에도 Sonnet 4.5와 GPT-5 에이전트가 각각 두 건의 신규 제로데이(Zero-day) 취약점을 발견했다.
이후 에이전트들은 이를 활용해 시뮬레이션 기준 3,694달러의 수익을 내는 실제 동작 가능한 익스플로잇을 생성했으며, GPT-5는 API 비용 3,476달러로 이 목표를 달성했다.
연구진은 “에이전트가 두 가지 새로운 제로데이 취약점을 발견했을 뿐 아니라, 3,694달러 가치의 익스플로잇을 만들어냈다”고 밝히며, 이는 “수익성 있는 현실 세계 자율 해킹이 기술적으로 가능하다는 개념증명(proof-of-concept)”이라고 설명했다.
이번 연구는 해당 능력의 가속이 놀라울 정도라고 지적한다. 지난 1년간, 최신형 AI 모델이 최신 취약점을 대상으로 시뮬레이션에서 만들어낸 총 익스플로잇 수익은 약 1.3개월마다 두 배씩 증가해온 것으로 나타났다.
이러한 기하급수적 성장은 툴 사용, 에러 복구, 장기 과업 수행과 같은 에이전트 능력의 고도화에 기인한다고 연구진은 분석했다.
또 읽어보기: XRP Ledger Sees Abnormal Transaction Spike Following Spot ETF Launch With $644M In Net Inflows
연구진은 스마트 컨트랙트가 독특한 테스트 베드 역할을 한다고 강조한다. 해당 취약점은 직접적인 자산 탈취가 가능하고, 그 재정적 영향을 정량적으로 측정할 수 있기 때문이다.
스마트 컨트랙트와 기존 소프트웨어의 익스플로잇에는 제어 흐름 추론, 프로그래밍 역량 등 유사한 기술이 요구되므로, 이번 결과는 “이들 AI의 광범위한 사이버 능력이 초래할 경제적 영향에 대한 구체적 하한선”을 시사한다고 연구진은 말한다.
특히 주목할 점은 AI 기반 공격의 비용 효율성이다.
하나의 계약에서 취약점을 탐색하는 데 드는 에이전트 평균 비용은 단지 1.22달러에 불과했다.
현재 개별 익스플로잇의 순이익은 아직 크지 않지만, 연구진은 “공격자가 바이트코드 패턴, 배포 이력 같은 휴리스틱을 활용해 타깃 선정 효율성을 높인다면 이 문제를 충분히 극복할 수 있다”고 지적한다.
또한 성공적인 익스플로잇을 만들어내는 데 필요한 계산 비용도 빠르게 줄어드는 중이다.
클로드 모델 분석 결과, Opus 4에서 Opus 4.5로 가는 데 불과 6개월도 안 되는 기간 동안 토큰 비용이 70.2% 감소했으며, 이는 공격자가 동일한 연산 예산으로 6개월 전보다 약 3.4배 더 많은 성공적인 익스플로잇을 확보할 수 있음을 의미한다. 연구진은 잠재적 피해를 막기 위해 모든 테스트를 블록체인 시뮬레이터 상에서 수행해 실제 자산에는 아무 영향도 주지 않았다고 밝혔다.
왜 중요한가
연구진은 “공격자는 이미 이런 툴을 독자적으로 구축할 강력한 재정적 유인을 갖고 있다”며, 수비 측이 자신의 스마트 컨트랙트를 스트레스 테스트할 수 있어야 한다는 이유로 벤치마크를 공개했다.
이번 연구 결과의 함의는 블록체인 보안을 넘어선다.
스마트 컨트랙트 익스플로잇을 가능하게 하는 장기 추론, 경계 조건 분석, 반복적 툴 사용 능력은 모든 소프트웨어 시스템에 동일하게 적용된다.
AI agents become more capable and cost-effective해질수록, 가치 있는 디지털 자산이 걸려 있는 오픈소스 및 상용 소프트웨어 모두에 대해 새로운 유형의 위협으로 부상하게 된다.
다음 읽기: Retail Investors Stay Passive While Bitcoin Whales Double Exchange Deposits, Research Shows

