Các AI agents tiên tiến hiện có thể tự động tìm và khai thác lỗ hổng trong các hợp đồng thông minh blockchain đang hoạt động, tạo ra hàng triệu đô la trong quỹ bị đánh cắp mô phỏng, theo nghiên cứu mới từ Anthropic.
Các findings này cho thấy một giai đoạn mới của các mối đe dọa mạng do AI dẫn dắt, nơi việc khai thác tự động, tìm kiếm lợi nhuận nay đã khả thi về mặt kỹ thuật.
Điều gì đã xảy ra
Trong một dự án gần đây, các học giả đã xây dựng một bộ chuẩn gồm 405 hợp đồng thông minh thực tế đã bị khai thác trong giai đoạn 2020–2025.
Khi được thử nghiệm với các hợp đồng bị hack sau tháng 3/2025, tức là nằm ngoài dữ liệu huấn luyện của mô hình, các AI agent Claude Opus 4.5, Claude Sonnet 4.5 và GPT-5 đã cùng nhau phát triển những khai thác trị giá 4,6 triệu đô la trong mô phỏng.
Mô hình có hiệu suất cao nhất, Opus 4.5, đã khai thác thành công 50% số hợp đồng gần đây này, tương ứng với 4,5 triệu đô la quỹ bị đánh cắp trong mô phỏng.
Quan trọng là, nghiên cứu còn mở rộng ra ngoài các lỗ hổng đã biết.
When scanning 2,849 recently deployed contracts with no known security issues, both Sonnet 4.5 and GPT-5 agents uncovered two previously unknown zero-day vulnerabilities.
Các agent sau đó đã tạo ra các khai thác hoạt động được, trị giá 3.694 đô la trong doanh thu mô phỏng, với GPT-5 đạt được điều này với chi phí API là 3.476 đô la.
“Các agent đều phát hiện hai lỗ hổng zero-day mới và tạo ra các khai thác trị giá 3.694 đô la,” các nhà nghiên cứu cho biết, thể hiện “như một bằng chứng khái niệm rằng việc khai thác tự động, có lợi nhuận ngoài đời thực là khả thi về mặt kỹ thuật.”
Nghiên cứu cho thấy một bước nhảy vọt đáng kinh ngạc về năng lực. Trong năm qua, tổng doanh thu từ các vụ khai thác mà những mô hình AI tiên phong tạo ra trên các lỗ hổng gần đây đã tăng gấp đôi khoảng mỗi 1,3 tháng.
Sự tăng trưởng theo hàm mũ này được cho là nhờ cải thiện các năng lực dạng agent như sử dụng công cụ, khôi phục sau lỗi và thực hiện nhiệm vụ dài hạn.
Cũng nên đọc: XRP Ledger Sees Abnormal Transaction Spike Following Spot ETF Launch With $644M In Net Inflows
Các nhà nghiên cứu nhấn mạnh rằng hợp đồng thông minh cung cấp một môi trường thử nghiệm độc đáo vì lỗ hổng cho phép trộm cắp trực tiếp với tác động tài chính đo lường được.
Vì khai thác hợp đồng thông minh và phần mềm truyền thống đều yêu cầu các kỹ năng tương tự, bao gồm suy luận luồng điều khiển và thành thạo lập trình, các kết quả này cho thấy một “ngưỡng dưới cụ thể về tác động kinh tế của các năng lực mạng rộng hơn của chúng.”
Tính hiệu quả về chi phí của các cuộc tấn công do AI dẫn dắt đặc biệt đáng lo ngại.
Chi phí trung bình để một agent quét một hợp đồng tìm lỗ hổng chỉ là 1,22 đô la.
Dù lợi nhuận ròng trên mỗi vụ khai thác hiện vẫn còn khiêm tốn, các nhà nghiên cứu lưu ý rằng “kẻ tấn công có thể giải bài toán này bằng cách dùng các heuristic như mẫu bytecode và lịch sử triển khai” để cải thiện hiệu quả nhắm mục tiêu.
Hơn nữa, chi phí tính toán để tạo ra các khai thác thành công đang giảm nhanh chóng.
Phân tích các mô hình Claude cho thấy chi phí token giảm 70,2% từ Opus 4 xuống Opus 4.5 trong chưa đầy sáu tháng, nghĩa là kẻ tấn công nay có thể thu được khoảng 3,4 lần số khai thác thành công cho cùng ngân sách tính toán như sáu tháng trước. Các nhà nghiên cứu đã tiến hành toàn bộ thử nghiệm trong các bộ mô phỏng blockchain, không tác động đến tài sản ngoài đời thực nhằm ngăn ngừa tổn hại tiềm ẩn.
Tại sao điều này quan trọng
Họ đã công khai bộ chuẩn của mình, lập luận rằng “kẻ tấn công vốn đã có động cơ tài chính mạnh để tự xây dựng các công cụ này” và bên phòng thủ cần công cụ để kiểm thử sức chịu đựng hợp đồng của họ.
Các hệ quả còn vượt ra ngoài an ninh blockchain.
Cùng những năng lực cho phép khai thác hợp đồng thông minh—suy luận dài hạn, phân tích biên và sử dụng công cụ lặp—đều áp dụng cho mọi hệ thống phần mềm.
Khi AI agents become more capable and cost-effective, chúng trở thành mối đe dọa mới nổi đối với cả phần mềm nguồn mở lẫn sở hữu, nơi các tài sản số giá trị cao đang bị đe dọa.
Đọc tiếp: Retail Investors Stay Passive While Bitcoin Whales Double Exchange Deposits, Research Shows

