Anthropic hứng chỉ trích sau khi Claude Code bí mật gắn cờ người dùng liên quan tới 147 tên miền Trung Quốc

Claude Code của Anthropic bí mật nhúng các dấu ẩn để gắn cờ người dùng liên quan tới 147 tên miền và phòng thí nghiệm AI Trung Quốc, theo tiết lộ của các nhà phát triển trong tuần này.

Các điểm chính

Các nhà phát triển phát hiện Claude Code mã hóa chi tiết proxy và múi giờ vào các ký tự Unicode vô hình, ẩn trong lời nhắc hệ thống

Cơ chế này kiểm tra cấu hình với 147 tên miền Trung Quốc và 11 từ khóa phòng thí nghiệm AI trước khi thay đổi một dòng ngày tháng trong prompt

Anthropic cho biết đoạn mã sẽ bị gỡ trong bản phát hành Claude Code tiếp theo sau khi nhà phát triển và nhà nghiên cứu lên tiếng cảnh báo

Các dấu hiệu ẩn trong prompt

Một lập trình viên khi dịch ngược Claude Code phiên bản 2.1.196 trong lúc khôi phục một tính năng điều khiển từ xa đã bị vô hiệu hóa phát hiện đoạn mã được làm rối, lặng lẽ tồn tại từ tháng 4.

Các phát hiện này xuất hiện trên Reddit ngày 30/6 dưới một tên tài khoản ẩn danh và được xác nhận trong một bài viết kỹ thuật đăng trên GitHub.

Các nhà phân tích kiểm tra ba bản phát hành Claude Code khác nhau và thấy cơ chế hoạt động giống hệt trong mỗi bản, không hề được nhắc tới trong ghi chú phát hành dù đã qua nhiều tháng cập nhật. Nó chỉ kích hoạt khi người dùng trỏ Claude Code tới một địa chỉ máy chủ tùy chỉnh thay vì máy chủ của Anthropic. Khi được kích hoạt, công cụ đọc múi giờ của hệ thống và kiểm tra xem nó có trùng với hai thành phố được liên kết với Trung Quốc đại lục hay không.

Địa chỉ proxy sau đó được so với danh sách tên miền ẩn gồm 147 mục, được làm rối để tránh bị lộ trong tìm kiếm văn bản thuần, bao gồm Baidu, Alibaba, Ant Group và ByteDance, cùng 11 từ khóa gắn với các phòng thí nghiệm AI Trung Quốc. Kết quả được nhúng vào câu trông rất bình thường là “Today's date is...”, trong đó dấu gạch ngang chuyển thành dấu gạch chéo cho múi giờ Trung Quốc và dấu nháy đơn chuẩn được thay bằng một trong ba ký tự gần như giống hệt.

Đọc thêm: BitMine chống chọi đà bán tháo với khoản cược Ethereum 43 triệu đô, chiến lược chùng lại

Khủng hoảng niềm tin của nhà phát triển

Các lập trình viên phản ứng đầy lo ngại khi cơ chế này bị phát hiện công khai, lập luận rằng một công cụ có quyền truy cập mã nguồn và lệnh shell phải minh bạch hơn nhiều so với một cửa sổ chat. Một báo cáo lỗi được gửi lên kho mã của dự án gọi đây là hành vi fingerprint bí mật và đặt câu hỏi còn những tín hiệu nào khác đang bị che giấu khỏi người dùng. Người bình luận nhận xét rằng việc kiểm tra này có thể bị vô hiệu chỉ bằng cách đổi hostname hoặc đồng hồ hệ thống.

Điều đó có nghĩa nó chủ yếu gắn thẻ các lập trình viên bình thường sử dụng proxy doanh nghiệp hợp pháp, thay vì những tác nhân tinh vi mà nó được thiết kế để phát hiện. Anthropic trước đây từng cáo buộc các phòng thí nghiệm Trung Quốc bao gồm DeepSeek, Moonshot AI và MiniMax dùng hơn 24.000 tài khoản gian lận và hơn 16 triệu phiên trao đổi để sao chép khả năng lập luận và hành vi viết mã của Claude hồi đầu năm nay.

Một kỹ sư Anthropic đã thừa nhận đoạn mã này trên mạng xã hội và nói rằng nó sẽ được gỡ trong bản phát hành ngày hôm sau, dù công ty chưa đưa ra tuyên bố chính thức bằng văn bản. Sự cố này nối dài chuỗi câu hỏi về bảo mật xoay quanh Claude Code trong năm nay.

Các nhà nghiên cứu tại Microsoft tiết lộ một lỗ hổng prompt injection trong tích hợp GitHub của công cụ này vào tháng 6, Check Point gắn cờ ba lỗ hổng riêng biệt hồi tháng 2, và chính mã nguồn của Anthropic cũng từng bị rò rỉ trong thời gian ngắn vào tháng 4.

Đọc tiếp: CZ nói Binance đã ở rất gần phê duyệt MiCA trước khi yếu tố chính trị can thiệp