Anthropic đang mở quyền truy cập vào mô hình trí tuệ nhân tạo Claude Mythos mạnh nhất của mình cho khoảng 150 tổ chức mới, chỉ một ngày sau khi công ty nộp hồ sơ kín cho một đợt phát hành cổ phiếu ra công chúng.
Các điểm chính:
- Anthropic đã thêm khoảng 150 tổ chức mới tại hơn 15 quốc gia vào Project Glasswing, chương trình truy cập dành cho Claude Mythos.
- Đợt mở rộng diễn ra chỉ một ngày sau khi công ty nộp kín hồ sơ cho đợt IPO đầu tiên.
- Các nhà nghiên cứu cảnh báo mô hình này có thể khiến tấn công mạng trở nên dễ dàng hơn, ngay cả khi Anthropic quảng bá nó như một công cụ phòng thủ.
Glasswing mở rộng sang 15 quốc gia
Công ty đã thông báo hôm thứ Ba rằng họ đang mở rộng Project Glasswing, một chương trình kiểm soát được xây dựng để tìm và vá lỗi phần mềm trước khi mô hình được tung ra công chúng.
Các đối tác mới nằm tại hơn 15 quốc gia. Mỗi đơn vị phải đáp ứng các yêu cầu an ninh trước khi được tham gia.
Nhóm ban đầu gồm khoảng 50 tổ chức đã tham gia vào tháng Tư, trong đó có Google, Microsoft, Palo Alto Networks và JPMorganChase. Kể từ đó, những người dùng đầu tiên này đã báo cáo hơn 10.000 lỗ hổng phần mềm mức cao hoặc nghiêm trọng. Đợt mở rộng mới nâng tổng số lên khoảng 200.
Đợt tuyển chọn mới lấp đầy những khoảng trống quan trọng. Nó bao trùm các lĩnh vực điện, nước, y tế, viễn thông và phần cứng, những ngành tụt lại trong vòng đầu tiên.
Theo ước tính của công ty, chỉ một vụ xâm nhập tại một trong các doanh nghiệp này cũng có thể gây hại cho hơn 100 triệu người.
Đọc thêm: Study Finds Four Major AI Labs Use Incompatible Prompt Injection Metrics
Vì sao Claude Mythos khiến các nhà nghiên cứu lo ngại
Các nhà nghiên cứu và cơ quan chính phủ đã đặt câu hỏi liệu những mô hình có năng lực như vậy có thể khiến các cuộc tấn công mạng phức tạp trở nên dễ thực hiện hơn hay không. Anthropic lập luận ngược lại, cho rằng bên phòng thủ cần công cụ sắc bén hơn trước khi kẻ tấn công có được chúng. Họ coi đợt triển khai này là một lợi thế bền vững cho phòng thủ.
Các bài kiểm thử độc lập càng làm nóng tranh luận. Viện An ninh AI của Vương quốc Anh đã ghi nhận một cuộc tấn công mạng mô phỏng gồm 32 bước do mô hình tự thực hiện. Mozilla báo cáo rằng Mythos đã tìm ra 271 lỗ hổng rồi tự vá trong trình duyệt Firefox, trong khi startup Calif mô tả một chuỗi khai thác nhắm vào chip M5 của Apple.
Công ty kỳ vọng các nhà phát triển đối thủ sẽ tung ra những mô hình tương đương trong vòng sáu đến 12 tháng, có thể với hàng rào bảo vệ yếu hơn.
Anthropic cảnh báo khoảng trễ đó có thể dẫn đến các cuộc tấn công thường xuyên hơn. Trong lúc này, Anthropic đã ra mắt Claude Security, một công cụ chạy trên mô hình công khai của họ, đã vá hơn 2.100 lỗi trong ba tuần.
Claude Mythos lần đầu xuất hiện công khai vào tháng Ba. Tài liệu dự thảo nội bộ của công ty đã bị rò rỉ lên mạng, và kể từ đó Anthropic từ chối bàn giao toàn bộ mô hình cho mọi người nếu chưa có các biện pháp bảo vệ chặt chẽ hơn. Trên thị trường dự đoán Myriad, khả năng phát hành công khai trước cuối tháng Sáu đã giảm xuống còn khoảng 26,5%, từ mức 58,5% một tuần trước.
Xem tiếp: Durov Renames Toncoin To Gram, Coin Pops 10% On Roots Return





