Anthropic mở Claude Mythos cho 150 công ty chỉ một ngày sau khi nộp hồ sơ IPO

Anthropic đang mở quyền truy cập vào mô hình trí tuệ nhân tạo Claude Mythos mạnh nhất của mình cho khoảng 150 tổ chức mới, chỉ một ngày sau khi công ty nộp hồ sơ chào bán cổ phiếu ra công chúng một cách bí mật.

Các điểm chính:

Anthropic đã bổ sung khoảng 150 tổ chức mới ở hơn 15 quốc gia vào Project Glasswing, chương trình truy cập dành cho Claude Mythos.

Việc mở rộng diễn ra chỉ một ngày sau khi công ty bí mật nộp hồ sơ chào bán cổ phiếu lần đầu ra công chúng.

Các nhà nghiên cứu cảnh báo mô hình có thể khiến tấn công mạng trở nên dễ dàng hơn, ngay cả khi Anthropic quảng bá nó như một công cụ phòng thủ.

Việc mở rộng Glasswing bao phủ 15 quốc gia

Công ty đã thông báo hôm thứ Ba rằng họ đang mở rộng Project Glasswing, một chương trình kiểm soát được xây dựng nhằm tìm và vá các lỗ hổng phần mềm trước khi mô hình đến tay công chúng.

Các đối tác mới nằm tại hơn 15 quốc gia. Mỗi đơn vị phải vượt qua các yêu cầu bảo mật trước khi được tham gia.

Nhóm ban đầu gồm khoảng 50 tổ chức tham gia vào tháng Tư, trong đó có Google, Microsoft, Palo Alto Networks và JPMorganChase. Từ đó đến nay, những người dùng đầu tiên này đã phát hiện hơn 10.000 lỗ hổng phần mềm mức cao hoặc nghiêm trọng. Làn sóng mới nâng tổng số lên khoảng 200.

Đợt tuyển chọn mới nhất lấp đầy những khoảng trống quan trọng. Nó bao phủ các lĩnh vực điện, nước, y tế, viễn thông và phần cứng, những ngành tụt lại phía sau trong vòng đầu.

Công ty ước tính chỉ một vụ vi phạm tại một trong các doanh nghiệp này có thể gây hại cho hơn 100 triệu người.

Cũng nên đọc: Study Finds Four Major AI Labs Use Incompatible Prompt Injection Metrics

Vì sao Claude Mythos khiến giới nghiên cứu lo ngại

Các nhà nghiên cứu và cơ quan chính phủ đã đặt câu hỏi liệu những mô hình mạnh như vậy có thể khiến các cuộc tấn công mạng phức tạp trở nên dễ thực hiện hơn hay không. Anthropic lập luận điều ngược lại, cho rằng bên phòng thủ cần công cụ sắc bén hơn trước khi kẻ tấn công có được chúng. Họ xem việc triển khai như một lợi thế lâu dài cho phòng thủ.

Các bài kiểm thử độc lập chỉ làm cuộc tranh luận thêm gay gắt. Viện An ninh AI của Anh đã ghi nhận một cuộc tấn công mạng mô phỏng gồm 32 bước mà mô hình tự thực hiện. Mozilla báo cáo Mythos đã tìm ra 271 lỗ hổng rồi tự vá trên trình duyệt Firefox, trong khi startup Calif mô tả một chuỗi khai thác nhắm vào chip M5 của Apple.

Công ty kỳ vọng các nhà phát triển đối thủ sẽ tung ra những mô hình tương đương trong vòng sáu đến 12 tháng, có thể với lớp bảo vệ yếu hơn.

Họ cảnh báo khoảng trễ đó có thể dẫn đến các cuộc tấn công thường xuyên hơn. Trong lúc chờ đợi, Anthropic đã ra mắt Claude Security, một công cụ trên mô hình công khai của hãng đã vá hơn 2.100 lỗ hổng trong ba tuần.

Claude Mythos lần đầu xuất hiện trước công chúng hồi tháng Ba. Các tài liệu dự thảo của công ty đã bị rò rỉ lên mạng, và từ đó Anthropic từ chối cung cấp toàn bộ mô hình cho mọi người nếu chưa có các biện pháp bảo vệ chặt chẽ hơn. Trên sàn dự đoán Myriad, khả năng phát hành công khai trước cuối tháng Sáu đã giảm xuống khoảng 26,5%, từ mức 58,5% một tuần trước.

Đọc tiếp: Durov Renames Toncoin To Gram, Coin Pops 10% On Roots Return