Anthropic sẽ mở Claude Mythos cho công chúng khi cơ chế bảo vệ theo kịp, có thể trong 12 tháng

Anthropic sẽ mở Claude Mythos cho công chúng khi cơ chế bảo vệ theo kịp, có thể trong 12 tháng

Anthropic cho biết hãng có ý định cho công chúng truy cập vào mô hình Mythos, its vulnerability-hunting AI, nhưng chỉ sau khi xây dựng được các cơ chế bảo vệ hiện chưa tồn tại.

Điểm chính:

  • Anthropic có kế hoạch phát hành rộng rãi các mô hình thuộc lớp Mythos sau khi trước hết mở rộng quyền truy cập cho chính phủ Mỹ và các nước đồng minh.
  • Công ty thừa nhận chưa có bên nào, kể cả chính họ, xây dựng được cơ chế bảo vệ đủ mạnh để ngăn việc lạm dụng.
  • Mythos đã phát hiện hơn 23.000 vấn đề trên 1.000 dự án mã nguồn mở, trong đó có 6.202 lỗi nghiêm trọng hoặc tới mức nguy kịch.

Phát hành Anthropic Mythos

Anthropic đã xác nhận kế hoạch này trong một bản cập nhật cho Project Glasswing, chương trình bảo mật giới hạn truy cập của hãng, và một báo cáo riêng cho biết mốc thời gian vẫn chưa chắc chắn.

Công ty nói rằng họ sẽ trước tiên làm việc với chính phủ Mỹ và các nước đồng minh để mở rộng chương trình. Một đợt phát hành rộng hơn của “các mô hình lớp Mythos” sẽ diễn ra trong tương lai gần.

Anthropic bày tỏ thẳng thắn về rủi ro. Hãng nêu rõ rằng chưa có công ty nào, kể cả chính Anthropic, xây dựng được cơ chế bảo vệ đủ mạnh để ngăn mô hình bị lạm dụng và gây tổn hại nghiêm trọng.

Dù vậy, công ty kỳ vọng các công cụ tương tự sẽ lan rộng nhanh chóng, dự đoán các mô hình ở mức Mythos sẽ được phổ biến rộng rãi trong vòng sáu đến 12 tháng.

Mythos đã ra mắt vào tháng Tư. Anthropic cho biết trong thử nghiệm, mô hình tạo ra khai thác hoạt động được trong 72,4% trường hợp, so với gần như 0% đối với một phiên bản Claude trước đó.

Đọc thêm: Cisco Research Shows Frontier AI Models Failing Under Multi-Turn Attacks

Phát hiện lỗ hổng của Mythos

Kể từ khi ra mắt, mô hình đã quét hơn 1.000 dự án mã nguồn mở và phát hiện 23.019 vấn đề, trong đó 6.202 vấn đề được đánh giá là có mức độ nghiêm trọng cao hoặc tới mức nguy kịch.

Một phát hiện nổi bật. Mythos đã tìm ra một lỗi trong thư viện mật mã wolfSSL, được sử dụng trên hàng tỷ thiết bị, có thể cho phép kẻ tấn công giả mạo chứng chỉ và mạo danh ngân hàng hoặc nhà cung cấp email. Lỗi này hiện đã được vá.

Lượng báo cáo dồn dập đã gây áp lực cho những người phải khắc phục chúng. Các nhà duy trì mã nguồn mở đã yêu cầu Anthropic giảm tốc độ công bố, cho rằng khối lượng vượt quá khả năng xử lý của họ.

Các nhà nghiên cứu nhìn thấy một sự mất cân bằng sâu sắc hơn. Anthropic cho rằng việc tìm lỗi giờ đây dễ hơn nhiều so với sửa lỗi, và công ty đã hợp tác với dự án Alpha-Omega của Open Source Security Foundation để giúp các nhà duy trì phân loại và xử lý tồn đọng.

Thẻ hệ thống Claude Mythos dự đoán AI sau cùng sẽ nghiêng về phía những người phòng thủ, dù Anthropic thừa nhận hiện tại có thể kẻ tấn công vẫn đang nắm lợi thế.

Khi Mythos lần đầu được công bố, Anthropic đã cho hơn 50 tổ chức, bao gồm Apple, Microsoft và Google, quyền truy cập cùng khoảng 100 triệu USD tín dụng sử dụng, đồng thời không phát hành mô hình cho công chúng vì khả năng vũ khí hóa các lỗ hổng phần mềm của nó.

Đọc tiếp: Cardano Whales Seize 67.5% Of ADA Supply, A Six-Year High

Tuyên bố miễn trừ trách nhiệm và cảnh báo rủi ro: Thông tin được cung cấp trong bài viết này chỉ dành cho mục đích giáo dục và thông tin, dựa trên ý kiến của tác giả. Nó không cấu thành lời khuyên tài chính, đầu tư, pháp lý hoặc thuế. Tài sản tiền mã hóa có tính biến động cao và chịu rủi ro cao, bao gồm rủi ro mất tất cả hoặc một phần lớn khoản đầu tư của bạn. Giao dịch hoặc nắm giữ tài sản crypto có thể không phù hợp với tất cả nhà đầu tư. Những quan điểm được bày tỏ trong bài viết này hoàn toàn là của (các) tác giả và không đại diện cho chính sách chính thức hoặc lập trường của Yellow, những người sáng lập hoặc giám đốc điều hành. Luôn tiến hành nghiên cứu kỹ lưỡng của riêng bạn (D.Y.O.R.) và tham khảo ý kiến chuyên gia tài chính được cấp phép trước khi đưa ra bất kỳ quyết định đầu tư nào.
Tin tức mới nhất
Xem tất cả tin tức
Anthropic sẽ mở Claude Mythos cho công chúng khi cơ chế bảo vệ theo kịp, có thể trong 12 tháng | Yellow.com