Anthropic đã khôi phục Fable 5 trên toàn thế giới vào ngày 1 tháng 7 với đầy đủ khả năng, đồng thời thêm một bộ lọc chặn một prompt hack bị gắn cờ trong hơn 99% số lần thử.
Điểm chính:
- Bộ Thương mại Hoa Kỳ đã dỡ bỏ các kiểm soát xuất khẩu, và Fable 5 trở lại phạm vi toàn cầu trên các sản phẩm chính của Anthropic.
- Mô hình giữ nguyên toàn bộ năng lực, dù nay có một bộ lọc mới chuyển hướng một prompt hack bị gắn cờ sang mô hình yếu hơn.
- Kiểm thử cho thấy các mô hình rẻ hơn cũng có thể phát hiện các lỗ hổng tương tự, làm suy yếu lập luận rằng Fable 5 là mối nguy hiểm độc nhất.
Fable 5 trở lại toàn cầu
Bộ Thương mại Hoa Kỳ đã dỡ bỏ lệnh khẩn cấp về xuất khẩu vào ngày 30 tháng 6, và mô hình đã đến tay người dùng trở lại vào ngày hôm sau trên Claude Platform, Claude.ai, Claude Code và Claude Cowork. Truy cập qua các nền tảng đám mây lớn sẽ được triển khai sau.
Người dùng trả phí có thể sử dụng trong giới hạn hàng tuần đến ngày 7 tháng 7, sau đó việc truy cập sẽ chuyển sang cơ chế tính phí theo tín dụng sử dụng.
Mô hình đã bị “tắt đèn” vào ngày 12 tháng 6. Cơ quan quản lý cấm mọi công dân nước ngoài được chạm vào nó và chỉ cho công ty khoảng 90 phút để tuân thủ, nên Anthropic đã rút mô hình khỏi mọi người dùng thay vì cố gắng sàng lọc từng người theo thời gian thực.
Chỉ thị này xuất phát từ một báo cáo trong đó các nhà nghiên cứu Amazon phát hiện một prompt có thể dẫn mô hình đến việc gắn cờ một cụm lỗ hổng phần mềm trên các hệ thống phổ biến. Trong một trường hợp, nó còn đi xa hơn và tạo ra đoạn mã chạy được cho thấy cách khai thác một lỗ hổng đơn lẻ. Chính màn trình diễn đơn lẻ đó, hơn là danh sách lỗ hổng, đã khiến chuông báo động vang lên.
Đọc thêm: CrowdStrike cảnh báo Claude Mythos có thể tăng tốc quyết định về zero-day
Kiểm thử giải oan cho Fable 5
Đợt rà soát của chính Anthropic, thực hiện song song với chính phủ và công ty nộp báo cáo, đã xác nhận rằng các mô hình yếu hơn nhiều cũng có thể phát hiện cùng những lỗ hổng đó, trong đó có Opus 4.8, GPT-5.5 và Kimi K2.7. Mọi mô hình khác mà nhóm kiểm tra đều vẫn có thể tái tạo lại màn trình diễn khai thác đơn lẻ đó, làm cạn kiệt lập luận cho rằng chỉ riêng Fable 5 nắm giữ một “vũ khí mạng” đặc biệt. Công ty đã gọi lệnh cấm này là sự lạm quyền.
Bản sửa lỗi rất hẹp. Khi trở lại, mô hình mang theo một bộ phân loại duy nhất dùng để bắt prompt đã được báo cáo và chuyển hướng nó sang mô hình yếu hơn là Opus 4.8, giữ nguyên năng lực của Fable 5 nhưng làm tăng cảnh báo sai với các tác vụ lập trình thông thường, đồng thời cảnh báo người dùng mỗi khi nó can thiệp.
Mythos 5 vẫn bị hạn chế
Mythos 5, cùng kiến trúc nền tảng nhưng ít “rào chắn” hơn, vẫn bị giới hạn cho khoảng 100 tổ chức Hoa Kỳ đã được thẩm định trong một chương trình có tên Project Glasswing.
Công ty cũng mở một kênh công khai để báo cáo jailbreak. Anthropic đồng thời hứa với cơ quan quản lý rằng họ sẽ cho phép tiếp cận sớm hơn để kiểm thử các mô hình biên giới trong tương lai trước khi ra mắt.
Fable 5 lần đầu được ra mắt vào ngày 9 tháng 6 như mô hình Mythos-class đầu tiên của Anthropic được cung cấp rộng rãi, được ca ngợi trên nhiều bảng đánh giá trong ngành trước khi biến mất chỉ sau vài ngày. Thời gian ngừng hoạt động chỉ kéo dài chưa đầy ba tuần. Màn tái xuất hiện bây giờ giúp nó giành lại vị thế trên các bảng xếp hạng mà một phòng thí nghiệm Trung Quốc đang lên nhanh đã lặng lẽ chiếm lĩnh trong lúc mô hình bị treo.
Đọc tiếp: XRP lại kiểm tra mốc 1,07 USD khi các đợt từ chối trong tháng 6 vẫn phủ bóng phe bò





