Claude Mythos giải bài hack AISI 32 bước trong 6/10 lần thử

Một checkpoint mới của Anthropic's Claude Mythos Preview đã trở thành mô hình AI đầu tiên giải được cả hai mô phỏng tấn công mạng của chính phủ Anh, làm dấy lên những câu hỏi mới về khả năng hack tự động.

AISI báo cáo đột phá của Mythos

AI Security Institute của Anh reported hôm thứ Tư rằng checkpoint Mythos mới hơn đã hoàn thành bài tấn công mạng doanh nghiệp 32 bước, "The Last Ones", trong 6 trên 10 lần thử. Phiên bản trước đó chỉ đạt 3 trên 10.

Bản cập nhật cũng chinh phục được "Cooling Tower", một cyber range hệ thống điều khiển công nghiệp mà chưa mô hình nào trước đó vượt qua, trong 3 trên 10 lần thử.

Đối thủ OpenAI với GPT-5.5 được kiểm tra trên cùng bài diễn tập. Nó solved "The Last Ones" trong 3 trên 10 lần thử nhưng không hoàn thành "Cooling Tower."

AISI vận hành các bài diễn tập với ngân sách tính toán 100 triệu token cho mỗi lần thử, và cơ quan này lưu ý rằng hiệu suất vẫn tiếp tục tăng ở ngưỡng đó, gợi ý rằng ngân sách cao hơn có thể đẩy tỷ lệ thành công lên nữa.

Also Read: Southeast Asia Blockchain Week Brings Ripple, Avalanche, Solana Foundation, And K-Pop To Bangkok

Thời gian nhân đôi tiếp tục rút ngắn

AISI theo dõi tiến bộ về an ninh mạng thông qua các mốc chân trời thời gian, đo lường khoảng thời gian dài nhất mà một nhiệm vụ tự động có thể được mô hình hoàn thành với độ tin cậy 80%. Vào tháng 11/2025, cơ quan này estimated thời gian nhân đôi là 8 tháng. Đến tháng 2/2026, con số đó đã bị nén xuống còn 4,7 tháng, và cả Mythos lẫn GPT-5.5 từ đó đã vượt trên xu hướng nhanh hơn này.

Cơ quan thừa nhận còn chưa rõ liệu các kết quả mới nhất báo hiệu một pha tăng tốc mới hay chỉ là một bước nhảy đột ngột một lần.

Tổ chức phi lợi nhuận METR, đơn vị theo dõi AI trên các nhiệm vụ phần mềm thay vì cyber range, đã đưa ra một con số tương tự, khoảng 4,2 tháng. AISI cho biết sự hội tụ này củng cố lập luận rằng xu hướng phản ánh các cải thiện năng lực thực sự chứ không phải sai lệch của một bộ đánh giá riêng lẻ.

Viện nhấn mạnh rằng các cyber range của họ không có người phòng thủ chủ động, vì vậy kết quả cho thấy mô hình có thể làm gì với các mạng được bảo vệ lỏng lẻo hơn là những hệ thống doanh nghiệp được củng cố.

Vì sao các cú nhảy năng lực lại quan trọng

Checkpoint Mythos mới không đi kèm với bản phát hành mô hình hoàn toàn mới. AISI sử dụng cùng phiên bản mà Anthropic triển khai tháng trước trong Project Glasswing, chương trình hợp tác an ninh của họ, sau khi nhận một bản build cập nhật của cùng mô hình.

"Những cú nhảy năng lực đáng kể không phải lúc nào cũng cần các bản phát hành mô hình mới," viện viết. Điều này đi ngược lại giả định rằng bên phòng thủ có thể điều chỉnh nhịp độ theo các chu kỳ phát hành sản phẩm.

Anthropic introduced Mythos Preview vào ngày 7/4, mô tả mô hình này như một bước ngoặt cho ngành an ninh sau khi nó phát hiện lỗ hổng zero-day trên nhiều hệ điều hành và trình duyệt lớn trong các thử nghiệm nội bộ. Công ty cho biết họ had withheld broader release vì những năng lực đó, và đợt đánh giá hồi tháng 4 trước đó của AISI đã đánh dấu Mythos là một bước tiến rõ rệt so với các hệ thống tuyến đầu trước đây.