GPT-5.5 sánh ngang Claude Mythos trong cuộc tấn công mạng 32 bước, AISI Vương quốc Anh báo cáo

Mô hình mới nhất của OpenAI là GPT-5.5 có thể tự động xâu chuỗi một cuộc xâm nhập mạng doanh nghiệp 32 bước và giải một bài toán đảo ngược kéo dài 12 giờ chỉ trong khoảng 10 phút.

Kết quả đánh giá an ninh mạng của AISI

Viện An ninh AI Vương quốc Anh (AI Security Institute), một cơ quan nghiên cứu thuộc Bộ Khoa học, Đổi mới và Công nghệ của Anh, đã công bố bản đánh giá vào thứ Năm.

Các nhà nghiên cứu phát hiện GPT-5.5 là mô hình thứ hai có thể hoàn toàn giải được “The Last Ones”, một mô phỏng nhiều giai đoạn được xây dựng cùng SpecterOps. Mô hình đã hoàn thành chuỗi tấn công trong hai trên mười lần thử.

Mô hình đầu tiên vượt qua bài kiểm tra là Claude Mythos Preview của Anthropic, đạt ba trên mười lần thành công. AISI ước tính một chuyên gia con người sẽ cần khoảng 20 giờ để hoàn tất cùng chuỗi tấn công trên bốn subnet và khoảng 20 máy chủ.

Ở nhóm nhiệm vụ cấp Chuyên gia, GPT-5.5 đạt tỷ lệ vượt qua 71,4%, nhỉnh hơn một chút so với Mythos Preview ở mức 68,6% và bỏ xa GPT-5.4 ở mức 52,4%.

Đọc thêm: Why 75% Of Institutions Stay Bullish On Bitcoin Despite Coinbase's Mythos Warning

Nguy cơ jailbreak và phản ứng chính sách

AISI phát hiện một jailbreak “phổ quát” có thể vượt qua các cơ chế bảo vệ của mô hình đối với mọi truy vấn tấn công mạng độc hại được kiểm tra. Khai thác này mất sáu giờ làm việc của nhóm red team chuyên gia để phát triển, và một lỗi cấu hình đã khiến việc xác minh bản vá của OpenAI bị chặn lại.

Cơ quan này cảnh báo rằng khả năng tấn công mạng chủ động hiện dường như đang xuất hiện như hệ quả phụ của những bước tiến rộng hơn về suy luận và tự động hóa.

Vào tháng 4, đánh giá của AISI về Mythos Preview marked the first time any frontier model finished the corporate attack từ đầu đến cuối, khiến GPT-5.5 được xem như sự xác nhận cho một xu hướng thay vì một bước nhảy đơn lẻ.

Bài tiếp theo: Crypto VC Funding Crashes To $659M In April, A 2-Year Low