Cách Claude Mythos và GPT-5.5 âm thầm viết lại bài toán phòng thủ mạng

Anthropic's Claude Mythos Preview và OpenAI's GPT-5.5, hai mô hình AI tiên phong, đã hoàn thành các tác vụ mạng tự động với tốc độ vượt xa các dự báo năng lực trước đó, theo báo cáo của các nhà nghiên cứu vào thứ Tư.

Các mô hình tiên phong vượt xu hướng

Claude Mythos Preview và GPT-5.5 outperformed xu hướng tăng gấp đôi mà AI Security Institute của Vương quốc Anh theo dõi từ cuối năm 2024.

Đầu năm nay, AISI ước tính rằng mốc thời gian để đạt 80% độ tin cậy trong các nhiệm vụ mạng đang rút ngắn một nửa khoảng mỗi năm tháng, giảm từ tám tháng vào tháng 11/2025. Một phiên bản Mythos Preview mới hơn đã solved bài “The Last Ones”, một cuộc tấn công mô phỏng vào mạng doanh nghiệp gồm 32 bước, trong 6 trên 10 lần thử, và hoàn thành “Cooling Tower” trong 3 trên 10 lần. GPT-5.5 vượt qua “The Last Ones” trong 3 trên 10 lần thử.

Đây là lần đầu tiên bất kỳ mô hình nào hoàn thành được cả hai dải bài kiểm tra của AISI.

Cũng nên đọc: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided

Cảnh báo “vulnpocalypse” từ Palo Alto

Palo Alto Networks reported những kết luận tương tự thông qua các bài kiểm tra riêng.

Trong tháng qua, công ty đã quét hơn 130 sản phẩm và phát hiện 75 lỗ hổng hợp lệ, gấp hơn bảy lần số lượng trung bình hàng tháng, và tất cả hiện đã được vá.

Lee Klarich, giám đốc công nghệ của công ty, cho biết các tổ chức chỉ còn một khoảng thời gian rất hẹp trước khi đối thủ đạt được các năng lực tương tự.

Ông ước tính có một “khoảng thời gian ba đến năm tháng rất hẹp để các tổ chức vượt lên trước đối thủ”.

AISI cảnh báo rằng mẫu thử nghiệm hiện vẫn nhỏ và các nhiệm vụ khó nhất có ít dữ liệu so sánh từ con người. Dù vậy, viện cho biết việc loại bỏ bất kỳ mô hình đơn lẻ nào khỏi phân tích cũng chỉ làm thay đổi ước tính thời gian tăng gấp đôi chưa đến một tháng. METR, một tổ chức phi lợi nhuận tracks AI trên các nhiệm vụ phần mềm, đưa ra con số gần như tương đồng, khoảng bốn tháng.

Đường cong năng lực dốc hơn

Anthropic đã giới hạn đợt triển khai Mythos sớm tháng trước cho một nhóm chọn lọc gồm Palo Alto Networks, CrowdStrike, Amazon, Apple và JPMorgan.

OpenAI sau đó tung ra mô hình GPT-5.5-Cyber và sáng kiến an ninh mạng Daybreak.

Tốc độ thay đổi đã trở nên dốc hơn rõ rệt trong 18 tháng qua. AISI đã rút ngắn thời gian dự báo tăng gấp đôi từ tám tháng xuống 4,7 tháng vào tháng 2/2026, rồi tiếp tục rút ngắn thêm sau vòng kiểm tra mới nhất. Con số tính lại hiện gần bốn tháng, phản chiếu kết quả của METR trên các nhiệm vụ kỹ thuật phần mềm.

Đọc tiếp: Coinbase Opens $100K USDC Loans Against Solana Token Holdings