Cách Claude Mythos và GPT-5.5 âm thầm viết lại bài toán phòng thủ mạng

Cách Claude Mythos và GPT-5.5 âm thầm viết lại bài toán phòng thủ mạng

Anthropic's Claude Mythos PreviewOpenAI's GPT-5.5, hai mô hình AI tiên phong, đã hoàn thành các tác vụ mạng tự động với tốc độ vượt xa các dự báo năng lực trước đó, theo báo cáo của các nhà nghiên cứu vào thứ Tư.

Các mô hình tiên phong vượt xu hướng

Claude Mythos Preview và GPT-5.5 outperformed xu hướng tăng gấp đôi mà AI Security Institute của Vương quốc Anh theo dõi từ cuối năm 2024.

Đầu năm nay, AISI ước tính rằng mốc thời gian để đạt 80% độ tin cậy trong các nhiệm vụ mạng đang rút ngắn một nửa khoảng mỗi năm tháng, giảm từ tám tháng vào tháng 11/2025. Một phiên bản Mythos Preview mới hơn đã solved bài “The Last Ones”, một cuộc tấn công mô phỏng vào mạng doanh nghiệp gồm 32 bước, trong 6 trên 10 lần thử, và hoàn thành “Cooling Tower” trong 3 trên 10 lần. GPT-5.5 vượt qua “The Last Ones” trong 3 trên 10 lần thử.

Đây là lần đầu tiên bất kỳ mô hình nào hoàn thành được cả hai dải bài kiểm tra của AISI.

Cũng nên đọc: Ripple's Schwartz Says Bitcoin's Mining Model Is The Flaw XRP Avoided

Cảnh báo “vulnpocalypse” từ Palo Alto

Palo Alto Networks reported những kết luận tương tự thông qua các bài kiểm tra riêng.

Trong tháng qua, công ty đã quét hơn 130 sản phẩm và phát hiện 75 lỗ hổng hợp lệ, gấp hơn bảy lần số lượng trung bình hàng tháng, và tất cả hiện đã được vá.

Lee Klarich, giám đốc công nghệ của công ty, cho biết các tổ chức chỉ còn một khoảng thời gian rất hẹp trước khi đối thủ đạt được các năng lực tương tự.

Ông ước tính có một “khoảng thời gian ba đến năm tháng rất hẹp để các tổ chức vượt lên trước đối thủ”.

AISI cảnh báo rằng mẫu thử nghiệm hiện vẫn nhỏ và các nhiệm vụ khó nhất có ít dữ liệu so sánh từ con người. Dù vậy, viện cho biết việc loại bỏ bất kỳ mô hình đơn lẻ nào khỏi phân tích cũng chỉ làm thay đổi ước tính thời gian tăng gấp đôi chưa đến một tháng. METR, một tổ chức phi lợi nhuận tracks AI trên các nhiệm vụ phần mềm, đưa ra con số gần như tương đồng, khoảng bốn tháng.

Đường cong năng lực dốc hơn

Anthropic đã giới hạn đợt triển khai Mythos sớm tháng trước cho một nhóm chọn lọc gồm Palo Alto Networks, CrowdStrike, Amazon, AppleJPMorgan.

OpenAI sau đó tung ra mô hình GPT-5.5-Cyber và sáng kiến an ninh mạng Daybreak.

Tốc độ thay đổi đã trở nên dốc hơn rõ rệt trong 18 tháng qua. AISI đã rút ngắn thời gian dự báo tăng gấp đôi từ tám tháng xuống 4,7 tháng vào tháng 2/2026, rồi tiếp tục rút ngắn thêm sau vòng kiểm tra mới nhất. Con số tính lại hiện gần bốn tháng, phản chiếu kết quả của METR trên các nhiệm vụ kỹ thuật phần mềm.

Đọc tiếp: Coinbase Opens $100K USDC Loans Against Solana Token Holdings

Tuyên bố miễn trừ trách nhiệm và cảnh báo rủi ro: Thông tin được cung cấp trong bài viết này chỉ dành cho mục đích giáo dục và thông tin, dựa trên ý kiến của tác giả. Nó không cấu thành lời khuyên tài chính, đầu tư, pháp lý hoặc thuế. Tài sản tiền mã hóa có tính biến động cao và chịu rủi ro cao, bao gồm rủi ro mất tất cả hoặc một phần lớn khoản đầu tư của bạn. Giao dịch hoặc nắm giữ tài sản crypto có thể không phù hợp với tất cả nhà đầu tư. Những quan điểm được bày tỏ trong bài viết này hoàn toàn là của (các) tác giả và không đại diện cho chính sách chính thức hoặc lập trường của Yellow, những người sáng lập hoặc giám đốc điều hành. Luôn tiến hành nghiên cứu kỹ lưỡng của riêng bạn (D.Y.O.R.) và tham khảo ý kiến chuyên gia tài chính được cấp phép trước khi đưa ra bất kỳ quyết định đầu tư nào.
Tin tức mới nhất
Xem tất cả tin tức
Cách Claude Mythos và GPT-5.5 âm thầm viết lại bài toán phòng thủ mạng | Yellow.com