OpenAI ra mắt Chế độ Lockdown để chặn các cuộc tấn công prompt injection

OpenAI đã ra mắt Chế độ Lockdown, một tính năng bảo mật mới nhằm bảo vệ những người dùng xử lý thông tin nhạy cảm khỏi prompt injection attacks. Công ty đã triển khai tính năng này vào ngày 7 tháng 6 năm 2026.

Theo The Economic Times, Chế độ Lockdown được thiết kế để phòng vệ trước prompt injection, một phương thức tấn công trong đó các chỉ dẫn độc hại được nhúng trong đầu vào cố gắng ghi đè hoặc thao túng hành vi của mô hình AI.

Chế độ Lockdown làm gì

Prompt injection là một trong những lỗ hổng được bàn luận nhiều nhất trong việc triển khai các mô hình ngôn ngữ lớn. Kẻ tấn công tạo ra đầu vào yêu cầu mô hình bỏ qua hướng dẫn trước đó hoặc tiết lộ thông tin bị hạn chế. Chế độ Lockdown áp dụng các lớp kiểm soát bổ sung để giảm rủi ro đó.

OpenAI chưa công bố phân tích kỹ thuật đầy đủ về cách triển khai Chế độ Lockdown trong lần phát hành hiện tại. Công ty mô tả tính năng này là nhắm tới những người dùng quản lý dữ liệu nhạy cảm, gợi ý nhóm đối tượng gồm khách hàng doanh nghiệp, nhà nghiên cứu và các chuyên gia coi trọng bảo mật.

Việc ra mắt phản ánh xu hướng tại OpenAI là bổ sung các tầng truy cập và lớp bảo mật khi nền tảng xử lý ngày càng nhiều trường hợp sử dụng có mức độ rủi ro cao. Việc triển khai trong các lĩnh vực pháp lý, chăm sóc sức khỏe và chính phủ đã làm tăng nhu cầu về kiểm soát bảo mật ngay ở cấp độ đầu vào.

Đọc thêm: Two AI Rivals, One Compute Bill: Inside Google's $30B SpaceX Move

Bối cảnh

Nỗ lực của OpenAI trong việc phát triển các công cụ tập trung vào an toàn diễn ra sau một giai đoạn giám sát chặt chẽ hơn đối với hành vi của mô hình AI. Trong những tuần trước khi ra mắt tính năng này, lãnh đạo của OpenAI, Anthropic, Google DeepMind và Microsoft đã cùng nhau kêu gọi Quốc hội bắt buộc sàng lọc DNA tổng hợp, viện dẫn vai trò tiềm tàng của AI trong các mối đe dọa an ninh sinh học. Bức thư đó, được đưa tin vào cuối tháng 5 và đầu tháng 6 năm 2026, đã đặt vấn đề an toàn AI ở trung tâm chương trình nghị sự lập pháp tại Washington.

Việc phát hành Chế độ Lockdown diễn ra trong bối cảnh các đối thủ, bao gồm Anthropic, cũng đã siết chặt kiểm soát truy cập đối với các mô hình mạnh nhất của họ. Anthropic đã giới hạn quyền truy cập vào hệ thống Claude Mythos hồi đầu năm nay như một phần của khuôn khổ rà soát trước khi phát hành trên cơ sở tự nguyện.

Các bổ sung tính năng bảo mật của OpenAI xuất hiện trước khi công ty nộp hồ sơ IPO bí mật, được gửi tới SEC vào ngày 1 tháng 6. Việc chứng minh các kiểm soát bảo mật đạt chuẩn doanh nghiệp nhiều khả năng sẽ là yếu tố quan trọng đối với niềm tin của nhà đầu tư trước bất kỳ đợt chào bán công khai nào.