Claude Opus 4.7 sắp ra mắt nhưng mô hình AI mạnh nhất của Anthropic vẫn bị hạn chế truy cập

Anthropic đang chuẩn bị ra mắt Claude Opus 4.7 và một công cụ thiết kế sử dụng AI để xây dựng website và bản thuyết trình, một động thái đã làm rung chuyển cổ phiếu của Adobe, Wix và Figma vào thứ Hai.

Chi tiết ra mắt Opus 4.7

The Information reported ngày 14/4 rằng cả hai sản phẩm có thể được phát hành sớm nhất trong tuần này, trích dẫn nguồn tin am hiểu kế hoạch. Công cụ thiết kế này nhận yêu cầu bằng tiếng Anh đơn giản và nhắm đến cả lập trình viên lẫn người dùng không chuyên kỹ thuật.

Điều đó puts Anthropic vào thế cạnh tranh trực tiếp với các startup như Gamma và Stitch của Google.

Opus 4.7 thậm chí không phải là mô hình tiên tiến nhất của Anthropic.

Danh hiệu đó thuộc về Claude Mythos, một hệ thống tập trung vào an ninh mạng mà công ty chỉ phân phối cho một số công ty an ninh được chọn thông qua Project Glasswing, đồng thời giữ nó tránh xa công chúng.

Cũng nên đọc: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked

Khủng hoảng bộ đo chuẩn AI và Mythos

OpenAI gần đây tuyên bố SWE-bench Verified, bộ đo chuẩn mã hóa hàng đầu, đã bị “ô nhiễm” sau khi phát hiện các mô hình tiên tiến đã ghi nhớ lời giải trong quá trình huấn luyện. Tuy vậy, các phòng lab vẫn tiếp tục viện dẫn chính các bài kiểm tra này trong so sánh mô hình.

Một đánh giá riêng ARC-AGI-3 nhấn mạnh khoảng cách giữa hệ thống AI và khả năng suy luận của con người. Gemini đạt 0,37% và GPT-5.4 đạt 0,26%, trong khi con người đạt 100%. Khi chưa có thẻ mô hình chi tiết từ Anthropic, những tuyên bố về cải tiến của Opus 4.7 vẫn khó được kiểm chứng độc lập.

Viện AI Security Institute của Anh gần đây đã evaluated Mythos Preview và phát hiện nó có thể tự động thực hiện các cuộc tấn công mạng tinh vi với tỷ lệ mà chưa mô hình nào khác đạt được. Nó trở thành AI đầu tiên hoàn thành “The Last Ones,” một mô phỏng tấn công mạng doanh nghiệp gồm 32 bước, vốn thường khiến đội red team phải mất 20 giờ.

Đọc tiếp: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers