Claude Opus 4.7 sắp ra mắt nhưng AI mạnh nhất của Anthropic vẫn bị hạn chế

Claude Opus 4.7 sắp ra mắt nhưng AI mạnh nhất của Anthropic vẫn bị hạn chế

Anthropic đang chuẩn bị ra mắt Claude Opus 4.7 và một công cụ thiết kế dùng AI để xây dựng website và bản trình bày, một động thái đã làm rung chuyển cổ phiếu của Adobe, WixFigma hôm thứ Hai.

Chi tiết ra mắt Opus 4.7

The Information reported ngày 14/4 rằng cả hai sản phẩm đều có thể được phát hành sớm ngay trong tuần này, trích dẫn một người am hiểu kế hoạch. Công cụ thiết kế này nhận lệnh bằng tiếng Anh đơn giản và nhắm đến cả lập trình viên lẫn người không chuyên.

Điều đó puts Anthropic vào thế cạnh tranh trực tiếp với các startup như Gamma và Stitch của Google.

Opus 4.7 thậm chí không phải là mẫu tiên tiến nhất của Anthropic.

Danh hiệu đó thuộc về Claude Mythos, một hệ thống tập trung vào an ninh mạng mà công ty chỉ phân phối cho một số hãng an ninh được chọn thông qua Project Glasswing, đồng thời giữ nó tránh xa công chúng.

Also Read: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked

Khủng hoảng benchmark AI và Mythos

OpenAI gần đây tuyên bố SWE-bench Verified, bộ benchmark lập trình hàng đầu, đã bị “ô nhiễm” sau khi phát hiện các mẫu tiên tiến đã ghi nhớ lời giải trong quá trình huấn luyện. Tuy vậy, các phòng lab vẫn tiếp tục trích dẫn những bài test này trong các so sánh mẫu.

Một đánh giá riêng ARC-AGI-3 nhấn mạnh khoảng cách giữa hệ thống AI và khả năng suy luận của con người. Gemini đạt 0,37% và GPT-5.4 đạt 0,26%, trong khi con người đạt 100%. Khi không có thẻ mô hình chi tiết từ Anthropic, các tuyên bố về cải tiến của Opus 4.7 vẫn khó được kiểm chứng độc lập.

Viện An ninh AI của Anh (AI Security Institute) gần đây evaluated Mythos Preview và phát hiện nó có thể tự động thực hiện các cuộc tấn công mạng tinh vi với tỷ lệ chưa mẫu nào sánh kịp. Đây là AI đầu tiên hoàn thành “The Last Ones”, một mô phỏng tấn công mạng vào hệ thống doanh nghiệp gồm 32 bước, vốn thường mất 20 giờ cho các đội red team của con người.

Read Next: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers

Tuyên bố miễn trừ trách nhiệm và cảnh báo rủi ro: Thông tin được cung cấp trong bài viết này chỉ dành cho mục đích giáo dục và thông tin, dựa trên ý kiến của tác giả. Nó không cấu thành lời khuyên tài chính, đầu tư, pháp lý hoặc thuế. Tài sản tiền mã hóa có tính biến động cao và chịu rủi ro cao, bao gồm rủi ro mất tất cả hoặc một phần lớn khoản đầu tư của bạn. Giao dịch hoặc nắm giữ tài sản crypto có thể không phù hợp với tất cả nhà đầu tư. Những quan điểm được bày tỏ trong bài viết này hoàn toàn là của (các) tác giả và không đại diện cho chính sách chính thức hoặc lập trường của Yellow, những người sáng lập hoặc giám đốc điều hành. Luôn tiến hành nghiên cứu kỹ lưỡng của riêng bạn (D.Y.O.R.) và tham khảo ý kiến chuyên gia tài chính được cấp phép trước khi đưa ra bất kỳ quyết định đầu tư nào.
Tin Tức Liên Quan
Bài viết học tập liên quan
Claude Opus 4.7 sắp ra mắt nhưng AI mạnh nhất của Anthropic vẫn bị hạn chế | Yellow.com