Claude Opus 4.7 sắp ra mắt nhưng mô hình AI mạnh nhất của Anthropic vẫn bị hạn chế truy cập

Claude Opus 4.7 sắp ra mắt nhưng mô hình AI mạnh nhất của Anthropic vẫn bị hạn chế truy cập

Anthropic đang chuẩn bị ra mắt Claude Opus 4.7 và một công cụ thiết kế sử dụng AI để xây dựng website và bản thuyết trình, một động thái đã làm rung chuyển cổ phiếu của Adobe, WixFigma vào thứ Hai.

Chi tiết ra mắt Opus 4.7

The Information reported ngày 14/4 rằng cả hai sản phẩm có thể được phát hành sớm nhất trong tuần này, trích dẫn nguồn tin am hiểu kế hoạch. Công cụ thiết kế này nhận yêu cầu bằng tiếng Anh đơn giản và nhắm đến cả lập trình viên lẫn người dùng không chuyên kỹ thuật.

Điều đó puts Anthropic vào thế cạnh tranh trực tiếp với các startup như Gamma và Stitch của Google.

Opus 4.7 thậm chí không phải là mô hình tiên tiến nhất của Anthropic.

Danh hiệu đó thuộc về Claude Mythos, một hệ thống tập trung vào an ninh mạng mà công ty chỉ phân phối cho một số công ty an ninh được chọn thông qua Project Glasswing, đồng thời giữ nó tránh xa công chúng.

Cũng nên đọc: World Liberty Financial Demands Insiders Burn 10% Of Their WLFI Or Stay Locked

Khủng hoảng bộ đo chuẩn AI và Mythos

OpenAI gần đây tuyên bố SWE-bench Verified, bộ đo chuẩn mã hóa hàng đầu, đã bị “ô nhiễm” sau khi phát hiện các mô hình tiên tiến đã ghi nhớ lời giải trong quá trình huấn luyện. Tuy vậy, các phòng lab vẫn tiếp tục viện dẫn chính các bài kiểm tra này trong so sánh mô hình.

Một đánh giá riêng ARC-AGI-3 nhấn mạnh khoảng cách giữa hệ thống AI và khả năng suy luận của con người. Gemini đạt 0,37% và GPT-5.4 đạt 0,26%, trong khi con người đạt 100%. Khi chưa có thẻ mô hình chi tiết từ Anthropic, những tuyên bố về cải tiến của Opus 4.7 vẫn khó được kiểm chứng độc lập.

Viện AI Security Institute của Anh gần đây đã evaluated Mythos Preview và phát hiện nó có thể tự động thực hiện các cuộc tấn công mạng tinh vi với tỷ lệ mà chưa mô hình nào khác đạt được. Nó trở thành AI đầu tiên hoàn thành “The Last Ones,” một mô phỏng tấn công mạng doanh nghiệp gồm 32 bước, vốn thường khiến đội red team phải mất 20 giờ.

Đọc tiếp: Binance Launches Built-In Chat Feature To Merge Messaging With Crypto Transfers

Tuyên bố miễn trừ trách nhiệm và cảnh báo rủi ro: Thông tin được cung cấp trong bài viết này chỉ dành cho mục đích giáo dục và thông tin, dựa trên ý kiến của tác giả. Nó không cấu thành lời khuyên tài chính, đầu tư, pháp lý hoặc thuế. Tài sản tiền mã hóa có tính biến động cao và chịu rủi ro cao, bao gồm rủi ro mất tất cả hoặc một phần lớn khoản đầu tư của bạn. Giao dịch hoặc nắm giữ tài sản crypto có thể không phù hợp với tất cả nhà đầu tư. Những quan điểm được bày tỏ trong bài viết này hoàn toàn là của (các) tác giả và không đại diện cho chính sách chính thức hoặc lập trường của Yellow, những người sáng lập hoặc giám đốc điều hành. Luôn tiến hành nghiên cứu kỹ lưỡng của riêng bạn (D.Y.O.R.) và tham khảo ý kiến chuyên gia tài chính được cấp phép trước khi đưa ra bất kỳ quyết định đầu tư nào.
Tin Tức Liên Quan
Bài viết học tập liên quan