Startup Tokyo Sakana AI đã ra mắt Fugu, một hệ thống điều phối một cụm mô hình ngôn ngữ có thể hoán đổi để cạnh tranh với các mô hình Fable và Mythos bị hạn chế của Anthropic.
Các điểm chính:
- Fugu của Sakana AI chạy như một mô hình duy nhất nhưng phối hợp một cụm hệ thống khác phía sau một API chung.
- Fugu Ultra đạt 73,7 điểm trong bài kiểm tra lập trình SWE-Bench Pro, vượt qua một số đối thủ tuyến đầu.
- Thiết kế này được giới thiệu như một biện pháp phòng ngừa trước các kiểm soát xuất khẩu đã khóa Fable và Mythos.
Sakana Fugu điều phối các mô hình
Phòng thí nghiệm tại Tokyo đã tung ra Fugu và phiên bản nặng hơn là Fugu Ultra vào ngày 22/6, cả hai đều truy cập được qua một endpoint tương thích OpenAI, như họ đã xác nhận. Tùy theo yêu cầu, nó sẽ tự xử lý tác vụ hoặc kêu gọi một nhóm hệ thống khác cùng tham gia.
Mô hình sau đó tự chạy các bước kiểm tra và tổng hợp.
Bản thân Fugu cũng là một mô hình ngôn ngữ.
Được huấn luyện để gọi các tác tử từ một cụm có thể hoán đổi, nó thậm chí có thể triệu hồi các bản sao của chính mình khi một công việc đơn lẻ cần nhiều “nhân lực” hơn một mô hình có thể cung cấp. Bản cơ sở hướng tới độ trễ thấp cho các tác vụ hàng ngày như lập trình, trò chuyện và các công cụ như Codex, đồng thời cho phép đội ngũ loại bỏ những tác tử cụ thể để đáp ứng quy định về quyền riêng tư. Ngược lại, Fugu Ultra theo đuổi chất lượng câu trả lời hàng đầu cho các bài toán dài như tái lập thí nghiệm bài báo và phân tích bảo mật, vốn đã được khoảng 500 người dùng beta thử nghiệm trong vài tuần gần đây.
Đọc thêm: Đợt xả Anthropic perp có phải lời cảnh báo cho các cược crypto tiền IPO?
Mollick và Levie lên tiếng
Các con số benchmark mà công ty đã công bố đặt Fugu Ultra ở mức 73,7 trong bài kiểm tra lập trình SWE-Bench Pro, vượt Opus 4.8, Gemini 3.1 Pro và GPT-5.5 trong cùng lần chạy.
Công ty cho biết những điểm số đó ngang với Fable 5 và Mythos Preview, và bảng so sánh nội bộ của họ cho thấy bộ điều phối đứng đầu trong 10 trên 11 hàng đã công bố.
Không phải người thử nào cũng bị thuyết phục. Nhà nghiên cứu AI Ethan Mollick viết rằng Fugu Ultra chạy “chậm khủng khiếp”, với các bài test lập trình thường kéo dài tới 30 phút và đầu ra thua Fable trong sử dụng thực tế. Sếp Box là Aaron Levie tỏ ra thiện cảm hơn, gọi việc định tuyến mỗi tác vụ qua một API duy nhất tới mô hình phù hợp nhất là một bước tiến cho cách xây dựng AI ứng dụng.
Những người khác thì chỉ ra mức giá, vì quá trình điều phối có thể khiến chi phí token đội lên gấp nhiều lần so với gọi trực tiếp một mô hình tuyến đầu đơn lẻ cho tác vụ tương đương. Sakana mô tả thiết kế cụm như một dạng bảo hiểm nếu bất kỳ nhà cung cấp nào “tắt đèn”, và nhấn mạnh các biện pháp kiểm soát xuất khẩu mới với Fable và Mythos như kiểu cú sốc có thể cắt đứt quyền truy cập chỉ sau một đêm.
Nguồn gốc Sakana AI
Sakana AI được hình thành năm 2023 dưới sự dẫn dắt của Llion Jones, đồng tác giả bài báo “Attention Is All You Need” của Google. David Ha, từng là trưởng nhóm nghiên cứu tại Stability AI, đã tham gia với vai trò đồng sáng lập. Phòng thí nghiệm này gây dựng tên tuổi nhờ kỹ thuật lai ghép mô hình theo hướng tiến hóa và dòng dự án AI Scientist cho nghiên cứu tự động, và họ từ lâu đã lập luận rằng các cụm mô hình phối hợp có thể vượt qua bất kỳ hệ thống đơn lẻ nào trong những công việc khó và kéo dài nhất.
Đọc tiếp: Mane City Mobile cập bến iOS và Android tại hơn 100 quốc gia





