Anthropic mời 15 nhà tư tưởng tôn giáo định hình Claude giữa lúc Giáo hoàng cảnh báo về AI

Anthropic đã tham vấn các nhà thần học và chuyên gia đạo đức để định hình cách chatbot Claude ứng xử, trong bối cảnh Giáo hoàng Leo XIV cảnh báo rằng artificial intelligence threatens phẩm giá con người.

Các ý chính:

Anthropic đã mời khoảng 15 nhà tư tưởng tôn giáo đến trụ sở tại San Francisco vào cuối tháng 3 để thảo luận về khuôn khổ đạo đức của Claude.

Các buổi làm việc nhằm hoàn thiện “bản hiến pháp” của Claude, tức bộ nguyên tắc bằng văn bản định hướng cách mô hình phản hồi người dùng.

Thông điệp đầu tiên (thông điệp chung) của Giáo hoàng Leo XIV, công bố ngày 25/5, kêu gọi phải vô hiệu hóa AI và giữ nó ở vị thế phục tùng phẩm giá con người.

Anthropic mời các học giả tôn giáo

Khoảng 15 nhà tư tưởng tôn giáo đã met với công ty tại văn phòng San Francisco vào cuối tháng 3. Họ đến để cùng cân nhắc một câu hỏi đang gây chia rẽ ngành AI: làm sao dạy một chatbot trở nên “tử tế” khi những quy tắc đơn giản không còn bao quát hết mọi trường hợp.

Thư mời được gửi đi theo nhiều cách khác nhau, một số qua email, số khác qua “bạn của một người bạn”. Mỗi khách mời tham gia một loạt buổi trao đổi về Claude và khuôn khổ đạo đức dự kiến dẫn dắt cách nó trả lời. Mục tiêu không phải biến mô hình thành mộ đạo, mà là khai thác hàng thế kỷ lập luận tôn giáo về đúng và sai.

Cách lập luận đó cung cấp nền tảng cho cái mà Anthropic gọi là “bản hiến pháp” của Claude, một bộ nguyên tắc bằng văn bản mà công ty dùng để định hình phản hồi của mô hình về mọi thứ, từ nỗi đau mất mát đến chăm sóc cuối đời. Công ty huấn luyện Claude tự phê bình và chỉnh sửa câu trả lời của nó dựa trên các quy tắc này, thay vì tuân theo một danh sách cấm đoán cố định.

Cũng nên đọc: Traders Now Give Fable 5 74% Shot At Returning By Mid-July

Chuyên gia đặt câu hỏi về khuôn khổ đạo đức của Claude

Brian Patrick Green, một nhà đạo đức học công nghệ tại Đại học Santa Clara, cho rằng quyền lực ngày càng tăng của phòng thí nghiệm này đã bắt đầu vượt xa sự khôn ngoan nội bộ. Greg Cootsona, người điều hành nhóm cố vấn AI and Faith, nhớ lại rằng nhân viên thừa nhận các câu hỏi đã trở nên quá lớn để có thể tự trả lời. Một buổi họp cuối tháng 4 đã broadened vòng tròn thảo luận, bao gồm cả các tiếng nói Do Thái giáo, Ấn Độ giáo, Sikh, Mormon và Chính thống giáo Hy Lạp.

Không phải học giả nào cũng tin rằng cách tiếp cận này giải quyết được vấn đề sâu xa hơn là ai sẽ chịu trách nhiệm với các công ty này. Carissa Véliz, một nhà đạo đức học tại Đại học Oxford, đặt câu hỏi liệu những tuyên bố về ý định có quan trọng hơn các động cơ mà mô hình thương mại tạo ra hay không.

Bà cảnh báo rằng ngôn ngữ tôn giáo quanh công nghệ có thể nuôi dưỡng lòng trung thành mang tính bộ tộc, chống lại lý trí thông thường. Giới phê bình coi hoạt động tiếp cận này là “rửa tội về đạo đức”, một nỗ lực vay mượn uy tín đạo lý. Green phản bác rằng bất kỳ sự giả tạo nào cũng sẽ nhanh chóng bị phát hiện và rất khó khắc phục.

Giáo hoàng Leo XIV đã published thông điệp chung đầu tiên của mình vào ngày 25/5, một văn bản khoảng 40.000 từ kêu gọi phải vô hiệu hóa AI và giữ nó ở vị thế phục tùng phẩm giá con người. Đồng sáng lập Anthropic Christopher Olah đã attended buổi giới thiệu tại Vatican, bước đi mới nhất trong nhiều tháng tiếp cận giới lãnh đạo tôn giáo.

Đọc tiếp: SpaceX Hits $2.94T Valuation After Passing Amazon And Microsoft