随着教宗警示人工智能风险，Anthropic 邀请 15 位宗教思想家共同塑造 Claude

Anthropic 一直在咨询神学家和伦理学家，以塑造其聊天机器人 Claude 的行为，同时 教宗良一四世（Pope Leo XIV） 警告称 artificial intelligence threatens 人类尊严。

要点：

Anthropic 邀请了大约 15 位宗教思想家，于 3 月下旬在旧金山总部讨论 Claude 的道德框架。

这些讨论旨在完善 Claude 的“宪法”——这一书面原则体系用于引导模型如何回应用户。

教宗良一四世于 5 月 25 日发表了首部通谕，敦促对 AI 进行“解除武装”，并始终处于人类尊严之下。

Anthropic 招募宗教学者参与

大约 15 位宗教思想家于 3 月下旬在公司旧金山办公室会面。他们来此权衡一个正在分化整个 AI 行业的问题：在简单规则已无法覆盖所有情形的情况下，如何教一款聊天机器人“行善”。

邀请函通过不同方式送达，有的经由电子邮件，有的则通过“朋友的朋友”转达。每位受邀者都参与了一系列关于 Claude 以及其回答所依据的道德框架的讨论。目标并非让模型变得虔信宗教，而是借鉴数百年来宗教在“是非对错”方面的推理传统。

这些推理汇入 Anthropic 所称的 Claude“宪法”——一套书面原则，公司借此塑造模型在从悲伤辅导到临终关怀等各类话题上的回应方式。公司对 Claude 的训练方式，是让它依据这些原则批判并修正自己的回答，而不是简单遵守一份固定的禁令清单。

延伸阅读： Traders Now Give Fable 5 74% Shot At Returning By Mid-July

专家质疑 Claude 的道德框架

圣克拉拉大学技术伦理学家 Brian Patrick Green 指出，这家实验室不断扩张的能力已开始超出其内部智慧的边界。运营咨询组织“AI and Faith”的 Greg Cootsona 回忆说，员工承认这些问题已经大到无法仅凭内部力量加以解答。4 月下旬的一场讨论会则扩大了参与范围，将犹太教、印度教、锡克教、摩门教以及希腊正教的声音纳入其中。

并非所有学者都相信这种做法能解决更深层的难题：究竟谁来追究这些公司的责任。牛津大学伦理学家 Carissa Véliz 质疑，企业公开声明的“良好意图”，是否真能胜过商业模式本身所带来的激励。

她警告说，围绕科技使用宗教化语言，可能滋生一种部落式的忠诚，从而抵触朴素理性。一些批评者将这类外联视为“伦理漂白”，即试图借用道德公信力的公关举措。Green 则反驳称，任何虚假姿态很快就会被识破，而且将难以修复。

教宗良一四世在 5 月 25 日发表其首部通谕《Magnifica humanitas》，全文约四万字，呼吁对 AI 进行“解除武装”，并始终使之服从人类尊严。Anthropic 联合创始人 Christopher Olah 参加了在梵蒂冈举行的发布会，这是公司数月来与宗教领袖持续沟通的最新一步。

下篇阅读： SpaceX Hits $2.94T Valuation After Passing Amazon And Microsoft