教宗警告人工智能之際，Anthropic 招募 15 位宗教思想家協助塑造 Claude

Anthropic 一直在諮詢神學家和倫理學家，以塑造其聊天機械人 Claude 的行為；同時，教宗利奧十四世 警告人工智能威脅人類尊嚴。

重點摘要：

Anthropic 於三月底邀請約 15 位宗教思想家前往其三藩市總部，討論 Claude 的道德框架。

這些會議旨在完善 Claude 的「憲法」，即引導模型如何回應用戶的書面原則。

教宗利奧十四世於 5 月 25 日發表第一封通諭，敦促解除 AI 的武裝，並讓其從屬於人類尊嚴。

Anthropic 招募宗教學者

約 15 位宗教思想家於三月底在三藩市辦公室會見該公司。他們聚首一堂，討論一個現正分裂整個 AI 產業的問題：當簡單規則已無法涵蓋所有情況時，要如何教導聊天機械人「行善」。

邀請以不同方式送達，有些透過電郵，有些則經由朋友介紹。每位來賓都參與了一連串關於 Claude 及其道德框架的討論，該框架旨在指引它如何作答。目標不是讓模型變得虔誠，而是借鑑宗教界數百年來對是非善惡的推理傳統。

這套推理注入了 Anthropic 所稱的 Claude「憲法」——一套書面原則，公司借此塑造模型在悲傷輔導到臨終照護等各種議題上的回應。公司訓練 Claude 依據這些規則批判並修訂自己的答案，而不是死守一張固定禁令清單。

延伸閱讀： Traders Now Give Fable 5 74% Shot At Returning By Mid-July

專家質疑 Claude 的道德框架

聖塔克拉拉大學科技倫理學家 Brian Patrick Green 表示，實驗室日益增長的力量已開始超越其內部的智慧儲備。負責顧問組織「AI and Faith」的 Greg Cootsona 回憶，員工坦承這些問題已大到無法獨自回答。四月底的一場會議則擴大圈子，納入猶太教、印度教、錫克教、摩門教及希臘東正教等聲音。

並非所有學者都相信這種做法能解決更深層的責任問題——究竟誰能讓這些公司負責。牛津大學倫理學家 Carissa Véliz 質疑，聲稱的善意是否真能比商業模型所創造的誘因更重要。

她警告，圍繞科技的宗教語言可能孕育出一種部落式忠誠，反而抗拒理性討論。批評者將這類外展斥為「倫理漂白」，只是企圖借用道德公信力。Green 則反駁，任何虛假姿態都會很快被識破，而且一旦失信，將難以修補。

教宗利奧十四世於 5 月 25 日發表首封通諭，約四萬字，呼籲解除 AI 的武裝，並讓其始終從屬於人類尊嚴。Anthropic 聯合創辦人 Christopher Olah 亦出席了梵蒂岡的發表會，這是該公司數月來與宗教領袖持續接觸的最新一步。

下一則閱讀： SpaceX Hits $2.94T Valuation After Passing Amazon And Microsoft