Anthropic 招募 15 位宗教思想家協助塑造 Claude，教宗警告 AI 帶來風險

Anthropic 一直在諮詢神學家與倫理學家，協助塑造其聊天機器人 Claude 的行為準則，同時 教宗利奧十四世 警告 artificial intelligence threatens 人類尊嚴。

重點摘要：

Anthropic 於 3 月下旬邀請約 15 位宗教思想家前往其位於舊金山的總部，討論 Claude 的道德框架。

這些會談旨在完善 Claude 的「憲法」，也就是引導模型回應方式的書面原則。

教宗利奧十四世於 5 月 25 日發布首份通諭，呼籲必須解除 AI 的武裝，並使其服從於人類尊嚴之下。

Anthropic 招募宗教學者

約 15 位宗教思想家在 3 月下旬 met 於公司舊金山辦公室。他們前來思考一個正在分裂 AI 產業的問題：在簡單規則已無法涵蓋所有情況時，該如何教導聊天機器人「做好事」。

邀請是以各種零散方式送達的，有些透過電子郵件，有些則是經由朋友介紹再轉介。每位來賓都參與了一系列關於 Claude 及其道德框架的討論，此框架意在指引它如何作答。目標並非讓模型變得虔誠，而是汲取宗教界數百年來對是非善惡的思辨。

這套思辨匯入了 Anthropic 所稱的 Claude「憲法」中——一套書面原則，用來塑造模型在各種情境下的回應，從悲傷輔導到臨終關懷皆然。公司訓練 Claude 依據這些原則批判並修訂自己的答案，而不是遵循一份固定的禁令清單。

延伸閱讀： Traders Now Give Fable 5 74% Shot At Returning By Mid-July

專家質疑 Claude 的道德框架

聖塔克拉拉大學科技倫理學家 Brian Patrick Green 表示，實驗室快速膨脹的影響力已開始超過其內部智慧所能支撐的範圍。經營諮詢團體「AI and Faith」的 Greg Cootsona 回憶，員工坦承相關問題已大到無法單靠內部來解答。4 月下旬的一場座談則 broadened 了參與圈子，納入猶太教、印度教、錫克教、摩門教以及希臘正教等多元聲音。

並非所有學者都相信這種做法能解決更深層的問題——也就是究竟誰能讓這些公司負起責任。牛津大學倫理學家 Carissa Véliz 質疑，宣稱的良好意圖是否真能比商業模式所創造的誘因更重要。

她警告，圍繞科技所使用的宗教語言，可能滋長一種部落式忠誠，反而抗拒理性思考。批評者將這種外展視為「倫理洗白」，企圖借用道德公信力。Green 則反駁，任何虛偽姿態都會很快被識破，且難以挽回。

教宗利奧十四世於 5 月 25 日 published 了首份約四萬字的通諭，呼籲必須解除 AI 的武裝，並使之從屬於人類尊嚴。Anthropic 共同創辦人 Christopher Olah attended 了在梵蒂岡舉行的發表會，這是該公司數月來持續與宗教領袖互動的最新進展。

接著看： SpaceX Hits $2.94T Valuation After Passing Amazon And Microsoft

Anthropic 招募 15 位宗教思想家協助塑造 Claude， 教宗警告 AI 帶來風險

重點摘要：

Anthropic 招募宗教學者

專家質疑 Claude 的道德框架

Anthropic 招募 15 位宗教思想家協助塑造 Claude，教宗警告 AI 帶來風險