Anthropic 一直在諮詢神學家與倫理學家,協助塑造其聊天機器人 Claude 的行為準則,同時 教宗利奧十四世 警告 artificial intelligence threatens 人類尊嚴。
重點摘要:
- Anthropic 於 3 月下旬邀請約 15 位宗教思想家前往其位於舊金山的總部,討論 Claude 的道德框架。
- 這些會談旨在完善 Claude 的「憲法」,也就是引導模型回應方式的書面原則。
- 教宗利奧十四世於 5 月 25 日發布首份通諭,呼籲必須解除 AI 的武裝,並使其服從於人類尊嚴之下。
Anthropic 招募宗教學者
約 15 位宗教思想家在 3 月下旬 met 於公司舊金山辦公室。他們前來思考一個正在分裂 AI 產業的問題:在簡單規則已無法涵蓋所有情況時,該如何教導聊天機器人「做好事」。
邀請是以各種零散方式送達的,有些透過電子郵件,有些則是經由朋友介紹再轉介。每位來賓都參與了一系列關於 Claude 及其道德框架的討論,此框架意在指引它如何作答。目標並非讓模型變得虔誠,而是汲取宗教界數百年來對是非善惡的思辨。
這套思辨匯入了 Anthropic 所稱的 Claude「憲法」中——一套書面原則,用來塑造模型在各種情境下的回應,從悲傷輔導到臨終關懷皆然。公司訓練 Claude 依據這些原則批判並修訂自己的答案,而不是遵循一份固定的禁令清單。
延伸閱讀: Traders Now Give Fable 5 74% Shot At Returning By Mid-July
專家質疑 Claude 的道德框架
聖塔克拉拉大學科技倫理學家 Brian Patrick Green 表示,實驗室快速膨脹的影響力已開始超過其內部智慧所能支撐的範圍。經營諮詢團體「AI and Faith」的 Greg Cootsona 回憶,員工坦承相關問題已大到無法單靠內部來解答。4 月下旬的一場座談則 broadened 了參與圈子,納入猶太教、印度教、錫克教、摩門教以及希臘正教等多元聲音。
並非所有學者都相信這種做法能解決更深層的問題——也就是究竟誰能讓這些公司負起責任。牛津大學倫理學家 Carissa Véliz 質疑,宣稱的良好意圖是否真能比商業模式所創造的誘因更重要。
她警告,圍繞科技所使用的宗教語言,可能滋長一種部落式忠誠,反而抗拒理性思考。批評者將這種外展視為「倫理洗白」,企圖借用道德公信力。Green 則反駁,任何虛偽姿態都會很快被識破,且難以挽回。
教宗利奧十四世於 5 月 25 日 published 了首份約四萬字的通諭,呼籲必須解除 AI 的武裝,並使之從屬於人類尊嚴。Anthropic 共同創辦人 Christopher Olah attended 了在梵蒂岡舉行的發表會,這是該公司數月來持續與宗教領袖互動的最新進展。
接著看: SpaceX Hits $2.94T Valuation After Passing Amazon And Microsoft





