Anthropic 一直在諮詢神學家和倫理學家,以塑造其聊天機械人 Claude 的行為;同時,教宗利奧十四世 警告人工智能威脅人類尊嚴。
重點摘要:
- Anthropic 於三月底邀請約 15 位宗教思想家前往其三藩市總部,討論 Claude 的道德框架。
- 這些會議旨在完善 Claude 的「憲法」,即引導模型如何回應用戶的書面原則。
- 教宗利奧十四世於 5 月 25 日發表第一封通諭,敦促解除 AI 的武裝,並讓其從屬於人類尊嚴。
Anthropic 招募宗教學者
約 15 位宗教思想家於三月底在三藩市辦公室會見該公司。他們聚首一堂,討論一個現正分裂整個 AI 產業的問題:當簡單規則已無法涵蓋所有情況時,要如何教導聊天機械人「行善」。
邀請以不同方式送達,有些透過電郵,有些則經由朋友介紹。每位來賓都參與了一連串關於 Claude 及其道德框架的討論,該框架旨在指引它如何作答。目標不是讓模型變得虔誠,而是借鑑宗教界數百年來對是非善惡的推理傳統。
這套推理注入了 Anthropic 所稱的 Claude「憲法」——一套書面原則,公司借此塑造模型在悲傷輔導到臨終照護等各種議題上的回應。公司訓練 Claude 依據這些規則批判並修訂自己的答案,而不是死守一張固定禁令清單。
延伸閱讀: Traders Now Give Fable 5 74% Shot At Returning By Mid-July
專家質疑 Claude 的道德框架
聖塔克拉拉大學科技倫理學家 Brian Patrick Green 表示,實驗室日益增長的力量已開始超越其內部的智慧儲備。負責顧問組織「AI and Faith」的 Greg Cootsona 回憶,員工坦承這些問題已大到無法獨自回答。四月底的一場會議則擴大圈子,納入猶太教、印度教、錫克教、摩門教及希臘東正教等聲音。
並非所有學者都相信這種做法能解決更深層的責任問題——究竟誰能讓這些公司負責。牛津大學倫理學家 Carissa Véliz 質疑,聲稱的善意是否真能比商業模型所創造的誘因更重要。
她警告,圍繞科技的宗教語言可能孕育出一種部落式忠誠,反而抗拒理性討論。批評者將這類外展斥為「倫理漂白」,只是企圖借用道德公信力。Green 則反駁,任何虛假姿態都會很快被識破,而且一旦失信,將難以修補。
教宗利奧十四世於 5 月 25 日發表首封通諭,約四萬字,呼籲解除 AI 的武裝,並讓其始終從屬於人類尊嚴。Anthropic 聯合創辦人 Christopher Olah 亦出席了梵蒂岡的發表會,這是該公司數月來與宗教領袖持續接觸的最新一步。
下一則閱讀: SpaceX Hits $2.94T Valuation After Passing Amazon And Microsoft





