人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-04 16:49:25 8678次浏览

??


菲利普·K.迪克在《仿生人会梦见电子羊吗》中描写了一个人性与非人性追逐与转化的故事。在男主人公里克对仿生人的追捕中,他所依赖的辨别依据是移情测试。因为人们相信移情是人类与仿生人之间的唯一差别,其原理是人类的群体本能所导致的情感投射,会对除自己以外的生物产生关爱。仿生人作为“独居的捕食者”,无法体会甚至无法假装出这种情感。这种预设出来的对立有其内在逻辑上的悖论:人类的移情反应被相信会投射到动物身上,但却不包括仿生人,尽管后者在外形上和人类一样,甚至也可以在其他方面表现出与人类相似的行为。这也就意味着,作为人性核心特征的移情能力既排除了仿生人作为其对象,也杜绝了被仿生人获得的可能。仿生人作为人类智能科技发展的卓越成果(甚至可以实现对仿生人的记忆植入),却在大前提上被设置了一个禁区。探究其背后真正的原因,可以发现,人类制造他们本来就是为了奴役,对仿生人的移情将使得工具式的利用和猎物式的追捕难以进行。可见,从心理层面来说,制造移情“缺位”不是因为技术的障碍,而是出于奠定人类的优越感和控制感。一个缺乏移情的行动体无论怎么与人相似,都因为没有“人性”(移情)而丧失被平等对待的资格。 和基于数据科学的人工智能技术的连续性不同,价值的不连续性来源于其自身的特征,从本质上来说它并不是一套精确的规则和条件判断,而更像是一个具有弹性的语法体系,其中包含了很多从历史文化信仰体系中获得的内化性原则,包括但不限于文化倾向、历史习俗、社会信念、群体观念、政治意识形态、地域、宗教、种族、性别甚至职业身份等多重元素。目前大多数科创企业所采取的通过强调匹配不同算法特征及其治理需求的分类治理框架来实现价值对齐的方式,体现为应用环境通过对输入变量赋值进而对输出结果产生影响,如对生成式人工智能进行预训练后的模型微调就属于此类。这种思路由设计者将被预设为普遍性的价值原则嵌入智能自治系统中以形成特定的概念空间,然后根据场景调用。于是,下游应用中的相关符号被赋值,并纳入与该价值原则相关的关系之中。这就是为什么“输出一个白人家庭”的要求会被Gemini拒绝,“白人”作为敏感符号被赋值与种族主义立场相关,而有色人种的要求则不会。这种“价值属性”其实并不是人工智能对人类价值观的理解,只是出于算法编写者的设计。从这个意义上说,价值对齐的叙事编织从根本上说并不反映被假想出来的人机差异,而是关乎人工智能设计和算法治理的问题,更简单地说,它是一个具有自主性的智能体应不应该,以及如何设计的问题。 一些国际机构已经发布了政策,试图明确人工智能系统在设计时应遵守的伦理原则。例如,欧盟已经确定了关于使用人工智能的四项道德原则:无恶意、尊重自主权、算法公平和透明性。美国白宫科学技术办公室提出的原则略有不同,其中特别强调了人类有选择不与人工智能互动的权利,这一点其实是对自主权内涵的进一步扩大,也是对人类个体的独特性和自治性的保护,即人类有权决定不受人工智能的影响而采取符合自己判断的自主行动。从这个意义上来讲,通过施加对人工智能的价值对齐进而将设计的伦理原则施加于人类社会的做法,本身就是价值殖民的一种改版。这一结论并不夸张。从技术实践的层面来看,能够有效地在现有大模型中推进价值嵌入和价值对齐的,通常都是在技术、数据和算力上占据优势的大型科技公司,OpenAI、谷歌的DeepMind之前都建立了专注于解决价值对齐问题的团队(然而,前者刚刚宣布对其予以解散,后者的成效还需要进一步验证)。考虑已开发的人工智能的应用广度和深度,技术决定论似乎又一次在价值领域以一种奇异的姿态发挥了作用,它使得头部从业者不但可以主导市场,甚至可以主导人类社会。现实有可能变成:谁掌握了最先进/应用最广的人工智能,谁就拥有了实现价值对齐的权力,谁也就拥有了界定人类价值和人类普遍利益的权力。从而,结果有可能是,人工智能技术的掌握者不但以特定的价值实现了对AI的“对齐”,而且更以后者的无所不在、以技术无意识的方式实现对人类群体的普遍性对齐。这种价值观的扩展方式是历史上任何政治文化方案都无法实现的。

??






??



人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

「活动」首次登录送19元红包

56.35MB
版本v5.4.8
下载强cao出水嗯啊高潮了3p视频安装你想要的应用 更方便 更快捷 发现更多
喜欢 77%好评(33人)
评论 16
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图0 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图1 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图2 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图3 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图4
详细信息
  • 软件大小: 33.69MB
  • 最后更新: 2025-01-04 16:49:25
  • 最新版本: V9.4.7
  • 文件格式: apk
  • 应用分类:ios-Android FreeHDXXXⅩ洋妞
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,揉我胸 啊 嗯~喷水微博,张开两腿强奸AV
二,欧美疯狂抽插,少妇插入
三,插女生逼,极品白虎自慰玩穴
四,欧美色图大鸡巴,杨伊人被肏哭了
五,国产同性恋艹逼,拔插拔插皇冠成人
六,在线观看雪梨小可爱,颜值女神躺在床上让小哥玩弄,吃奶抠逼小嘴就是最好的润滑,美女被操的好爽
七,日本熟夫爱爱,欧美性爱女同
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
r2.8.4
国产老头老妇女AAA片

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉 8天前
    中国美女逼逼
  • 极品美女杨晨晨掀开JK裙子 8天前
    偷拍欧美美女兽交
  • 18禁 粗大进出美女下面视频 7天前
    成人毛片 嗯啊痛轻点
  • 处女黄片 8天前
    大奶艹逼
  • 欧美姐弟乱伦thepron 5天前
    国产又粗又猛又爽又黄蜜臀网站
  • 91插逼吸奶视频毛片 1天前
    流水艹肉男女视频舔
  • 土豪酒店狂草美女 8天前
    蜜穴欧美一起草
  • 极品美女露乳自慰失禁喷水 9天前
    性中国毛片 潮喷
  • 艳妇臀荡H乳欲伦交换漫画 8天前
    人体性爱网站免费版
  • 青操逼逼 1天前
    啪啪啪美女自慰,