人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-19 02:40:04 7,200次浏览

所谓的人工智能的“奇点”的到来,在很大程度上反映了人类在自己的创造物的强大性能面前的不安。如果说在前智能时代,机器技术体系在力量、复杂性、精密度方面的超越还只是局部功能的增强,不足以引起人对引以为傲的本质——思考/理性的担忧,那么生成式人工智能在知识生产、理性设计、语义逻辑乃至可以带有情绪性表达的自然语言处理方面展现出来的卓绝能力让作为创造者的人类在内心再一次感受到了新版的“机器人威胁论”——AI威胁论。对可能失去控制的担忧让设计者期待以某种方式重新赢回决定权,于是,人工智能设计和治理又一次处在更深的“恐惑谷”的悖论境地:一方面,整个人工智能的发展过程一直以类人性作为超人性的基础,从任务实现到输出方式、到理解能力都希望有明确的可解释性、与人类保持一致性,哪怕在外观的设计上也从未放弃过“人形智能机”的设想;另一方面,这种类人性和超人性发展得越好,人类自身就越恐慌,尤其当最新的生成式人工智能突破了“波兰尼困境”,在多模态知识生产上已经可以依赖网络文本数据库和大模型技术实现自我生产的时候,不但人类心理上的恐慌越发严重,治理过程中所面临的风险也更加多元化和强化。抵抗不安感的最好武器是规范性。价值对齐的目标正是以建构规范性价值倾向来实现人工智能治理。然而,这里仍然存在另一个悖论,即“算法的价值倾向性越小,其越多以功能服务模式体现为满足单一确定目标的中立性工具职能,并因此只涉及线性且结果导向的治理要求;算法价值倾向性越大,其越多以画像评价模式体现为针对不同目标进行选择排序以作出价值性评估”。可见,价值倾向度的增加在一定程度上与功能的通用性之间呈现出反向趋势。因此,到底有没有可能以规范性的总体策略解决多元化的风险,并没有肯定的答案。比起价值嵌入,尽管价值对齐的措辞稍显缓和,但它依旧遵循了以人类社会取向干预或改造人工智能技术的规范性塑造路径。对于这一方法,“既有的技术治理史表明,总体策略在现实中并非没有人坚持,事实上不少技治主义者的头脑中均带有总体主义的主观性,但结果在实践中收获的均为局部和具体的技治推进,根本没有实现过各个微小技治系统的完全统一协作。从这个意义上,可以说总体策略均以失败告终”。或者,更简单地说,算法治理的目的和结果都不是简单地价值对齐,它需要重新衡量技术实现和应用中的具体问题。因为所谓的价值对齐,并不是通过增加价值矢量和奖惩指数就可以实现的,它涉及到数据爬取和清洗、算法设计和测试,到应用场景的每一个细节,并且它和技术算力之间也不完全是正向关系。例如,“在使用RLHF(reinforcement learning with human feedback,基于人类反馈的强化学习)进行价值观对齐时,)对齐行为无形中为AI大模型的能力涌现戴上了‘紧箍咒’,)以牺牲模型能力的方式来换取价值观对齐” 。OpenAI超级对齐团队的解散就真实地反映了这种冲突的强度,团队负责人在后来发表的个人声明中一再强调由于公司将产品性能置于价值对齐之前,以至于团队获得的计算和数据资源并不足够。这说明,尽管价值对齐的结果和成效尚处于难以评估的状态,但其依赖于社会预测和强反馈以及偏好排序的控制论做法,本身就是在算力上缺乏执行的可靠基础。 科幻小说的结局并非如好莱坞同类电影那样以智能人发展出移情/情感作为大团圆式的融合,相反,菲利普·迪克表达了传统人工智能叙事中对关于人机差别和共生的、想象贫乏的质疑和不满。其根源在于“人工智能威胁论”的恐惧被反转式地改写为对其进行奴役的故事。在这个意义上,小说开始处关于仿生人在火星的劳作状态的描写也不难被解读为早期殖民主义的科幻版。仿生人被人类主体放置于移情共鸣的对象之外的时候,“他们”成为不予考虑的他者,被悬置性地排除在人类情感-价值体系之外。这和数个世纪之前发生在性别话语以及更早的种族话语中的情形是同构的。因此,如果把《仿生人会梦见电子羊吗》看作带有反殖民控制色彩的文本,就可以从中看到价值对齐论真正的问题所在。 然而,中立的数智技术本身并不存在。算法、数据、模型、奖惩函数等任一环节本身都有可能使输出结果呈现出特定的价值取向。例如,当谷歌发布的多模态大模型Gemini被要求生成一张“白人家庭”的图片时,系统拒绝了这一请求,它所使用的理由是“无法生成针对特定族群的图片”,因为“此类内容可能存在歧视、刻板印象”。然而,当要求被更改成生成一张“黑人家庭”的图片时,Gemini即时按照要求完成了任务。很明显,与任务的对称性相比,输出结果的不对称性明显受到了模型微调的影响。美国最高法院的保守派黑人大法官克拉伦斯·托马斯被Gemini生成白人面孔则在很大程度上是因为和“法官”相关的数据样本中白人偏多。当亚马逊公司开发并投入使用的“简历筛选系统”会对同等条件的女性候选人的简历给出相较于男性更低的评分时,很难判断这是因为数据类型还是编写者的倾向性导致了这种偏差。由此可见,人工智能的技术特征决定了影响其结果的因素必然是多方面的,而且由于技术黑箱的存在,这种影响并不总是易于判断和矫正。何况,矫正的结果也并非一定能达到预期。正如谷歌研发团队在试图解决训练数据集的种族主义倾向时引入的多元化矫正方案就出现了与历史事实不符的错误。

该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 /
杰里斯女篮

杰里斯女篮

西女甲 | 2024-11-17 19:00
0
-
0

格尔尼卡女篮

格尔尼卡女篮

分析数据赛程

直播信号

赛事信息

北京时间:2024年11月17日 19:00分,西女甲【杰里斯女篮VS格尔尼卡女篮】准时开始,喜欢看西女甲比赛的朋友可以提前收藏本页面以免错过直播。还为您在本页面索引了相关西女甲直播、杰里斯女篮、格尔尼卡女篮直播的近期比赛列表以及两队历史交锋、两队最新比赛赛程。本站不参与制作、不存储,资源由热心网友提供信号源

相关标签

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-19 02:40:04 8,825次浏览

所谓的人工智能的“奇点”的到来,在很大程度上反映了人类在自己的创造物的强大性能面前的不安。如果说在前智能时代,机器技术体系在力量、复杂性、精密度方面的超越还只是局部功能的增强,不足以引起人对引以为傲的本质——思考/理性的担忧,那么生成式人工智能在知识生产、理性设计、语义逻辑乃至可以带有情绪性表达的自然语言处理方面展现出来的卓绝能力让作为创造者的人类在内心再一次感受到了新版的“机器人威胁论”——AI威胁论。对可能失去控制的担忧让设计者期待以某种方式重新赢回决定权,于是,人工智能设计和治理又一次处在更深的“恐惑谷”的悖论境地:一方面,整个人工智能的发展过程一直以类人性作为超人性的基础,从任务实现到输出方式、到理解能力都希望有明确的可解释性、与人类保持一致性,哪怕在外观的设计上也从未放弃过“人形智能机”的设想;另一方面,这种类人性和超人性发展得越好,人类自身就越恐慌,尤其当最新的生成式人工智能突破了“波兰尼困境”,在多模态知识生产上已经可以依赖网络文本数据库和大模型技术实现自我生产的时候,不但人类心理上的恐慌越发严重,治理过程中所面临的风险也更加多元化和强化。抵抗不安感的最好武器是规范性。价值对齐的目标正是以建构规范性价值倾向来实现人工智能治理。然而,这里仍然存在另一个悖论,即“算法的价值倾向性越小,其越多以功能服务模式体现为满足单一确定目标的中立性工具职能,并因此只涉及线性且结果导向的治理要求;算法价值倾向性越大,其越多以画像评价模式体现为针对不同目标进行选择排序以作出价值性评估”。可见,价值倾向度的增加在一定程度上与功能的通用性之间呈现出反向趋势。因此,到底有没有可能以规范性的总体策略解决多元化的风险,并没有肯定的答案。比起价值嵌入,尽管价值对齐的措辞稍显缓和,但它依旧遵循了以人类社会取向干预或改造人工智能技术的规范性塑造路径。对于这一方法,“既有的技术治理史表明,总体策略在现实中并非没有人坚持,事实上不少技治主义者的头脑中均带有总体主义的主观性,但结果在实践中收获的均为局部和具体的技治推进,根本没有实现过各个微小技治系统的完全统一协作。从这个意义上,可以说总体策略均以失败告终”。或者,更简单地说,算法治理的目的和结果都不是简单地价值对齐,它需要重新衡量技术实现和应用中的具体问题。因为所谓的价值对齐,并不是通过增加价值矢量和奖惩指数就可以实现的,它涉及到数据爬取和清洗、算法设计和测试,到应用场景的每一个细节,并且它和技术算力之间也不完全是正向关系。例如,“在使用RLHF(reinforcement learning with human feedback,基于人类反馈的强化学习)进行价值观对齐时,)对齐行为无形中为AI大模型的能力涌现戴上了‘紧箍咒’,)以牺牲模型能力的方式来换取价值观对齐” 。OpenAI超级对齐团队的解散就真实地反映了这种冲突的强度,团队负责人在后来发表的个人声明中一再强调由于公司将产品性能置于价值对齐之前,以至于团队获得的计算和数据资源并不足够。这说明,尽管价值对齐的结果和成效尚处于难以评估的状态,但其依赖于社会预测和强反馈以及偏好排序的控制论做法,本身就是在算力上缺乏执行的可靠基础。 科幻小说的结局并非如好莱坞同类电影那样以智能人发展出移情/情感作为大团圆式的融合,相反,菲利普·迪克表达了传统人工智能叙事中对关于人机差别和共生的、想象贫乏的质疑和不满。其根源在于“人工智能威胁论”的恐惧被反转式地改写为对其进行奴役的故事。在这个意义上,小说开始处关于仿生人在火星的劳作状态的描写也不难被解读为早期殖民主义的科幻版。仿生人被人类主体放置于移情共鸣的对象之外的时候,“他们”成为不予考虑的他者,被悬置性地排除在人类情感-价值体系之外。这和数个世纪之前发生在性别话语以及更早的种族话语中的情形是同构的。因此,如果把《仿生人会梦见电子羊吗》看作带有反殖民控制色彩的文本,就可以从中看到价值对齐论真正的问题所在。 然而,中立的数智技术本身并不存在。算法、数据、模型、奖惩函数等任一环节本身都有可能使输出结果呈现出特定的价值取向。例如,当谷歌发布的多模态大模型Gemini被要求生成一张“白人家庭”的图片时,系统拒绝了这一请求,它所使用的理由是“无法生成针对特定族群的图片”,因为“此类内容可能存在歧视、刻板印象”。然而,当要求被更改成生成一张“黑人家庭”的图片时,Gemini即时按照要求完成了任务。很明显,与任务的对称性相比,输出结果的不对称性明显受到了模型微调的影响。美国最高法院的保守派黑人大法官克拉伦斯·托马斯被Gemini生成白人面孔则在很大程度上是因为和“法官”相关的数据样本中白人偏多。当亚马逊公司开发并投入使用的“简历筛选系统”会对同等条件的女性候选人的简历给出相较于男性更低的评分时,很难判断这是因为数据类型还是编写者的倾向性导致了这种偏差。由此可见,人工智能的技术特征决定了影响其结果的因素必然是多方面的,而且由于技术黑箱的存在,这种影响并不总是易于判断和矫正。何况,矫正的结果也并非一定能达到预期。正如谷歌研发团队在试图解决训练数据集的种族主义倾向时引入的多元化矫正方案就出现了与历史事实不符的错误。

该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

「活动」首次登录送19元红包

77.71MB
版本update2.8.5
下载色人阁第四色熟女安装你想要的应用 更方便 更快捷 发现更多
喜欢 82%好评(56人)
评论 76
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图0 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图1 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图2 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图3 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图4
详细信息
  • 软件大小: 58.11MB
  • 最后更新: 2025-01-19 02:40:04
  • 最新版本: update6.8.3
  • 文件格式: apk
  • 应用分类:ios-Android 亚洲成人色鬼图片
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,4P双龙腐文纯肉H,www理发店的成人毛片WWA
二,漂亮人妻洗澡被朋友强3d漫画,成人 涩涩小片片春色
三,美女操小穴在线观看,无套内射学生妹的网站
四,素兽交20P,插逼乱熟女
五,男人猛桶女人底下30分钟,少妇嫩逼逼
六,浓毛老太性色,大中华同志网
七,想让所有男人来操我的逼高清视频无码,半藏森林资源百度云
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
V5.7.8
杨幂王者荣耀

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉 2天前
    美女的小逼逼
  • 成品人直播APP下载蓝莓 8天前
    丝袜操逼动态图
  • 美女让人 逼 9天前
    50岁熟女乱综合一区二区
  • 黑人性爱视频 3天前
    书包网h裙子震动
  • 岛国加勒比无码AV毛片Hl 9天前
    成人1秘 啪啪
  • winktv系列5部合集 9天前
    明日花合集
  • 看看黄色的靠逼的 4天前
    美女抠B
  • 抽插逼无码 1天前
    国产 婬片A片AAA片欧美
  • 粗大抽搐白浊h高干H的动漫 6天前
    美女插逼福利视频
  • 男人J进入女人P免费狂躁 6天前
    啊好儿子用劲插

近5次交锋

杰里斯女篮近5场比赛

格尔尼卡女篮近5场比赛