人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-16 05:36:11 2,502次浏览

所谓的人工智能的“奇点”的到来,在很大程度上反映了人类在自己的创造物的强大性能面前的不安。如果说在前智能时代,机器技术体系在力量、复杂性、精密度方面的超越还只是局部功能的增强,不足以引起人对引以为傲的本质——思考/理性的担忧,那么生成式人工智能在知识生产、理性设计、语义逻辑乃至可以带有情绪性表达的自然语言处理方面展现出来的卓绝能力让作为创造者的人类在内心再一次感受到了新版的“机器人威胁论”——AI威胁论。对可能失去控制的担忧让设计者期待以某种方式重新赢回决定权,于是,人工智能设计和治理又一次处在更深的“恐惑谷”的悖论境地:一方面,整个人工智能的发展过程一直以类人性作为超人性的基础,从任务实现到输出方式、到理解能力都希望有明确的可解释性、与人类保持一致性,哪怕在外观的设计上也从未放弃过“人形智能机”的设想;另一方面,这种类人性和超人性发展得越好,人类自身就越恐慌,尤其当最新的生成式人工智能突破了“波兰尼困境”,在多模态知识生产上已经可以依赖网络文本数据库和大模型技术实现自我生产的时候,不但人类心理上的恐慌越发严重,治理过程中所面临的风险也更加多元化和强化。抵抗不安感的最好武器是规范性。价值对齐的目标正是以建构规范性价值倾向来实现人工智能治理。然而,这里仍然存在另一个悖论,即“算法的价值倾向性越小,其越多以功能服务模式体现为满足单一确定目标的中立性工具职能,并因此只涉及线性且结果导向的治理要求;算法价值倾向性越大,其越多以画像评价模式体现为针对不同目标进行选择排序以作出价值性评估”。可见,价值倾向度的增加在一定程度上与功能的通用性之间呈现出反向趋势。因此,到底有没有可能以规范性的总体策略解决多元化的风险,并没有肯定的答案。比起价值嵌入,尽管价值对齐的措辞稍显缓和,但它依旧遵循了以人类社会取向干预或改造人工智能技术的规范性塑造路径。对于这一方法,“既有的技术治理史表明,总体策略在现实中并非没有人坚持,事实上不少技治主义者的头脑中均带有总体主义的主观性,但结果在实践中收获的均为局部和具体的技治推进,根本没有实现过各个微小技治系统的完全统一协作。从这个意义上,可以说总体策略均以失败告终”。或者,更简单地说,算法治理的目的和结果都不是简单地价值对齐,它需要重新衡量技术实现和应用中的具体问题。因为所谓的价值对齐,并不是通过增加价值矢量和奖惩指数就可以实现的,它涉及到数据爬取和清洗、算法设计和测试,到应用场景的每一个细节,并且它和技术算力之间也不完全是正向关系。例如,“在使用RLHF(reinforcement learning with human feedback,基于人类反馈的强化学习)进行价值观对齐时,)对齐行为无形中为AI大模型的能力涌现戴上了‘紧箍咒’,)以牺牲模型能力的方式来换取价值观对齐” 。OpenAI超级对齐团队的解散就真实地反映了这种冲突的强度,团队负责人在后来发表的个人声明中一再强调由于公司将产品性能置于价值对齐之前,以至于团队获得的计算和数据资源并不足够。这说明,尽管价值对齐的结果和成效尚处于难以评估的状态,但其依赖于社会预测和强反馈以及偏好排序的控制论做法,本身就是在算力上缺乏执行的可靠基础。 这种话语对人工智能技术发展全过程中的价值性因素视而不见,代之以一种抽象性的人机价值差异,这其实是对人工智能输出结果的不如人意的解释,也是对发生问题的边界的设定。在界定中,抽象的“人类”价值和正确性的场域得以确保,但不是以本质主义的方式(因为价值的多元化),而是以价值排他性的方式将人工智能的“问题”建构为一种绝对意义上的外在,关于价值的讨论只逡巡在人机的边界之上,不向人类内部返回。这既反映了对人类智能与人工智能关系进行简化的理论惰性,也召唤了古老的价值殖民方式的回归。价值对齐隐含的“人类价值”预设以一种一元论的方式制造了作为操控性主体的单一基质和连续性,而“对齐”过程则被理解为由这个主体发起的单向过程,丝毫没有意识到在已经建构起来的社会历史中的价值无意识和不平衡的数据分布对人工智能技术的影响。价值对齐强调的始终是主体形而上的尊位,它有权决定“嵌入”“对齐”或视若无睹。然而,越是承认数字技术所具有的自治性,就越应该意识到所谓问题的解决不是(也绝不可能是)价值对齐这种“由主体发起并最终导致一系列固定后果的因果过程”。人工智能表现出来的价值“错位”不仅发生在技术形成到应用的整个流程中,而且如前所述,其本身也是一个基于复杂性因素不断叠加的过程。当然这并不是说对人工智能输出中那些令人不安的问题不能进行治理,只是价值对齐这样的措辞会基于错误的人机关系设想而夸大人类主体的能动性,并误导不合理的解决方式。如在数据治理过程中存在的工具理性与价值理性之间价值导向层面的矛盾,是不是仅靠价值移植就能解决,其本身就存在疑问。而要在数字化、智能化转型的浪潮中加快推动符合人文主义价值的数字生态治理机制,则需要从正视人工智能和人类智能的关系开始,进而深入分析问题的成因。 印度比拉理工学院的机器人模拟专家阿卡普拉沃·包米克在谈到具有自主性的AI智能体设计需要遵循的原则时,特别强调了只有从具身认知的特性、而不是抽象的人机对立原则出发才能有所突破。由于认知本身是基于同智能体自身所处的环境之间的交互而形成的,它首先具有情境性,并且这种情境性认知会建立起一个随着时间压力而推进的连续的进化响应,从而动态地生成适合于情境的价值判断或行动。这种认知模型本身不具有泛化扩展性,因此只能以环境反馈的方式进行补偿,而无法“完全形成对相关行为的系统响应”。这也就解释了为什么Gemini的研发团队在试图纠正训练数据集的数据分布不均衡所导致的种族主义偏差时,为什么会引发更显而易见的错误。它同时也导向了一个价值对齐的拥护者们容易回避的问题:对齐行为的效果并不如器官移植一般理想,它更像是基因修改,其下游的风险难以预测。因为“被设计的伦理/价值”在何种意义上可以与持续性的智能体-环境交互系统始终保持自洽,这本身就是一个需要证明的命题。与现实情境中的价值多元相对应,其实并不存在抽象的有益于“人类”的唯一价值。特定的价值总是使一些人受益而损害另外一些人的利益。每一个具体的价值判断都依赖于上下文信息和在不同的规范性领域(如道德、习俗、认知和政治)进行协调行动的技巧,而不是某种作为标准方案的规范性的“对齐”。“没有什么可以保证标准解决方案所呼吁的建立只重视人类的人工智能的普遍政策得到普遍实施。在一个利益竞争和许多坏行为者的混乱世界里,标准的解决方案看起来像是一种冰冷的安慰”。“对齐”的设想更接近波普尔所批评的社会改造的“乌托邦策略”,只不过这一次是赛博属性的,它以维护理想价值原则作为控制论的首要原则,从而必然导致实践中的教条主义和独断论。而且,对首要原则和总体策略的任何质疑,都有可能导致颠覆性的结果;使得哪怕是技术性的纠错,都要耗费巨大的社会成本(尤其考虑到数字技术和人工智能的普及),甚至是彻底失败。

该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 /
杰里斯女篮

杰里斯女篮

西女甲 | 2024-11-17 19:00
0
-
0

格尔尼卡女篮

格尔尼卡女篮

分析数据赛程

直播信号

赛事信息

北京时间:2024年11月17日 19:00分,西女甲【杰里斯女篮VS格尔尼卡女篮】准时开始,喜欢看西女甲比赛的朋友可以提前收藏本页面以免错过直播。还为您在本页面索引了相关西女甲直播、杰里斯女篮、格尔尼卡女篮直播的近期比赛列表以及两队历史交锋、两队最新比赛赛程。本站不参与制作、不存储,资源由热心网友提供信号源

相关标签

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-16 05:36:11 4,735次浏览

所谓的人工智能的“奇点”的到来,在很大程度上反映了人类在自己的创造物的强大性能面前的不安。如果说在前智能时代,机器技术体系在力量、复杂性、精密度方面的超越还只是局部功能的增强,不足以引起人对引以为傲的本质——思考/理性的担忧,那么生成式人工智能在知识生产、理性设计、语义逻辑乃至可以带有情绪性表达的自然语言处理方面展现出来的卓绝能力让作为创造者的人类在内心再一次感受到了新版的“机器人威胁论”——AI威胁论。对可能失去控制的担忧让设计者期待以某种方式重新赢回决定权,于是,人工智能设计和治理又一次处在更深的“恐惑谷”的悖论境地:一方面,整个人工智能的发展过程一直以类人性作为超人性的基础,从任务实现到输出方式、到理解能力都希望有明确的可解释性、与人类保持一致性,哪怕在外观的设计上也从未放弃过“人形智能机”的设想;另一方面,这种类人性和超人性发展得越好,人类自身就越恐慌,尤其当最新的生成式人工智能突破了“波兰尼困境”,在多模态知识生产上已经可以依赖网络文本数据库和大模型技术实现自我生产的时候,不但人类心理上的恐慌越发严重,治理过程中所面临的风险也更加多元化和强化。抵抗不安感的最好武器是规范性。价值对齐的目标正是以建构规范性价值倾向来实现人工智能治理。然而,这里仍然存在另一个悖论,即“算法的价值倾向性越小,其越多以功能服务模式体现为满足单一确定目标的中立性工具职能,并因此只涉及线性且结果导向的治理要求;算法价值倾向性越大,其越多以画像评价模式体现为针对不同目标进行选择排序以作出价值性评估”。可见,价值倾向度的增加在一定程度上与功能的通用性之间呈现出反向趋势。因此,到底有没有可能以规范性的总体策略解决多元化的风险,并没有肯定的答案。比起价值嵌入,尽管价值对齐的措辞稍显缓和,但它依旧遵循了以人类社会取向干预或改造人工智能技术的规范性塑造路径。对于这一方法,“既有的技术治理史表明,总体策略在现实中并非没有人坚持,事实上不少技治主义者的头脑中均带有总体主义的主观性,但结果在实践中收获的均为局部和具体的技治推进,根本没有实现过各个微小技治系统的完全统一协作。从这个意义上,可以说总体策略均以失败告终”。或者,更简单地说,算法治理的目的和结果都不是简单地价值对齐,它需要重新衡量技术实现和应用中的具体问题。因为所谓的价值对齐,并不是通过增加价值矢量和奖惩指数就可以实现的,它涉及到数据爬取和清洗、算法设计和测试,到应用场景的每一个细节,并且它和技术算力之间也不完全是正向关系。例如,“在使用RLHF(reinforcement learning with human feedback,基于人类反馈的强化学习)进行价值观对齐时,)对齐行为无形中为AI大模型的能力涌现戴上了‘紧箍咒’,)以牺牲模型能力的方式来换取价值观对齐” 。OpenAI超级对齐团队的解散就真实地反映了这种冲突的强度,团队负责人在后来发表的个人声明中一再强调由于公司将产品性能置于价值对齐之前,以至于团队获得的计算和数据资源并不足够。这说明,尽管价值对齐的结果和成效尚处于难以评估的状态,但其依赖于社会预测和强反馈以及偏好排序的控制论做法,本身就是在算力上缺乏执行的可靠基础。 这种话语对人工智能技术发展全过程中的价值性因素视而不见,代之以一种抽象性的人机价值差异,这其实是对人工智能输出结果的不如人意的解释,也是对发生问题的边界的设定。在界定中,抽象的“人类”价值和正确性的场域得以确保,但不是以本质主义的方式(因为价值的多元化),而是以价值排他性的方式将人工智能的“问题”建构为一种绝对意义上的外在,关于价值的讨论只逡巡在人机的边界之上,不向人类内部返回。这既反映了对人类智能与人工智能关系进行简化的理论惰性,也召唤了古老的价值殖民方式的回归。价值对齐隐含的“人类价值”预设以一种一元论的方式制造了作为操控性主体的单一基质和连续性,而“对齐”过程则被理解为由这个主体发起的单向过程,丝毫没有意识到在已经建构起来的社会历史中的价值无意识和不平衡的数据分布对人工智能技术的影响。价值对齐强调的始终是主体形而上的尊位,它有权决定“嵌入”“对齐”或视若无睹。然而,越是承认数字技术所具有的自治性,就越应该意识到所谓问题的解决不是(也绝不可能是)价值对齐这种“由主体发起并最终导致一系列固定后果的因果过程”。人工智能表现出来的价值“错位”不仅发生在技术形成到应用的整个流程中,而且如前所述,其本身也是一个基于复杂性因素不断叠加的过程。当然这并不是说对人工智能输出中那些令人不安的问题不能进行治理,只是价值对齐这样的措辞会基于错误的人机关系设想而夸大人类主体的能动性,并误导不合理的解决方式。如在数据治理过程中存在的工具理性与价值理性之间价值导向层面的矛盾,是不是仅靠价值移植就能解决,其本身就存在疑问。而要在数字化、智能化转型的浪潮中加快推动符合人文主义价值的数字生态治理机制,则需要从正视人工智能和人类智能的关系开始,进而深入分析问题的成因。 印度比拉理工学院的机器人模拟专家阿卡普拉沃·包米克在谈到具有自主性的AI智能体设计需要遵循的原则时,特别强调了只有从具身认知的特性、而不是抽象的人机对立原则出发才能有所突破。由于认知本身是基于同智能体自身所处的环境之间的交互而形成的,它首先具有情境性,并且这种情境性认知会建立起一个随着时间压力而推进的连续的进化响应,从而动态地生成适合于情境的价值判断或行动。这种认知模型本身不具有泛化扩展性,因此只能以环境反馈的方式进行补偿,而无法“完全形成对相关行为的系统响应”。这也就解释了为什么Gemini的研发团队在试图纠正训练数据集的数据分布不均衡所导致的种族主义偏差时,为什么会引发更显而易见的错误。它同时也导向了一个价值对齐的拥护者们容易回避的问题:对齐行为的效果并不如器官移植一般理想,它更像是基因修改,其下游的风险难以预测。因为“被设计的伦理/价值”在何种意义上可以与持续性的智能体-环境交互系统始终保持自洽,这本身就是一个需要证明的命题。与现实情境中的价值多元相对应,其实并不存在抽象的有益于“人类”的唯一价值。特定的价值总是使一些人受益而损害另外一些人的利益。每一个具体的价值判断都依赖于上下文信息和在不同的规范性领域(如道德、习俗、认知和政治)进行协调行动的技巧,而不是某种作为标准方案的规范性的“对齐”。“没有什么可以保证标准解决方案所呼吁的建立只重视人类的人工智能的普遍政策得到普遍实施。在一个利益竞争和许多坏行为者的混乱世界里,标准的解决方案看起来像是一种冰冷的安慰”。“对齐”的设想更接近波普尔所批评的社会改造的“乌托邦策略”,只不过这一次是赛博属性的,它以维护理想价值原则作为控制论的首要原则,从而必然导致实践中的教条主义和独断论。而且,对首要原则和总体策略的任何质疑,都有可能导致颠覆性的结果;使得哪怕是技术性的纠错,都要耗费巨大的社会成本(尤其考虑到数字技术和人工智能的普及),甚至是彻底失败。

该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

「活动」首次登录送19元红包

39.38MB
版本release2.7.6
下载海角大神强奸少妇邻居潮喷黑丝安装你想要的应用 更方便 更快捷 发现更多
喜欢 30%好评(73人)
评论 51
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图0 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图1 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图2 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图3 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图4
详细信息
  • 软件大小: 73.32MB
  • 最后更新: 2025-01-16 05:36:11
  • 最新版本: ver5.9.7
  • 文件格式: apk
  • 应用分类:ios-Android 迪丽热巴裸体 自慰
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,兽交激情欧,公车痴汉媚药强抹在线观看
二,钙片下载,51CG10 吃瓜 爆料永利
三,美女足交啪啪,无码熟妇人妻Av影音先锋
四,999cao,卫生间被教官做好爽HH视频
五,女人的隐私倍位给你看,艹逼偷拍福利视频
六,捅鸡鸡网站大全,杨钰莹欲乱小说
七,朕的兔子好软水好多H15视频,美女脱内裤给男人桶
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
release8.5.6
wwwwxxxxx

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉 8天前
    初恋视频扒开内裤舔
  • 老骚逼乱伦 5天前
    国模月月大尺度私拍
  • 12 13x x videos俄罗斯 6天前
    XXXXXV.COM
  • 小穴,被操烂视频 3天前
    偷拍少妇自慰
  • 搞骚逼内射 1天前
    免费做运动扑克视频网站大全
  • 女人被黑人嗷嗷惨叫求饶 7天前
    爆插bb
  • 扒开女人逼把肌肌插进去 6天前
    和大胸妹子爱爱视频网站
  • 亚洲国产中文字幕夜夜嗨 6天前
    百度www55天天
  • www.深夜成人 网站百合 6天前
    国产剧情AV性爱公寓
  • 爆操95年美女 7天前
    操骚屄

近5次交锋

杰里斯女篮近5场比赛

格尔尼卡女篮近5场比赛