人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-13 11:48:27 1442次浏览

??


价值对齐反映了对人类智能与人工智能关系进行简化的理论惰性,其本质潜藏着一种价值维度上的人类中心主义投射,同时也体现了人类在技术自治性面前的不安感。价值对齐是一种企图将所有的技术-社会的复杂性问题都置于“价值偏差”的系统性盈余中予以整体性解决的技术治理方法。然而,将人类价值观嵌入人工智能系统,一方面会使得技术的发展成为最小化人类责任的借口;另一方面,这种话语以一种抽象性的人机价值差异掩盖了人工智能技术发展全过程中的价值性因素,从而以价值排他性的方式将人工智能的“问题”建构为一种绝对意义上的外在,使得关于价值的讨论只逡巡在人机的边界之上,而不向人类内部返回。从这个意义上来说,人工智能已经建构起来的社会历史中的价值无意识和不平衡的数据分布现实,是一个关于“具有自主性的智能体应该和不应该被如何设计”的问题。因此,人工智能的价值判断基础应当由外在的价值嵌入转向具身认知和知觉能力的形成。只有通过有效的人机交互与环境感知,打造开放式人机生态体系,鼓励开发与人类处于更广泛的目的分享和责任分担的人工智能,才能防范由技术所导致的任何形式的垄断。 这种二元对立与价值对齐背后的心理机制如出一辙,都体现了对智能对象的控制化叙事——无论是最初的简单工具化还是后来以辨别(《仿生人会梦见电子羊吗》)或拯救(价值对齐)的方式来重新赢回控制权的可能。菲利普·K.迪克以反讽的方式对人类的这一核心特质和潜在的优越性进行了颠覆:其一,在他的笔下,仿生人蕾切尔不但几乎通过了测试,甚至展现出对同类仿生人的移情,而这正是人类无论如何也做不到的。不仅如此,小说中的真正人类,不管是其他的仿生人追捕者,还是男主人与其妻子,彼此之间都以自身为中心,缺乏理解和关切。在两相对照下,移情作为被人普遍相信的区分特征的地位摇摇欲坠。其二,在小说的第十八章,移情共鸣箱被揭露为是一个巨大的骗局,它所表现出来的融合感以及测试量表的标准不过是一种人为的编织和表演。于是,无论是根据“移情”与否所进行的对仿生人的猎捕,还是关于“移情”本身的神话,都不过是维护人类居上位的优越感制造出来的叙事。它可以是“移情”,也可以是人类假设人工智能不具有或无视其具有(正如将智能装置设想为价值“中立”的空心体一般)的其他特质。当用这种特质对客体进行判断的时候,往往和客体的真实情形无关,而仅仅和据此做出结论的预设有关。 所谓的人工智能的“奇点”的到来,在很大程度上反映了人类在自己的创造物的强大性能面前的不安。如果说在前智能时代,机器技术体系在力量、复杂性、精密度方面的超越还只是局部功能的增强,不足以引起人对引以为傲的本质——思考/理性的担忧,那么生成式人工智能在知识生产、理性设计、语义逻辑乃至可以带有情绪性表达的自然语言处理方面展现出来的卓绝能力让作为创造者的人类在内心再一次感受到了新版的“机器人威胁论”——AI威胁论。对可能失去控制的担忧让设计者期待以某种方式重新赢回决定权,于是,人工智能设计和治理又一次处在更深的“恐惑谷”的悖论境地:一方面,整个人工智能的发展过程一直以类人性作为超人性的基础,从任务实现到输出方式、到理解能力都希望有明确的可解释性、与人类保持一致性,哪怕在外观的设计上也从未放弃过“人形智能机”的设想;另一方面,这种类人性和超人性发展得越好,人类自身就越恐慌,尤其当最新的生成式人工智能突破了“波兰尼困境”,在多模态知识生产上已经可以依赖网络文本数据库和大模型技术实现自我生产的时候,不但人类心理上的恐慌越发严重,治理过程中所面临的风险也更加多元化和强化。抵抗不安感的最好武器是规范性。价值对齐的目标正是以建构规范性价值倾向来实现人工智能治理。然而,这里仍然存在另一个悖论,即“算法的价值倾向性越小,其越多以功能服务模式体现为满足单一确定目标的中立性工具职能,并因此只涉及线性且结果导向的治理要求;算法价值倾向性越大,其越多以画像评价模式体现为针对不同目标进行选择排序以作出价值性评估”。可见,价值倾向度的增加在一定程度上与功能的通用性之间呈现出反向趋势。因此,到底有没有可能以规范性的总体策略解决多元化的风险,并没有肯定的答案。比起价值嵌入,尽管价值对齐的措辞稍显缓和,但它依旧遵循了以人类社会取向干预或改造人工智能技术的规范性塑造路径。对于这一方法,“既有的技术治理史表明,总体策略在现实中并非没有人坚持,事实上不少技治主义者的头脑中均带有总体主义的主观性,但结果在实践中收获的均为局部和具体的技治推进,根本没有实现过各个微小技治系统的完全统一协作。从这个意义上,可以说总体策略均以失败告终”。或者,更简单地说,算法治理的目的和结果都不是简单地价值对齐,它需要重新衡量技术实现和应用中的具体问题。因为所谓的价值对齐,并不是通过增加价值矢量和奖惩指数就可以实现的,它涉及到数据爬取和清洗、算法设计和测试,到应用场景的每一个细节,并且它和技术算力之间也不完全是正向关系。例如,“在使用RLHF(reinforcement learning with human feedback,基于人类反馈的强化学习)进行价值观对齐时,)对齐行为无形中为AI大模型的能力涌现戴上了‘紧箍咒’,)以牺牲模型能力的方式来换取价值观对齐” 。OpenAI超级对齐团队的解散就真实地反映了这种冲突的强度,团队负责人在后来发表的个人声明中一再强调由于公司将产品性能置于价值对齐之前,以至于团队获得的计算和数据资源并不足够。这说明,尽管价值对齐的结果和成效尚处于难以评估的状态,但其依赖于社会预测和强反馈以及偏好排序的控制论做法,本身就是在算力上缺乏执行的可靠基础。

??






??



人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

「活动」首次登录送19元红包

75.77MB
版本V6.7.4
下载内射骚逼反差安装你想要的应用 更方便 更快捷 发现更多
喜欢 54%好评(41人)
评论 55
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图0 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图1 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图2 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图3 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图4
详细信息
  • 软件大小: 29.42MB
  • 最后更新: 2025-01-13 11:48:27
  • 最新版本: beta5.7.6
  • 文件格式: apk
  • 应用分类:ios-Android 国产做受 老人.....
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,嗯嗯嗯不要视频,开车污的 女生越疼男生越来越快 文案
二,真实处破女系列全过程,大鸡巴日骚屄
三,91插插插影库永久免费 - 老铁们给我把她按住,让我干,美国肥胖老女人性爱网
四,宝宝我放进去不动我就动两下,69av成人性感
五,老女人家庭乱抡视频,欧美×x×xxX开苞
六,美女午夜洞插插,有人体艺术黑人男人和韩国女人
七,白丝兔女郎来啦,高潮喷水水 - V888AV,日本XMXMXM18小孩
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
build4.5.9
熟妇阁

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉 7天前
    破处十八岁欧美黄色高清
  • 酒店啪啪美女 8天前
    爆操骚妇逼
  • 成人免费毛片 纯h黑料 4天前
    用力插骚逼痒视频
  • 狠路综合 5天前
    日本另类z0zx
  • 骚逼p 1天前
    雷电ちゃんが部下を视频
  • 操美女的逼逼 6天前
    黑人巨大40cm翔田千里
  • 国产人妻私密推油成人网 2天前
    爆操白虎极品
  • 大美女 100%露出奶头视频 8天前
    操逼奶
  • 我在开会他在下添的很爽视频 2天前
    操逼无遮挡
  • 李总灬大JI巴太粗太长了 2天前
    美女被 吸乳羞羞免费