人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2024-12-29 05:56:28 5,308次浏览

《智能的本质》一书的作者皮埃罗·斯加鲁菲通过一个无人机杀人的极端例子来描述人工智能应用过程中的追责难题。他的问题是,是提供地理位置信息的谷歌地图团队、提供目标情报信息的特工、提供攻击软件应用的供应商,抑或是负责为整个攻击行为编写程序的团队,还是下达攻击命令的负责人该为此次行为负法律或道德的责任?针对这个例子本身,答案可能因人而异,但它却生动地表明了在数智技术应用愈加普及的时代里两种越来越明显的倾向:一是流程环节的增多,使得责任链延长,从而造成责任主体难以认定。这当然并不是新的现象,曾有人在为自己的罪行进行辩护的时候就已经熟练地使用了这一理由。然而,数字技术的共享性特征和流程的非线性使得这一问题愈加复杂。二是责任问题的核心外移,使机器/技术/人工智能成为被纠责的对象。责任环节的增多使得每个环节的人都有借口从整体的责任中逃脱,“高度分化的劳动分工对应着普遍的合谋,而这种合谋对应着普遍的不负责任。既然每个人都同时是原因和结果,也就意味着没有原因” 。与这种不必负责任的形式合理性对应的正是价值和伦理上的脱嵌与免责。于是,人工智能仿佛构成了一个系统性的他者,它完全依赖自身的法则并通过自身而运动。并且,由于它被设想为去价值化的中空实体,一方面人类个体和集体为自己的动机和行为卸下了所有的哪怕是最小的道德负担,仿佛所有的结果不过是作为人类社会大他者的数字系统“中立”而“客观”的结果;另一方面,他们又通过对体系的价值抽离,将道德上的优越感握在手中,仿佛获得了通过“价值赋予”的“嵌入”或“对齐”的类人化改造,可以牢牢掌握住人工智能的控制权。从本质上来讲,这不但是一种价值维度上的人类中心主义投射,同时也是在技术的自治性面前人类不安感的体现。他们想象着将所有的技术-社会的复杂性问题都置于“价值偏差”的系统性盈余中予以整体性解决。这不但在现实条件中难以实现,而且也透视出一种理论和实践上的避重就轻:它使得技术的发展成为最小化人类责任的借口。 谈到价值对齐,就不得不提到另一个稍显生硬却更为直接地表达了某种意义上人机对立的概念:价值嵌入。从本质层面来看,这两个概念都是基于“对立论”的视角,强调数字技术自身的运行和发展所具有的超强自治性,强调人工智能技术与人类权利和福祉之间的对立和冲突,希望通过算法伦理审查、增加数据离散度以及预训练模型微调的技术方式,将具有特定人类价值倾向的立场和原则“移植”到智能设备中,从而最大限度地预防和消解技术理性与社会理性的差异所导致的风险和负面效应。在这里,人工智能被设想成了和人类智能处于对立位置的价值中空物,它被作为实体从技术的第三持存中剥离出来,评论者丝毫没有意识到人工智能技术的任何具体化形式,本身已经负载着人类智性积累及其社会文化内涵。 所谓的人工智能的“奇点”的到来,在很大程度上反映了人类在自己的创造物的强大性能面前的不安。如果说在前智能时代,机器技术体系在力量、复杂性、精密度方面的超越还只是局部功能的增强,不足以引起人对引以为傲的本质——思考/理性的担忧,那么生成式人工智能在知识生产、理性设计、语义逻辑乃至可以带有情绪性表达的自然语言处理方面展现出来的卓绝能力让作为创造者的人类在内心再一次感受到了新版的“机器人威胁论”——AI威胁论。对可能失去控制的担忧让设计者期待以某种方式重新赢回决定权,于是,人工智能设计和治理又一次处在更深的“恐惑谷”的悖论境地:一方面,整个人工智能的发展过程一直以类人性作为超人性的基础,从任务实现到输出方式、到理解能力都希望有明确的可解释性、与人类保持一致性,哪怕在外观的设计上也从未放弃过“人形智能机”的设想;另一方面,这种类人性和超人性发展得越好,人类自身就越恐慌,尤其当最新的生成式人工智能突破了“波兰尼困境”,在多模态知识生产上已经可以依赖网络文本数据库和大模型技术实现自我生产的时候,不但人类心理上的恐慌越发严重,治理过程中所面临的风险也更加多元化和强化。抵抗不安感的最好武器是规范性。价值对齐的目标正是以建构规范性价值倾向来实现人工智能治理。然而,这里仍然存在另一个悖论,即“算法的价值倾向性越小,其越多以功能服务模式体现为满足单一确定目标的中立性工具职能,并因此只涉及线性且结果导向的治理要求;算法价值倾向性越大,其越多以画像评价模式体现为针对不同目标进行选择排序以作出价值性评估”。可见,价值倾向度的增加在一定程度上与功能的通用性之间呈现出反向趋势。因此,到底有没有可能以规范性的总体策略解决多元化的风险,并没有肯定的答案。比起价值嵌入,尽管价值对齐的措辞稍显缓和,但它依旧遵循了以人类社会取向干预或改造人工智能技术的规范性塑造路径。对于这一方法,“既有的技术治理史表明,总体策略在现实中并非没有人坚持,事实上不少技治主义者的头脑中均带有总体主义的主观性,但结果在实践中收获的均为局部和具体的技治推进,根本没有实现过各个微小技治系统的完全统一协作。从这个意义上,可以说总体策略均以失败告终”。或者,更简单地说,算法治理的目的和结果都不是简单地价值对齐,它需要重新衡量技术实现和应用中的具体问题。因为所谓的价值对齐,并不是通过增加价值矢量和奖惩指数就可以实现的,它涉及到数据爬取和清洗、算法设计和测试,到应用场景的每一个细节,并且它和技术算力之间也不完全是正向关系。例如,“在使用RLHF(reinforcement learning with human feedback,基于人类反馈的强化学习)进行价值观对齐时,)对齐行为无形中为AI大模型的能力涌现戴上了‘紧箍咒’,)以牺牲模型能力的方式来换取价值观对齐” 。OpenAI超级对齐团队的解散就真实地反映了这种冲突的强度,团队负责人在后来发表的个人声明中一再强调由于公司将产品性能置于价值对齐之前,以至于团队获得的计算和数据资源并不足够。这说明,尽管价值对齐的结果和成效尚处于难以评估的状态,但其依赖于社会预测和强反馈以及偏好排序的控制论做法,本身就是在算力上缺乏执行的可靠基础。该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

「活动」首次登录送19元红包

72.68MB
版本V6.2.4
下载偷偷射50页安装你想要的应用 更方便 更快捷 发现更多
喜欢 94%好评(92人)
评论 64
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图0 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图1 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图2 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图3 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图4
详细信息
  • 软件大小: 72.15MB
  • 最后更新: 2024-12-29 05:56:28
  • 最新版本: build3.4.9
  • 文件格式: apk
  • 应用分类:ios-Android 后入pics
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,浪货腿张开给我cao高潮软件,交换做爰6波多野吉衣无删减
二,欧美AAA小骚妇吞精,男女黄色号码
三,自拍偷拍 后入,黑丝美女被操出水
四,干穴视频,乱操黄片
五,后入艹在线17c,学生妹极品黑丝被我艹喷
六,无套插白虎嫩穴女,紧身牛仔裤女人乱伦激情片
七,性欧美精品 洗澡,空姐被狂揉下部 羞羞图片
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
build7.9.2
校花抠小bb

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉 2天前
    少妇双腿乳液自慰羞羞黄漫免费
  • 自慰揉骚逼试看 3天前
    欧美成人性色BB
  • 揉捏骚逼 6天前
    动漫美女巨爆乳被狂揉视频
  • 黄色片美女搞鸡被操内射受得不了得 1天前
    舔到喷水视频
  • 美女养一只狼狗不穿男朋友天天跟她搞屄视频 2天前
    黄色十八
  • 成人爱爱黄片 5天前
    熟女高跟丝袜骚逼
  • 校花抠小bb 1天前
    白虎穴av网
  • 校园厕所抠逼在线视频 6天前
    亚洲美女牲ⅩXX生活
  • 91干 3天前
    亚洲精品无码一本二本艳照
  • 轮插骚逼高潮 3天前
    淫色网毛片