人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-01 12:44:10 3060次浏览

??


一些国际机构已经发布了政策,试图明确人工智能系统在设计时应遵守的伦理原则。例如,欧盟已经确定了关于使用人工智能的四项道德原则:无恶意、尊重自主权、算法公平和透明性。美国白宫科学技术办公室提出的原则略有不同,其中特别强调了人类有选择不与人工智能互动的权利,这一点其实是对自主权内涵的进一步扩大,也是对人类个体的独特性和自治性的保护,即人类有权决定不受人工智能的影响而采取符合自己判断的自主行动。从这个意义上来讲,通过施加对人工智能的价值对齐进而将设计的伦理原则施加于人类社会的做法,本身就是价值殖民的一种改版。这一结论并不夸张。从技术实践的层面来看,能够有效地在现有大模型中推进价值嵌入和价值对齐的,通常都是在技术、数据和算力上占据优势的大型科技公司,OpenAI、谷歌的DeepMind之前都建立了专注于解决价值对齐问题的团队(然而,前者刚刚宣布对其予以解散,后者的成效还需要进一步验证)。考虑已开发的人工智能的应用广度和深度,技术决定论似乎又一次在价值领域以一种奇异的姿态发挥了作用,它使得头部从业者不但可以主导市场,甚至可以主导人类社会。现实有可能变成:谁掌握了最先进/应用最广的人工智能,谁就拥有了实现价值对齐的权力,谁也就拥有了界定人类价值和人类普遍利益的权力。从而,结果有可能是,人工智能技术的掌握者不但以特定的价值实现了对AI的“对齐”,而且更以后者的无所不在、以技术无意识的方式实现对人类群体的普遍性对齐。这种价值观的扩展方式是历史上任何政治文化方案都无法实现的。 所谓的人工智能的“奇点”的到来,在很大程度上反映了人类在自己的创造物的强大性能面前的不安。如果说在前智能时代,机器技术体系在力量、复杂性、精密度方面的超越还只是局部功能的增强,不足以引起人对引以为傲的本质——思考/理性的担忧,那么生成式人工智能在知识生产、理性设计、语义逻辑乃至可以带有情绪性表达的自然语言处理方面展现出来的卓绝能力让作为创造者的人类在内心再一次感受到了新版的“机器人威胁论”——AI威胁论。对可能失去控制的担忧让设计者期待以某种方式重新赢回决定权,于是,人工智能设计和治理又一次处在更深的“恐惑谷”的悖论境地:一方面,整个人工智能的发展过程一直以类人性作为超人性的基础,从任务实现到输出方式、到理解能力都希望有明确的可解释性、与人类保持一致性,哪怕在外观的设计上也从未放弃过“人形智能机”的设想;另一方面,这种类人性和超人性发展得越好,人类自身就越恐慌,尤其当最新的生成式人工智能突破了“波兰尼困境”,在多模态知识生产上已经可以依赖网络文本数据库和大模型技术实现自我生产的时候,不但人类心理上的恐慌越发严重,治理过程中所面临的风险也更加多元化和强化。抵抗不安感的最好武器是规范性。价值对齐的目标正是以建构规范性价值倾向来实现人工智能治理。然而,这里仍然存在另一个悖论,即“算法的价值倾向性越小,其越多以功能服务模式体现为满足单一确定目标的中立性工具职能,并因此只涉及线性且结果导向的治理要求;算法价值倾向性越大,其越多以画像评价模式体现为针对不同目标进行选择排序以作出价值性评估”。可见,价值倾向度的增加在一定程度上与功能的通用性之间呈现出反向趋势。因此,到底有没有可能以规范性的总体策略解决多元化的风险,并没有肯定的答案。比起价值嵌入,尽管价值对齐的措辞稍显缓和,但它依旧遵循了以人类社会取向干预或改造人工智能技术的规范性塑造路径。对于这一方法,“既有的技术治理史表明,总体策略在现实中并非没有人坚持,事实上不少技治主义者的头脑中均带有总体主义的主观性,但结果在实践中收获的均为局部和具体的技治推进,根本没有实现过各个微小技治系统的完全统一协作。从这个意义上,可以说总体策略均以失败告终”。或者,更简单地说,算法治理的目的和结果都不是简单地价值对齐,它需要重新衡量技术实现和应用中的具体问题。因为所谓的价值对齐,并不是通过增加价值矢量和奖惩指数就可以实现的,它涉及到数据爬取和清洗、算法设计和测试,到应用场景的每一个细节,并且它和技术算力之间也不完全是正向关系。例如,“在使用RLHF(reinforcement learning with human feedback,基于人类反馈的强化学习)进行价值观对齐时,)对齐行为无形中为AI大模型的能力涌现戴上了‘紧箍咒’,)以牺牲模型能力的方式来换取价值观对齐” 。OpenAI超级对齐团队的解散就真实地反映了这种冲突的强度,团队负责人在后来发表的个人声明中一再强调由于公司将产品性能置于价值对齐之前,以至于团队获得的计算和数据资源并不足够。这说明,尽管价值对齐的结果和成效尚处于难以评估的状态,但其依赖于社会预测和强反馈以及偏好排序的控制论做法,本身就是在算力上缺乏执行的可靠基础。 对此的一个佐证是对一些基于误判而出现的机器人事故的解读。各国都曾出现过机器人因将人体误判为作业对象而使其致残或致死的事故。这是“回形针假设”的现实版。究其原因,机器只根据预先的算法设计行事,而不是根据传感装置获得的对象的特殊信息进行判断。后者正是智能认知具身化的要求。事实上,早在1986年,布鲁克斯已经从控制论角度出发,强调智能是具身化和情境化的,他认为传统以信息表征为核心的经典AI进化路径是错误的,而要消除表征的局限性,就要制造基于行为获取信息的机器人。苏黎世大学人工智能实验室前主任罗尔夫·普菲弗与加拿大佛蒙特大学的乔希·邦加德则在合著的《身体的智能:智能科学新视角》一书中进一步提出,智能行为可以通过加强智能体的“身体”与外部环境交互的方式实现新的学习反馈机制,从而形成更能应对世界复杂性的智能。而在业界方面,英伟达创始人黄仁勋就曾在2023年表示,具身智能是能理解、推理,并与物理世界互动的智能系统,是人工智能的下一个浪潮。

??






??



人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

「活动」首次登录送19元红包

50.67MB
版本beta3.6.4
下载无毛白虎自慰安装你想要的应用 更方便 更快捷 发现更多
喜欢 95%好评(47人)
评论 65
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图0 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图1 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图2 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图3 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图4
详细信息
  • 软件大小: 59.41MB
  • 最后更新: 2025-01-01 12:44:10
  • 最新版本: update6.8.3
  • 文件格式: apk
  • 应用分类:ios-Android 欧美尿交
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,www淫妻,蜜桃潮吹啪啪
二,恩啊在楼梯上边走边做,91VA午夜福利院
三,白虎 自慰,老女人的逼被操体内射精视频
四,色秘 乱码一区二区三区唱戏,女人在男人j里躁得呻吟动态图
五,白丝美女自慰喷水,午夜影院午夜福利回家不迷路
六,hazxxxxxxx狗日小穴老妈,搞鸡91
七,欧美性爱抽插高潮视频,体育生Gay脱裤子自慰网站
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
beta4.9.1
极品嫩逼

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉 5天前
    插插入入爽歪歪
  • 教授公大JI巴好好爽好深H 2天前
    迈开腿舔鲍鱼
  • 推特大尺度西门吹穴巨臀私拍 2天前
    阴展出白浆日本毛耸耸
  • 公交车一晃一晃掩盖我农民 9天前
    操大奶子骚逼
  • 纪倩倩午夜福利 7天前
    白丝芭蕾裙自慰扒开www
  • 成人A片又粗又硬真做 6天前
    局长揉着秘书的双乳H文电影
  • 爽 躁多水 快 高潮了美国 2天前
    忘忧草官网在线观看
  • 成人福利动态图啪啪GIF出处 2天前
    猛男女婬AAAAA片
  • 嫩逼 播放 2天前
    亚洲美女艹逼流水
  • 宝贝别蹭了我硬了H 2天前
    亚洲乱伦熟女小说图片