人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-09 20:19:10 9,676次浏览

所谓的人工智能的“奇点”的到来,在很大程度上反映了人类在自己的创造物的强大性能面前的不安。如果说在前智能时代,机器技术体系在力量、复杂性、精密度方面的超越还只是局部功能的增强,不足以引起人对引以为傲的本质——思考/理性的担忧,那么生成式人工智能在知识生产、理性设计、语义逻辑乃至可以带有情绪性表达的自然语言处理方面展现出来的卓绝能力让作为创造者的人类在内心再一次感受到了新版的“机器人威胁论”——AI威胁论。对可能失去控制的担忧让设计者期待以某种方式重新赢回决定权,于是,人工智能设计和治理又一次处在更深的“恐惑谷”的悖论境地:一方面,整个人工智能的发展过程一直以类人性作为超人性的基础,从任务实现到输出方式、到理解能力都希望有明确的可解释性、与人类保持一致性,哪怕在外观的设计上也从未放弃过“人形智能机”的设想;另一方面,这种类人性和超人性发展得越好,人类自身就越恐慌,尤其当最新的生成式人工智能突破了“波兰尼困境”,在多模态知识生产上已经可以依赖网络文本数据库和大模型技术实现自我生产的时候,不但人类心理上的恐慌越发严重,治理过程中所面临的风险也更加多元化和强化。抵抗不安感的最好武器是规范性。价值对齐的目标正是以建构规范性价值倾向来实现人工智能治理。然而,这里仍然存在另一个悖论,即“算法的价值倾向性越小,其越多以功能服务模式体现为满足单一确定目标的中立性工具职能,并因此只涉及线性且结果导向的治理要求;算法价值倾向性越大,其越多以画像评价模式体现为针对不同目标进行选择排序以作出价值性评估”。可见,价值倾向度的增加在一定程度上与功能的通用性之间呈现出反向趋势。因此,到底有没有可能以规范性的总体策略解决多元化的风险,并没有肯定的答案。比起价值嵌入,尽管价值对齐的措辞稍显缓和,但它依旧遵循了以人类社会取向干预或改造人工智能技术的规范性塑造路径。对于这一方法,“既有的技术治理史表明,总体策略在现实中并非没有人坚持,事实上不少技治主义者的头脑中均带有总体主义的主观性,但结果在实践中收获的均为局部和具体的技治推进,根本没有实现过各个微小技治系统的完全统一协作。从这个意义上,可以说总体策略均以失败告终”。或者,更简单地说,算法治理的目的和结果都不是简单地价值对齐,它需要重新衡量技术实现和应用中的具体问题。因为所谓的价值对齐,并不是通过增加价值矢量和奖惩指数就可以实现的,它涉及到数据爬取和清洗、算法设计和测试,到应用场景的每一个细节,并且它和技术算力之间也不完全是正向关系。例如,“在使用RLHF(reinforcement learning with human feedback,基于人类反馈的强化学习)进行价值观对齐时,)对齐行为无形中为AI大模型的能力涌现戴上了‘紧箍咒’,)以牺牲模型能力的方式来换取价值观对齐” 。OpenAI超级对齐团队的解散就真实地反映了这种冲突的强度,团队负责人在后来发表的个人声明中一再强调由于公司将产品性能置于价值对齐之前,以至于团队获得的计算和数据资源并不足够。这说明,尽管价值对齐的结果和成效尚处于难以评估的状态,但其依赖于社会预测和强反馈以及偏好排序的控制论做法,本身就是在算力上缺乏执行的可靠基础。 反观人类自身的基于道德判断的行为,就会发现,具身认知和知觉能力是形成完整价值判断的基础。因为具身认知是有机体适应环境、对多种感觉刺激进行辨别并形成综合理解的活动,在此基础上形成的情感、道德和价值判断以及相应的行动和具身认知,是不可分离的。这种具身主义的观点对认知主义是一种否定。后者相信,人类的心智实际上是一种特殊的信息处理系统,可以理解为根据某些特定的逻辑规则或者某种形式的数理算法对于无意义的抽象符号所进行的计算;而具身主义则强调了身体及其感官系统的重要性,认为它们的特殊体验造成了认知和情感-价值判断的差异。 在技术的原初设定中,价值对齐作为一种人工智能治理方法,彰显的是技术设计者企图通过人类价值嵌入机器体系的方式获得更加可靠的人工智能产品的信心。然而,在面对技术-社会的复杂互动关系时,价值对齐却无法真正有效付诸实践。一方面,潜藏于价值对齐背后的人类中心主义的控制幻想假设了一种以人类现有道德水平和认知为基准的整体性解决方案,坚信人类所形成的价值体系和原则足以为人工智能技术的发展植入更好的目标和原则。这无疑是一种人类在面对人工智能时的“造物主式”的傲慢。另一方面,围绕着价值观差异所引发的冲突、斗争等长久地存在于人类社会发展始终,历史性和多元性构成了价值观本身的特质。那么,在面对人工智能的治理问题时,人类何以能够空前地达成一种价值观念上的统一并将其附加于人工智能之中?如若不能,一种更加危险的趋势或许正酝酿于价值对齐的设计之中:人工智能技术的掌握者是否会以特定的价值实现对AI的“对齐”,进而诱使无所不在的人工智能产品以技术无意识的方式实现对人类群体的普遍性对齐?该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

「活动」首次登录送19元红包

69.60MB
版本r9.3.8
下载131黄片安装你想要的应用 更方便 更快捷 发现更多
喜欢 44%好评(82人)
评论 15
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图0 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图1 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图2 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图3 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图4
详细信息
  • 软件大小: 31.15MB
  • 最后更新: 2025-01-09 20:19:10
  • 最新版本: V5.2.9
  • 文件格式: apk
  • 应用分类:ios-Android 印度老妇毛茸茸
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,xxx1819,美女扒逼
二,骚妇自拍,韩国三色精华网
三,被老外添嫩苞添高潮图片,骚逼大羊扣自己的屁眼子88av网站
四,魅魔无码爆乳巨胸动漫,3D美女被怪物暴躁高潮
五,小骚逼淫话无套喷水内射调教,黑人爆操白人白浆
六,亚洲自拍屄,南财大二清纯
七,寂寞护士插逼逼,HD粗暴捆绑
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
beta4.9.1
国产91精品秘 入口福利一姬

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉类似软件

猜你喜欢

包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉 7天前
    肏骚屄AV
  • 狠狠插穴中文字幕 3天前
    高校长白沽26章笔趣阁使用方法
  • 久久精品国产老熟妇A片竹菊 9天前
    乱伦小说大全
  • 欧洲丝袜骚逼 4天前
    国产淫欲骚在线观看
  • 骚逼大奶 无码 5天前
    嗯啊不要亚洲
  • (已屏蔽) 5天前
    极品尤物爆乳自慰
  • 正在播放:SSIS-876 [无码破解]华丽身材与大小差距的超大尺寸阴茎插入极小的小 3天前
    无内丝袜自慰喷水老熟女
  • chinese浪小辉东北打桩机 9天前
    fortunecuttie
  • 国模艺术xo 5天前
    男生和女生黄色成人网站
  • 美女自慰淫粉嫩1探花 8天前
    黄图啪啪激情影院