人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-15 13:27:53 1,927次浏览

在大模型技术狂飙突进的今天,随着数据规模和算力的不断提高,以及模型调整对于场景-价值多元化的适应,人工智能的性能持续跃迁,涌现不再是偶发的技术意外,数智应用的泛化性、通用性和界面友好性都有了质的提升,成为架构人类社会发展当之无愧的技术基底。如何建设安全有效的数智设备,避免人工智能因其自身的技术特征或外在原因的滥用产生危及人类的后果,已成为AI行业研发和应用过程中的核心议题之一。一方面,数智技术的全面嵌入和良好的交互性使得用户对人工智能的期许和信任度不断推高;另一方面,可解释性陷阱的存在以及技术-社会两者发展逻辑在本质上的异质性使得“AI威胁论”从未真正消失,对AI可能带来的风险和挑战进行防范的研究方向之一就是探索引导和操控“超智能”AI系统的新方法。其中的一种路径就是通过价值对齐的方式确保人工智能追求与人类价值观相适配的目标,敦促AI以对人类和社会有益的方式行事,不侵害人类的价值和权利。 和基于数据科学的人工智能技术的连续性不同,价值的不连续性来源于其自身的特征,从本质上来说它并不是一套精确的规则和条件判断,而更像是一个具有弹性的语法体系,其中包含了很多从历史文化信仰体系中获得的内化性原则,包括但不限于文化倾向、历史习俗、社会信念、群体观念、政治意识形态、地域、宗教、种族、性别甚至职业身份等多重元素。目前大多数科创企业所采取的通过强调匹配不同算法特征及其治理需求的分类治理框架来实现价值对齐的方式,体现为应用环境通过对输入变量赋值进而对输出结果产生影响,如对生成式人工智能进行预训练后的模型微调就属于此类。这种思路由设计者将被预设为普遍性的价值原则嵌入智能自治系统中以形成特定的概念空间,然后根据场景调用。于是,下游应用中的相关符号被赋值,并纳入与该价值原则相关的关系之中。这就是为什么“输出一个白人家庭”的要求会被Gemini拒绝,“白人”作为敏感符号被赋值与种族主义立场相关,而有色人种的要求则不会。这种“价值属性”其实并不是人工智能对人类价值观的理解,只是出于算法编写者的设计。从这个意义上说,价值对齐的叙事编织从根本上说并不反映被假想出来的人机差异,而是关乎人工智能设计和算法治理的问题,更简单地说,它是一个具有自主性的智能体应不应该,以及如何设计的问题。 所谓的人工智能的“奇点”的到来,在很大程度上反映了人类在自己的创造物的强大性能面前的不安。如果说在前智能时代,机器技术体系在力量、复杂性、精密度方面的超越还只是局部功能的增强,不足以引起人对引以为傲的本质——思考/理性的担忧,那么生成式人工智能在知识生产、理性设计、语义逻辑乃至可以带有情绪性表达的自然语言处理方面展现出来的卓绝能力让作为创造者的人类在内心再一次感受到了新版的“机器人威胁论”——AI威胁论。对可能失去控制的担忧让设计者期待以某种方式重新赢回决定权,于是,人工智能设计和治理又一次处在更深的“恐惑谷”的悖论境地:一方面,整个人工智能的发展过程一直以类人性作为超人性的基础,从任务实现到输出方式、到理解能力都希望有明确的可解释性、与人类保持一致性,哪怕在外观的设计上也从未放弃过“人形智能机”的设想;另一方面,这种类人性和超人性发展得越好,人类自身就越恐慌,尤其当最新的生成式人工智能突破了“波兰尼困境”,在多模态知识生产上已经可以依赖网络文本数据库和大模型技术实现自我生产的时候,不但人类心理上的恐慌越发严重,治理过程中所面临的风险也更加多元化和强化。抵抗不安感的最好武器是规范性。价值对齐的目标正是以建构规范性价值倾向来实现人工智能治理。然而,这里仍然存在另一个悖论,即“算法的价值倾向性越小,其越多以功能服务模式体现为满足单一确定目标的中立性工具职能,并因此只涉及线性且结果导向的治理要求;算法价值倾向性越大,其越多以画像评价模式体现为针对不同目标进行选择排序以作出价值性评估”。可见,价值倾向度的增加在一定程度上与功能的通用性之间呈现出反向趋势。因此,到底有没有可能以规范性的总体策略解决多元化的风险,并没有肯定的答案。比起价值嵌入,尽管价值对齐的措辞稍显缓和,但它依旧遵循了以人类社会取向干预或改造人工智能技术的规范性塑造路径。对于这一方法,“既有的技术治理史表明,总体策略在现实中并非没有人坚持,事实上不少技治主义者的头脑中均带有总体主义的主观性,但结果在实践中收获的均为局部和具体的技治推进,根本没有实现过各个微小技治系统的完全统一协作。从这个意义上,可以说总体策略均以失败告终”。或者,更简单地说,算法治理的目的和结果都不是简单地价值对齐,它需要重新衡量技术实现和应用中的具体问题。因为所谓的价值对齐,并不是通过增加价值矢量和奖惩指数就可以实现的,它涉及到数据爬取和清洗、算法设计和测试,到应用场景的每一个细节,并且它和技术算力之间也不完全是正向关系。例如,“在使用RLHF(reinforcement learning with human feedback,基于人类反馈的强化学习)进行价值观对齐时,)对齐行为无形中为AI大模型的能力涌现戴上了‘紧箍咒’,)以牺牲模型能力的方式来换取价值观对齐” 。OpenAI超级对齐团队的解散就真实地反映了这种冲突的强度,团队负责人在后来发表的个人声明中一再强调由于公司将产品性能置于价值对齐之前,以至于团队获得的计算和数据资源并不足够。这说明,尽管价值对齐的结果和成效尚处于难以评估的状态,但其依赖于社会预测和强反馈以及偏好排序的控制论做法,本身就是在算力上缺乏执行的可靠基础。该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

「活动」首次登录送19元红包

33.35MB
版本V6.7.4
下载迈开腿让尝尝你的森林软件安装你想要的应用 更方便 更快捷 发现更多
喜欢 30%好评(95人)
评论 54
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图0 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图1 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图2 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图3 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图4
详细信息
  • 软件大小: 91.65MB
  • 最后更新: 2025-01-15 13:27:53
  • 最新版本: V3.6.7
  • 文件格式: apk
  • 应用分类:ios-Android 特大尺度按摩推油
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,双人吃鸡吧操操操,把女朋友做哭了是什么体验知乎
二,啊啊啊大鸡巴插我小穴视频,揉我奶 啊 嗯
三,X88av,性爱免费日逼逼
四,美国人videos video7o,我父子截了一段小视频
五,宝宝腿开大点就不疼了视频网站,扒开双腿猛进入jk校花小说
六,岛国性爱精品论理剧,亚洲欧美美女强奸乱伦黑丝17c
七,乱日熟女BB,亚洲强奸sm
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
beta3.6.4
欧美日韩国产偷拍自拍绿帽淫妻

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉 6天前
    火影忍者无翼乌禁漫全彩
  • www女JK软萌白丝自慰喷水 4天前
    少妇欲乱系列小说
  • 欧美黑人×××BB 4天前
    狠狠淫xxx
  • umd论坛 1天前
    俄罗斯性爱束缚
  • きょくちょ哔咔网页版 3天前
    开车污的 女生越疼男生越来越快 段子动
  • 猛地一挺腿再开一点就不疼 5天前
    jizz又大又粗插进去又爽
  • 美洲大奶美女口交 7天前
    极品性感女神操逼
  • 把冰棍放到B里可以吗 7天前
    亚洲足交网站
  • 操逼奶 2天前
    欧美黑人xxxxx性受-第8页-91porn视频
  • 嫩穴美女爱爱 4天前
    青青操女的