人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-04 13:09:50 2,115次浏览

所谓的人工智能的“奇点”的到来,在很大程度上反映了人类在自己的创造物的强大性能面前的不安。如果说在前智能时代,机器技术体系在力量、复杂性、精密度方面的超越还只是局部功能的增强,不足以引起人对引以为傲的本质——思考/理性的担忧,那么生成式人工智能在知识生产、理性设计、语义逻辑乃至可以带有情绪性表达的自然语言处理方面展现出来的卓绝能力让作为创造者的人类在内心再一次感受到了新版的“机器人威胁论”——AI威胁论。对可能失去控制的担忧让设计者期待以某种方式重新赢回决定权,于是,人工智能设计和治理又一次处在更深的“恐惑谷”的悖论境地:一方面,整个人工智能的发展过程一直以类人性作为超人性的基础,从任务实现到输出方式、到理解能力都希望有明确的可解释性、与人类保持一致性,哪怕在外观的设计上也从未放弃过“人形智能机”的设想;另一方面,这种类人性和超人性发展得越好,人类自身就越恐慌,尤其当最新的生成式人工智能突破了“波兰尼困境”,在多模态知识生产上已经可以依赖网络文本数据库和大模型技术实现自我生产的时候,不但人类心理上的恐慌越发严重,治理过程中所面临的风险也更加多元化和强化。抵抗不安感的最好武器是规范性。价值对齐的目标正是以建构规范性价值倾向来实现人工智能治理。然而,这里仍然存在另一个悖论,即“算法的价值倾向性越小,其越多以功能服务模式体现为满足单一确定目标的中立性工具职能,并因此只涉及线性且结果导向的治理要求;算法价值倾向性越大,其越多以画像评价模式体现为针对不同目标进行选择排序以作出价值性评估”。可见,价值倾向度的增加在一定程度上与功能的通用性之间呈现出反向趋势。因此,到底有没有可能以规范性的总体策略解决多元化的风险,并没有肯定的答案。比起价值嵌入,尽管价值对齐的措辞稍显缓和,但它依旧遵循了以人类社会取向干预或改造人工智能技术的规范性塑造路径。对于这一方法,“既有的技术治理史表明,总体策略在现实中并非没有人坚持,事实上不少技治主义者的头脑中均带有总体主义的主观性,但结果在实践中收获的均为局部和具体的技治推进,根本没有实现过各个微小技治系统的完全统一协作。从这个意义上,可以说总体策略均以失败告终”。或者,更简单地说,算法治理的目的和结果都不是简单地价值对齐,它需要重新衡量技术实现和应用中的具体问题。因为所谓的价值对齐,并不是通过增加价值矢量和奖惩指数就可以实现的,它涉及到数据爬取和清洗、算法设计和测试,到应用场景的每一个细节,并且它和技术算力之间也不完全是正向关系。例如,“在使用RLHF(reinforcement learning with human feedback,基于人类反馈的强化学习)进行价值观对齐时,)对齐行为无形中为AI大模型的能力涌现戴上了‘紧箍咒’,)以牺牲模型能力的方式来换取价值观对齐” 。OpenAI超级对齐团队的解散就真实地反映了这种冲突的强度,团队负责人在后来发表的个人声明中一再强调由于公司将产品性能置于价值对齐之前,以至于团队获得的计算和数据资源并不足够。这说明,尽管价值对齐的结果和成效尚处于难以评估的状态,但其依赖于社会预测和强反馈以及偏好排序的控制论做法,本身就是在算力上缺乏执行的可靠基础。 OpenAI超级对齐团队的解散为价值对齐问题的解决提供了另外一种思路:与其着眼于现有大模型的价值对齐,既需要面对价值本身的复杂性及其与人工智能性能的张力问题,还需要面对下游风险加剧的问题,不如专注于AI更多的可能性与开放式人机生态体系的打造,通过有效的人机交互与环境感知,鼓励开发与人类处于更广泛的目的分享和责任分担的人工智能。吴冠军在分析Midjourney的风险防控时,也谈到:“过滤”的非持续有效性,可以通过互动机制改善识别——“在互动过程中,我们需要探寻可能存在的突破点或‘短路’机制,识别用于切入并可能导致系统无法完全过滤此类信息的入口。这揭示了世界的复杂性和趣味性。”于2023年9月成立的法国生成式人工智能委员会在2024年3月向政府提交的新时期法国人工智能发展建议报告中特别提到,开放性是人工智能发展的基础。报告指出必须从技术开发和市场开放两方面预防所可能导致的集中化风险,支持多元主体之间的竞争。无论是应对人类社会的复杂性,还是防范由技术所导致的任何形式垄断,开放性都是极为核心的一个维度。这就如同拉图尔所强调的行动者穿梭于其间的“网络”概念,而人工智能也正是这些行动者之一。 当然,批评这一点并不意味着人工智能系统本身不存在与人类社会价值取向不一致的地方。事实上,数据技术逻辑与人类社会逻辑本质上存在着极大的异质性。这里既有具有规律性的可压缩的数据信息流和具有混沌性的不可压缩的经验信息流之间的区别,也有技术理性的效率原则、增长伦理和人类价值体系之间的差异,同时还关乎对于可能因此产生的社会风险的界定和判别方式。经由这些复杂性因素而建立起的关联,实在难以被纳入价值嵌入或价值对齐的框架。该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

「活动」首次登录送19元红包

76.83MB
版本v5.4.8
下载使劲操骚逼视频安装你想要的应用 更方便 更快捷 发现更多
喜欢 53%好评(80人)
评论 43
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图0 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图1 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图2 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图3 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图4
详细信息
  • 软件大小: 47.13MB
  • 最后更新: 2025-01-04 13:09:50
  • 最新版本: V9.2.8
  • 文件格式: apk
  • 应用分类:ios-Android 把校花 吊起来揉搓视频软件
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,好儿子用力舔妈妈……啊……舒服……爽,淫荡老女人的淫穴
二,国产乱伦肏视频,www.淫荡av.com
三,国产AV内s绿帽少妇,看自拍偷拍肏美女视频
四,日批啊,好爽操逼,美女无毛嫩穴流浆白虎自慰
五,大哥鸡吧操骚逼,无套看软多汁护士白丝
六,白丝 扒腿自慰爽出白浆动漫,男生的积积桶女生的
七,性感人妻少妇骚逼被干过程,免费 吸乳羞羞网站国产
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
update9.3.2
91丝袜强奸乱伦

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉 5天前
    欧美孕妇兽交
  • 国产大学生口爆吞精 2天前
    国产巨屌草b视频
  • 嫩逼国产 9天前
    少妇吃鸡吧视频
  • 国产熟女凸凹曼av 2天前
    亚洲妓女 69式
  • 好吊操黄色av 4天前
    日韩性交
  • 两男一女亚洲久草 7天前
    91扒开双腿猛进入爽爽呻吟软件
  • 猛插小穴 5天前
    揉我奶头 啊 嗯小雪
  • 女生抠逼 6天前
    逼逼喷水狂喷
  • 《斗罗大陆》3d幼女操逼视频 6天前
    国产暴操乱伦露脸
  • 都市激情乱伦性爱故事 5天前
    白虎逼喷水