人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-01 14:39:31 5143次浏览

??


可见,人工智能技术从来不是一个独立于人类智能之外的系统,相反,它从开发、形成到测试及至运用的整个过程都浸润在人类的行为和经验之中。这些经验和事实未必只受到数字化或互联网的左右,它们是人类社会内部所包含的历史、文化、习俗乃至偏见或冲突的投射。完全“责任主体”的认定在人工智能技术的实施过程中难以确定,这也就使得价值“嵌入”或“对齐”的目标是否可以通过研发团队一揽子解决本身就是存疑的。从结果上来看,当谷歌试图为确保Gemini避免过去图像生成技术的陷阱而进行调整时,显然因为某种忽视而造成了过度输出或过度保守的后果。 美国计算机应用专家戴维·波尔特在《图灵人:计算机时代的西方文化》一书中以“图灵人”的具身化比喻,将计算机的工具理性原则所塑造的技术无意识的社会化和个人化生动地表达了出来。“图灵人暗示人与信息、工作、权力和自然的关系……计算机把人界定为‘信息处理器’,把自然定义为信息处理的对象”。整个世界的加速数字化(然而却并不均衡)使得数字技术形成了一种连续性的基础,将一切人、机器、制度整合进了“万物互联”之中,以至于不但很难再将属于数字技术的工具理性和衡量标准从事物中剥离出来,甚至连认知都受到了新的知识生产范式的影响。纷繁复杂的世界以一种追求确定性的方式被某种形式上的一致性所连缀,它仿佛陀思妥耶夫斯基笔下的由钢铁和玻璃建造起来的巨大的、无缝笼罩的水晶宫,透明夺目,令人惊叹,将一切的复杂性都吸收到自己的内部,赋予其中的一切以抽象且匀质的合法性。只不过在今天,这个数字化的“水晶宫”的建筑材料是0和1,物理形状上无所不包的穹顶则被无数的连接所形成的扁平结构所取代。这个以1862年伦敦万国博览会展馆为原型的关于世界的隐喻,“已经为集中的、体验为导向的、大众化的资本主义(尤其是数字资本主义——本文作者注)做好了物质准备,广泛地将外部世界吸收到一个完全精确计算的内部空间里来。……它的维度足够大,以至于也许人们根本不用再离开它了”。 所谓的人工智能的“奇点”的到来,在很大程度上反映了人类在自己的创造物的强大性能面前的不安。如果说在前智能时代,机器技术体系在力量、复杂性、精密度方面的超越还只是局部功能的增强,不足以引起人对引以为傲的本质——思考/理性的担忧,那么生成式人工智能在知识生产、理性设计、语义逻辑乃至可以带有情绪性表达的自然语言处理方面展现出来的卓绝能力让作为创造者的人类在内心再一次感受到了新版的“机器人威胁论”——AI威胁论。对可能失去控制的担忧让设计者期待以某种方式重新赢回决定权,于是,人工智能设计和治理又一次处在更深的“恐惑谷”的悖论境地:一方面,整个人工智能的发展过程一直以类人性作为超人性的基础,从任务实现到输出方式、到理解能力都希望有明确的可解释性、与人类保持一致性,哪怕在外观的设计上也从未放弃过“人形智能机”的设想;另一方面,这种类人性和超人性发展得越好,人类自身就越恐慌,尤其当最新的生成式人工智能突破了“波兰尼困境”,在多模态知识生产上已经可以依赖网络文本数据库和大模型技术实现自我生产的时候,不但人类心理上的恐慌越发严重,治理过程中所面临的风险也更加多元化和强化。抵抗不安感的最好武器是规范性。价值对齐的目标正是以建构规范性价值倾向来实现人工智能治理。然而,这里仍然存在另一个悖论,即“算法的价值倾向性越小,其越多以功能服务模式体现为满足单一确定目标的中立性工具职能,并因此只涉及线性且结果导向的治理要求;算法价值倾向性越大,其越多以画像评价模式体现为针对不同目标进行选择排序以作出价值性评估”。可见,价值倾向度的增加在一定程度上与功能的通用性之间呈现出反向趋势。因此,到底有没有可能以规范性的总体策略解决多元化的风险,并没有肯定的答案。比起价值嵌入,尽管价值对齐的措辞稍显缓和,但它依旧遵循了以人类社会取向干预或改造人工智能技术的规范性塑造路径。对于这一方法,“既有的技术治理史表明,总体策略在现实中并非没有人坚持,事实上不少技治主义者的头脑中均带有总体主义的主观性,但结果在实践中收获的均为局部和具体的技治推进,根本没有实现过各个微小技治系统的完全统一协作。从这个意义上,可以说总体策略均以失败告终”。或者,更简单地说,算法治理的目的和结果都不是简单地价值对齐,它需要重新衡量技术实现和应用中的具体问题。因为所谓的价值对齐,并不是通过增加价值矢量和奖惩指数就可以实现的,它涉及到数据爬取和清洗、算法设计和测试,到应用场景的每一个细节,并且它和技术算力之间也不完全是正向关系。例如,“在使用RLHF(reinforcement learning with human feedback,基于人类反馈的强化学习)进行价值观对齐时,)对齐行为无形中为AI大模型的能力涌现戴上了‘紧箍咒’,)以牺牲模型能力的方式来换取价值观对齐” 。OpenAI超级对齐团队的解散就真实地反映了这种冲突的强度,团队负责人在后来发表的个人声明中一再强调由于公司将产品性能置于价值对齐之前,以至于团队获得的计算和数据资源并不足够。这说明,尽管价值对齐的结果和成效尚处于难以评估的状态,但其依赖于社会预测和强反馈以及偏好排序的控制论做法,本身就是在算力上缺乏执行的可靠基础。

??






??



人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

「活动」首次登录送19元红包

78.71MB
版本r7.8.5
下载20boys帅男bay视频安装你想要的应用 更方便 更快捷 发现更多
喜欢 13%好评(44人)
评论 20
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图0 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图1 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图2 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图3 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图4
详细信息
  • 软件大小: 98.11MB
  • 最后更新: 2025-01-01 14:39:31
  • 最新版本: r9.3.7
  • 文件格式: apk
  • 应用分类:ios-Android 骚逼美女本日
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,日小处女的骚逼,邪恶帝侵犯老师
二,出租屋做爰3p,啊在公交车上被轮流玩
三,jizzzxxxx,亚洲人99黑丝69反
四,国产精品白丝ThePorn.,正面偷拍老太啪啪
五,明星换脸自慰喷潮,宝宝喜欢我这样弄你吗
六,色酷播放器,屌艹逼
七,男人使劲躁女人视频小V网站喷水,妈妈介绍大肚婆
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
V8.9.2
午夜黄色美女自慰直播小穴喷水色综合高潮婷婷轮奸欧美

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉 2天前
    91精品_线二线三线精华夜
  • 快穿做妓女好爽H 6天前
    骚穴对白
  • 廖承宇野外3P1069 5天前
    亚洲学生妹嫩逼
  • 天美性爱 8天前
    国产美女足交
  • 涨精装满肚子上学公交车 3天前
    萝控酱免费精选国产
  • narutopixxx黑土vk 6天前
    国产美女自慰小穴喷水
  • www.huangse欧美女同 1天前
    岛国搬运工亚洲精品少妇
  • 啊 好痛 嗯 轻一点揉我胸 1天前
    YAPING ZHANG 的视频 IVK
  • 日韩国产传媒果冻天美爱豆麻花 1天前
    美女扒开鸡巴蛋男人操
  • 美女肏逼乱淫网站 3天前
    鸡鸡插阴道视频