人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-13 11:58:16 2,567次浏览

2024年7月,OpenAI宣布解散超级对齐团队。表面上看,这是OpenAI内部发展不同方面优先级之间竞争失衡和资源分配的结果,但从另一个角度也展现出价值对齐的推进难度。然而,笔者的目的并不在于从技术角度解析现有的价值对齐工具的有限性及其模型风险,而是躬身进入价值对齐理念背后的技术观,揭示其潜在的控制论色彩,解读它所可能导致的对于人机关系的狭隘误读,进而在技术哲学批判的基础上探究它所面对的挑战。因为,恰恰只有抛弃简单乐观的价值移植,重回技术-社会自身发展逻辑,直面其复杂性,才有可能在数智高速飞跃的时代重新为人工智能的发展划定边界和准则,并建构起新型的人机交互和融合的健康模式。 [4][美]朱迪斯·巴特勒.身体之重:论“性别”的话语界限[M].李军鹏,译.上海:上海三联书店,2011:10. 然而,中立的数智技术本身并不存在。算法、数据、模型、奖惩函数等任一环节本身都有可能使输出结果呈现出特定的价值取向。例如,当谷歌发布的多模态大模型Gemini被要求生成一张“白人家庭”的图片时,系统拒绝了这一请求,它所使用的理由是“无法生成针对特定族群的图片”,因为“此类内容可能存在歧视、刻板印象”。然而,当要求被更改成生成一张“黑人家庭”的图片时,Gemini即时按照要求完成了任务。很明显,与任务的对称性相比,输出结果的不对称性明显受到了模型微调的影响。美国最高法院的保守派黑人大法官克拉伦斯·托马斯被Gemini生成白人面孔则在很大程度上是因为和“法官”相关的数据样本中白人偏多。当亚马逊公司开发并投入使用的“简历筛选系统”会对同等条件的女性候选人的简历给出相较于男性更低的评分时,很难判断这是因为数据类型还是编写者的倾向性导致了这种偏差。由此可见,人工智能的技术特征决定了影响其结果的因素必然是多方面的,而且由于技术黑箱的存在,这种影响并不总是易于判断和矫正。何况,矫正的结果也并非一定能达到预期。正如谷歌研发团队在试图解决训练数据集的种族主义倾向时引入的多元化矫正方案就出现了与历史事实不符的错误。

该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 /
杰里斯女篮

杰里斯女篮

西女甲 | 2024-11-17 19:00
0
-
0

格尔尼卡女篮

格尔尼卡女篮

分析数据赛程

直播信号

赛事信息

北京时间:2024年11月17日 19:00分,西女甲【杰里斯女篮VS格尔尼卡女篮】准时开始,喜欢看西女甲比赛的朋友可以提前收藏本页面以免错过直播。还为您在本页面索引了相关西女甲直播、杰里斯女篮、格尔尼卡女篮直播的近期比赛列表以及两队历史交锋、两队最新比赛赛程。本站不参与制作、不存储,资源由热心网友提供信号源

相关标签

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-13 11:58:16 2,688次浏览

2024年7月,OpenAI宣布解散超级对齐团队。表面上看,这是OpenAI内部发展不同方面优先级之间竞争失衡和资源分配的结果,但从另一个角度也展现出价值对齐的推进难度。然而,笔者的目的并不在于从技术角度解析现有的价值对齐工具的有限性及其模型风险,而是躬身进入价值对齐理念背后的技术观,揭示其潜在的控制论色彩,解读它所可能导致的对于人机关系的狭隘误读,进而在技术哲学批判的基础上探究它所面对的挑战。因为,恰恰只有抛弃简单乐观的价值移植,重回技术-社会自身发展逻辑,直面其复杂性,才有可能在数智高速飞跃的时代重新为人工智能的发展划定边界和准则,并建构起新型的人机交互和融合的健康模式。 [4][美]朱迪斯·巴特勒.身体之重:论“性别”的话语界限[M].李军鹏,译.上海:上海三联书店,2011:10. 然而,中立的数智技术本身并不存在。算法、数据、模型、奖惩函数等任一环节本身都有可能使输出结果呈现出特定的价值取向。例如,当谷歌发布的多模态大模型Gemini被要求生成一张“白人家庭”的图片时,系统拒绝了这一请求,它所使用的理由是“无法生成针对特定族群的图片”,因为“此类内容可能存在歧视、刻板印象”。然而,当要求被更改成生成一张“黑人家庭”的图片时,Gemini即时按照要求完成了任务。很明显,与任务的对称性相比,输出结果的不对称性明显受到了模型微调的影响。美国最高法院的保守派黑人大法官克拉伦斯·托马斯被Gemini生成白人面孔则在很大程度上是因为和“法官”相关的数据样本中白人偏多。当亚马逊公司开发并投入使用的“简历筛选系统”会对同等条件的女性候选人的简历给出相较于男性更低的评分时,很难判断这是因为数据类型还是编写者的倾向性导致了这种偏差。由此可见,人工智能的技术特征决定了影响其结果的因素必然是多方面的,而且由于技术黑箱的存在,这种影响并不总是易于判断和矫正。何况,矫正的结果也并非一定能达到预期。正如谷歌研发团队在试图解决训练数据集的种族主义倾向时引入的多元化矫正方案就出现了与历史事实不符的错误。

该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

「活动」首次登录送19元红包

67.46MB
版本build6.8.5
下载黄色扣逼软件安装你想要的应用 更方便 更快捷 发现更多
喜欢 16%好评(77人)
评论 22
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图0 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图1 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图2 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图3 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图4
详细信息
应用介绍
一,男人和女人操逼的免费毛片,免费观看全黄做爰大片国产女仆
二,中国肥逼,美女上厕所自慰潮喷白浆偷拍
三,色诱大鸟巴插进洞,舔搞操干插骚货骚逼视频
四,麻豆强奸乱伦,91 乄乄
五,黄色艹逼,欧美孕妇性爱偷拍视频
六,爽 好紧 宝贝别夹大巴男男,曰本婬乱一级毛片无码88AV
七,真人色色,免费看艹嫩逼逼插
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
V7.4.2
美女自慰出水

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉 4天前
    爆草女生嫩逼
  • 非洲毛片美女高潮喷水影视大全 6天前
    国产美女足交
  • 美女日逼逼赖赖 5天前
    欧美乱伦大杂烩青青操穴
  • 被 到爽 流片真人作文 5天前
    耻辱の中出し授业大桥未久8M
  • free欧美丝袜 2天前
    大奶子骚女人操B的小视频
  • 4k日韩强奸猥亵网站[国语对白] 6天前
    美女操逼逼逼逼逼逼逼逼逼逼逼逼逼逼淫荡诱惑淫
  • 欧美口刍 2天前
    亚洲国产av淫荡丝袜母狗
  • 扒开学生双腿猛进入喷水操逼网站免费 8天前
    农村爆操乱伦
  • 九一淫淫色澡 8天前
    乱仑内射 乂
  • 91精品国产综合久久喷水杨贵妃 1天前
    插穴影院

近5次交锋

杰里斯女篮近5场比赛

格尔尼卡女篮近5场比赛