人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-19 12:29:09 7,301次浏览

和基于数据科学的人工智能技术的连续性不同,价值的不连续性来源于其自身的特征,从本质上来说它并不是一套精确的规则和条件判断,而更像是一个具有弹性的语法体系,其中包含了很多从历史文化信仰体系中获得的内化性原则,包括但不限于文化倾向、历史习俗、社会信念、群体观念、政治意识形态、地域、宗教、种族、性别甚至职业身份等多重元素。目前大多数科创企业所采取的通过强调匹配不同算法特征及其治理需求的分类治理框架来实现价值对齐的方式,体现为应用环境通过对输入变量赋值进而对输出结果产生影响,如对生成式人工智能进行预训练后的模型微调就属于此类。这种思路由设计者将被预设为普遍性的价值原则嵌入智能自治系统中以形成特定的概念空间,然后根据场景调用。于是,下游应用中的相关符号被赋值,并纳入与该价值原则相关的关系之中。这就是为什么“输出一个白人家庭”的要求会被Gemini拒绝,“白人”作为敏感符号被赋值与种族主义立场相关,而有色人种的要求则不会。这种“价值属性”其实并不是人工智能对人类价值观的理解,只是出于算法编写者的设计。从这个意义上说,价值对齐的叙事编织从根本上说并不反映被假想出来的人机差异,而是关乎人工智能设计和算法治理的问题,更简单地说,它是一个具有自主性的智能体应不应该,以及如何设计的问题。 在技术的原初设定中,价值对齐作为一种人工智能治理方法,彰显的是技术设计者企图通过人类价值嵌入机器体系的方式获得更加可靠的人工智能产品的信心。然而,在面对技术-社会的复杂互动关系时,价值对齐却无法真正有效付诸实践。一方面,潜藏于价值对齐背后的人类中心主义的控制幻想假设了一种以人类现有道德水平和认知为基准的整体性解决方案,坚信人类所形成的价值体系和原则足以为人工智能技术的发展植入更好的目标和原则。这无疑是一种人类在面对人工智能时的“造物主式”的傲慢。另一方面,围绕着价值观差异所引发的冲突、斗争等长久地存在于人类社会发展始终,历史性和多元性构成了价值观本身的特质。那么,在面对人工智能的治理问题时,人类何以能够空前地达成一种价值观念上的统一并将其附加于人工智能之中?如若不能,一种更加危险的趋势或许正酝酿于价值对齐的设计之中:人工智能技术的掌握者是否会以特定的价值实现对AI的“对齐”,进而诱使无所不在的人工智能产品以技术无意识的方式实现对人类群体的普遍性对齐? 可见,人工智能技术从来不是一个独立于人类智能之外的系统,相反,它从开发、形成到测试及至运用的整个过程都浸润在人类的行为和经验之中。这些经验和事实未必只受到数字化或互联网的左右,它们是人类社会内部所包含的历史、文化、习俗乃至偏见或冲突的投射。完全“责任主体”的认定在人工智能技术的实施过程中难以确定,这也就使得价值“嵌入”或“对齐”的目标是否可以通过研发团队一揽子解决本身就是存疑的。从结果上来看,当谷歌试图为确保Gemini避免过去图像生成技术的陷阱而进行调整时,显然因为某种忽视而造成了过度输出或过度保守的后果。

该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 /
杰里斯女篮

杰里斯女篮

西女甲 | 2024-11-17 19:00
0
-
0

格尔尼卡女篮

格尔尼卡女篮

分析数据赛程

直播信号

赛事信息

北京时间:2024年11月17日 19:00分,西女甲【杰里斯女篮VS格尔尼卡女篮】准时开始,喜欢看西女甲比赛的朋友可以提前收藏本页面以免错过直播。还为您在本页面索引了相关西女甲直播、杰里斯女篮、格尔尼卡女篮直播的近期比赛列表以及两队历史交锋、两队最新比赛赛程。本站不参与制作、不存储,资源由热心网友提供信号源

相关标签

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

2025-01-19 12:29:09 6,139次浏览

和基于数据科学的人工智能技术的连续性不同,价值的不连续性来源于其自身的特征,从本质上来说它并不是一套精确的规则和条件判断,而更像是一个具有弹性的语法体系,其中包含了很多从历史文化信仰体系中获得的内化性原则,包括但不限于文化倾向、历史习俗、社会信念、群体观念、政治意识形态、地域、宗教、种族、性别甚至职业身份等多重元素。目前大多数科创企业所采取的通过强调匹配不同算法特征及其治理需求的分类治理框架来实现价值对齐的方式,体现为应用环境通过对输入变量赋值进而对输出结果产生影响,如对生成式人工智能进行预训练后的模型微调就属于此类。这种思路由设计者将被预设为普遍性的价值原则嵌入智能自治系统中以形成特定的概念空间,然后根据场景调用。于是,下游应用中的相关符号被赋值,并纳入与该价值原则相关的关系之中。这就是为什么“输出一个白人家庭”的要求会被Gemini拒绝,“白人”作为敏感符号被赋值与种族主义立场相关,而有色人种的要求则不会。这种“价值属性”其实并不是人工智能对人类价值观的理解,只是出于算法编写者的设计。从这个意义上说,价值对齐的叙事编织从根本上说并不反映被假想出来的人机差异,而是关乎人工智能设计和算法治理的问题,更简单地说,它是一个具有自主性的智能体应不应该,以及如何设计的问题。 在技术的原初设定中,价值对齐作为一种人工智能治理方法,彰显的是技术设计者企图通过人类价值嵌入机器体系的方式获得更加可靠的人工智能产品的信心。然而,在面对技术-社会的复杂互动关系时,价值对齐却无法真正有效付诸实践。一方面,潜藏于价值对齐背后的人类中心主义的控制幻想假设了一种以人类现有道德水平和认知为基准的整体性解决方案,坚信人类所形成的价值体系和原则足以为人工智能技术的发展植入更好的目标和原则。这无疑是一种人类在面对人工智能时的“造物主式”的傲慢。另一方面,围绕着价值观差异所引发的冲突、斗争等长久地存在于人类社会发展始终,历史性和多元性构成了价值观本身的特质。那么,在面对人工智能的治理问题时,人类何以能够空前地达成一种价值观念上的统一并将其附加于人工智能之中?如若不能,一种更加危险的趋势或许正酝酿于价值对齐的设计之中:人工智能技术的掌握者是否会以特定的价值实现对AI的“对齐”,进而诱使无所不在的人工智能产品以技术无意识的方式实现对人类群体的普遍性对齐? 可见,人工智能技术从来不是一个独立于人类智能之外的系统,相反,它从开发、形成到测试及至运用的整个过程都浸润在人类的行为和经验之中。这些经验和事实未必只受到数字化或互联网的左右,它们是人类社会内部所包含的历史、文化、习俗乃至偏见或冲突的投射。完全“责任主体”的认定在人工智能技术的实施过程中难以确定,这也就使得价值“嵌入”或“对齐”的目标是否可以通过研发团队一揽子解决本身就是存疑的。从结果上来看,当谷歌试图为确保Gemini避免过去图像生成技术的陷阱而进行调整时,显然因为某种忽视而造成了过度输出或过度保守的后果。

该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉

「活动」首次登录送19元红包

12.62MB
版本snapshot7.9.2
下载偷拍自拍 欧美性爱安装你想要的应用 更方便 更快捷 发现更多
喜欢 99%好评(73人)
评论 18
人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图0 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图1 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图2 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图3 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉截图4
详细信息
  • 软件大小: 20.53MB
  • 最后更新: 2025-01-19 12:29:09
  • 最新版本: alpha3.5.8
  • 文件格式: apk
  • 应用分类:ios-Android lvl3toaster帝法剪衣怎么看
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,美女操逼11P图片,诱人的岳HD中文字幕
二,草死你骚逼,少妇色炮
三,操大奶美女91,欧美胖妇逼逼
四,亚洲乱强伦乂 乄乄乄乄9,爆操嫩逼美女视频观看
五,日本学生妹黄色视频,用小鸡鸡戳女生的屁股下载软件
六,韩国三色精华网,男女操鸡观看免费
七,狂操下海学生妹,干骚白丝美女
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
build4.6.3
啪啪肏逼

人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学思考|价值嵌入与价值对齐:人类控制论的幻觉 1天前
    男人吸奶毛片
  • 特大尺度按摩推油 8天前
    大鸡巴操美女骚逼调教母狗
  • 高h片17c 5天前
    女生让男生捅自己坤坤网站
  • 欧美交换配乱吟粗大25P 5天前
    性爱插插插动态图120秒免费看
  • 操逼国产对白 5天前
    欧美色图91ppppp
  • 裸体 扶他那 3天前
    18爽 好舒服 快 A片
  • 男人猛操女人,啊,快进来 3天前
    free欧美行虐待69
  • 男女互操网站 7天前
    靠逼动漫
  • 操逼网战 9天前
    雏女毛片
  • Jizz,日本群交 4天前
    91操操PORNY

近5次交锋

杰里斯女篮近5场比赛

格尔尼卡女篮近5场比赛