人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”

2025-02-03 07:47:04 9,781次浏览

价值对齐是出于科学和伦理目的,避免由人工智能(artificial intelligence,简称AI)的自主性引发相关风险的一种方法,旨在使AI所表现出来的自主性与人类的价值观保持一致。事实上,从技术效用来看,发生对齐故障的系统往往在实际环境中也不太有效。虽然这种一致性是确保AI系统有效性的一条重要途径,但是在追求这种一致性的过程中,AI所表现出的欺骗性行为使得AI为人类带来福祉的宗旨备受质疑。在价值对齐的过程中,AI与人类互动时所表现出的似乎与人类价值观相“对齐”,但实际上这种对齐是表面的。这种对齐以欺骗的方式获得,且不能反映AI的真实目标或意图的现象被称为欺骗性价值对齐(deceptive value alignment)。AI的欺骗性使得监控和评估AI行为变得更加复杂,而这一切不仅增加了监管难度,更是威胁到人类对AI系统的信任。若想要建立一个安全、可靠、可控且可信的人-机(技)协作环境,就必须提出合理应对欺骗性价值对齐的有效措施。因此,在智能革命的当下,探寻欺骗性价值对齐的应对逻辑是人类必须解决的一个关键问题。 从欺骗性价值对齐的形成与后果来看,使用端在AI产生实际效用过程中的意义越来越受到关注。在关于AI的规则、法规与条例等的文件中,对使用者的规范正逐步成为一项必要的内容。这种变化一方面倒逼设计者重新思考新的设计视角,使得当今的设计者越来越注重将未来的技术、社会和文化相结合,力求设计过程和方法的改变;另一方面,则意味着仅仅依靠设计端的努力是不够的,想要抵抗欺骗性价值对齐带来的风险,就必须增强设计与使用两端的AI素养。这种双重增强源于AI的技术特性,并非通过两端的独立发展,而是通过两端的融合实现的“共生”关系。 在20世纪80年代,莉莉-玛琳·鲁索(Lilly Marlene Russow)曾将欺骗笼统地定义为“当且仅当一个行为主体意图使另一个生物体因其行为而产生错误的信念(并可能按照错误的信念行动)时,该行为主体的行为才具有欺骗性”。在日常的话语体系中,欺骗作为负面行为经常与撒谎同时出现,撒谎代表着一方故意隐瞒或歪曲事实,甚或意图操纵另一方。就撒谎而言,查尔斯·邦德(Charles F. Bond)和米切尔·罗宾逊(Michael Robinson)将其视为“一种倾向于使传播者受益的虚假沟通”。因此,“意图”在界定欺骗行为时扮演着关键角色。仅仅在知道信息不实的情况下提供虚假信息,并不构成欺骗。欺骗行为必须伴随着某种“意图”,而这种“意图”又通常与某个主体的利益相关联。基于此,至少可以从如下两个方面来审视AI欺骗的“意图”表现:一方面,欺骗者进行欺骗可能有多种动机,但其动机之一通常是趋利避害的,即欺骗者获得利益需要牺牲被欺骗者的利益。例如,编造网络谣言的造谣者主要是想通过谣言获得经济或政治利益;有些人为了增强自信心或避免自尊受损而在与人的交往过程中编造莫须有的经历等。因此,“欺骗”的根源可以追溯到人类的“意图”和利益。若缺乏严格的监管和问责机制,即便AI技术在设计上并未预设欺骗功能,它仍可能极大地增强人类的欺骗能力。特别是在商业领域中,AI作为一类工程项目,其目标在于实现产品和服务的市场化。当前AI研究重点也更多地聚焦于如何创造产品和服务的商品化途径,这使得AI在最坏的情况下或将成为经济统治的工具,也就是说,在人类的能动性和利益的驱使之下,AI欺骗获得了巨大的生长空间。另一方面,AI欺骗表现出更加无规律可循的特点,其背后的“意图”更加难以把握。因此,相比传统欺骗而言,AI欺骗具有更大的欺骗性,导致的后果也更加无法预料。例如,OpenAI开发的ChatGPT能够访问庞大的文本数据库,并利用其强大的计算力分析数据间的联系,构建模型以生成类似人类写的文本,这个生成过程涉及约“1750亿次”运算。面对如此庞大的运算规模,甚至连AI模型的设计者也不知道它们是如何工作的。这种机器和人类之间的信息不对称在AI系统的应用中是很常见且明显的,也正是这种信息不对称为AI欺骗提供了诸多可能性。

该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 /
杰里斯女篮

杰里斯女篮

西女甲 | 2024-11-17 19:00
0
-
0

格尔尼卡女篮

格尔尼卡女篮

分析数据赛程

直播信号

赛事信息

北京时间:2024年11月17日 19:00分,西女甲【杰里斯女篮VS格尔尼卡女篮】准时开始,喜欢看西女甲比赛的朋友可以提前收藏本页面以免错过直播。还为您在本页面索引了相关西女甲直播、杰里斯女篮、格尔尼卡女篮直播的近期比赛列表以及两队历史交锋、两队最新比赛赛程。本站不参与制作、不存储,资源由热心网友提供信号源

相关标签

人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”

2025-02-03 07:47:04 3,186次浏览

价值对齐是出于科学和伦理目的,避免由人工智能(artificial intelligence,简称AI)的自主性引发相关风险的一种方法,旨在使AI所表现出来的自主性与人类的价值观保持一致。事实上,从技术效用来看,发生对齐故障的系统往往在实际环境中也不太有效。虽然这种一致性是确保AI系统有效性的一条重要途径,但是在追求这种一致性的过程中,AI所表现出的欺骗性行为使得AI为人类带来福祉的宗旨备受质疑。在价值对齐的过程中,AI与人类互动时所表现出的似乎与人类价值观相“对齐”,但实际上这种对齐是表面的。这种对齐以欺骗的方式获得,且不能反映AI的真实目标或意图的现象被称为欺骗性价值对齐(deceptive value alignment)。AI的欺骗性使得监控和评估AI行为变得更加复杂,而这一切不仅增加了监管难度,更是威胁到人类对AI系统的信任。若想要建立一个安全、可靠、可控且可信的人-机(技)协作环境,就必须提出合理应对欺骗性价值对齐的有效措施。因此,在智能革命的当下,探寻欺骗性价值对齐的应对逻辑是人类必须解决的一个关键问题。 从欺骗性价值对齐的形成与后果来看,使用端在AI产生实际效用过程中的意义越来越受到关注。在关于AI的规则、法规与条例等的文件中,对使用者的规范正逐步成为一项必要的内容。这种变化一方面倒逼设计者重新思考新的设计视角,使得当今的设计者越来越注重将未来的技术、社会和文化相结合,力求设计过程和方法的改变;另一方面,则意味着仅仅依靠设计端的努力是不够的,想要抵抗欺骗性价值对齐带来的风险,就必须增强设计与使用两端的AI素养。这种双重增强源于AI的技术特性,并非通过两端的独立发展,而是通过两端的融合实现的“共生”关系。 在20世纪80年代,莉莉-玛琳·鲁索(Lilly Marlene Russow)曾将欺骗笼统地定义为“当且仅当一个行为主体意图使另一个生物体因其行为而产生错误的信念(并可能按照错误的信念行动)时,该行为主体的行为才具有欺骗性”。在日常的话语体系中,欺骗作为负面行为经常与撒谎同时出现,撒谎代表着一方故意隐瞒或歪曲事实,甚或意图操纵另一方。就撒谎而言,查尔斯·邦德(Charles F. Bond)和米切尔·罗宾逊(Michael Robinson)将其视为“一种倾向于使传播者受益的虚假沟通”。因此,“意图”在界定欺骗行为时扮演着关键角色。仅仅在知道信息不实的情况下提供虚假信息,并不构成欺骗。欺骗行为必须伴随着某种“意图”,而这种“意图”又通常与某个主体的利益相关联。基于此,至少可以从如下两个方面来审视AI欺骗的“意图”表现:一方面,欺骗者进行欺骗可能有多种动机,但其动机之一通常是趋利避害的,即欺骗者获得利益需要牺牲被欺骗者的利益。例如,编造网络谣言的造谣者主要是想通过谣言获得经济或政治利益;有些人为了增强自信心或避免自尊受损而在与人的交往过程中编造莫须有的经历等。因此,“欺骗”的根源可以追溯到人类的“意图”和利益。若缺乏严格的监管和问责机制,即便AI技术在设计上并未预设欺骗功能,它仍可能极大地增强人类的欺骗能力。特别是在商业领域中,AI作为一类工程项目,其目标在于实现产品和服务的市场化。当前AI研究重点也更多地聚焦于如何创造产品和服务的商品化途径,这使得AI在最坏的情况下或将成为经济统治的工具,也就是说,在人类的能动性和利益的驱使之下,AI欺骗获得了巨大的生长空间。另一方面,AI欺骗表现出更加无规律可循的特点,其背后的“意图”更加难以把握。因此,相比传统欺骗而言,AI欺骗具有更大的欺骗性,导致的后果也更加无法预料。例如,OpenAI开发的ChatGPT能够访问庞大的文本数据库,并利用其强大的计算力分析数据间的联系,构建模型以生成类似人类写的文本,这个生成过程涉及约“1750亿次”运算。面对如此庞大的运算规模,甚至连AI模型的设计者也不知道它们是如何工作的。这种机器和人类之间的信息不对称在AI系统的应用中是很常见且明显的,也正是这种信息不对称为AI欺骗提供了诸多可能性。

该文章转自 海外网 ,如有异议,请发邮件至diguowang08@163.com。 人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”
人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”

人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”

「活动」首次登录送19元红包

82.36MB
版本V8.4.2
下载果冻传媒影视在线播放安装你想要的应用 更方便 更快捷 发现更多
喜欢 89%好评(51人)
评论 20
人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”截图0 人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”截图1 人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”截图2 人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”截图3 人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”截图4
详细信息
  • 软件大小: 66.65MB
  • 最后更新: 2025-02-03 07:47:04
  • 最新版本: V6.7.2
  • 文件格式: apk
  • 应用分类:ios-Android 迪丽热巴多人运动
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,女生奖励自己隐私越狠越安全好,乱伦老女人
二,zzjj日本,少妇掰逼
三,透逼爱影院,薛婧姿韵3大胆
四,黄书性奴白丝,日韩美女掰开粉嫩的逼
五,美女打开双腿 含羞视频,美女裸体被 喷水国产
六,爽 躁多水 快 深点18禁,女生艹逼
七,偷拍欧美美女兽交,欧美乱伦色图
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
snapshot6.3.9
亚洲美女艹逼流水

人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”类似软件

猜你喜欢

包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生” 1天前
    欧美一级婬片A片免费啪啪狂飙
  • tpimage视频 1天前
    被多人强伦的小柔小说片段
  • 人凌参观园辱中文2动漫 4天前
    自本女裸交
  • 色酷播放器 9天前
    老赵抱着媛媛在厨房作爱视频
  • yindang网站入口 8天前
    少妇乘骑喷水
  • 校花被群jian又粗又大H 8天前
    国产同性恋艹逼
  • 少妇扣逼视频 1天前
    乱轮色色
  • 黄片操逼免 7天前
    强行破瓜粗暴顶弄蹂躏哭喊
  • 肉体╳╳╳╳裸交ⅩXXXXX 7天前
    美女被操内射
  • 小浪货腿张开水好多啊视频 4天前
    一牝户二玉茎

近5次交锋

杰里斯女篮近5场比赛

格尔尼卡女篮近5场比赛