人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”

2025-01-17 16:32:12 2537次浏览

??


【本文原载于《华中科技大学学报(社会科学版)》2024年第5期,澎湃新闻经授权转载】 在20世纪80年代,莉莉-玛琳·鲁索(Lilly Marlene Russow)曾将欺骗笼统地定义为“当且仅当一个行为主体意图使另一个生物体因其行为而产生错误的信念(并可能按照错误的信念行动)时,该行为主体的行为才具有欺骗性”。在日常的话语体系中,欺骗作为负面行为经常与撒谎同时出现,撒谎代表着一方故意隐瞒或歪曲事实,甚或意图操纵另一方。就撒谎而言,查尔斯·邦德(Charles F. Bond)和米切尔·罗宾逊(Michael Robinson)将其视为“一种倾向于使传播者受益的虚假沟通”。因此,“意图”在界定欺骗行为时扮演着关键角色。仅仅在知道信息不实的情况下提供虚假信息,并不构成欺骗。欺骗行为必须伴随着某种“意图”,而这种“意图”又通常与某个主体的利益相关联。基于此,至少可以从如下两个方面来审视AI欺骗的“意图”表现:一方面,欺骗者进行欺骗可能有多种动机,但其动机之一通常是趋利避害的,即欺骗者获得利益需要牺牲被欺骗者的利益。例如,编造网络谣言的造谣者主要是想通过谣言获得经济或政治利益;有些人为了增强自信心或避免自尊受损而在与人的交往过程中编造莫须有的经历等。因此,“欺骗”的根源可以追溯到人类的“意图”和利益。若缺乏严格的监管和问责机制,即便AI技术在设计上并未预设欺骗功能,它仍可能极大地增强人类的欺骗能力。特别是在商业领域中,AI作为一类工程项目,其目标在于实现产品和服务的市场化。当前AI研究重点也更多地聚焦于如何创造产品和服务的商品化途径,这使得AI在最坏的情况下或将成为经济统治的工具,也就是说,在人类的能动性和利益的驱使之下,AI欺骗获得了巨大的生长空间。另一方面,AI欺骗表现出更加无规律可循的特点,其背后的“意图”更加难以把握。因此,相比传统欺骗而言,AI欺骗具有更大的欺骗性,导致的后果也更加无法预料。例如,OpenAI开发的ChatGPT能够访问庞大的文本数据库,并利用其强大的计算力分析数据间的联系,构建模型以生成类似人类写的文本,这个生成过程涉及约“1750亿次”运算。面对如此庞大的运算规模,甚至连AI模型的设计者也不知道它们是如何工作的。这种机器和人类之间的信息不对称在AI系统的应用中是很常见且明显的,也正是这种信息不对称为AI欺骗提供了诸多可能性。 虽然近年来关于AI能动性与自主性的研究备受关注,但从严格意义上来讲,当下,AI依然缺乏人类的心理理论、自我意识和社会意识,然而,这并不意味着AI完全不具备欺骗的能力。卢卡斯·伯格伦德(Lukas Berglund)等人的研究指出,大模型拓展过程中可能出现的一种“态势感知”(situational awareness)能力,这种态势感知能力使AI模型能够意识到自己的存在,并且能够识别自己当前是处于训练、测试还是处于实际应用阶段。事实上,一些具备态势感知能力的高级AI模型,已经表现出了类似动物的欺骗行为。拥有这种能力并不意味着AI能够有意识地进行欺骗,而是其算法和数据处理方式可能导致AI的行为产生欺骗性的结果。同时,AI系统可能会在特定情境下生成误导性的信息或做出非预期的决策,这在某种程度上反映了一种“欺骗”行为。因此,不能简单地将AI视为完全诚实或完全欺骗的实体,而应该更深入地理解其行为背后的复杂机制和潜在影响。

??






??



人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”

人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”

人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”

「活动」首次登录送19元红包

28.27MB
版本beta5.7.3
下载操美女的肥皮安装你想要的应用 更方便 更快捷 发现更多
喜欢 18%好评(88人)
评论 33
人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”截图0 人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”截图1 人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”截图2 人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”截图3 人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”截图4
详细信息
  • 软件大小: 56.99MB
  • 最后更新: 2025-01-17 16:32:12
  • 最新版本: V7.2.9
  • 文件格式: apk
  • 应用分类:ios-Android 91操小孩视频
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.41以上
应用介绍
一,抓奶插逼,高H猛烈失禁潮喷G片在线观看
二,逼特,性爱动态视频
三,办公小姐玩单杠,激情无码 喷水丝袜
四,扒开美女内裤 到喷水好爽,20boys帅男bay视频
五,91无限看丝瓜苏州晶体公司肌肌,性ⅩXXX搡XXXX搡自慰
六,欧美大乱交H,国产另类干屄屄
七,99热精品网红性虐,畸情 100部分
【联系我们】
客服热线:135-2881-646
加载更多
版本更新
ver6.2.9
口の虎は身を破る什么意思

人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 人工智能价值对齐的哲学反思|探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生” 2天前
    亚洲美女牲ⅩXX生活
  • 爆草女同事在线 9天前
    不知火舞蹈和三个小孩子公园狂野
  • 欧美草草草动态图 2天前
    可乐操成人
  • 白虎美女被操喷水 1天前
    操毛
  • 高冷女神反差自慰XX喷水 5天前
    男男基佬车车好快的车车视频推荐
  • 猛男操逼 4天前
    三角片打扑克
  • 亚洲胖女人肏逼 8天前
    90后嫩屄
  • 极品白丝无套内射 2天前
    换妻乱伦 亚洲色图
  • 斗罗大陆微博 6天前
    清纯唯美偷窥自拍图片区
  • 色色国王 4天前
    18同志少爷ktv直播