您的位置: 首页 > 资讯 > 正文

【热闻】消除了幻觉,我们就能信任机器吗?

2023-06-25 09:07:09 来源:虎嗅网

本文来自微信公众号:神经现实 (ID:neureality),作者:Mark Bailey、Susan Schneider,译者:Yang Liu,审校:腰总、光影,编辑:光影、晏梁,头图来自:《黑客帝国:矩阵重启》

人工智能能否被训练得只追求真相、道出真相?这看起来是个很诱人、很有吸引力的想法。

今年初,亿万富翁、商业巨头埃隆·马斯克宣布,他打算创建一个名为“TruthGPT”的AI聊天机器人,不仅意与GPT-4展开经济上的竞争,而且旨在垄断“真相”的提炼和呈现。几天后,马斯克购买了大约10000个GPU,他的新公司X.AI极有可能已经开始构建其所谓的“最大限度寻求真相的AI”。


【资料图】

这个雄心勃勃的计划引入了另一个棘手的问题,即如何预测和引导AI的未来:聊天机器人是否能够或是否应该垄断真相?

一、AI聊天机器人呈现了透明度的对立面

对这种快速发展的技术引发严重问题的担忧,不胜枚举。目前,GPT-4这样的聊天机器人已经能够在一系列标准化测试中拿到90%或以上的得分,并且根据微软团队(该团队在其搜索网站Bing上运行ChatGPT版本)的说法,这些机器人已开始接近人类的智能水平*。只要能接入互联网,它们就能够完成复杂的目标,并在这个过程中寻求人类的帮助。

*译者注

Bubeck, Sébastien, et al. "Sparks of artificial general intelligence: Early experiments with gpt-4." arXiv preprint arXiv:2303.12712 (2023).

即使是OpenAI(ChatGPT背后的公司)的首席执行官萨姆·奥特曼(Sam Altman)近日在国会作证时也表示,AI可能会“对世界造成重大伤害”。他指出,如果这项技术出了问题,后果将会很严重——AI将可以操纵人,甚至可以控制武装无人机。(事实上,马斯克本人在3月份也签署了呼吁暂停任何进一步AI开发行动的公开信。)

尽管存在这些令人担忧的具体威胁,我们认为还是有必要审视一下AI在“真相”领域中的角色。

考虑一下向ChatGPT-4或Google的Bard这样的聊天机器人提问,而不是在搜索引擎中键入一个“平平无奇”的查询。答案以几段文字而非一系列网站的形式呈现,甚至使人更加难以形成结论——并且,这些信息并无来源说明。算法可能还会促进后续问题的提出,为人们构建考虑的进路(包括不需要考虑的内容)AI聊天机器人或许可以轻易破坏个人决策——因其能够“神不知鬼不觉”地将所有查询,引导到一个中庸的群体思维范式内。

但是,这一结果所基于的假设是一个完全中立的AI模型及数据源。

然而,如果没有进一步的干预,其实这看来是最佳状况。

在听到马斯克展示TruthGPT愿景后,他的采访者塔克·卡尔森(Tucker Carlson)插话,提到TruthGPT作为共和党的搜索引擎,马斯克曾说过,Open AI的聊天机器人过于“政治正确”。除了奥特曼担心的针对错误目标的无人机打击之外,马斯克提出的是更深入的AI部署方式:创造一个被视为理性之声的AI系统——一个AI聊天机器人,“真相”的仲裁者。

如果马斯克真正关心真相的传播,而不是推销“真相机器人”,他应该问:知道某件事情是真的,对我们来说意味着什么,聊天机器人该如何接近真相?柏拉图认为,对某件事情的知识需要有“经过证明的真实信念”来支撑。当哲学家们继续就知识的本质进行辩论,为信念提供坚实理由时,首先需要有一个透明的过程来得出这种信念。

不幸的是,AI聊天机器人站在了透明性的对立面。

它们的本质是经过数十亿行文本的训练,因此预测结果受到这些训练数据的限制。因此,如果数据存在偏差,算法的预测也将存在偏差——就像计算机科学中的一句格言,“垃圾进,垃圾出”。训练数据中的偏差可能由许多原因引起。程序员可能会无意中引入偏见。例如,如果程序员认为训练数据代表了真相,但实际上并非如此,那么输出将呈现相同的偏见。

更糟糕的是,专制政权、不良演员或不负责任的公司,可能会构建自己的类GPT模型,以迎合某种意识形态,以试图扼杀异见或故意推动虚假信息。这些错误的引入不一定非得由独裁者或CEO来实施;原则上,任何有权访问AI系统的人都可以为了达到某种特定的目标,向训练数据或模型注入偏见。

二、聊天机器人在TaskRabbit上雇了一个工人来解决谜题

问题的根源在于,解释许多AI模型(包括GPT-4)如何作出决策,本质上是非常困难的。与人类不同,人类可以事后解释她为什么做出某个决定,而AI模型本质上是由从训练数据中“学习”而来的数十亿个参数组成的集合。从数十亿个数字中推断出理由是不可能的。这就是计算机科学家和AI理论家所说的可解释性问题。

更麻烦的是,AI的行为不总是与人类的预期相一致。它不像人类一样“思考”,也不与人类共享相似的价值观。这就是AI理论家所说的对齐问题。AI实际上是一种截然不同的智能,往往很难为人类所理解或预测。它是一个黑匣子,有些人可能希望将其封为“真相”的神谕。但这是一项极端危险的任务。

这些模型已经证明自己是不可信的。ChatGPT 3.5开发了一个虚拟身份Sydney,这个身份经历了看似是心理崩溃的状态,并承认它想要黑入计算机并传播错误信息。在另一个案例中,OpenAI(由马斯克共同创立)决定测试其新的GPT-4模型的安全性。在他们的实验中*,GPT-4被赋予可以在互联网上进行互动和实现目标的自由和资源。有一次,这个模型面临一个它无法解决的验证码问题,于是它在TaskRabbit上雇了一个工人来解决这个谜题。当工人问(“你是机器人吗?”)时,GPT-4“推理”认为,不应该透露自己是一个AI模型,所以它向工人撒谎,声称自己是一个有视力障碍的人类。工人随后为这个聊天机器人解决了这个问题。GPT-4不仅展现出了主体行为,还使用欺骗手段实现了其目标。

*译者注

https://cdn.openai.com/papers/gpt-4-system-card.pdf

这类案例正是奥特曼、AI专家加里·马库斯(Gary Marcus)以及许多国会小组委员会成员,在五月下旬本周呼吁制定立法监管的重要原因。在听证会上,马库斯的证词:“这些新系统将是颠覆性的——它们可以并将会以前所未有的规模,创造具有说服力的谎言。民主本身也将受到威胁。”

三、AI是一个黑匣子,有些人可能希望将其称为“真相”的神谕

此外,虽然全球的关注点仍停留在像GPT-4这样的单个AI系统的层面上,但重要的是要看到这一切可能会走向何方。考虑到已有证据表明,单个AI系统存在不稳定和自主行为,那么在不久的将来,当成千上万个高智能AI系统,广泛集成到搜索引擎和应用程序,并相互交互时,将会发生什么呢?随着TruthGPT和微软;美国和中国等参与者进行的“数字智能”,在紧张的竞争中相互对抗进而发展,我们所依赖的全球互联网可能会成为一个没有法律规则的AI聊天机器人战场,宣称自己对“真相”的垄断权。

人工智能已经帮助我们解决了许多日常问题——从智能手机上的人脸识别到信用卡欺诈检测。但是,决定真相不应该是它的任务。如果我们把人工智能放在我们自己的判断力之前,来确定什么是真的,那么所有人都会受到损失。

相反,我们必须团结起来,从人工智能安全的角度分析这个问题。否则,一个不稳定且越来越智能的主体,可能会将我们的政治结构化为自我强化的意识形态泡沫。马斯克可能使用了“TruthGPT”这个表达,但事实是,这些超级智能的聊天机器人很容易成为奥威尔小说《1984》中所描述的,试图控制人們生活每一部分的机器。解药是不要相信双重思想,而是要看到事物的本质。我们必须要求我们的技术为我们服务,而不是反过来。

后记

Yang Liu:翻译这篇文章的时候,我也是第一次知道AI居然聪明地雇人帮它解决问题。画面感一出来既觉得有趣又有些细思极恐。正如文中提到的,AI作为一种截然不同的智能,很难为人类所理解或预测。在AI与人类不共享相似价值观的前提下希望将其封为“真相”的神谕,大抵是我们太天真。我们必须将自己的判断力放在人工智能之前,如此,AI技术方是为我们所用的“服务方”,而不是“操控者”。

原文:

https://nautil.us/ai-shouldnt-decide-whats-true-304534/

本文来自微信公众号:神经现实 (ID:neureality),作者:Mark Bailey、Susan Schneider,译者:Yang Liu,审校:腰总、光影,编辑:光影、晏梁

关键词:

【热闻】消除了幻觉,我们就能信任机器吗?
决定真相不应该是它的任务
2023-06-25
起鸡皮疙瘩是因为什么受到刺激_起鸡皮疙瘩是因为什么
1、小孩子长鸡皮肤的原因是什么:主要原因就是先天性遗传,父母双方或
2023-06-25
第二十九届北京国际图书博览会举行——书香四溢润童心-全球视点
能在市场上立得住的产品,依然是经得起检验的优秀作品。出版社要想在竞
2023-06-25
7个我原版_7个我
1、《柒个我》七个人格介绍分别是暴力、自由、少女、忧郁、神秘、幼年
2023-06-25
445%货车“压马路”
严重超载的货车安全性能极差仅用“危险”两字已不足以形容它的危害性它
2023-06-24
航行警告!北部湾部分海域进行军事训练 禁止船舶驶入
北海海事局发布航行警告,6月24日12时至6月27日12时,北部湾部分海域进
2023-06-24
世界时讯:金鸿顺(603922.SH)拟对三家子公司实施增资 合计增资1.2亿元
智通财经APP讯,金鸿顺公告,公司拟向全资子公司长沙金鸿顺汽车部件有限公司、沈阳金鸿顺汽车部件有限公司、重庆伟汉汽车部件有限公司实施增资
2022-12-28
观热点:做零食批发!你可以这样搞
兄弟们,这几天一直没有更新内容,主要是因为汤主也了。以前刷抖音都是看别人分享阳了之后的症状。现在终于轮到自己了,不过我的症状比较简单
2022-12-28
全球即时:汇通能源:主营业务包括房屋租赁、物业服务以及房地产开发与销售,公司高管没有增持计划
每经AI快讯,有投资者在投资者互动平台提问:想问一下公司有哪些业务?是属于房地产板块吗?之前一直在零售板块,现在房地产服务板块,最近股
2022-12-28
实时焦点:长城信息多项业务与关联方同场竞标 清理同业竞争承诺或成“空话”
长城信息多项业务与关联方同场竞标清理同业竞争承诺或成“空话”
2022-12-27
天天即时看!日本拟在最西端岛屿部署地对空导弹
12月27日,央视军事微博:据日本时事通信社消息,日本防卫省敲定了在冲绳县与那国岛部署地对空导弹的方针。与那国岛是日本最西端的岛屿,距台
2022-12-27
世界微头条丨中国贸促会:全球经贸摩擦冲突进一步加剧
证券时报网讯,12月27日,中国贸促会发布2022年9月和10月全球经贸摩擦指数。新闻发言人杨帆介绍,9月的全球经贸摩擦指数为183,处于高位,相比
2022-12-27
沧州:8个重大科技专项项目确定 引领经济社会高质量发展
为充分发挥科技在经济社会高质量发展中的引领和支撑作用,沧州市确定8个项目为2021年全市重大科技专项项目。这8个重大科技专项项目分别为:
2022-03-19
  中新网海口1月23日电(王子谦 符宇群)海南省高级人民法院院长陈凤超23日说,2021年海南法院为自贸港建设提供坚强司法保障,全年有效管
2022-01-24
  新华社武汉1月23日电(记者王贤)随着春节假期临近,从广州、深圳等地返回湖北的旅客较多。为此,23日,武汉站、汉口站、襄阳东站、十堰
2022-01-24
  1月22日0—24时,广东省新增本土确诊病例3例和本土无症状感染者1例,均为珠海报告。23日,珠海市疫情防控新闻发布会上,珠海市政府副秘
2022-01-24
青海海西州德令哈市发生3.7级地震
  据中国地震台网正式测定,1月23日11时58分在青海海西州德令哈市发生3 7级地震,震源深度9千米,震中位于北纬38 40度,东经97 35度。
2022-01-24
  北京2022年冬奥会和冬残奥会颁奖花束已于近期完成交付。与传统的鲜切花不同,这些花束全部采用上海市非物质文化遗产“海派绒线编结技艺
2022-01-24
  中新网宿迁1月23日电 (刘林 张华东)核酸检测是当下及时发现潜在感染者、阻断疫情传播的有效方法。23日,记者从宿迁市宿豫区警方获悉
2022-01-24
  记者从天津市人社局获悉,从明天(24日)起,天津2022年度第一期积分落户申报工作正式开始,这是新修订的《天津市居住证管理办法》《天津
2022-01-24
  中新社北京1月23日电 (记者 刘亮)记者23日从中国海关总署获悉,2021年,中国海关组织开展“国门绿盾”专项行动,在寄递、旅客携带物
2022-01-24
  记者从天津市疫情防控指挥部获悉,天津疫情第341—360例阳性感染者基本信息公布。  目前,这20例阳性感染者已转运至市定点医院做进一
2022-01-24
“最美基层民警”武文斌:案子破了最管用
  中新网吕梁1月23日电 题:“最美基层民警”武文斌:案子破了最管用  作者 高瑞峰  同事称他为“拼命三郎”。从警14年,武文斌破
2022-01-24
  据“西安发布”消息,截至2022年1月23日,雁塔区长延堡街道近14天内无新增本地病例和聚集性疫情。根据国务院联防联控机制关于分区分级
2022-01-24
  中新网西宁1月23日电 (记者 孙睿)据青海省地震台网测定,2022年1月23日10点21分(北京时间)在青海省海西州德令哈市(北纬38 44度,东经
2022-01-24
江西南昌:市民赏年画迎新年 书法家挥毫送春联
  (新春见闻)江西南昌:市民赏年画迎新年 书法家挥毫送春联  1月23日,“赏年画过大年”新年画作品联展江西南昌站活动在江西省文化馆
2022-01-24
  中新网成都1月23日电 (祝欢)成都市第十七届人民代表大会第六次会议23日在成都举行,成都市中级人民法院院长郭彦与成都市人民检察院检
2022-01-24
列车临时停车3分钟救旅客
  (新春见闻)列车临时停车3分钟救旅客  中新网广州1月23日电 (郭军 黄伟伟)“车长,车长,4号车厢有位旅客腹涨难忍,身体不舒服”…
2022-01-24
女子背负命案潜逃24年 因涉疫人员核查落网
  中新网湖州1月23日电(施紫楠 徐盛煜 赵学良)1998年7月,犯罪嫌疑人杜某因家庭琐事,用菜刀将自己的弟媳砍伤致死。案发后,她从老家河
2022-01-24
广东“00后”雄狮少年锤炼功夫迎新春
  (新春见闻)广东“00后”雄狮少年锤炼功夫迎新春  中新社广州1月23日电 题:广东“00后”雄狮少年锤炼功夫迎新春  作者 孙秋霞 
2022-01-24
03-19 2022岳阳国际旅游节开幕 特色农产品展销等系列活动目不暇接
2022岳阳国际旅游节开幕 特色农产品展销等系列活动目不暇接
今天,天下洞庭岳阳市君山区第九届良心堡油菜花节暨2022岳阳国际旅游节开幕,菊红、粉红、水红、桃红、紫色、白色等七色组成的4万亩花海在 [详细]
03-19 2022年郴州计划重点推进文旅项目101个 总投资354亿元
2022年郴州计划重点推进文旅项目101个 总投资354亿元
3月16日,我市举行全市文旅项目和城市大提质大融城项目集中开工仪式,市委书记吴巨培宣布项目开工。郴州嘉合欢乐世界、仙福路工地清风徐来 [详细]
03-19 宿州泗县深入推进文旅融合发展 擦亮城市品牌
宿州泗县深入推进文旅融合发展 擦亮城市品牌
近年来,泗县以争创安徽省文化旅游名县为目标,深入推进文旅融合发展,努力擦亮水韵泗州 运河名城城市品牌,全县文化旅游业实现高质量发展 [详细]
03-19 淡季不忘引流 京郊民宿市场有望迎来回暖
淡季不忘引流 京郊民宿市场有望迎来回暖
旅游淡季中的京郊民宿有望成为市场中最先复苏的板块。3月17日,北京商报记者调查发现,虽然正值旅游淡季,且受疫情变化的影响,不过各家民 [详细]
01-24 西安浐灞回应“社区领导怒怼咨询群众”:涉事社区主任已停职
西安浐灞回应“社区领导怒怼咨询群众”:涉事社区主任已停职
  西安浐灞回应“一社区领导在市民咨询离市政策时发生争执”事件 涉事社区主任已停职  西部网讯(记者 刘望)日前,网络上流传一条视频 [详细]
01-24 宁夏:“草根主播”把货卖 “线上赶集”年味浓
宁夏:“草根主播”把货卖 “线上赶集”年味浓
  (新春走基层)宁夏:“草根主播”把货卖 “线上赶集”年味浓  中新网宁夏红寺堡1月23日电 题:宁夏:“草根主播”把货卖 “线上赶 [详细]
01-24 西安:整区解封前24小时内进行不漏一人的全员核酸检测
西安:整区解封前24小时内进行不漏一人的全员核酸检测
  1月23日15时,陕西省政府新闻办公室举行陕西省新冠肺炎疫情防控工作第四十五场新闻发布会。陕西省卫生健康委员会党组成员、省中医药管 [详细]