彭兰:人机协同视角下的新闻生产与消费

选择字号:   本文共阅读 47 次 更新时间:2026-06-01 10:09

进入专题: 人机协同   人机信任   推荐算法   大模型   价值对齐  

彭兰 (进入专栏)  

内容提要:尽管人机协同研究已有60多年历史,但对新闻业而言,它是在近十多年间伴随其智能化变革才逐渐浮现的重要议题。智能时代的新闻生产仍然应该以人为核心,但信息采集、文本与多媒体内容生成等环节,需依据具体任务情境进行灵活的人机分工与协作。与此同时,新闻消费也深度依赖于人机协同。在算法推荐机制下,为防止信息茧房等效应,人与算法需相互提供必要的“负反馈”;而在大模型所支撑的交互环境中,人机协同程度进一步深化,人的主动性得以更充分发挥,但面临的挑战也更为严峻。无论是新闻生产还是消费,有效的人机协同都关涉到人对机器的适度信任,这受到多重因素影响;另一方面,机器也需对人类采取有限信任策略,其核心难题在于人类能否真正实现“价值对齐”。

关键词:人机协同/ 人机信任/ 推荐算法/ 大模型/ 价值对齐/

作者简介:彭兰,中国人民大学新闻学院教授、博士生导师。

原文出处:《新闻与写作》(京)2026年第1期 第5-14页

随着智能技术在内容产业的渗透,新闻的生产与消费正进入人机协同的新阶段。人机协同的研究在技术界已有60多年历史,但对于新闻业来说,它是近十多年才浮现出来的新问题。如何将抽象的人机协同理念转化为实践中的具体操作模式与机制,实现人与机器的有效分工、协作,以及人与机器的相互监督、校正,仍需要长时间的探索。

一、人机协同:新闻业遭遇的新问题

人机协同的思想源于美国计算机科学家、心理学家J.C.R.利克莱德(Licklider,J.C.R.)在1960年发表的《人机共生》(Man-Computer Symbiosis)一文,这被视为人机协同领域的奠基性文献。那时整个计算机技术的应用还在初级阶段,人工智能概念也刚出现不久,但利克莱德看到了人与机器各自的局限,因此提出了“人机共生”这一关系模式。他指出,人机共生旨在实现人类与电子计算机之间的协作互动,人与机器将形成紧密耦合的伙伴关系,其主要目标在于:其一,使计算机不仅能辅助解决既定问题,更能促进人类形成构思性思维;其二,让人类与计算机能够在决策和管理复杂情境时实现协同合作,摆脱对预设程序的僵化依赖。对于这种共生伙伴关系的预期是,人类将负责设定目标、构建假设、确定标准并进行效果评估,计算机则完成那些为技术和科学的洞察与决策铺路的必要的、常规化工作。①他说的人机共生,实质上就是人机协同。

在包括利克莱德在内的很多研究者眼里,人机协同的一个重要目标是实现人类智慧增强。1962年,道格拉斯·恩格尔巴特(Douglas Engelbart)发布了报告《增强人类智慧:一个概念框架》,指出所谓的“增强人类智慧”,是指提高人类处理复杂问题情境的能力,获得满足其特定需求的理解力,以及推导出问题解决方案的能力。具体体现为:更快的理解速度、更好的理解质量、在以往因过于复杂而无法理解的情境中获得有效理解的可能性、更快的解决方案、更好的解决方案,以及找到解决以往看似无解之难题的可能性。②道格拉斯·恩格尔巴特被称为“鼠标之父”,他还推动了图形化界面、超文本、视频会议、实时协同编辑等概念与技术的发展,在人机交互技术方面享有盛誉,他也是互联网早期建设的参与者之一。但他对人机关系的思考,并没停留在人机的工具性互动层面,而是上升到利用机器实现人类智慧增强这一高度。

在不同方向和任务中,人机协同的方式和层次不尽相同,机器参与的程度也有差异。R.帕拉苏拉曼(R.Parasuraman)和T.B.谢里丹(T.B.Sheridan)等学者2000年发表的论文《人与自动化机器交互的类型与层级模型》,将机器介入程度分为十级。一级:计算机不提供任何帮助;二级:计算机提供完整的决策/行动备选方案列表;三级:计算机将选择范围缩小至几个方案;四级:计算机建议一个最佳方案;五级:计算机建议一个方案,并在人类明确批准后执行;六级:计算机允许人类在有限时间内否决,否则自动执行;七级:计算机自动执行,且必须通知人类;八级:计算机自动执行,只有在人类询问时才告知;九级:计算机自动执行,并且只有当它自己觉得有必要时才告知人类;十级:计算机决定一切并自动行动,完全忽略人类。③在该文中,作者还分析了信息处理不同阶段所适合的自动化等级情形。后文将进一步介绍。

与人机协同相关的一个重要研究领域,是人机信任,即人与机器之间能否相互信任的问题,人机互信是人机协同的基础。人机信任的研究可以追溯到20世纪70年代,早期研究主要出现在军事、航空、自动化等领域,20世纪90年代,与计算机系统相关的人机信任研究逐步涌现。在很长一段时间内,人机信任的研究更多聚焦人对机器的信任问题,即人可以在哪些方面、在什么样的程度上信任机器,如何判定机器是否可信。

2004年,J.D.李(J.D.Lee)等人发表了《自动化信任:面向适当依赖的系统设计》一文,这是人机信任领域最具代表性的文献之一。文中指出,信任不是越高越好,而是要与机器的能力相匹配,人对机器的依赖应是“适度”的。作者还指出了人们信任与使用机器时两种常见的问题,其一为“误用”和“过度信任”(Misuse/Overtrust),即机器能力很差而人们盲目信任,其二为“弃用”与“不信任”(Disuse/Distrust),即机器能力强而人们对它不信任。④这提示我们,人类形成对机器恰当信任的核心,是需要了解机器的能力,包括其优势与局限。

在上述论文中,作者还提出了影响信任形成的因素模型。该模型指出,自动化信任及其对行为的影响取决于操作者、环境、自动化和界面之间的动态交互。2015年,K.A.霍夫(K.A.Hoff)、M.巴希尔(M.Bashir)发表的论文《自动化信任:影响信任因素的实证证据综述》,对J.D.李等人的研究做了进一步发展。他们基于既往的127项实证研究,总结出了三层信任模型,即影响用户对机器信任三个层面的因素,分别为:特质性信任(Dispositional Trust),它包括用户的性别、年龄、性格、文化背景等因素;情境性信任(Situational Trust),包括外部(如系统类型、系统复杂度、任务复杂度、工作负荷等)与内部(如自信心、专长、情绪)等两大类等;习得性信任(Learned Trust),即用户在和机器互动过程中获得的信息,包括产品既往名声、系统表现、交互历史等。⑤这两个模型可以帮助我们从更多维度认识影响人对机器信任的因素,也让我们意识到,人机信任是动态的,在每一个人机互动过程中,人都需要对机器可信度做出判断,而不能仅根据以往经验进行推断。《为什么我们要相信你?对任意分类器预测的可解释方法》一文,也是人机信任领域代表性研究之一。文中指出,可解释性是让用户信任模型的关键,尤其在决策需要人机协同时。⑥可解释性也是当前算法开发中被频频提到的一个原则。

除了人对机器的信任这个研究方向外,近些年,关于机器对人的信任问题的研究也开始增加。在人机协同中,机器对人的评估及由此做出的信任度选择,也是重要的。在一些情境下,机器需要判断它们能否放心让人来进行某些操作,例如,自动驾驶的汽车需要判断特定条件下人是否有能力接管驾驶。

尽管人机协同及相关的人机信任等问题的研究已经有60余年,但以往研究基本集中在军事、工业、交通等领域,人机协同这样的理念进入到新闻业,是近十多年的事。以往的新闻业被认为是人独有的领地,技术只是人使用的工具,人对机器只是操纵关系,但今天智能技术不仅以工具还以主体的角色介入到新闻业,人机协同也成为新闻业必须面对的新人机关系,这既体现在新闻生产中,也体现在新闻消费中。

二、不同类型新闻生产任务中的人机协同

前文提到的《人与自动化机器交互的类型与层级模型》一文指出,人脑处理信息有四个步骤(信息获取、信息分析、决策选择、行动执行),作者将其称为“信息处理四阶段模型”,并认为自动化可以分别介入这四个步骤中的任意一个。在第一和第二阶段,使用高等级自动化通常是好的,因为它能扩展人类的感知,且不会剥夺人类的最终决定权。而在决策阶段,必须非常谨慎,高等级的决策自动化是非常危险的,因为它直接剥夺了人类的情境意识。建议让机器止步于“推荐方案”,而由人来“确认方案”。执行阶段可以高自动化(如自动巡航),但前提是人类必须随时监控,并且系统必须提供清晰的反馈。⑦这里提到的四个阶段,是针对人的大脑处理任务的情境而言,与内容生产的各个环节并不对应,但其中一些思路与原则对于内容生产也有借鉴意义,尤为值得参考的一个重要原则是,当涉及“决策”时,人类不能缺位。在决策环节人的作用不可替代,这一观点也得到其他一些研究的呼应。有研究者指出,AI的决策过程主要依赖于历史数据等显性知识,而人类能够获取显性和隐性知识,在处理涉及不确定性和模糊性的问题时具有优势。⑧

新闻内容生产的各个环节都涉及判断与决策,其中也会涉及一些不确定和模糊性问题,因此,发挥决策核心作用的仍应是人。在这一基本前提下,需要根据具体任务情境来进行人机分工与合作。

(一)信息采集中的人机协同

信息采集是内容生产的首要环节,直接影响到内容生产的方向与质量。机器可以帮助人拓展信息采集的时空维度,也会在一定程度上拓展人对世界的认知维度,这一点毋庸置疑。因此,在信息采集时纳入机器的力量是必要的。

但如果信息采集过程完全由机器主导,会使“信息采集”向“数据采集”倾斜。尽管“信息”和“数据”两个概念之间有很大的交集,但现实世界的某些信息现在并不能被数据化,或者数据化的维度有限。例如,人的思维活动信息虽然可以通过脑电仪、眼动仪等设备被部分数据化,但目前的技术只能揭示思维活动的兴奋度等,却不能反映具体的思维内容,而以往记者可以通过与采访对象的交流来挖掘其深层想法,获得采访对象更丰富的思维层面的信息。此外,现实世界中的对象映射为数据的过程中,会被抽象、简化,大量的细节被忽视。

过于依赖智能机器的信息采集,虽然某些维度的信息量会大大增加,但一些传统的需要由人来进行观察、捕捉的信息反而减少,在此基础上形成的内容作品,对于现实世界的反映也会走向片面。

因此,人在新闻现场或其他一些现实空间的采访、调查仍然是信息采集的核心。机器采集的数据是对人的采访的延伸、补充,而不是替代。对于智能机器采集来的信息,人需要对其应用的范围及局限性有充分的判断。对于特定主题或事件的新闻报道,在哪些层面应用机器采集的信息、在哪些方面必须使用人采访获得的信息、这些信息之间如何配合,这是未来的新闻报道中媒体人需要时时做出的权衡。此外,对于智能机器采集信息的准确性、可靠性的判断,也需要由人来做出。

(二)文字内容生成中的人机协同

此处所说的内容生成,既包括完全原创性的内容生成,也包括基于已有素材的加工。人机协同的文字内容生成有“人类为主+机器辅助”和“机器为主+人类监督”两种基本方式。

“人类为主+机器辅助”适用于那些需要人的深度思考和立场、态度等主观表达的内容,如深度报道、特写、评论等,也适用于那些需要体现写作者风格、个性的内容。在这些内容生产中,人是主要的写作者,机器的辅助作用体现在选题策划中为人提供思路启发,在写作中提供数据、论据或其他资料性支撑,或进行一些信息的查证等。在这样的写作中,机器的角色并非不可或缺,但有了机器的辅助,人类的写作效率可以提高,在某些方面内容质量也有望得到提升。

在人类为主的模式里,机器会越来越多参与到选题策划过程中,但是,未来是否所有的选题策划都需要依赖机器提供的线索,甚至基于机器的数据分析直接生成选题?答案显然是否定的。机器提供的数据在所有人的面前都是一样的,直接由机器做出选题方案难免导致同质化。在机器提供的数据基础上,人还需要发挥自身经验、直觉的作用,有时,这些因素比数据更为重要。某些时候,完全摆脱机器的提示,有可能产生全新的选题创意。个性化的选题仍是基于人的思考与决策。

但当人们形成了对机器的依赖惯性时,自己的思考往往会被抑制,为此,Z.布钦卡(Z.Buçinca)等人在其研究中设计了三种“认知强制”干预机制,即在决策时刻激发人类思考的干预措施,包括:要求人们在看到AI的推荐之前先做出决定,以避免AI推荐产生锚定偏差;减慢流程,即延迟展示AI的推荐;让人们选择是否以及何时查看AI推荐。⑨在选题策划中,这样的认知强制干预尤为重要。人自身对选题的思考应该先于机器推荐出现,机器推荐只是为人提供延伸、启发的线索,或为人的判断提供相应依据,而不是替代人做出选题的决定。

“机器为主+人类监督”的内容生产是目前人工智能领域更关注的应用方向,不同类型的系统有不同的生产原理,人需要介入的程度也有差异,分析人机协同的思路也需要区分不同的使用情境。

从文字内容的生成原理来看,目前主要有三种智能模式:

其一是信息抓取与整合模式。2010年美国Narrative Science公司推出的自动写作工具Quill、2015年国内出现的Dreamwriter和快笔小新等都是这一模式。它们可以在指定的信息来源中进行自动搜索,抓取有价值的最新数据,对数据进行清洗、加工,再将其整合进合适的新闻写作模板中,生成新闻文本,有些情况下,这类系统还会整合多个信息源的信息。如果这类系统依赖的是可靠的信息源,那么真实性相对容易得到保障。这类生产模式,主要以事实性信息传达为主,即使内容中包含意见性信息,也是来自其他信息源已经存在的内容。

其二是现场生成新闻模式。例如,字节跳动团队开发的“Xiaoming bot”系统,可以通过布置在新闻现场的摄像头,对某些现场中人的活动、环境等进行图像捕捉与识别,并将图像信息转换成文字信息。虽然现在这样的生产模式还不成熟,应用尚不多,但可以预测的是未来类似这样模式的应用将逐步增加。这种自动新闻生成模式不依赖其他新闻源,实现了完全的原创。在技术成熟的前提下,内容的真实性、准确性也不难实现。这类方式也主要用于事实性信息传达。

其三是大模型生成内容模式,也就是基于语料库的内容生成。但在目前的大模型模式下,它难以对生成内容的真实性、准确性负责,也无法完成“现场报道”。当下它们在原创内容,特别是原创新闻生产方面,风险仍难控制。但大模型适用的内容生产情境更广,文字风格也可以更多样。

前两种生产模式都是自动化程度很高的原创内容生产,人不需要在其生产过程中以及生产结束后进行决策,但人的决策并没有完全消失,只是“前置”了,这体现在写作系统的信息源的选择、报道领域与对象的选择、报道模板的制定等方面。只有这些前提性的决策正确,智能机器所生产的内容才是可靠的。

大模型可以生成更丰富、风格更多样的文字内容,但准确性无法保证,因此,人对于其生成内容可信度的判断变得十分重要,这是一种关键的“决策”。在新闻生产情境下,让大模型参与哪些类型的写作,也是人需要做出的重要决策。例如,虽然理论上说大模型可以写新闻评论,但这是否意味着媒体人要将评论写作这一任务交给它们?评论代表的是人的意见与态度,大模型虽然可以通过对语料的综合来传达某些意见,但它们不能替代人自身的意见表达,大模型生成的评论也很难展现个性化的锋芒。更重要的是,如果把评论交给大模型,人将会失去在新闻业的一个核心领地。

在一些情境下,即使智能系统可以完全自动化地完成内容原创,但为了使生成的内容更具个性,人也需要在机器生成内容基础上进行优化。在一些重大的选题方向下,人可以以机器生成的内容为基础,找到深入挖掘的方向,完成更深度、专业的内容生产。

(三)多媒体内容生成中的人机协同

在图片、视频等视觉内容方面,目前智能化生成主要有三种情形。一种是完全“无中生有”的生产,例如利用AIGC技术的文生图片、文生视频等;第二种是“自动记录”式生产,即利用各类环境中布置的摄像头进行自动拍摄,生成图片、视频;第三种则是“加工生产”,即基于现有素材进行编辑、组合,形成新的内容。

“无中生有”的图片和视频都是“虚构的”,在新闻生产中,如何将虚构的内容应用于新闻报道而不会对真实性带来损害,这是需要由人做出的一个关键决策。当前,虚构性的图片或视频在新闻报道中的主要作用是对知识、原理、效果等进行解释、示意,或对新闻事件过程、发生环境等进行模拟、重现等。这一应用方向无可争议,但要将解释、示意、模拟、重现做得准确、可信,应用者需要对各种细节做出判断,任何一个判断的失误,都有可能对整体内容的真实性、准确性产生影响。随着技术的提升,越来越多“无中生有”的图片、视频的真假难以识别,将这些内容应用于新闻生产时,人们面临的更大挑战在于鉴别真伪。

“自动记录”模式是基于现实的对象,因此,真实性可以保证,但机器生产的内容是否具有相应的新闻价值、在表现形式方面是否恰当、是否适合公开传播,仍需要由人来进行判断和取舍。对机器记录的素材不加选择地采用与传播,会带来进一步的信息泛滥,也可能带来对个人隐私的侵犯等问题。机器自动生产内容越多,这样的取舍也变得越重要。

对于“加工生产”式类型,如果所采用的图片、视频素材是真实可靠的,那么加工后的内容出现完全虚构性内容的风险较少,但对图片局部的裁剪、视频镜头的不当组接等,也同样可能带来误导。以往新闻图片与视频的编辑、加工中的一些基本原则,对于机器也是适用的。在智能系统的开发中,这些专业原则也需要嵌入其中,这也是人的作用的体现。

与音频相关的智能化内容生成技术也在不断发展,目前的应用主要包括三类。其一是文字与音频自动互转(智能配音也属于文字转音频),在这类应用中,转换内容可能会出现一定差错,人需要对这些差错进行识别和判断。智能配音应用中,使用者需要分析与决定是采用完全由AI合成的声音还是有原型的克隆声音,也要判断不同声音类型对于内容传播效果会带来什么影响。当涉及到真人声音的克隆时,应用者还要判断是否存在对当事人的侵权问题。其二是利用智能翻译应用,为音频生成其他的语言版本。在这类应用中,人除了要判断翻译过程中可能出现的错误外,还需要判断这样的应用是否会干扰人们对真实性的判断,例如,某个外国人说的中文,究竟是出自其本人,还是由AI生成。如果确有必要使用这类应用,需要加上标确的AI生成标识。其三是音频智能剪辑与加工,这类应用中可能出现的问题,与视频的加工相似,人的作用也类似。

(四)内容生产其他环节中的人机协同

除了前面提到的信息采集、内容生成两个环节外,在内容生产其他环节,也需要充分应用人机协同的机制。

当前各大内容平台在内容审核过程中都会使用智能技术,审核涉及决策,有些决策可以基于数据分析自动做出,例如,对于色情内容、敏感信息,智能系统往往可以进行自动识别与处理。但审核中很多时候还涉及价值判断,这种判断还是应该由人来进行。

审核环节还往往涉及到事实的核查,机器可以通过信息来源的追踪、交叉验证、技术性判断等方式来进行核查,而人则可以通过调查、逻辑分析等方式进行核实判断。当AI技术制造出各种肉眼难以分辨真假的虚构性内容时,技术性的判断会变得更重要。

内容传播效果的监测、评估环节,主要涉及相关的数据获取与分析,所以很大程度上可以由机器自动进行,但对相关数据的解读,还是应由人来进行,过于依赖数据进行效果评价,会使内容生产被简单的“数据指挥棒”带偏。除了数据收集、分析以外,面向用户的深度访谈等传统方式也不应该被舍弃,而这还是人的任务。

三、不同机制下新闻内容消费中的人机协同

新闻生产正在走向人机协同,这已经成为共识,但另一种协同往往被忽视,那就是新闻消费中的人机协同。智能时代的新闻内容消费过程,是人与推荐算法、大模型等智能技术共同发生作用的过程,人如何处理与智能技术的互动,直接影响着内容消费的结果。但这种协同性消费是以往用户不曾经历过的,人们大多会以本能的方式去回应机器,这个过程也会暴露出很多问题。

(一)推荐算法机制下的协同消费

在应用了推荐算法的平台,人们接触、消费信息的过程,是人的自主选择与算法推荐机制共同决定的。表面看,推荐算法在很大程度上影响着用户接触的信息范围,但算法推荐并非凭空产生,它们都是基于对人的既有行为的分析,也是对人的兴趣的回应,人对算法的反馈也会影响算法的下一步推荐。很多人担心算法会强化个体的信息茧房,但这个结果是否会发生,取决于多重因素。有研究者指出,信息茧房已从传统推荐算法逻辑下的“单向收敛、同质化、窄化”,逐步过渡为智能推荐环境下由用户行为、算法机制和外部环境共同作用构建的多层次、动态平衡的自适应系统。⑩

信息茧房问题,或推荐算法机制下信息消费的其他问题,都需要从人与算法互动形成的系统角度去理解。人与算法的互动构成了一种控制论的系统,两者互为反馈机制。在控制论中,反馈是指系统输出端回送到系统输入端的信号,它包括“正反馈”和“负反馈”两类。“正反馈”指的是系统的输出信号与输入信号方向或性质相同,“负反馈”则指的是系统输出信号与输入信号方向或性质相反。

如果个体对于算法推荐结果只是接受、顺从,就会为算法提供一种“正反馈”,即对推荐结果的肯定,这会导致算法强化类似推荐。如果用户对算法做出“负反馈”,即提供否定性反馈,那么就会促使算法调整推荐结果。但用户是否会做出负反馈,由很多因素决定。用户的算法意识、媒介素养水平、从算法推荐中获得的满足程度等,都决定着人们是接受算法的不断“投喂”,还是做出相应的逃避甚至反抗。而平台为用户提供哪些反馈方式,以及反馈方式的便捷性等,也会影响到用户的反馈。

同样,如果算法的开发思路都是给用户提供“正反馈”,即顺应他们的既有兴趣和行为,则有可能强化用户既有的信息茧房,而适当的“负反馈”则有助于拓展用户的阅读范围。目前一些算法也在不断改进其模型,试图以不同方式来给用户提供必要的“负反馈”。

推荐算法对用户提供的“负反馈”,还需要体现在“量”的方面。推荐算法不仅影响着用户获取信息的范围,也影响着用户的信息获取量。今天平台利用算法源源不断地进行内容推荐,这加大了用户这端的信息超载,而人们往往在用手指滑动页面、不断加载内容这一机械动作中难以自拔,这也是一些用户在某些平台沉迷的原因。算法适时终止推荐,也是必要的。

从控制论角度看,“正反馈”会使系统逐渐偏离平衡状态,走向极端状态或发生本质改变,“负反馈”则会抑制输入信号带来的变化,使系统保持稳定。尽管走向极端或发生本质改变并非一定都是有问题的,但将某些内容的消费推向极端的确会给用户带来很多问题。因此,人与推荐算法都需要适当给予对方“负反馈”。

推荐算法对内容消费的影响,还体现在它们对于文本的重组。当算法将来自四面八方的内容推荐到用户的阅读时间线时,这些文本在用户端进行了一次再创作:内容生产者生产的原始文本只是一个微文本,而算法将大量的微文本汇聚起来成为一个新的宏文本,它不只是对某一个微文本的扩展,而是对所有微文本的延伸与意义再造,所有微文本都借助彼此产生了新的意涵。有些重组会对内容产生增强效应,有些则会出现相互削弱、消解、冲突、对抗等效果。在新闻内容消费中,也同样如此。

算法作用于人们的文本接收甚至理解过程,这也构成了一种人机协同消费。算法以什么样的逻辑对内容进行重组、如何避免重组对用户产生的误导,也是未来算法开发中需要考虑的问题。而人能否识别与摆脱算法重组对原始内容的干扰,也影响到他们内容消费的质量。

从结果来看,推荐算法机制下,机器对人的影响与控制更明显,但从机制本身看,人并非一定会受控于算法。如果人时刻坚持自己的判断与决策,采取相应的行动,那仍有可能与算法形成平等的互动关系。但人们往往因为自己的惯性、惰性而放弃这样的判断与决策。目前的算法放大和助推了人性的这些弱点,未来算法有必要基于对这些人性的弱点的认识而设计一些调整机制。

(二)大模型机制下的协同消费

对一般用户而言,大模型的使用过程集内容的生成与消费于一体。用户可以通过提示词为机器给出内容生产的方向,还可以为大模型提供相应的素材。对大模型生成的内容,人们不只是简单地接收,还可以通过不断调教,使大模型生成更接近自己需要的内容。

在与新闻消费相关的过程中,大模型的角色主要体现在快速提炼新闻的关键信息与要点,解释背景和知识性内容,完成复杂新闻信息的整合甚至解读,生成某些多模态内容或其他语言版本,在人的引导下对某些信息进行查证、核实、延伸等。而人的角色,除了通过提示词等不断引导大模型提供自己所需的答案或文本外,还需要进行真实性的判断及必要的核查。人们通过大模型获得的新闻信息质量,既取决于人的提示水平、信息核查能力、追问能力,也取决于大模型对人的意图的理解能力。这也意味着这个过程中人机协同的程度比算法推荐过程更高,人的主动性可以得到更多发挥,当然,面临的挑战也更多。

但大模型提供的新闻消费环境存在结构性的缺陷。人们在新闻内容消费时,不仅需要获取事实性信息,还需要了解与此相关的他人的意见、态度,在当下,这往往是基于社交空间中的交流、讨论,社交空间的意见基本来自于真实的人,这些意见之间可能存在着很多冲突,相关的意见分布也是舆情的一种表现,人们可以在众说纷纭之中更全面了解社会意见气候。但当越来越多的人通过大模型获得新闻信息时,他们获得的意见性信息是不充分的。大模型虽然可能整合一些代表性意见,但难以全面地反映所有人的意见,难以反映真实的意见环境。用户也可能在与大模型的交流中表达自己的意见,并试图从大模型那得到回应。但大模型对人表达的意见,常常会表示应和、认同,这会导致人们更加固持己见。用户需要意识到大模型的这种局限,并主动扩展自己了解意见气候的渠道。

从长远来看,如果大模型要成为一个更好的新闻传播平台,也有必要建立一定的人与人之间的意见交流空间,避免人机互动完全替代人与人的互动。

四、新闻生产、消费语境下的人机互信

新闻生产或消费中的人机协同,不只是人机分工的问题,也涉及到前文所说的人机互信,这既包括人对机器的适度信任问题,也包括机器对人的适度信任问题。对于那些不可信的方面,两者之间还需要进行相互监督,甚至校正。

(一)人对机器适度信任中的主要挑战

人对机器的适度信任,意味着人需要判断机器在哪些方面可以信任,在哪些方面会有局限甚至偏差,在此基础上,承担起人机协同中人应该担负的责任。

恰当、适度的信任能否形成,取决于很多因素。前面提到霍夫等学者的研究指出,人对机器信任有三个方面的重要影响因素,即特质性因素(用户的个人因素)、情境性因素(人机互动的各种具体因素)、习得性因素(包括产品既往名声、系统表现、交互历史等)。但并非每个人每一次与机器互动都是这些因素在均衡地起作用,某些时候,某一个或两个方面因素更容易占上风。这三类因素中,特质性因素和习得性因素是当下影响人们对智能技术可信度判断的主要因素。当人们对智能技术整体发展持乐观态度,或从机器那获得过一定的回报时,往往会加大对机器的信任,并可能将这些信任扩大到其他领域,而如果人们对智能技术存在消极判断,或在与机器的某些互动中有不好的体验时,则容易对机器产生抵制情绪。但机器是否可被信任,很多时候取决于情境性因素。霍夫等人将情境性因素分为外部、内部两大类,外部因素包括系统类型、系统复杂性、任务难度、任务负荷、感知的风险、感知的收益、组织环境、任务框定方式等一系列变量,内部因素包括自信心、学科/领域专长、情绪、注意力承载能力等。(11)情境性因素复杂多样,人要针对每一个具体情境做出对机器可信度的准确判断也非常困难。

从内容生产方面来看,前文针对不同类型生产任务的分析说明,智能化内容生产涉及的任务复杂程度不尽相同,对某些任务而言,机器可信度相对较高,人需要干预的程度较低,但某些任务中机器的作用有限,人应该起主导作用。而与此同时,内容生产者自身在智能时代的认知素养与水平也会影响人对机器的信任,认知能力不足可能导致人们对机器产生两个极端的态度,或者盲目信任,或者完全不信任。提高内容生产者对智能机器的认知水平,让他们清晰判断在各种生产任务中机器能力的强项、弱项及人机边界,对于形成恰当的人机信任是必要的。

霍夫等基于以往的研究还指出,组织环境也是影响人机信任的因素,小组可以改善决策质量,但也会受到某些倾向的影响,如群体极化、群体思维和社会惰化等。将不同认知风格的操作者组成团队,可能是改善小组决策的一种方法。(12)在媒体这样的机构,也需要更多的团队合作,让多元的生产者(包括技术开发者、管理者)等共同来进行机器能力的评价,以更好地判断不同任务情境中机器的可信度。

从内容消费方面来看,大多数用户并没有认真思考过机器信任的问题,人们往往凭着自己的直觉来进行判断。当机器出现了一些问题时,例如杜撰一些“事实”,人们往往会说机器出现了幻觉,但本质上,这是盲目信任机器的人自身的幻觉——认为机器不应该犯错。与内容生产者一样,对于内容消费者而言,智能时代最重要的是进行人机信任的意识与素养的培养,形成恰当信任的态度。在此基础上,在不同的消费情境中,用户也需要对机器运行结果做出判断。

基于推荐算法的内容消费,情境和任务相对简单,因为推荐算法本身并不生产内容,而只是为用户进行内容的匹配。用户对算法的信任,主要与推荐内容和自己兴趣的匹配度相关。但用户需要对算法推荐带来的收益与风险做出恰当的评估,特别是被过窄的内容所局限可能带来的风险,并做出必要的“负反馈”。

基于大模型的内容消费,情境要复杂很多,因为个体要通过提示词来引导大模型的内容生产,还要推动大模型的内容优化,甚至要对大模型生成的内容进行真假、可靠性等方面的鉴别。不同环节涉及不同的能力,但对大模型的适度信任意识及必要的纠偏、纠错应该贯穿始终。

此外,上文提到的研究还指出,个体的注意力承载能力也会影响到其判断,当个体处于多任务处理情境时,对机器的判断能力会受到影响,只有减少处理任务的数量,个体才有余力对机器运行结果进行仔细分析。

总体而言,人对机器的可信度判断,不只是与个人素养、能力相关,还与很多因素及其复合作用相关,任何人都难以保证其对机器做出的信任度判断以及由此采取的行动总是正确的。因此,人机协同过程,会充满种种变数。人机协同未必总是对人类智力的增强,有时也可能会带来相反的结果。

(二)人类的“价值对齐”:机器对人信任问题的核心挑战

从机器角度看,机器所要做的,不是对人进行无条件信任和依从,而是要能及时发现人存在的问题,并对人进行相应的制衡或纠偏。目前的各种智能模型都在折射人性、解析人性,在对人性的洞察基础上为人提供服务、满足。人们不能自察的一些人性弱点,也可能被某些模型捕捉或激发。但如果机器只是机械映照和复制人类,那就容易助长人性的弱点与“恶”。

前文提到,推荐算法需要对人的行为做出必要的“负反馈”,正是为了对人的某些行为或心理进行纠偏,当然,算法需要有一定的判断依据,知道人的哪些行为值得鼓励,哪些行为需要抑制甚至阻止。而算法的依据,建立在人类本身的价值判断基础上。

大语言模型是基于对人类语料库的学习,但这也不意味着它们只是简单模仿,特别是当一些人有意地投喂“脏语料”时。大模型在与人互动的时候,也需要对人的语言及背后的行为、思维进行判断,给予人恰当的反馈,而不是一味迎合人。同样,要让机器学会对人的判断与恰当反馈,也需要人给机器合理的判断标准。

机器对人的信任问题,往深层发展便是人类借机器对自身进行反思的问题。今天业界在普遍讨论机器与人的“价值对齐”,但现实的困境是,人类在很多问题上并没有达成共识,或者说人类本身没有实现“价值对齐”,因此,也很难在短期内为机器提供统一的价值判断标准。在人工智能发展过程中,首先要争取让不同国家、民族、人群之间在一些基本问题上达成共识,否则,引导机器向善也会成为空谈。

限于篇幅,本文对智能时代新闻生产与消费中的人机协同进行了分析,但没有专门讨论新闻传播这一环节。值得注意的,智能环境下,传播过程很多时候已经与消费过程融合,算法既是传播手段,也直接作用于内容消费,大模型也是如此。因此本文所分析的新闻消费也涉及到传播。不同于传统媒体和社交媒体的是,智能技术提供了个性化传播渠道,也营造了个性化的消费环境,在这样的环境下,部分用户对“传播”这一环节的感知会弱化,甚至消失。这也意味着一些传统的传播思维受到挑战。对于内容生产者来说,如何既激发用户的传播行为,又能呼应机器的智能传播机制,实现人机协同的传播,也是一个新课题。

注释:

①Licklider J.C.R.,"Man-Computer Symbiosis",IRE Transactions on Human Factors in Electronics,vol.HFE-1,no.1,1960,pp.4-11.

②Douglas C.Engelbart.,"Augmenting Human Intellect:A Conceptual Framework",EB/OL,https://gffggc10856a4696d41aesbvx90oxf66996xwwfgzb.hbpu.wttczd-86544418598.com/content/view/138/.

③R.Parasuraman,T.B.Sheridan,& C.D.Wickens,"A model for types and levels of human interaction with automation",IEEE Transactions on Systems,Man,and Cybernetics-Part A:Systems and Humans,vol.30,no.3,pp.286-297.

④Lee J.D.,& See K.A.,"Trust in Automation:Designing for Appropriate Reliance",Human Factors,vol.46,no.1,2004,pp.50-80.

⑤(11)(12)Hoff K.A.,& Bashir M.,"Trust in Automation:Integrating Empirical Evidence on Factors That Influence Trust",Human Factors,vol.57,no.3,2015,pp.407-434.

⑥Ribeiro M.T.,Singh S.,& Guestrin C.,"Why Should I Trust You?:Explaining the Predictions of Any Classifier"[EB/OL],https://gffgg760181693fa340b9sbvx90oxf66996xwwfgzb.hbpu.wttczd-86544418598.com/pdf/1602.04938.

⑦R.Parasuraman,T.B.Sheridan,& C.D.Wickens,"A model for types and levels of human interaction with automation," IEEE Transactions on Systems,Man,and Cybernetics-Part A:Systems and Humans,vol.30,no.3,pp.286-297.

⑧张亚莉、李辽辽、丁振斌:《组织管理中的人工智能决策:述评与展望》,《外国经济与管理》2024年第10期,第18-38页。

⑨Buçinca Z.,Malaya M.B.,& Gajos K.Z.,"To Trust or to Think:Cognitive Forcing Functions Can Reduce Overreliance on AI in AI-Assisted Decision-Making",https://gffggda2320ea44f64d8esbvx90oxf66996xwwfgzb.hbpu.wttczd-86544418598.com/doi/10.1145/3449287.

⑩黄玉波、李梦瑶:《弹性化边界:智能推荐算法中信息茧房的动态调适与管理路径》,《传媒观察》2025年第8期,第73-83页。

进入 彭兰 的专栏     进入专题: 人机协同   人机信任   推荐算法   大模型   价值对齐  

本文责编:chendongdong
发信站:爱思想(https://www.aisixiang.com)
栏目: 学术 > 新闻学 > 理论新闻学
本文链接:https://www.aisixiang.com/data/176769.html

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2025 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号-1 京公网安备11010602120014号.
工业和信息化部备案管理系统