姬德强:深度造假:人工智能时代的视觉政治

选择字号:   本文共阅读 235 次 更新时间:2021-09-09 15:19:22

进入专题: 深度造假   后真相   视觉政治   人工智能   平台化  

姬德强  
期待在人们对音视频内容失去信任之前,思考如何培养记者乃至全体公众的新素养,以严肃对待如下问题,包括:视频或音频文件中是否有小问题和不一致?你是否相信信源?你能发现佐证的片段吗?记者们如何检查地理定位和其他元数据?值得注意的是,虽然深度造假的危害正在显现,但这一后果并不会均衡发生在每一个人身上。数字鸿沟的存在会同时限制和放大造假的影响。他们提出,深度造假更多出现在那些弱势社群中间——在那里,主流媒体的使用率很低或者没有,而假消息却往往在封闭的社交网络中被分享和散布,或者更多出现在脆弱的国家里——在那里,信任本来就低,人们也易受阴谋论的影响。换句话说,深度造假技术虽然如下文所说,会被各种政治势力所利用,成为欧美国家后真相竞选政治中的新式武器,但在新闻权威和国家能力依然强大的国家,就不会直接挑战主导的舆论秩序,而是借助社交网络散布,成为大多数社会下层民众的替代性消费内容。尽管如此,深度造假给当代社会带来的最大危机依然是人们对任何事情的默认的怀疑态度,这将在腐蚀新闻业的可信性的同时,给社会带来更多的不确定性,乃至可能的灾难性后果。

   因此,深度造假不仅是一种技术迷思和技术景观,而且是一个充满变动的权力场域。这一场域受到多种政治、经济和技术力量的干预。自2017年出现并流行以来,关于深度造假的最具代表性的怀疑论点来自被虚假信息和假新闻所动摇的理性主义真相观,尤以新闻专业主义为代表。然而,本文认为,真相的瓦解与重建并不能改变深度造假的技术趋势,需要关注的应是深度造假如何参与型构了新的平台控制,并依托怎样的经济动能完成平台的可持续再生产。

  

   二、深度后真相:理性主义视野中真相的最终瓦解?

  

   有关真相瓦解的悲观论调在深度造假的技术运动中得到延续,并主导了政治和媒体议程。后真相的内涵在渐入平庸之后借助深度造假重获了关注。

   随着算法的完善和使用成本的降低,这一以人脸为改造对象的深度造假技术开始进入竞选政治、社会政策和社交媒体等领域,引发了有关后真相及其背后的政治驱动力的进一步讨论。比如,奥巴马批评特朗普愚蠢的合成片段,扎克伯格声称反对数据被盗的讽刺视频,深度造假给2020年美国总统大选带来的潜在政治风险(Hall,2018),以及因真假愈加难辨而给民主造成的威胁,等等。

   深度造假之所以被政治和社会领域所关注,恰恰是由于精确换脸对这些领域中真相的认识论的进一步瓦解,以及造成的有关传播失序的道德恐慌。眼见并不为实,深度造假是信息灾难的前兆(Paris&Donovan,2019)。如此悲观论调正在政治家、媒体和社会公众中间散播。始自2016年的后真相和假新闻,如今升级为更具颠覆力的深度造假,进一步挑战着传统的真相观,或者更精确地说,传统上拥有真相定义或制造权的专业权威。本文将这一新阶段称为“深度后真相”(deep post-truth)。

   延续理性主义的逻辑,“深度后真相”具有两个方面的特征。

   第一,视觉客观性的瓦解。自从摄影术、视频、射线扫描技术出现以来,视觉文本的客观性就在法律、新闻以及其他社会领域被慢慢建立起来,成为真相存在——或者更准确地说,建构真相——的最有力证据。“眼见为实”成为这一认识论权威的最通俗表达;与此同时,视觉文本的制造者和阐释者也顺理成章地成为真相的最权威定义者和阐释者(Paris&Donovan,2019)。在这个意义上,视觉客观性产自一种特定的专业权威体制。然而,深度造假的技术优势和游猎特征,使得这一专业权威体制遭遇前所未有的挑战。借助这一体制生产的视觉文本,深度造假者替换了不同乃至相反的文本内容和意涵,造成了文本的自我颠覆,也就从根本上颠覆了这一客观性或者真相的生产体制。除此之外,借助“云服务+终端”的平台化网络架构,更加廉价和智能的深度造假终端应用进一步扩大了这一体制瓦解的负面效应。借助符号学的基础理论,深度造假看起来改造的是能指,却通过干预意指过程,深刻地改变了所指。通过对能指和所指关系理据性(隋岩,2014)的打破,深度造假打破了符号的社会共识,也就从根本上改变了社会的意义和价值空间。对视觉文本的广泛不信任将严重影响社会的政治进程和传播秩序。

   第二,新闻专业主义的自我救赎。这无疑是新闻专业主义权威在后真相时代的瓦解与重建的新阶段。“如果大众感兴趣的是色情视频,那么媒体更愿意讨论政治问题”(Leetaru,2019)。面对视觉化后真相时代的到来,在更具传播力和煽动性的深度造假视频面前,传统媒体的解决方案依然是回到兼具意识形态和操作规范的专业主义。比如,为了应对深度造假的来临,《华盛顿邮报》设立了“媒体求证委员会”(Media Forensics Committee),汇集了视频、摄影、视觉、研究、平台和新闻编辑在内的各种力量,通过内部训练提升甄别深度造假的能力。委员会由该报的伦理与标准以及研究与发展两个小组负责领导。除此之外,《华盛顿邮报》还通过举办训练工作坊、与学术机构合作等方式,来探索如何用技术来抵抗这一问题。那么,如何甄别或检测出深度造假的视频和行为呢?《华盛顿邮报》的“媒体求证委员会”总结了如下几个方面:第一,核查来源。这也是新闻媒体最惯常使用也是最有效的办法,即联系或查找视频来源;如果联系不到视频的发布者,可以通过InVID等工具查看元数据,或者与Storyful等其他内容验证机构合作。该委员会认为,技术本身不会从根本上解决这个问题,人(尤其是新闻媒体的从业者)才是这一过程的关键。第二,找到影像的旧版。深度造假往往基于网上获取的已有视频。一些反向视频查找工具可以帮助找到这些影像的旧版本,比如Tineye或Google Image Search等。第三,也是比较专业的做法,是利用Final Cut等编辑软件,一帧一帧地检查脚本,从而找到那些明显的小问题,比如嘴部的模糊或不自然的光线。对音频来说,可以细致检查其中是否有不自然的语调、非常规的呼吸,听起来像金属的声音,明显的编辑问题等。当然,需要注意的是,被压缩的视频往往也会呈现出一些上面提到的问题,所以,有时也很难单凭上述标准来断定视频是否为深度造假。这是一个目前尚无法完全解决的矛盾(Marconi&Daldrup,2018)。

   在拥有深度学习能力的深度造假技术面前,传统媒体依然坚守了基于主客体二元论和新闻业独立性的专业主义立场,认为成就自身专业水准的那些能力依然可以保证真相的可获得性。正如迈克尔·舒德森在面对后真相的现实时所重申的那样,专业主义的独立合法性通过以下方式保证“真相”的生产,即:及时收回、更正错误表述,并通过含蓄或公开的方式致歉;依赖准确、两面证据、跟踪事态发展等专业准则;以及记者的职业特征,比如冷静陈述、搞清楚消息来源、使用权威信息和追踪、展现与直觉相反的证据和线索(舒德森、周岩,2017)。然而,虽然拥有这些制造真相和核查真相的专业技术,但深度造假快速崛起的现实以及传播与核查之间富裕的时间差,使得传统媒体在多大程度上能够有效应对网络化生产和散布的造假视频,乃至继续扮演民主的守门人角色,成为一个难以回答的问题。当下,深度造假可能是假新闻在质量上的变化,也就是采用包括人工智能在内的更加复杂但越来越廉价和可以被用户端所轻易使用的技术,未来也可能在数量上超出以往任何时期(Alibašić&Rose,2019)。

   “事实将会进一步失去效力,因为伪造的视频和图像正在变得更加复杂。这让那些最为基础的材料来源也值得怀疑。”(Fillion,2018)如上文所述,如果传统媒体的做法可以被称为一种精英主义专业主义在面对深度造假时的延续,那么,除了应对方式的有效性可能有限之外,一个有关后真相的老问题也在延续,那就是后真相本身的去语境化话语。正如支庭荣、罗敏(2018)在对“后真相”话语的梳理中所指出的,“‘后真相’是西方政治失灵和新闻失范的产物,而当下的西方媒体实践中的事实查验并不能从根本上扭转媒体秩序”。

   历史地来看,“换脸”并不是一个新现象,它曾经是好莱坞的技术优势和工业化标签,就其叙事而言,是赛博格时代“一种描绘我们的社会现实与身体现实的虚构,同时也是一种想象资源,预示了成果颇丰的联系”(哈拉维,2018)。然而,人工智能驱动的“换脸”技术的去工业化和大众化,以社交网络为代表的互联网平台公司捕捉这一技术运动的商业主义动机,使得“换脸”本身从想象与物质的浓缩转化为单纯的物质化行为,从而往往超出了真假之辩,而是与表达的具体社会语境以及创造新的流量增长点紧密相连。眼见为实、眼见为虚,均止于认识论。而对深度造假而言,眼见为“要”,目的是通过编辑或合成视听,表达特定的观点,塑造特定的舆论,动员特定的行为,以及贡献于特定的平台经济等。纵观全球,竞选政治、新闻、网络社交上的自我展现等都是被深度造假技术所瞄准的领域,它们所引发的有关隐私、政治宣传和后人文主义的伦理论争也在持续发酵。

   简而言之,深度造假正在展现出丰富的视觉政治经济学,影响乃至控制着人们对政治世界和社会政策的认知,也因其多义性使得不同意见群体可以进行多元解释(Bucy&Joo,2019)。在进一步瓦解真相的理性建构观的基础上,深度造假,正在形塑着崛起中的平台社会。在这里,人与人的互联被数据化、商品化和互联网平台的算法选择或者说算法偏见所型构(van Dijck,Poell&de Waal,2018)。真与假的二元对立关系被替换为渠道与内容的供需关系,复杂的政治后果背后隐藏着平台经济的精明算计。

  

   三、视觉控制:深度造假的政治内涵

  

   伴随着眼见不一定为实或者说眼见是否为实不再那么重要的时代的到来,深度造假带来的是怎样的视觉政治?是更多的视觉控制还是更大的视觉赋权?是对既有权力的夯实还是瓦解?它给当下和未来的政治传播生态将带来怎样的改变?

   随着深度造假被广泛使用,其侵入政治领域所激发的有关真假与民主的关系的讨论,再次加深了社会对后真相时代的体认。Alphabet旗下智库Jigsaw的研发总监Yasmin Green说道:“如果说,过去几年有什么可供借鉴的教训,那就是虚假视频将越来越多地被用于推进政治议程。”(K线财眼,2018)正如2016年以来,后真相时代的假新闻的出现“恰逢”全球范围内政治诚信的危机和民粹主义政治的兴起(Alibašić&Rose,2019),深度造假自然也是这一“历史巧合”下的产物或者延伸,而视觉传播赋予了深度后真相生命力。

首先,在西方,深度造假干预政党竞选并扩大政治分裂。围绕深度造假的讨论大多与2020年美国总统大选有关。2016年以来,深受假新闻和社交媒体干预的美国竞选政治,在快速发展的传播技术面前表现得异常紧张。电影人Jordan Peele曾使用深度造假技术,借用奥巴马的脸来向公众发出警示,警惕深度造假的危害。但深度造假视频的病毒式传播往往早于对于假视频的识别结果,尽管或早或晚会被证实造假,但在这一时间差内,造假视频借力社交媒体平台的传播效果已经显现,而改变人们已经形成的认知变得异常困难。在这个政治语境中,深度造假并不是简单地加剧了真与假的分离,而是进一步撕裂了政治鸿沟,从而导致更加严重的社会分裂,以及更极化的政治立场和更激化的社会矛盾。(点击此处阅读下一页)

    进入专题: 深度造假   后真相   视觉政治   人工智能   平台化  

本文责编:hanzhirui
发信站:爱思想(http://www.aisixiang.com),栏目:天益学术 > 新闻传播学 > 传播学实务
本文链接:http://www.aisixiang.com/data/128460.html
文章来源:《新闻大学》2020年第7期

0 推荐

在方框中输入电子邮件地址,多个邮件之间用半角逗号(,)分隔。

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2021 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号-1 京公网安备11010602120014号.
工业和信息化部备案管理系统