余成峰:从大数据神话拯救隐私

选择字号:   本文共阅读 2351 次 更新时间:2022-01-13 00:32:29

进入专题: 大数据   隐私  

余盛峰 (进入专栏)  

 

  一

  博尔赫斯曾写过一则短故事,在这个故事里,他描述了一片遥远的陆地,那里的地图学达到了荒谬的极端:地图师们雄心勃勃地绘制了一张精确的地图,跟整个帝国的比例是一比一。博尔赫斯讽刺地写道:子孙后代根本找不到这张笨重地图的实际用处。于是,这张地图就这样烂在了沙漠中,并和它代表的地图学一起随风而逝。

  博尔赫斯的地图悖论是:如果地图和地理同样庞大,那么地图也就丧失了存在的意义。但当大数据技术兴起,这一悖论似乎有了新的解读可能。当数据存储、处理和展示的能力足够,一张与帝国比例相同的实时数字地图,理论上已不再是天方夜谭。

  对于美国《连线》杂志前主编克里斯·安德森(Chris Anderson)来说,博尔赫斯的讽刺本身就是讽刺。在二〇〇八年著名的《理论的终结:数据洪流淘汰科学方法》一文中,安德森宣告,面对海量数据,“假设、模型、检验”的一系列科学方法正变得过时。我们可以停止寻找模型,在不经假设的前提下对数据进行分析,将数据投入尽可能大的计算集群,让统计算法找到科学未能寻找到的模式。

  安德森介绍了科学狂人J.克雷格·文特尔(J.Craig Venter)“鸟枪法”基因测序的工作。通过高速测序仪和超级计算机对大数据进行统计分析,文特尔先是对单个有机体测序,接着对整个生态系统测序。二〇〇三年,跟随库克船长的航程,他对大量海域进行了测序。而在二〇〇五年,他开始对空气展开测序。在整个过程中,他发现了数千种以前未知的细菌与其他生命形式。

  与现代性主要基于个人意向思考和社会自由沟通的理性模式不同,大数据的技术原理主要依循后验性的推断。它并不预设任何前瞻性标准,而是通过历史数据的搜集、回看与整理,从混沌的数据海洋中回溯性地挖掘可供算法自主运作的模式。正如麦肯齐(D.A.MacKenzie)在《引擎,而非照相机:金融模型如何塑造市场》中所说,将过去作为线索,以推断不可知的未来。

  大数据的运行基于自我指涉(self-reference)的技术系统闭合性。这要求摆脱人类意志的干预,排除外界意见交流的干扰,通过自身算法和代码的设置,完成数据挖掘与概率预测的全过程。例如,网络平台的个性产品推荐和广告分发,就不再需要专家系统或市场调查机构的帮助,也不再预备各类前期知识与相应的假设,只需要经由机器学习,通过特定的算法机制自动在全平台流通的信息中搜索、比对和分析,从而产生新的可用知识。这类知识主要基于历史与实时行为数据的存储记录,通过特定的算法技术赋予信息以结构,提炼其相关性模式,用以预测和指导后续的运作方向。借助互联网时代海量的数据规模,以及各种用以过滤、筛选与再合成历史信息的算法技术开发,从而将冗余的数据资源通过新的循环和再利用机制,转化为一种具有自我观察与自我指向功能的技术装置。

  正因如此,基于“数据完备性假设”的大数据强调定量先于定性,在这种认知信念下,海量的数据和统计学工具为理解世界提供了一种全新的方式,“相关性取代了因果关系;即使没有自洽的模型、统一的理论或真正的机械论解释,科学也会进步”(安德森语)。因果是主观的,数据是客观的。大数据相信表象世界背后的概率相关性,从而拒绝任何带有主观色彩的因果设定。世界虽然高度复杂,但此种复杂性只是一种既定的、可被算法有效化约的可计算对象。于此,大数据为我们许诺了一个社会物理学的美丽新世界,在这个新世界中,最关键的是掌握所有颗粒(你和我)的隐私细节。一旦掌握了所有细节,便可以设计出更为公平、智能和高效的企业、组织与社会,这便是大数据所宣扬的“微粒社会”(The Granular Society)。

  二

  但是,博尔赫斯的讽刺是否具有更为深邃的内涵?大数据技术是否已完全破解全景帝国地图的悖论?大数据的可能性及其限度是什么?对此,意大利社会理论家埃斯波西托(Elena Esposito)提出的创见颇具启发性。她的惊人发现是,大数据理性不同于现代科学理性,而存在某种“返祖”现象,它与古代近东、希腊和中国的占卜术有异曲同工之妙:关注表象、相关性、展示先于提问、完美记忆。

  事实上,在近代科学革命之前,占卜术长期是知识发现、行动决策和应对不确定未来的重要手段。古典学家韦尔南总结了占卜理性的认知结构:强调必然性,否定偶然性,摒弃对于事件线性因果关系的追索,核心是揭示万事万物的同源性、相关性以及宇宙的命定秩序。因为,在占卜世界中,所有现象都是其他现象的征兆,并不存在非对称的线性因果关系;无论是鸟的飞行轨迹、动物肝脏、星宿迁移、龟甲裂纹、水纹波动,都暗藏了宇宙秩序的玄机,可以用来解释所有其他未知事物。根据法国汉学家汪德迈的研究,占卜理性乃以形态学为基础,关注事件之间的关联,忽视因果链,重视图形组合变化,以此代表与每一个无穷尽的新变化相应的宇宙状态的整体变化。因此,占卜理性恰与神学理性相区别,后者将每一事件解释为神意,每一事件都是神意设计的结果。神意安排是手段,超验是目的,而此种神学目的论恰恰也正是因果思想的生发基础。

  如汪德迈所说,占卜术把现象世界的无穷偶合转化为几种格式化的、付诸计算的知性。它的工作原理是高度技术化和程式化的,“卜”的类型化是对无数未设定的卜兆的抽象,从而成为可标准化操作的信息一般化媒介。与占卜理性指向宇宙世界的技术类似,大数据则以人的数字痕迹作为勘察资源。大数据预设的世界图景也同样屏蔽了偶然性的存在,一切事物无非是数字比特和信息熵潮起潮落的映射,不需要探究现象的深层目的与意义指向,而只需在数据的表面搜索其概率空间和模式变量。与占卜术的指导原理相同,大数据技术同样假设在事物之间存在同时性原理,万物在终极数学意义上可以相互操作,从而形成控制论意义上的数字相关性。它同样无需在过去和未来之间,在原因与结果之间,在问题和答案之间,建立直接的因果律关系,无需理解、诠释与沟通其深层意涵。相反,代码、算法和数据的同步化运行,借助人工神经网络与深度学习技术,就可以为我们呈现事物的潜在秩序。正如我们无法挑战神谕,我们也同样无法对大数据提供的答案置言。与占卜术一样,大数据的基本目标也是通过展示世界的隐匿秩序来指导未来,进而控制与塑造未来,或者说,它们都是一种去时间的时间性技术。

  在十七世纪之前的基督教世界,时间乃是上帝永恒注视下的概念,而在十七世纪之后,时间变成一个“反身性”(reflexive)的概念,人类主体作为“观察者”开始打破整体的永恒时间,通过当下的行动介入,干预从过去朝向不确定未来的进程。这种新的启蒙时间观,在一系列分类学(Taxonomy)、本体论(Ontology)和认识论(Epistemology)的支持下,成为现代国家与各大社会系统建制的基本动力。

  首先产生于欧洲的现代科学与法律理性,同时预设了世界的可知性和偶然性,科学与法律的目的并非寻找世界的必然真理,而是在持续的命题假设和反复的辩驳验证中形成可供进一步讨论与廓清的结论。与现代科学传统一样,现代法律方法论主要通过各种法律理论、命题和学说,对不同法律事件、证据与法律规范的因果关系进行推论解释以及合法性证明,其应用场景通常围绕当事人的沟通行动以及抗辩活动展开,主要围绕法律人格、法律行为等主观意向性概念建构体系。在这种理性传统下,现代法律需要不断的质疑、提问以及意义的诠释,其关键是通过原则的意义解释,回应当事人在特定案件语境下深层正义需求的冲突,以此克服硬性法律规则的僵滞。意义诠释提供了面向不确定的未来实现价值持续更新的动力。这要求现代法律主体必须同时具备观察能力、行动能力与反思能力。而大数据神话的信条则预设过往历史业已囊括了未来的所有线索,无需意义的因果建构,无需深层的价值追问,最关键的只是数据、速度以及效率。如果说,现代理性需要不断突破事物表象,探寻事件背后的原因、机制和意义,而大数据理性则坚称只需返回表面的关联,而无需深入探究和反思社会深层结构的原理。

  事实上,整个现代科学、道德与法律传统都建立在对于因果理性的思考之上。命题假设和实验证明、理性选择与道德责任、规范预期和法律后果,都有赖于因果推断及其意义解释作为基础。更关键的是,因果思维为人类文明演化提供了一种反事实推理(what-ifs)的能力,提供了某种基于模态逻辑(modal logic)进行社会想象与世界创造的可能。在韦伯新教伦理的论述中,反对现状的救赎期望也正是一切现代道德行动和科学思想的基石,回溯过往的行为以及设想其他可能情境的能力,成为一切自由意志与道德责任的基础。

  近代以降,我们生活在一个以因果科学为基础的时代,占卜理性对宇宙命定秩序的探寻逐渐沦为前现代的迷信和僭妄。现代科学与法律理性都必须借助理论学说、命题假设和方法论操作,将理性结论通过可操作与可验证的机制反复辩驳。换言之,现代真理始终是有边界的、不完美的、有条件的,真理不是必然的而是偶联的,是据时间、空间和观察者视角的不同而随时发生变化的。正因如此,现代社会的运行同时预设了各种自由与民主论证的制度架构的存在。

  现代性的核心特征在于由人类行动本身的不确定性所决定的未来的高度开放性,而占卜理性的式微在于其宣示宇宙秩序的必然性。正因如此,由于同样不能回应现代世界的偶联性和不可决定性特征,大数据技术与现代社会的理性文化构成了深刻冲突。

  三

  卢曼使用“双重偶联性”(Double Contingency)概念概括现代社会的核心特征,即社会是由互为黑箱的隐私个体在无法确知彼此意图的状态下互动演化的。世界的复杂性正来自此种隐私黑箱所带来的微妙状态。这种不确定性决定了人类必须在各种可能性中主动或被迫进行选择,从而存在各种期望落空、事与愿违和突发意外的可能。但在隐私保护下,这种不确定性不会构成对未来行动机会的毁灭性打击,从而提供了不断自由试错的空间。同时,隐私也让现代主体获得突破任何既定秩序的能力,为新的因果可能性探索提供了庇护所。而在这个意义上,大数据技术由于难以把握双重偶联性的深度,它只能依照历史数据的相关性映射出某种简单的概率模式,它无法真正理解社会沟通的不可预测性,而只是借助算法机制强行遮蔽与简化人类社会的复杂性,并以此限制新的社会想象和实践探索。而从根本上说,这一困境无法通过数据本身的规模与处理速度的提升解决,这是由大数据和占卜技术所共享的理性模式所决定的。

  现代性的文化演化依托于个体隐私的丰富和深度,隐私保护个人心理的黑箱不被外部洞穿与支配,以此应对各种例外情况和不确定性,这成为一系列现代自由价值发育的基础。现代法律因此假定个体身份的独特性与不可决定性,隐私保护从而在现代法律中承担了至关重要的权利功能。在隐私权保护背后,实际上蕴含了整个现代法律人文主义的基础假设,即作为自由个体的心理情感深度、社会角色蕴含的行动和沟通潜力,及由因果归责所捍卫的自主道德尊严。换言之,现代主体的隐私深度从根本上排斥外在的监控与干预。

  美国法学家莱斯格(Lawrence Lessig)在《代码2.0》中指出,现代宪法所保护的包括隐私在内的法律价值,事实上依赖于技术能力的局限所带来的制度性生态平衡。而当技术能力转变,大数据等数字技术迅猛发展,现代隐私权所扎根的生态系统开始面临深刻危机。

大数据的运作结构及其智能机制具有独特性,海量数据经由算法挖掘生成特定的知识,无需调用任何个人的动机或意向。因此,大数据技术对隐私的影响,也不同于传统隐私的侵权类型。核心表现在于,大数据技术并不指向因果性质的刺探与入侵,而是围绕对社会群体相关性行为模式的挖掘。它无需意图邪恶地深入掌握不可告知的个人秘密,而以日常的信息基础设施捕捉各类数字化的表面踪迹(点击此处阅读下一页)

进入 余盛峰 的专栏     进入专题: 大数据   隐私  

本文责编:admin
发信站:爱思想(http://www.aisixiang.com),栏目:天益综合 > 天益读书
本文链接:http://www.aisixiang.com/data/130895.html
文章来源:《读书》2022年1期

2 推荐

在方框中输入电子邮件地址,多个邮件之间用半角逗号(,)分隔。

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2023 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号-1 京公网安备11010602120014号.
工业和信息化部备案管理系统