刘品新:论大数据证据

选择字号:   本文共阅读 120 次 更新时间:2019-07-03 22:43:46

进入专题: 大数据   大数据证据  

刘品新  

   【摘要】大数据开启了证据法制建设的时代转型。将形形色色的大数据材料用作证据以证明案情,是当下司法实践无法回避的一道题目。该现象的背后存在着重要的价值论和方法论基础。概要地说,大数据证据以海量电子数据凝练的规律性认识发挥证明作用,其主要以分析结果或报告的形式呈现。对于这一证据如何定位,各国法律界存在着不同的理论争论和实务处理,主要包括鉴定意见说、专家辅助人意见说、证人证言说等。考虑到大数据证据具有专业性和科学性,中国现实的便宜选择是将其纳入鉴定意见的证据法定形式。对于这一证据如何审查判断,我国应当聚焦真实性与关联性规则进行创新。具体来说,针对海量数据本身的真实性问题,要建设以“大”真实性为主的真实性规则;针对大数据分析结果的真实性问题,要构建判断机器算法是否可信的真实性规则;针对大数据分析结果所揭示的关联性结论,要构建基于整体数据与具体数据分层的关联性规则,特别是探索超越人类经验判断的关联性规则。

   【关键词】大数据;大数据证据;鉴定意见;机器证言;证据规则

  

   一、引言

  

   “大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发……”这是2013年英国学者维克托对大数据改变社会所做的预言。近年来,世界范围内司法领域确实发生了巨变,突出表现为基于机器算法、机器人和高级人工智能等新兴科技的各种大数据材料涌向法庭。

   美国实务中已出现了将汽车事件数据记录系统数据、谷歌地球卫星图像和GPS坐标数据、“查找我的iPhone”功能数据等用作证据的案例。这些材料的特点是数据量巨大,并可被编译为分析报告。如汽车事件数据记录系统(EDR)是专门记录汽车行驶数据的系统,它通常可以在撞车发生前、中、后,按照秒级自动提取车辆运行、系统状态、司机指令、撞车特征等各种数据,以在需要时还原汽车事件真相。我国的司法舞台也上演着同样的故事。早期,海量的通信数据、资金流数据、账户信息、网页数据、网络舆情信息、GIS地理信息及专业数据库的数据被运用于侦查活动中,成为侦查信息化转型的一道道亮丽风景。新近,人们又接续看到将“舆情分析报告”、“百度指数”、“淘宝客反作弊系统数据”、“轨迹大数据”、“公安大数据平台数据”、“证券交易监控系统数据”、“大数据资金分析报告”等用于证明的情景,同时遇到控辩双方产生争议及裁判者任意裁决的种种问题。这些都需要我们针对性地进行制度建设。本文尝试对大数据证据的基础问题作出回应,以期推动实务发展和法制变革。

  

   二、大数据用作证据的理论基础

  

   证据是证明的根据,但并不是一切用于证明的根据都属于法定的证据。在司法实践中,某些可用作证明根据的特定材料会被习惯性地排除出证据范围。一些新生事物常会遭遇这一规律。它们通常难以为人们快速地普遍接受,如视听资料、电子数据等也是经过很长一段时间后才入法正名。现如今,形形色色的、以海量信息特征呈现的大数据材料,便处于寻求获得法律认可的境地。

   大数据材料具有“容量大”、“种类多”、“价值密度低”等特点,尤以“容量大”为基础特征。笔者调研e租宝案件发现,该案在侦查阶段收集的海量数据包括:(1)e租宝及芝麻金融数据;(2)集团OA系统中关于会议、财务、合同的数据;(3)关于公司及其产品介绍的电子数据;(4)涉案人员的手机数据等。它们的数据体量大到难以想象的程度。其中,“e租宝及芝麻金融数据”至少包括从4000多家银行、247家第三方支付平台、164家保险公司、114家券商汇总的1万多个账户的几十亿条资金交易流水信息,“集团OA系统中关于会议、财务、合同的数据”主要是部署在阿里云平台的、涉及200多台服务器的数据。全案数据的总量达到30TB左右。这些海量的数据交由司法人员一条一条地筛选使用根本不现实,但可以借助数据统计、数据碰撞、数据挖掘与机器学习等方法形成分析报告,用作办案支撑。这一现象不是特例,随着司法实践的发展,各种类似的报告还会花样翻新。那么,面对大数据材料,我们是抱陈守旧地将之局限于作为侦查线索,还是将其延展一步用作审判环节的证据?这就需要从基础理论层面进行考量。

   (一)大数据用作证据的价值论

   当下,依靠大数据证明案件事实已经成为一种客观需要。这首先是因为案件专业化、巨型化演变态势所决定的。在越来越专业、复杂的案件中,用于证明案件事实的证据也必然越来越专业、庞杂。当今涉众型犯罪的出现和演变,就呈现出涉案人数不特定、证据巨量的特点。据报道,我国金融领域中涉众型犯罪案件的涉案金额已超过百亿元、千亿元,涉案人员达到十万人、百万人,数额之大、人数之众令人瞠目。笔者调研发现,在一线司法机关办理的涉众型犯罪案件中证据材料就达到数千卷,背后是司法人员庞大的人力与时间付出。此种情形下,仅仅凭借传统证据来证明案件事实面临着难以承受之重。与之相反,通过大数据证明案件事实就明显高效得多,尤其是基于海量数据的分析报告通常浓缩为具体的一份或多份文书证据,使用起来更具可操作性。

   其次,这符合降低司法证明难度的导向。证据是一种稀缺的资源,证据短缺是人类司法的永恒规律。千百年来人类一直在寻找有效化解证明难题的方法,其中包括对新型证明方法的探索与推广。当代,我国面临着惩治以网络犯罪为代表的新型犯罪的艰巨任务,不同层面的法律规范一直千方百计地试图降低证明难度,包括更多引入“综合认定”、“综合评估”的规则,甚至尝试推出含有“证明责任移转”意味的条款。学理上也提出了“底线证明法”、“抽样取证法”、“等约计量法”等建议。若能从直接扩充证据范围的角度进行制度建设,即引入大数据以证明案情,将具有更为深远的意义。实践中,我国许多案件虽未将大数据列明为证据,但仍技巧性地发挥出它的证明作用。这在很大程度上是受制于旧观念,却也反证了司法证明中存在着大量的需求。

   最后,大数据用作证据具有独到的价值。每一份具体的传统证据反映的是案件中具体的人、事、物、时、空等信息;与之不同的是,大数据反映的是案件整体或作为其很大一部分的人、事、物、时、空等信息。这一差异在涉众型犯罪案件中尤为明显。调研发现,涉众型犯罪案件中难以通过传统证据证明的案件事实,都有可能通过大数据材料找到便捷的解题之策。比如,在证明涉众型犯罪案件的组织架构时,传统上调查工商注册材料等证明方法面临着工作量巨大、材料真假难辨的困扰,而海量资金流数据等能够像DNA一样将涉众型犯罪中不同涉案人员识别并关联起来,揭示不同人员在犯罪组织中的具体角色;又如,在证明涉众型犯罪行为人主观故意时,传统的证明方法主要是通过口供或者“通过客观行为推断主观明知”,易遇到嫌疑人以不知情为由进行辩解的挑战,而利用数据挖掘方法则能发现行为人存在着规避打击的习惯做法,从而以犯罪习惯证明其主观故意。目前这样的探索取得了初步成功,表明以大数据化解司法证明难题之路,值得进行实践推广和理论提升。

   (二)大数据用作证据的方法论

   大数据材料并非空中飘来之物,客观上就是一个个具体数据的聚合。当聚合到一定规模之后,将其中的数据规律揭示出来,就能够用于还原案件事实。如在一起涉税案件中,办案人员调取了涉案的全量资金数据——资金流水数据上亿条、账户数达上万个,聘请技术专家“建立了资金特征分析模型……在很短时间内完成可疑资金网络的刻画,利用关系可视化技术清晰展现可疑资金的来源和去向,并且自动标注账号和主体的类别标签”。在这里,起到证明作用的就是海量数据凝练而成的规律性认识——具体呈现为专业分析报告。这是大数据用作证据的特色及魅力所在。

   这样的分析报告类似于鉴定人或其他专家的意见,但也与之有明显不同,其专业化程度已经超越人类的专家。准确地说,其是借助于机器算法形成的判断。在前述e租宝案件中,北京检察机关曾经对海量的电子数据做了分类处理。其中,对于涉案人员的手机数据和产品介绍数据,主要是通过扣押、勘验、检验、远勘的方式形成扣押清单、勘验笔录、数据刻盘、远勘笔录等证据,这是以电子介质的载体和电子数据的内容来证明案件事实; 对于相关的资金流水数据、OA办公系统数据,主要是通过通知调取、扣押、勘验、委托鉴定的方式形成镜像数据、扣押清单、勘验笔录、鉴定意见书等证据,这是以转化性证据来证明案件事实。它们的共同之处是利用证据所蕴含的内容或信息。回看该案的办理过程,司法证明的思路在整体上仍然是将大数据材料转化为传统证据,即以转化性证据办案。如此办案不仅费时费力,而且也呈现出“固守”传统证据的陈旧观念。假如该案能够将基于海量资金数据的各种分析报告( 其时主要是服务于侦查工作) 提交法庭,那就跃升到一个更高级的司法证明层次,即将大数据用作证据证明的新境界。

  

   三、大数据证据的法律地位

  

   从技术原理上讲,大数据变身证据通常要经过三个环节:第一步是汇总数据并进行数据清洗,第二步是建构分析模型或机器算法,第三步是进行运算形成分析结论。这一过程结束后,就会产生大数据证据。为论述的便利,本文将“大数据证据”限定为基于海量电子数据形成的分析结果或报告。在这个定义中,海量的电子数据是“源”,分析得出的结果或报告是“果”。直接起证明作用的往往是“果”——大数据分析结果或报告。当然,在特殊情况下,从海量电子数据中“淘”出来某一条或多条数据也可能起到证明作用。这一条或多条数据也可以被理解为“果”。对于如何为大数据证据赋予合理地位,目前共有如下几种选择方案。

   (一)鉴定意见

   一种主流观点认为,大数据证据应当作为鉴定意见使用。有论者针对“资金大数据分析结论”提出,“最好把资金大数据分析纳入司法鉴定范畴。这有利于司法实践的展开,在法律上也可以找到依据。”在组织传销案件、非法吸收公众存款案件、集资诈骗案件中,确实出现了很多这样的新型鉴定意见书。如在王某某等组织、领导传销活动罪一案中,司法鉴定机构对“××平台后台数据库”进行了检验分析,得出的鉴定意见为:该网站注册账户1×××个,成功激活1×××个;缴纳会费账户1×××个,空单账户1××个……根据推荐与被推荐的层级关系,共计22级;收取会员投资共计26××××××元;除被告人所有的账户外,还有1×××个会员账户共计17××××××元投资款没有返还。”

   然而,鉴定意见本意是由鉴定机构的鉴定人对专业问题做出的专业判断。将大数据证据纳入司法鉴定的范围,必然会遭遇诸多挑战。首先,法条上语焉不详,导致该做法的合法性存疑。我国公安部《公安机关鉴定规则》、司法部《司法鉴定执业分类规定(试行)》、最高人民检察院《人民检察院鉴定规则(试行)》均未将大数据鉴定明确纳入司法鉴定的业务范围。其次,在鉴定方法、鉴定主体等具体细节方面存有障碍。就鉴定方法来说,鉴定机构出具的现有“大数据分析鉴定意见书”显示,采取的鉴定方法通常是《电子物证数据搜索检验规程》《数字化设备证据数据发现提取固定方法》,而其实际检验过程同这两个方法并不完全对应;就鉴定主体来说,“大数据分析鉴定意见书”在很大程度上是由机器算法给出实质判断——不同于以往专家借助仪器设备做出判断,这对于以由专家做出判断的司法鉴定体制是一个过于超前的突破。

(点击此处阅读下一页)

    进入专题: 大数据   大数据证据  

本文责编:陈冬冬
发信站:爱思想(http://www.aisixiang.com),栏目:天益学术 > 法学 > 宪法学与行政法学
本文链接:http://www.aisixiang.com/data/116996.html

0 推荐

在方框中输入电子邮件地址,多个邮件之间用半角逗号(,)分隔。

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2019 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号 京公网安备11010602120014号.
易康网