《个人信息保护法》既是保护法,也是促进法。已有学者注意到《个人信息保护法》第27条同时体现了对效率与公平问题的关注,但对于已公开个人信息的合理处理范围,司法实践及学理研究皆莫衷一是。既有观点大多注重引入外部理论,但因其价值中立或者价值偏向特质,往往难以真正解决信息主体与信息处理者间的价值判断冲突。本文意图回归《个人信息保护法》,在原则层面重释目的限制原则,并在规则层面对重大影响、拒绝权和告知义务进行体系化解析,以期构建一个已公开个人信息合理处理范围的完整认定框架。
一、已公开个人信息合理处理范围认定路径的考察与反思
围绕已公开个人信息合理处理范围的认定,学界多尝试从《个人信息保护法》外寻求基准。事实上,这些外部理论具有价值中立或者价值偏向特质,以其作为已公开个人信息合理处理范围的标准,可能遮蔽《个人信息保护法》已作出的价值权衡,即以促进个人信息合理利用为底色,通过“合理的范围”兼顾个人信息权益保护。
(一)对学界既有观点的简要考察
1.路径一:适用《民法典》中的人格权规则
有观点认为,可以利用《民法典》第998条关于人格权侵权认定规则中的考量因素及其协动方式,审查已公开个人信息的处理范围是否合理,其理由在于:一方面,虽然《个人信息保护法》是特别法,但由于个人信息权益具有人格权属性,故而可以借助一般法中的规则认定个人信息的合理处理范围;另一方面,第998条具有动态体系论的基因,借助其弹性特点进行认定,能够在具体案件中兼顾多方利益。本文认为,不宜使用《民法典》第998条及动态体系论判定已公开个人信息的合理处理范围。适用该路径的首要困难在于《民法典》第998条规定本身具有内在的不确定性。《民法典》第998条以动态体系论为理论基石,而动态体系论的初衷不仅是对抗概念法学之僵硬性,而且在于对抗自由法学之恣意性。若片面强调结果的弹性化,便有背离其克服不确定性之初衷的风险,因而必须以基础评价和原则性示例加以限制。如《民法典》第998条虽然可为判断合理处理范围提供“行为的目的、方式、后果”等考量因素,但这些要素的权重不明,也缺乏相应的基础评价和原则性示例,因此必须回到《个人信息保护法》中寻找判断基准。
《个人信息保护法》已实现了对《民法典》第998条和第1036条的更新。具体而言,《个人信息保护法》第13条第1款第6项,已经将《民法典》第1036条第2项的“合理处理”,细化为“依照本法规定在合理的范围内处理”,此举使得判断已公开个人信息处理是否合理的标准被引致至《个人信息保护法》。例如,第6条中的目的限制原则替代了对“行为的目的、方式”的宽泛考量,“对个人权益有重大影响”则替代了对“行为后果”的模糊评估,而“明确拒绝”为考量处理者的“过错程度”提供了一个清晰的标准。
2.路径二:引入公法上的比例原则
有观点认为,“在合理范围内处理”的判定与个人信息处理原则联系密切,天然地契合比例原则的要义,故可引入比例原则作为评判分析工具。本文以为,不宜引入比例原则作为判断已公开个人信息合理处理范围的标准。因为比例原则只是一种价值中立的论证框架,而非一套实质法哲学理论。如果说比例原则蕴含着某种价值,那么它只是“合比例性”这种形式价值或关系价值,而非任何实质价值或目的价值。当这样一个价值中立的框架被直接应用于已公开个人信息利用这一充满内在价值冲突的领域时,就会暴露出明显的局限性。以转载裁判文书为例,两级法院对处理行为是否合比例的判断,很大程度取决于裁判者预设的价值立场:当站在信息主体的立场时,便可认定以营利为目的转载行为因未征得当事人同意,而构成非法使用他人个人信息;而站在信息处理者的立场时,便可认定信息处理者基于公开渠道收集并在其合法经营范围内向客户提供已公开裁判文书的行为,属于对已合法公开个人信息的合理使用。
更关键的是,将比例原则作为独立的外部标准直接适用于对合理范围的判断,实际上遮蔽了《个人信息保护法》自身的规范构造。可以说,第27条本身即是立法者运用比例原则进行价值权衡后,所形成的具体规则。“合理的范围”并非要求司法者在个案中从零开始进行抽象的利益衡量,因为立法者已经事先通过设定目的限制原则、对个人权益造成重大影响等具体要件,预先内嵌了对处理目的之正当性、处理方式之适当性和必要性以及权益影响之合比例性的考量。质言之,《个人信息保护法》已提供了相较于比例原则更具体且更优先的判断工具,与其诉诸一个一般性原则并再度陷入司法裁量中的价值判断困境,不如回归《个人信息保护法》中为本领域量身定做的规则。
3.路径三:借鉴法经济学中的卡—梅框架
学界有观点利用卡—梅框架分析已公开个人信息的合理处理范围,主张对于意定公开个人信息的处理应当以财产规则为核心分析框架,以信息主体的意思作为认定信息处理行为是否合法的判准;对于法定公开个人信息的处理,则应以责任规则为核心分析框架,限制信息主体的拒绝权。卡—梅框架的核心在于,当权利人与意图使用者之间的交易成本较低时,应采用财产规则保护,即除非经过权利人的同意,他人不得获取该权益;而当交易成本过高,以至于自愿交易难以达成时,则应采用责任规则,允许他人在支付客观确定的损害赔偿后获取该权益。但是,该框架在个人信息场景下难以适用:一方面,已公开个人信息的利用通常由信息处理者单方面进行,几乎不存在自愿交易,信息主体难以获得经济利益,因而财产规则适用空间狭窄;另一方面,即便个人信息权益受损,由于单条个人信息价值低微,个人往往不会选择诉诸法院“拿回”补偿,责任规则因此沦为强制使用而非责任平衡。
《个人信息保护法》也未采纳卡—梅框架的效率至上逻辑,而是意图兼顾对个人信息权益的保护和对个人信息合理利用的促进。第一,已公开个人信息中的同意或拒绝,不同于财产规则中的自愿交易。卡—梅框架将是否适用同意规则系于交易成本之高低。而在已公开个人信息中,《个人信息保护法》一方面将个人的“未明确拒绝”,推定为对他人在合理范围内处理的同意,以促进利用;另一方面尊重了个人的明确拒绝,并要求信息处理者在处理活动对个人权益有重大影响时取得个人的同意,以兼顾保护。第二,《个人信息保护法》否定了责任规则的适用空间。卡—梅框架下的责任规则,本质是一种“付费即可侵权”的逻辑。但依据《个人信息保护法》第66条,对违反《个人信息保护法》的行为,监管机构不仅可以没收违法所得,还可以处以高额罚款,以遏制大规模侵害个人信息的行为。
(二)对学界既有观点的反思
既有典型认定路径效果不佳的共同原因在于,对外部理论的过度依赖,可能导致立法者已作出的权衡被遮蔽。一方面,利用动态体系论和比例原则等价值中立的分析框架,实际上是将《个人信息保护法》经权衡而作出的回答,还原为一个需要司法者重新回答的问题;另一方面,利用卡—梅框架这类本身预设价值立场的分析框架,则因其价值偏向与立法者所作决断不吻合,而有扭曲《个人信息保护法》规范意旨的可能。为避免司法裁量的恣意,我们必须回归法律文本自身,探寻立法者已经作出的价值决断。恰如价值评判法学所指出的,司法判决“就其本质而言,应该适用法律的价值判断,而不能根据(法官)自己的价值判断来做出”。当然,这并非主张排斥一切外部理论,而是主张外部理论在事实评价等方面要受制于教义学本身。
《个人信息保护法》在第1条便开宗明义地表明了其基本价值判断。该条规定“为了保护个人信息权益,规范个人信息处理活动,促进个人信息合理利用,根据宪法,制定本法。”可见,《个人信息保护法》既是保护法也是促进法,其通过规范个人信息处理活动,来兼顾保护个人信息权益和促进个人信息合理利用。这一平衡保护与利用的根本价值判断,为我们解释已公开个人信息利用的合理范围划定了基准。首先,必须承认,已公开个人信息处理规则的底色是促进信息的流动与利用。但在此基础上,《个人信息保护法》设置了“合理的范围”这一限制,作为实现利益平衡的机制。该机制由一系列具体规定构成:其一是第27条明文规定的限制,也即个人的拒绝权,以及在处理行为“对个人权益有重大影响”时,处理者需另行取得个人同意的义务;其二是第27条中未提及但依体系解释应遵循的限制,这包括但不限于第6条规定的目的限制原则以及第17条等规定的告知义务。其中,位于总则部分的目的限制原则是规制个人信息处理行为的“帝王条款”,构成了判断合理范围的逻辑起点。下文将首先就此展开分析。
二、目的限制原则在已公开个人信息处理中的适用
艾伦·威斯汀于1967年提出目的限制原则时,其目的在于遏制信息处理者滥用“权力”,保护个人信息权益。而在当代,数据已经成为“新的石油”,其经济价值日益凸显。如何平衡个人信息权益保护与个人信息利用,已成为目的限制原则需要回应的核心问题。
(一)我国目的限制原则的内涵
欧盟通过目的兼容原则缓和保护与利用的矛盾。艾伦·威斯汀提出的目的限制原则要求,政府所收集的个人信息只能用于特定目的,不得用于其他目的或者进一步流转。但目的特定原则面临的最大挑战是数据处理者在后续数据处理中会或多或少地偏离数据收集时的目的。因而为缓和目的特定原则适用的僵硬性,欧盟GDPR采用了“目的兼容”的表述,允许信息处理者对信息执行与初始目的相互兼容的所有操作。由此,目的特定原则和目的兼容原则便组成欧盟GDPR中的目的限制原则。
我国《个人信息保护法》第6条规定的目的限制原则虽借鉴于欧盟GDPR,但未完全照搬其规定,而是做了更为严格的规定。一方面,《个人信息保护法》使用的“明确、合理的目的”相较于GDPR中“特定的、明确的、合法的目的”更为严格,内涵也更为丰富。“特定(specified)”和“明确(explicit)”在GDPR中是不同的要求:前者限定了控制者可使用所收集个人数据的目的范围,着眼于目的之范围;而后者强调目的应以清晰、可理解的方式披露、解释或表达,着眼于目的之表达。二者未必一致,例如“一揽子”授权、概括同意等方式虽明确但不特定。“合理”则是实质性价值判断,其至少要求目的不违反法律法规和公序良俗,除此以外,还要结合具体处理场景、处理行为进行判断。此外,通说还认为目的限制原则要求目的特定。因此,我国的“目的合理”其实内嵌了目的合法和目的特定的意蕴,但又不止于此。另一方面,《个人信息保护法》中的“直接相关”较GDPR中的“目的兼容”也更为严格。“直接相关”要求信息处理者的个人信息处理行为能够直接推动处理目的的实现,个人信息处理行为与达成个人信息处理目的之间不应有中间环节;而“目的兼容”则允许信息处理者开展对初始目的相互兼容的所有操作。
(二)已公开个人信息中“处理目的”的理解
对于处理已公开个人信息是否应遵守目的限制原则这一问题,学界存在争议。《个人信息保护法(草案)》(二次审议稿)曾规定“个人信息处理者处理已公开的个人信息,应当符合该个人信息被公开时的用途”,后颁布的正式文本将其修改为“在合理的范围内处理”。有观点认为,可借鉴二次审议稿提出的标准,判断对公开个人信息的处理是否属于“合理的范围”,也有观点认为《个人信息保护法》“在合理范围内”的表述,意味着立法放弃了“符合初始公开用途”的限定。本文认为,处理已公开个人信息应遵守目的限制原则,但可以通过宽泛解释“处理目的”,以契合实践需求。目的限制原则位于《个人信息保护法》的总则部分,对于同意以外的其他合法性基础也具有重要的指引作用,同时由于规定“与处理目的直接相关”是对目的特定原则的松绑,因此将“直接相关”解释为必须“因果关系紧密”可能过于严苛。有观点将“直接相关”理解为“兼容”,即只要与公开目的兼容便可认定为符合目的限制原则。但与其解释“直接相关”,不如解释“处理目的”。即,将已公开个人信息处理活动中的“处理目的”解释为“处理行为本身的目的”而非“公开目的”。只要对已公开个人信息的处理出于合理目的,而且这一目的以明确的方式表达,实际的处理行为也与该目的直接相关,那么便应当认为这一处理行为符合目的限制原则,而不再要求处理行为与公开目的直接相关或者兼容。司法实践中,便有法院如此处理。
具体而言,第一,宽松解释“处理目的”,既能实现对目的限制原则的必要松绑,又能最大限度地尊重规范文义。首先,将“直接相关”解释为“兼容”面临超越文义的诘问。目的扩张解释必须在可能文义的范围内,如果逾越了可能文义的范畴,就进入了漏洞填补阶段。由于不相关的事物也可以共存,“兼容”的文义外延显然较“直接相关”更为宽泛,因此将后者解释为前者有超越文义之嫌。其次,文义解释相较于漏洞填补具有优先性。如果缺陷可以通过狭义法律解释加以弥补,那么就不存在法律漏洞;如果解释者一定要将其作为法律漏洞,就是在对“假想漏洞”进行填补。由于完全可以通过宽松解释“处理目的”来弥补缺陷,因此并无必要再将“直接相关”解释为“兼容”。第二,将“处理目的”理解为“公开目的”,在实践中面临着公开目的难以查明或在逻辑上难以构成“直接相关”的困难。信息主体自行公开个人信息的目的难以查明,若在后续处理时逐一查明初始公开目的,则会耗费巨额成本。而以司法公开等其他合法方式公开时,公开目的虽可能较为明确,但若认定后续商业目的与保障公众知情权等公开目的“直接相关”,则在逻辑上难以成立。
三、已公开个人信息合理处理范围的认定规则解析
判断已公开个人信息的合理处理范围,应从原则层面的目的限制落实到规则层面的体系分析。已公开个人信息处理行为的目的合理性,仍然需要通过《个人信息保护法》的具体规则予以约束和检验。具体而言,这一规则体系主要由以下三个核心维度构成:一是对个人权益有重大影响的认定,这决定了对已公开个人信息的处理是适用弱化保护规则还是知情同意规则;二是对个人拒绝权的体系解释,这涉及对其适用限制、行使方式以及法律效力的全面考察;三是处理者告知义务的边界,这旨在厘清在何种情形下该义务必须被履行,又在何种情形下可被豁免。
(一)对个人权益有重大影响的解释
依《个人信息保护法》第27条,对个人权益有重大影响的,应取得个人同意,否则即超出合理的处理范围。对于如何理解“对个人权益有重大影响”,有观点认为,“重大”往往意味着利益衡量应予变动,“重大”的认定即判断何种情形下应当优先保护个人权益而禁止未经同意的处理活动。亦有观点认为,重大影响应当被理解为“处理行为的高权益侵害风险”。还有观点认为,应区分意定公开个人信息和法定公开个人信息:在前者中宽泛解释“对个人权益有重大影响”,在后者中则作出严格解释。本文认为,对“重大影响”的理解,不应区分意定公开个人信息和法定公开个人信息,而应作一体把握。“重大影响”的法律内涵,可被界定为个人权益被侵害的高风险状态。这一结论并非主观臆断,而是对《个人信息保护法》作体系解释的必然结果。具体而言,《个人信息保护法》第27条以“对个人权益有重大影响”作为“应取得个人同意”的触发条件。而第55条则采取“对个人权益有重大影响”作为应当进行个人信息保护影响评估的认定标准。该条列举了“处理敏感个人信息”“利用个人信息进行自动化决策”等四种对个人权益有重大影响的个人信息处理活动,并以“其他对个人权益有重大影响的个人信息处理活动”作为兜底条款。根据立法机关的解读,这些处理活动的共性在于,它们都是“高风险个人信息处理活动”。而正是因为其高风险性,才会发生从弱化保护规则到知情同意规则的利益衡量变动。
由于处理行为的高风险性这一标准仍较为抽象,因而立法机关认为可借助《个人信息安全影响评估指南(GB/T39335—2020)》细化对“对个人权益有重大影响”的评估。该标准将“个人权益”的外延界定为限制个人自主决定权、引发差别性待遇、个人名誉受损或遭受精神压力与人身财产受损四个维度。而评估处理行为的风险等级是否达到“重大影响”,需要综合考虑对个人权益影响程度和安全事件可能性两个要素,前者表现为消除影响和克服影响的难度,后者可从已实施的安全措施、相关方、处理规模等方面进行考察。
这种基于风险的规制思路,与侵权责任法上的“风险损害”高度契合,二者均指向损害尚未发生但未来损害发生概率较高的风险状态。但《个人信息保护法》未采取侵权责任法的事后救济思路,而是选择了事前预防的规制路径。《个人信息保护法》之所以作出这种制度选择,是因为单纯依赖事后救济路径,在应对个人信息风险损害时存在困境:个人为预防风险而支出的费用可否成为《民法典》第1182条中的“财产损失”以及个人因风险产生的焦虑能否达到第1183条规定的“严重损害”的精神损害赔偿标准,都存在疑问。虽然《个人信息保护法》的规制重心在于事前预防,但这不妨碍我们借鉴侵权责任法中判断加害人是否尽到注意义务的工具,来判断信息处理者采取的保护措施是否达到《个人信息保护法》第56条中“与风险程度相适应”之程度。这一工具便是汉德公式。在汉德公式中,B表示预防成本(Burden),P表示损害发生概率(Probability),L表示损害(Loss),当B<PL时,表明加害人构成过失。在已公开个人信息场景中,损害可通过个人权益影响程度进行评估,而损害发生概率可通过安全事件可能性进行评估。因而这一逻辑可被转译为:如果信息处理者未投入的预防成本(B),低于其可预见的风险所会造成的损害(P×L),便可认定其采取的保护措施与风险不相适应。这种不相适应的状态虽然不能直接等同于重大影响,但可作为认定该处理行为对个人权益有重大影响的关键考量因素。由此还引发了一个更深层次的问题:由于安全事件可能性是评估风险的要素之一,那么若处理者可证明其已投入足够的预防成本(B≥P×L),可否以此证明其处理活动的风险性已被降低至不足“重大影响”的程度,进而不承担“取得同意”的义务,这一问题有待理论和实践的进一步探索。
(二)个人拒绝权的行使
依据《个人信息保护法》第27条,在个人明确拒绝后,信息处理者若继续处理个人信息,则属于不合理处理。对已公开个人信息处理的正当性存在放弃保护说、风险自担说和推定同意说三种观点。从“个人明确拒绝的除外”这一表述来看,《个人信息保护法》采取的立场应是:若个人未明确拒绝,则推定为同意。下文将从拒绝权的适用范围、行使方式以及法律效力三方面展开论述。
1.拒绝权的适用范围
由于《个人信息保护法》第27条对拒绝权是否存在限制未作规定,因此学界就拒绝权的适用范围存在分歧。有观点认为拒绝权存在限制,如认为拒绝权在维护公共利益场域内应受限;或认为个人可以拒绝自行公开个人信息的处理,但原则上不得拒绝法定公开个人信息之处理。但也有反对观点认为拒绝权不受信息公开渠道等条件限制,原因在于一般信息权益相较于反射性公共利益具有普遍的优越性。司法实践中对此也存在分歧。例如,在“贝尔塔案”中,二审法院以“贝尔塔公司在收到个人信息主体要求后仍未及时删除相关裁判文书和公告文书违反了合法性、正当性和必要性原则”为由,认定贝尔塔公司侵犯了个人信息权益。而在“汇法正信案”中,法院则认为,虽然原告称被控行为对其生活造成困扰,但并未向法庭阐明其比司法数据公有、共享等公共利益更为迫切需要保护的重大利益或合理理由,因而法院否认了原告拒绝权的行使。
本文认为,通过体系解释可知,拒绝权确实存在法定限制,但该限制并非因信息公开方式不同而产生,而是与其他个人信息处理的合法性基础有关。《个人信息保护法》第44条即规定个人虽然有权“拒绝他人对其个人信息进行处理”,但“法律、行政法规另有规定的除外”。“另有规定”集中地体现为《个人信息保护法》第13条无需同意的其他处理事由,例如“为履行法定职责或者法定义务所必需”“为公共利益实施新闻报道、舆论监督等行为,在合理的范围内处理个人信息”等等。需要注意的是,“贝尔塔案”和“汇法正信案”的裁判均在《个人信息保护法》颁布前作出。根据《个人信息保护法》的立场进行评判,“贝尔塔案”的裁判更为合理。因为,一方面,合理范围的设定本就是在已公开个人信息处理偏向利用的情形下,为保护个人信息权益而设计的再衡平,此时再以促进利用为由否认拒绝权的做法与立法目的不符;另一方面,由于此时不存在处理的合法性依据,因而否认拒绝权并不妥当,虽然裁判文书的转载确实客观上促进了公共利益,但转载行为毕竟主要出于商业目的,难以符合第13条第1款中“为公共利益”之要件而获得豁免。
2.拒绝权的行使方式
所谓“明确拒绝”,是指拒绝行为应当以较为显著或明确的方式作出。有观点认为,若信息处理者在处理信息之前未提供拒绝权行使的条件、渠道,那么只要信息主体未有明确同意处理的意思表示,就应认定为信息主体“默示拒绝”。但依据《民法典》第140条,沉默只在有法律规定、当事人约定或者符合当事人之间的交易习惯时,才可以视为意思表示。在《个人信息保护法》未作明确规定前,不宜认定此情形构成“默示拒绝”,因为其已超出第27条中“明确”二字的文义射程。运用体系解释方法,还可知个人信息处理者有义务为个人信息主体行使拒绝权提供便利。依据《个人信息保护法》第44条,拒绝他人对其个人信息进行处理,是个人在个人信息处理活动中的权利。同时,依据第50条第1款,个人信息处理者应建立便捷的个人行使权利的申请受理和处理机制。如处理者未建立申请受理和处理机制,个人可依据第65条向履行个人信息保护职责的部门进行投诉、举报。而且此时企业应被视为“未履行本法规定的个人信息保护义务”,由监管部门依据第66条责令其限期整改。如果个人信息处理者拒绝个人行使权利的请求,个人可依据第50条第2款,依法向人民法院提起诉讼。
值得注意的是,个人不得通过直接起诉的方式行使拒绝权。有学者对此持否定观点,认为个人向法院起诉个人信息处理者没有前置程序。但最高人民法院则认为,个人因行使权利而向法院起诉的,应当依据《个人信息保护法》第50条第2款,提供个人信息处理者拒绝个人行使权利请求的初步证明材料。其理由在于,拒绝权等权利如果动辄诉诸法院,不但会造成不必要的讼累,而且可能成为诉讼人滥用权利的工具,有违“促进个人信息合理利用”的立法目的。本文赞同后一观点。实践中,也有法院以信息主体未向信息处理者提出请求为由,驳回了信息主体的起诉。
3.拒绝权的法律效力
《个人信息保护法》未规定拒绝权的法律效力,本文认为,可类推适用关于撤回权效力的规定。类推适用,是指在对特定的案件缺乏法律规定时,法官援引与该案件类似的法律规定,将法律的明文规定适用于法律没有规定、但与明文规定相类似的情形。之所以可类推适用撤回权的规定,是因为拒绝权体现了一种信息公开后亦可撤回的精神,与同意的撤回具有内在一致性。类推适用第15条可知,个人的拒绝不影响拒绝前已进行的个人信息处理活动的效力,而仅否定了拒绝后个人信息处理者依第27条之处理活动的合法性;类推适用第47条第1款第3项可知,个人信息处理者应在个人明确拒绝后主动删除个人信息。由此来看,拒绝权并非“自由”,也不是“请求权”,而是“终止形成权”。
若信息主体未依据处理者建立的申请受理和处理机制行使拒绝权,则不发生拒绝的效力。例如,杭州互联网法院认定,在被告建立有便捷的个人行使权利的申请受理和处理机制的情况下,原告向被告销售电子邮箱发送删除申请的行为不是有效的删除申请。拒绝权的行使亦应如此。这是因为,考虑到信息处理者内部专业分工等因素,在信息处理者已尽到法定义务的情形下,申请未及时回复等不良后果不应由信息处理者承担,而应由存在疏忽的原告自负。这体现了《个人信息保护法》在信息处理者和信息主体间的利益衡平:出于保护信息主体利益的考虑,《个人信息保护法》要求信息处理者建立申请受理和处理机制;而在已向信息处理者施加负担的情况下,为了衡平信息处理者和信息主体间的利益,又要求信息主体依据处理者建立的申请受理和处理机制行使权利。
(三)告知义务的履行与豁免
1.是否告知应持区分说
信息处理者的告知义务是《个人信息保护法》第7条公开透明原则的直接要求。《个人信息保护法》第13条已明确规定处理已公开个人信息无需取得个人同意,但是否应向信息主体告知,则存在当然告知说、无需告知说和区分说三种观点。有司法判例支持当然告知说,认为即便是已公开个人信息,在处理之前也应告知信息主体。与之相反的是无需告知说,其理由主要是涉众过多,信息处理链条过长,耗费成本过高。区分说则认为应当区分情形决定是否需要告知。本文赞同区分说,但认为区分的依据必须是《个人信息保护法》中与告知义务及其豁免制度有关的规定。首先是关于信息处理者应当履行告知义务的规定。由于第17条关于告知义务的规定位于个人信息处理规则的一般规定中,故而应认为,除非存在法定豁免情形,否则信息处理者均应履行告知义务。尤其应注意的是,对于法律已规定告知义务的特定情形,应当慎重对其适用豁免制度。具体包括:其一,法律明文规定告知义务的情形,例如第22条关于因合并等原因转移个人信息的规定;其二,法律虽未明确告知义务但规定应当征得同意的情形,例如“对个人权益有重大影响”的相关规定,这是因为同意以告知为前提,个人不知情自然也就无从同意。
2.告知义务的豁免
我国《个人信息保护法》于两处规定了告知义务的豁免:第一处是第18条第1款,其规定“个人信息处理者处理个人信息,有法律、行政法规规定应当保密或者不需要告知的情形的,可以不向个人告知前条第一款规定的事项。”第二处是第35条,其规定“国家机关为履行法定职责处理个人信息,应当依照本法规定履行告知义务;有本法第十八条第一款规定的情形,或者告知将妨碍国家机关履行法定职责的除外。”对“有法律、行政法规规定应当保密或者不需要告知的情形”存在两种理解。一是将其理解为“法律、行政法规规定应当保密的情形”和“法律、行政法规规定不需要告知的情形”;二是将其理解为“法律、行政法规规定应当保密的情形”和“不需要告知的情形”。其区别在于:依前一理解,不需要告知的情形由法律、行政法规规定;依后一理解,不需要告知可由法院在个案中衡量。本文认为,采后一解释有助于平衡信息主体与处理者之间的权益。此时,法官可以在遵循法教义学的逻辑下进行衡量,在此基础上,可进一步通过成本收益分析(cost-benefit analysis)展开具体衡量。
3.基于成本收益分析的具体衡量
通过比较应当告知与无需告知情形下收益(B)减去成本(C)得到的净收益大小,可以判断哪种情形是有效率的,从而选择最有利于法律实施的解释结论。在应当告知情形下,成本C1=告知成本+因拒绝造成的收益损失+处理成本+超出合理处理范围侵权成本T1,收益用B1表示;在无需告知情形下,成本C2=处理成本+超出合理处理范围侵权成本T2,收益用B2表示。假设信息处理者要处理100个人公开的100条不同偏好信息,并向广告商获得100支广告,且每支广告的价格一致。假设情形一中明确拒绝的人数为X,因拒绝造成的收益损失=X%B2,故B1=(1-X%)B2。基于信息处理者追求利益的理性,是否告知不会影响处理者超出合理处理范围的概率。同时,实践中因难以计算或证明个人信息权益遭受的损害,多以处理者获益确定损害赔偿额,故T1=(1-X%)T2。因处理信息总量不大,故本文假设处理成本一致。
经分析可知,B1-C1=(1-X%)B2-告知成本-因拒绝造成的收益损失-处理成本-(1-X%)T2。(B1-C1)-(B2-C2)=X%(T2-2B2)-告知成本。故当告知成本<X%(T2-2B2)时,告知相较于不告知有效率。在本假设情形中,信息处理者是理性的经济人,T2无论如何应当小于B2,否则信息处理者不可能开展处理活动,因而得出X%(T2-2B2)为负数,而告知成本必然为正数的结论。因此在个人信息数量较小的情况下,信息处理者不履行告知义务更为经济合理。但是,当信息处理者要处理的个人信息数量极大时,应调适此假设前提。当个人信息的范围扩大至一定数量,信息处理者获得的边际收益递减,而实践中行使拒绝权的信息主体数量极少,使得B1趋近于B2,故因拒绝造成的收益损失=B2-B1≈0。为与前述假设情形区分,假设此时明确拒绝的人数为Y,处理成本分别为D2、D3,设分配到每个信息主体的平均处理成本为b,则D3=D2+bY。设信息主体因超出合理处理范围平均受到的损害为a,则T2=T1+aY。此时,B1-C1≈B2-告知成本-D3+bY-T2+aY,(B1-C1)-(B2-C2)=Y(a+b)-告知成本。当告知成本<Y(a+b)时,告知相较于不告知更具效率。随着被处理的个人信息数量越来越大,b值会越来越小直至趋于稳定。因侵害个人信息权益多数为微型侵权,司法实践中也未见因个人信息权益受损而提起天价赔偿,故a值偏小。同时,是否行使拒绝权很可能取决于信息主体的偏好程度。在一个普遍注重保护自身个人信息权益的社会体系中,Y值偏大,投入较高的告知成本是有效率的;而在一个偏好促进个人信息利用的社会体系中,Y值偏小,投入较低的告知成本才是有效率的。
综上,可以由法官在个案中利用成本收益分析衡量是否应豁免信息处理者的告知义务,衡量标准为:处理少量已公开个人信息时,在不履行告知义务是有效率的情形下,应豁免告知义务;处理大量已公开个人信息时,不应豁免告知义务,不论信息主体的偏好程度,投入较低的告知成本总是有效率的,但在一个偏好促进个人信息利用的社会体系中,只有投入较低的告知成本,才是有效率的。需要说明的是,对于如何界定大量和少量,需要结合个案中信息处理者的成本控制与运营情况。一方面,处理个人信息的成本不会随着信息数量的增长而同步增加。在信息处理者的技术基础设施和合规体系所能有效支撑的容量内,总成本通常可以保持相对稳定,因而在成本平稳的状态下可以称之为少量。另一方面,“大量”是相对的。对一个小型企业来说,处理几万条个人信息可能已经是“大量”;但对于大型平台而言,这个数字可能只是日常运营的一部分。
四、生成式人工智能场景下已公开个人信息合理处理范围的认定
生成式人工智能的发展极度依赖大规模公开数据,而其中常包含大量已公开个人信息。因此,从对原则与规则的解析走向具体应用场景下合理处理范围的认定,辨析生成式人工智能对已公开个人信息的处理是否超出合理范围具有紧迫的现实意义。
(一)应宽松解释处理目的
目的限制原则在生成式人工智能场景中适用困难,对此,有观点提出应对处理目的作宽松解释,将“用作训练语料”纳入公开的目的范围之内,理由是基础大模型几乎可以服务于任何公共目标,因而间接地契合了个人信息公开的目的。但如前所述,训练行为只是与公开目的“间接”相关,有超越《个人信息保护法》第6条“直接相关”文义之嫌。
也有观点认为,目的限制原则在生成式人工智能场景中难以适用,其理由在于,语言模型如何处理包含已公开个人信息的训练数据是不可知的,服务提供者无法将已公开个人信息的处理限定在特定目的上,更遑论限定在信息主体公开个人信息的初始目的上。此观点实为对目的限制原则的误读,其将技术过程的不可知性等同于处理目的之不特定性。模型的内部运行机制虽然复杂,但这不妨碍从外部清晰界定其处理活动的目的。在模型训练阶段,无论内部计算如何不可知,其整体行为都服务于一个特定的目的,即训练一个具备特定能力的模型。而在模型运行阶段,无论模型如何调用其内部知识,其行为同样服务于一个特定的目的,即根据用户指令提供服务。由此可见,技术黑箱的特性并未使目的限制原则失效,而是要求为其寻找更具解释力的适用路径。前文已述,处理目的宜解释为“处理行为目的”而非“公开目的”,此种解释在生成式人工智能场景下也更为适宜。
因此,在模型训练阶段,审查的焦点应是:第一,训练模型这一目的本身是否合理,例如,若训练模型是为了生成、传播虚假信息,那么该目的显然不具有合理性;第二,数据收集等处理行为是否与这一目的直接相关,例如,如果为了训练电商客服模型,收集了医疗健康数据,那么这一收集行为显然与目的不相关。在模型运行阶段,审查的关键则是:第一,提供服务这一目的本身是否合理,例如,若提供的服务是深度伪造色情内容,则该目的显然不具有合理性;第二,模型生成具体内容的处理行为是否与该目的直接相关,例如,若模型在提供求职建议时,不必要地引用公开简历作为负面案例,并暴露其姓名和具体工作履历,则该输出行为显然与服务目的非直接相关。
(二)“对个人权益有重大影响”的判断标准应具有客观性并应进行事前评估
有观点认为,哪些处理活动属于“对个人权益有重大影响”的解释规则并不明确,因而生成式人工智能服务提供者极易陷入侵权风险之中:从个体角度出发,不同风险偏好的信息主体完全可能作出不同判断;采取结果导向的判定思路,该条款就失去了应有的风险预防功能。如前所述,本文认为,第一,评估的标准应是客观风险,而非主观偏好。即,从客观上判断该处理行为是否不合理地提高了个人权益被侵害的风险,而非探究某一特定主体是否感受到了重大影响。《个人信息安全影响评估指南》为这种客观风险评估提供了一套系统的分析流程,要求从四个维度评估个人权益影响,并以影响是否难以消除或克服作为判断其是否“重大”的核心标尺。这一框架将判断的基点从不可预测的个人主观偏好,转移到了可分析的客观法益受侵害风险上,从而为个人信息处理者提供了一个稳定的合规基准。第二,评估应在处理活动开始前进行,而不应采取结果导向的思路。《个人信息保护法》第55条明确规定,对个人权益有重大影响的个人信息处理活动,处理者应当“事前”进行个人信息保护影响评估。这一“事前义务”的设定,本身就是风险预防理念的立法体现。事实上,将生成式人工智能等创新技术纳入高风险处理活动的范畴,并要求事前进行个人信息保护影响评估,已是国内外监管的共识。
(三)应健全拒绝权的替代性保障
拒绝权在生成式人工智能场景中面临其派生的删除义务在技术上难以实现的挑战。如前所述,在个人明确拒绝后,个人信息处理者应当主动删除个人信息。但是在生成式人工智能场景中,相应的个人信息已经被内化为模型中数以亿计的参数,彻底删除特定个人信息数据需要实施机器反学习,而这不仅需要耗费大量的时间和成本,还可能对模型功能产生破坏性影响。故而应认为,删除已内化为模型参数的个人信息,属于《个人信息保护法》第47条第2款规定的“删除个人信息在技术上难以实现”之豁免情形。但即使删除个人信息在技术上难以实现,个人信息处理者仍然应当依据该条第2款采取必要的安全保护措施。这些替代性保障至少包括:第一,阻断未来的再学习。生成式人工智能服务提供者应当将该个人信息从数据库中删除,并在后续训练时使用不包含该个人信息数据的语料。过滤方法包括但不限于关键词、分类模型、人工抽检等。第二,屏蔽已有的再输出。研发者应部署有效的输出端过滤机制,采取包括安全提示词库建设、恶意提示词改写与拦截、过滤审核机制等技术措施,尽最大努力防止模型在生成内容时直接再现该信息主体的个人信息。
(四)应强化生成式人工智能服务者披露数据来源的告知义务
生成式人工智能场景中的挑战还在于,信息主体无从知晓其已公开的个人信息是否被用于训练模型或者生成内容。因而,有观点主张,生成式人工智能服务提供者可以公示方式履行告知义务,在官方网站以及其他媒体平台上向互联网长期公示其获取已合法公开个人信息的具体来源和处理规则。本文赞成这一观点。由此,相应信息主体便可建立起“我的信息已被使用”的合理认知,进而可通过服务提供者建立的行权机制行使拒绝权。
应当说,要求服务提供者说明数据来源并非空中楼阁,我国现行监管规定已体现了这一精神。依据《生成式人工智能服务管理暂行办法》第17条,提供具有舆论属性或社会动员能力的生成式人工智能服务的,需开展安全评估,并履行算法备案等手续。而从《生成式人工智能服务安全基本要求》来看,训练数据安全评估是安全评估的核心环节之一,其区分了开源、自采、商业等不同数据来源,要求企业提供相应的证明材料。这表明,生成式人工智能服务提供者的数据来源在监管层面上已被纳入审查。一般情况下,若通过安全评估和算法备案,服务提供者便应不惧披露训练数据来源,但目前这种面向监管者的备案审查并未自动转向面向社会的公开透明。2024年年末的一份报告显示,15款国产大模型无一披露训练数据来源。此现象背后固然有商业竞争等考量,但更深层次的原因可能在于,我国法律对于公开数据爬取的合法性至今仍然缺乏清晰的规则,服务提供者若主动公开其具体数据来源,则存在被数据持有者提起诉讼的风险。就此而言,亟需完善公开数据爬取制度,为生成式人工智能服务者披露数据来源提供信心。本文赞同参酌商业秘密中秘密性的认定,前台数据条目虽然公开,但受技术管理措施控制的后台数据集合仍可能符合秘密性的要求。而若技术管理措施未达到“在正常情况下足以防止商业秘密泄露”的程度,便不应认定符合秘密性的要求,相关数据仍可被自由爬取。除此以外,还可考虑建立针对文本与数据挖掘的合理使用或法定许可制度。简言之,只有数据爬取行为获得了合法性基础,企业才有可能坦然地履行其告知义务,从而真正激活信息主体的拒绝权。
结 语
《个人信息保护法》将合理处理已公开个人信息作为合法性基础之一,彰显了数字时代下保护个人信息权益与促进个人信息利用并重的立法取向。然而,欲使这一平衡在已公开个人信息处理的相关规则中真正落地生根,就必须摒弃依赖外部理论而导致的价值摇摆,回归《个人信息保护法》,通过严谨的法教义学分析并适度结合法经济学分析,将立法者作出的价值决断,从原则细化到规则,将规则应用于场景。