摘要:在公共数据开放的地方实践中形成了先界定宽泛的公共数据,再由政府主导开展授权运营活动的主流模式。这一模式使政府成为公共数据的唯一供给者,混淆了政府角色与社会角色定位,政府不堪重负,成为公共数据“供不出、流不动、不好用”的症结。公共数据仍然遵循先投资整理再运营管理的数据要素化开发利用一般逻辑。政府开发利用自身运营形成的数据,应当首先服务于公共管理和公共服务(自用和共享),再将形成的可重用数据供给社会使用(开放)。这需要政府建立权责明确的政府数据开发利用管理体制。应区分确立政府数据持有者权和数据资源管理权的制度逻辑,并基于各级各类政府部门的业务需求和职权分工合理配置这两类权利(力),以实现公共数据的高效开发利用。基于政府数据持有者权,政府数据除了供政府部门自用和共享外,还应当向社会供给,并根据数据的公用性差异采取不同的开发利用机制。基于数据资源管理权,政府还应当建立制度规则以促进社会主体为公用(公共利益)和共用(共益目的)目的数据供给,形成公共数据的多元化供给体制。
关键词:政府数据;公共数据;数据持有者权;数据整理;数据开发利用
一、引论
在我国的数据资源格局中,各级政府部门所掌握的数据量占据了社会总量的约80%,[1]目前,我国地方政府已开展了许多富有成效的实践探索,建立了政府内部数据共享与向社会开放两大数据基础制度。特别是在数据开放领域,已逐渐探索出包括无条件开放、有条件开放及授权运营制度在内的多元化路径。然而,在取得不俗成绩的背后,公共数据开放领域仍然普遍存在“不愿开放”“不敢开放”和“不会开放”的现象。[2]一方面,公共数据开放主要由政府主导和推动,存在数据治理和利用管理职责不明确、责任难以落实的问题,导致跨部门、跨行业和跨地域的数据共享和开放面临实现难题,另一方面,现阶段开放的公共数据普遍存在数据质量不高、实用价值不强、应用成效不突出等问题。[3]2024年9月21日,中共中央办公厅、国务院办公厅联合发布了《关于加快公共数据资源开发利用的意见》(以下简称《意见》),明确提出加快公共数据资源的开发利用,以充分释放公共数据要素的潜能,推动经济的高质量发展的战略部署。《意见》的核心亮点在于提出了公共数据开发利用的概念,并以此为基础统筹共享、开放和授权运营三种要素化利用方式。
早期的政府数据开放存在一个误区,认为政府机构运营产生的和获取的数据可以直接作为要素使用。这种观点未能充分认识到产生各业务系统的数据只有经过开发之后才能被他人使用(重用)。这是因为,来源于不同业务场景和系统,具有异构性,只有被整理后才能关联、汇集、匹配,且形成关于某个认知对象足够多的数据时,才具有发现模式、预测趋势、产生洞察。这种将不同来源的多样数据,整理成为标准一致的可关联、可集成、可互操作的数据(即可重用数据)的过程,从技术角度称为数据整理,从经济的角度就是数据开发。数据开发就是汇集不同来源数据进行清洗、标注、去重、补齐等行为,使数据可用、好用,成为不同主体重用数据(即可流通数据)。由于数据利用的可分享性,开发形成的可重用数据既可以为开发者自用,也可以为开发者之外的政府部门利用(共享利用)和提供给社会利用(开放利用)。共享和开放成为已开发数据利用的主要方式。之后,在公共数据有条件开放基础上探索出的授权运营,实际上是对政府数据应当“先开发,后开放”的承认。授权运营的法律基础是数据作为资源,按照经济规律开展的,与作为公共服务的公共数据开放理念不同。尤其是在地方实践中形成的以“主体+业务”性质定义的公共数据,[4]导致公共数据非常宽泛,使政府一方面承担过重的数据开放责任,另一方面导致以授权运营方式实施数据开放的正当性受到质疑。《意见》引入公共数据开发利用概念的一个重要意图是探索公共数据资源开发利用制度规则,形成公共数据开发利用新体制。
在开发利用视角下,我们必须反思先定义宽泛的公共数据,然后再由政府授权运营来开发利用“公共数据”体制的合理性。因为这一方面剥夺了公用公益企事业单位的自主开发数据的权利,另一方面它混淆了政府与社会的角色,过分依靠行政力量推动数据流通,[5]导致政府在公共数据要素化利用过程中承担过重的责任。这实际上是忽视了其他社会主体的参与和贡献,造成政府与国家投资的公用公益企事业单位在公共数据供给方面的边界模糊,难以有效支撑科学高效的公共数据开放利用。
为厘清政府在数据要素化利用中角色,本文提出应当区分政府数据持有者权和政府数据资源管理权,以政府数据持有者推进公共数据开放和授权运营,而以数据资源管理权推进整个社会数据要素化利用,包括公用公益企事业单位的数据要素化利用。为避免进一步探讨公共数据定义和范围问题,[6]本文将现行地方性法规中的公共数据拆分为政府数据和其他“公共数据”,认为政府对其他公共数据的开发利用行使管理权,而不是直接开发利用者角色。因此,本文旨在反思政府与社会主体在公共数据开发利用中的角色与责任定位,探讨如何以政府数据持有者权为基础,科学落实政府数据开发利用与管理责任,构建多元公共数据供给基础制度,更好地实现公共数据共享和开放以支撑智能决策,进而促进全社会的数据要素化利用和高质量发展。在本文,数据要素化利用等同于数据开发利用,将政府数据要素化利用分为“开发”和“利用”两个阶段。“开发”指将数据整理成为可重用数据资源的过程,而“利用”指政府管理和使用可重用数据资源,通过政府内部共享和向社会开放实现数据使用价值的过程。其中,授权运营是政府数据有条件开放的一种特殊实现形式。
二、政府在数据要素化利用的角色:政府数据持有者权和数据资源管理权
在数字经济时代,数据要素化利用既是政府自身面临的新兴事业,也是整个社会数字化转型核心内容。为此,需要区分政府自身数据的开发利用职责和对整个社会的管理责任,并在此基础上区分政府数据持有者权与数据资源管理权,[7]合理界分政府数据与社会数据的边界,并在此基础上构建清晰明确的政府数据开放利用制度。
(一)政府数据持有者权与数据资源管理权
在数据成为社会性资源的背景下,政府已经成为社会中最大且最基础的数据资源生产者和持有者。政府一方面要行使政府数据持有者权,加快推进政府数据要素化开发利用,同时又扮演着整个社会数据资源管理者的角色,推动公共数据、行业数据等多元数据的汇集和开发利用。本文称前者为政府数据持有者权,后者为数据资源管理权。
在现代社会发展的不同阶段,政府与社会之间均应当存在明确界限以区分公共事务与私人事务。这一界限标准同样适用于数据资源的开发与利用。政府在履行公共管理和服务职能过程中产生的数据,理应由政府自身持有和管理,并负责这些数据资源的开发与利用。相应地,社会主体在自身业务运营中生成的数据,则应由社会主体持有和管理,并承担开发利用的责任,即“谁生产、谁持有、谁管理”原则。这一原则在政府数据资源的开发利用阶段依然适用。政府通过对其生成的数据进行整理,进而成为政府数据持有者;而社会主体则因其数据生成和整理行为而成为社会数据持有者。这是建立数据重用秩序的一种制度性前提与要求。在过去,社会对政府数据的需求主要基于满足知情权,依赖于政府的主动公开或依申请公开两种机制,以响应社会对政府决策透明度的要求。[8]在数据智能时代,社会对政府掌握的大量事实性数据需求日益增长,迫切希望政府能向社会提供原始且可重用的数据资源。在此背景下,我们必须首先确认政府对其生成和整理后形成的数据资源的数据持有者地位,并明确其开发利用数据资源的权利(同时也是义务),以确保政府数据资源得到高效有序利用。[9]
在数据资源开发利用方面,政府数据持有者与社会数据持有者的权责是相似的。只是因为政府是公共管理主体,对其从事公共管理和服务所形成的数据本身及其整理后的数据并没有专属利益或自主权利。政府对其整理形成的数据资源只有按照数据资源性质及合理利用方式加以利用的权利(这类权利应当由法律明确规定)。相对地,在社会数据开发利用方面,则应当奉行“法无禁止皆自由”原则,社会数据持有者享有在法律允许范围内自主使用数据的权利。
除了对自己生成和整理的数据享有持有者权外,政府对于整个社会的数据资源享有管理权。这种管理权不是源于对数据的生产或持有,而是源自对社会事务的公共管理权,旨在构建各类数据资源的利用秩序,以实现整个社会资源的合规高效利用,最大化实现数据价值。社会数据由各社会主体持有,数据持有者是数据资源使用的决定者,政府管理职责在于规范和明确各类数据持有者的权利和义务,以构建数据社会化重用或流通利用的秩序,使各类持有者在数据法律制度框架内自主行使权利,实现安全和负责地使用数据。这也就是说,对于整个社会的数据资源,政府都有管理和规范利用秩序的职责和义务。因此,政府是全社会数据资源重用制度的供给者,同时也是数据社会化利用秩序的维护者。
作为社会公共事务的管理者,政府承担着整个社会的公共数据(不仅仅是政府数据)资源的开发与供给管理职责。类比政府在道路、公园等公共基础设施建设中的角色,政府亦应致力于构建和供应公共数据资源,以响应数字经济时代社会对公共数据的需求。这些公共数据资源不仅源自政府数据,也来自社会主体出于公共或公益目的提供或“捐赠”。“数据作为新的生产要素呈现出指数型的快速增长趋势,不会产生折旧或消耗”[10],鉴于数据的这一非排他性和非竞争性特征,此类供给不会妨碍社会主体作为数据持有者继续利用数据。在地方层面的数据开放实践中,公共数据的范畴被宽泛地界定,不仅包括政府机构在履行职能过程中产生的数据,也包括公用事业和公益性企业在提供服务过程中生成的数据。这些数据被归类为公共数据,由政府负责汇集、保管和开发利用,并行使相应的管理权限。然而,在先行定义公共数据并推动其开放利用的过程中,制度规则的不明确性不仅挫伤社会主体开发利用积极性,而且不利于政府数字化转型,实现基于数据的决策,更极大地增加了政府对于数据治理的投入要求。
明确政府数据持有者权的目的是更好地管理利用数据,赋权政府整理开发自有数据,在支撑政府科学决策的同时,向社会提供基本公共服务。同时,政府还享有社会性的数据资源管理权,在激励社会主体自主开发利用数据、构建数据社会化重用秩序的同时,汇集来源于政府和社会的可重用公共资源,形成数字经济时代的数据基础设施。因此,在数据资源化背景下,应当区分政府的两类角色和两类数据开发利用行为,设计面向未来的公共数据开发利用制度。
(二)政府的数据资源管理权:多元化的公共数据供给机制
政府对于公用公益企事业单位的公共数据不应当拥有开发利用权利,而应当是数据资源管理权。政府应从数据资源管理者角色出发,在推进政府数据开发利用(详论见下一部分)的同时,促进社会可用公共数据资源的形成和汇集,打造出政府数据开放和社会数据供给相互融合的公共数据供给与利用体系。
数据的非排他性、非竞争性、非消耗性以及价值的多样性特征决定了其使用性质的多样性和目的依赖性,不存在单一的使用目的。[11]这种特性使得可重用数据资源的开发具有显著的外部性。公共资金的投入用于数据整理,形成了公共数据资源并开放给公众,这种开放并不完全排除使用者将数据用于私人或商业目的。[12]同样,由社会资金投入整理的可重用数据,也并非仅限于商业用途,它们同样可以服务于公益或共益目的。因此,从数据使用者的角度来看,数据开发整理的投入主体或资金性质并非决定性因素。这意味着数据是否应当作为公共数据开放,主要取决于公共政策的选择。公共政策选择的主要依据则应当是数据需求的普遍性(公用性)或其是否直接应用于公益目的。如果数据需求仅属于特定小众群体,那么公共资金的投入就不应是首选,而应考虑社会资本的投入。[13]从这一角度,公共数据的社会化供给就存在以下三种方式:
1.公共数据的政府供给
政府数据应当按照数据的公用性来决定其是否被作为公共数据开发利用。[14]将政府运营形成的数据作为公共数据的前提是建立在数据初始生成和后续整理均是由政府财政预算支撑;当数据从原始数据转变为可重用数据的投入不是由政府预算支撑时,就会改变这一前提。即使完全是由政府预算产生出可重用数据,该数据是否就可以无偿和无条件提供也会受到另一因素的制约,即数据的公用性。
所谓数据的公用性是指数据可为不特定公众使用或获益的程度。[15]例如,如果经政府整理形成的数据不受行业限制,可能为各行业、各主体所使用,那么该使用具有公用性。若数据使用行为的直接目的具有公益性(如教育、科研等),那么该数据使用具有公益性。若满足“财政预算生产+数据使用具有公用”,政府整理形成的数据开放就应当采取“无偿+无条件”模式。换句话说,凡是来源于政府运营的数据且满足公用性的,其数据整理投入和对外提供安全管理的成本均应当由财政预算支出。若来源于政府的数据在整理后的使用限于特定行业、特定人群或由完全申请定制,那么该数据整理开发就不满足公用性的要求,就不能用财政预算内资金实施整理和利用管理,因而这种数据的开放利用应当定位于非公共数据的开放利用。在实践中表现为“有偿+有条件”的利用模式,应当通过授权运营的方式来实现。
因此,公用性标准可以适用到数据资源的开发利用管理上,成为政府数据作为公共数据来源供给的标准。至于公用性如何判断,一般应当认为没有明显人群、行业或者使用条件的限制,或者应当作为公共基础设施提供。具有公用性的数据,在供给上就不应当设置主体条件(即对所有社会主体开放),且通常不应当收费。如此就意味着,政府还应当对履行职责和提供公共服务中的数据投入资金进行整理,并将此作为基本公共服务向社会提供。显然,公用性是应然判断,因为这些数据具有普遍的使用需求,政府应当将之作为基本公共服务来提供。这使得公共数据确定演变为公共政策范畴,它由政府根据数据产生的价值及其各种因素权衡是否应当作为公共数据提供。例如,若政府认为基础大模型训练关系社会进步发展,应当支撑各组织对基础语料的供给,那么政府可以确定将某些数据作为公共数据向所有需求数据的主体提供。实际上,由于数据要素的“乘数效应”[16],政府可以为做强做优做大数字经济、构筑国家竞争新优势支持建设各种公共数据资源池或语料池,这类事业也应当被定位为数据公益事业。
2.公共数据的社会供给
对于每个社会主体来讲,基于自身业务运营形成的数据自然应当由其持有并进行产品化开发,对其形成可流通数据集或数据产品享有自主决定权。也就是说,经过产品化整理开放后,数据添附了价值,就不应视为任何人可自由使用的公共资源。投入资源进行产品化的数据持有者应当可以自主决定其形成的可重用数据的使用。由于每个主体都是社会性存在,其运营产生的数据具有社会性和公共性,允许每个社会主体绝对控制数据不利于数据价值实现。另外,数据的价值存在多样性、时序性、场景性,在许多情形下提供数据给他人使用在“照亮他人的同时也并非使自己黑暗”。因此,法律制度应当激励社会主体对外提供(流通)数据,至少确保这种对外提供不会给提供者带来损害或风险。在确认和保护数据持有者权的前提下,可以采取两类措施使社会主体的数据转化为公共数据以满足社会普遍需要:一是履行法律规定向政府提供履行公共管理职责和公共服务所必要的数据的义务;[17]二是成立纯粹公益目的数据开发利用组织,激励社会主体的数据捐助行为。
政府为履行公共管理和服务职能,需要社会主体提供必要数据,这是社会主体履行法律规定的义务或者基于政府监管或服务要求而提供的。比如,行政监管基于监督执法目的要求行政相对人提供资料,社会主体为申报政府项目或者办理各种资质或手续提供的资料,企事业单位为配合行政监管和公共服务向政府提供的数据资料等等。[18]这些数据通过政府使用后,可以被整理开发为公共数据。每个社会主体都可能成为公共数据之源。当然,在履行向政府提供数据义务方面,各社会主体的义务和范围并不完全一致。明显地,公用公益企事业单位因为其直接服务民生基本需求,肩负着政府公共服务辅助人的角色,因而政府通过“一网通办”为社会提供各种公共服务或全民服务过程中,均需要接入公用或公益企事业单位提供的数据。因此,这些企业生产的数据首先要满足政府的公共管理和公共服务需要,然后再考虑自行开发利用。
除了向政府提供数据,间接转化为公共数据之外,企事业单位还可以自愿整理数据,免费和无条件向社会提供。只是免费提供也并不能无序,还是要建立专门的接收、汇集整理和对外提供数据的组织,以使各单位提供的数据得到有效利用。欧盟在其《数据治理法》中尝试建立的“数据利他主义流通利用制度”[19],即属于这样的制度。
3.公共数据的行业供给
自由使用数据和受控使用数据是数据使用方式的两个极端。[20]实际上,数据流通是各社会主体为了相互补齐数据,实现数据聚合和规模化效应,本质上是通过“交换机制”实现数据共同使用。也就是说,产业链上下游、存在相互依赖关系数据持有者之间可以达成数据共享协议,或者行业组织能够建立数据共享制度规则,所有数据提供者可以共用数据资源,形成共建共用的数据共享机制。[21]这种共享机制,实际上是每个数据持有者与其他数据提供者的数据交换,每个数据持有者均可以“以少换多”,发挥数据聚合效应。这种共享机制使一个行业、一个群体或共同体实现数据共用,本质上是一种小范围有序使用的“公共数据”。这种公益性数据使用机制的成功需要由行业组织或可信第三方来运营管理(存在有效公益基金或成本分摊机制),以确保参与者在提供各自数据的同时,能够使用其需要的数据,维护公平有效的共用秩序。
在这个方面,政府基于其社会数据资源管理权可以发挥重要作用。政府不仅基于数据持有者以无条件和无偿方式向社会开放基础数据资源,同时作为社会数据资源的公共管理者,还可以组织行业组织和企事业单位建立公益性数据资源分享利用机制。政府可以制定激励政策,推动建立行业数据空间、科研数据共享机制的形成,以促进公益性数据汇集使用。[22]政府还可以通过授权运营或国有资本投入,将政府数据和社会数据融合治理,形成面向各种使用目的的公共数据资源池,实现以公益为目的的数据开发利用机制。
三、政府数据开发利用的制度基础:政府数据持有者权
在从事公共管理和公共服务过程中,政府与社会存在数据交互。这些数据要素化利用首先是政府数字化转型,实现基于数据智能决策管理;其次是向社会提供其开发的可重用数据,作为数字经济时代的公共服务新内容。这两个目标的实现均依赖政府数据持有者权的有效行使,构建有效政府数据开发利用体制,形成由政府合法管理使用的数据资产。
(一)基于数据持有者权的政府数据开发制度
政府作为数据持有者的核心目标在于确立政府在数据开发与利用中的责任主体地位,进而构建一个高效的数据开发与利用机制。作为数据持有者,“政府作为数据开放收益分配的主导者,不仅是数据来源者的代表和数据持有者,而且也是履行提供公共产品、推动经济发展等职责的更为宏大的公共治理者”[23]。因此,与其说政府享有开发利用数据的权利,不如说是政府应当履行开发利用数据的义务,即有效地管理数据并实现其要素价值。本文忽略政府内部共享利用,而仅以政府向社会开放数据为例,分析政府数据开发利用的核心问题,并提出构建一个更加有效的政府数据开放体制框架。
1.政府数据开发的目的:政府数智转型需要
政府数据的来源主要有两个方面:一是政府直属机构(如事业单位)的采集和提供;二是社会主体(市场主体,也称为行政相对人)的报送。[24]确立政府数据持有者权的目的在于界定政府持有数据的范围。鉴于政府在社会中的优势地位,若不对政府从社会主体获取数据的行为加以限制,政府获取数据将泛化。在数据资源化利用的背景下,必须避免政府从社会获取数据后,再以政府名义向社会开放。因为政府不能以公共数据的名义,专门从社会收集数据再向社会供给数据,成为“数据商人”,避免“数据财政”的异化。[25]因此,政府从社会获取数据的边界应当限定在服务于政府的公共管理和公共服务目的之内。例如,“一网通办”或者“一网通管”政策,旨在简化社会数据采集流程,提升政府运营效率,通过单一窗口申请和部门间数据共享,实现公共管理和服务效率的提升。[26]政府向社会提供的数据应限于公共管理和服务过程中沉淀的数据“副产品”,而非为了开放而专门从社会获取的数据。这也就是说,数据开放不应成为脱离政府基础业务的独立事项,而应当是将基础业务形成的数据整理后向社会提供,因此不存在专门为开放目的而从社会收集数据和开发的情况。
这是基于政府性质、功能或目的对政府数据开发利用的判断。政府的日常业务运营产生的数据,应当开发整理后服务于政府业务的绩效提升。政府主导的公共数据开发利用受到两个方面的制约:一是对政府从事公共管理和公共服务过程形成的数据开发,而不是为了开放而从社会获取数据;二是数据开发的目的不是为了向社会提供数据,而为实现自身数智化。政府是将为自身公共管理和服务目的形成的数据资源供给社会使用,是发挥公共数据二次利用价值,在赋智政府的同时也赋能社会。这是数据用途多样性和使用的非排他性使政府具有这样的能力,也是发挥公共数据价值的需要。也就是,政府数据开放(特别是授权运营)不应成为脱离政府基本职能的独立业务,而是因为数据可分享或可重用给了政府服务于社会的“机会”。
但是,这并不意味着借这样的“机会”,可以扩张政府从社会获取数据的范围,政府从社会获取的数据必须限于政府公共管理和服务的目的,比如,社会主体办理证照、申报项目,或者行政检查、查处违法行为等需要收集必要的证据等。比如,不能因为医疗数据具有公共性,就要求医疗机构的医疗数据应当提供给政府主管部门,而由主管部门开发或授权运营。政府只能因为从事公共健康、疾病防控、医疗保障等需要而采集医疗机构的数据,向社会开放的医疗数据也仅限于这一过程形成的数据。不能因为笼统贴上公共数据的标签,所有医疗数据都由政府开发或授权运营。作为公共服务新内容,政府数据开放必须与政府基础业务紧密关联,应理解为将政府在从事公共管理和公共服务过程中形成的数据资源向社会提供,而不是专门为此采集数据。这样的限定有助于理顺政府与社会的关系,将政府持有的数据限定在政府运营产生的数据范围内。这使得政府在做好本职工作的同时,能够将社会可重用的数据提供出来,发挥其再利用价值。
2.开放数据的开发:谁来投资和运营
在明确政府对运营形成的数据具有向社会提供义务(权利)后,进一步需明确政府向社会提供的数据类型。理论上,政府提供的数据对社会主体具有潜在使用价值。[27]从数据类型上,政府向社会提供的数据可分为两类:一类是数字化的信息资源,如业务汇总、统计报表、工作报告等;另一类是原始、可机读的事实数据集。从数据价值或用途也分为两类:一是信息或知识价值,用于理解和分析,支撑行业或企业利用智能工具进行分析,支持组织决策;二是计算价值,即用于算法模型训练,形成基础模型或行业模型,以在特定场景下分析数据,输出智能决策或智慧行动。虽然可机读的数据集主要用于后者,但政府的统计报表等亦可提取事实数据,用于模型训练和机器学习。由于机器对数据处理分析是自动化进行的,对于政府提供的可用于模型训练和机器学习等数据集具有明确的要求:经过整理,满足一定质量标准或要求的可重用数据集。[28]这不仅涉及对基础数据的整理,还涉及按照特定需求开展的汇集整理。
数据整理是一项需要持续人财物投入的事业,因而需要资金投入和组织运营。目前国家政策和地方立法大多已明确各级财政应负担数据开放事业的数据整理费用。[29]但从数据开放实践来看,地方政府预算内资金难以支撑开放数据的整理,政府内部数据共享的数据治理投入亦缺乏或不足。财政预算不足以支撑数据开发事业,阻碍政府数据内部共享和对外开放,导致授权运营的产生,政府授权专门的公共数据开发公司(以数据集团为典型),承担公共数据开发和供给业务。
为了厘清作为基本公共服务的数据提供和面向社会需求的数据供给行为,本文区分了两类数据开发行为,一是为政府公共管理和服务目的的开发行为,所形成的可重用数据集亦可作为开放数据资源(即重叠数据整理行为),作为数字政府的基本公共服务;二是对于政府产生的为了满足社会数据需求的数据整理行为,则可以按照市场化运作原理向社会供给。这两种开发利用行为都是政府数据持有者权的行使,但属于不同目的和性质的开发利用行为。理想的方式应采取两种开发利用体制:一种是基础公共数据的整理开发和供给,如人口数据、法人数据、地理空间数据、经济统计数据是典型的四类基础数据。这些基础数据不仅支撑政府部门使用,而且是整个社会运营所依赖的数据资源。因此,对于此类基础数据应由政府投资开发和运营。另一种是为特定社会需求开展的整理开发和供给,则可以吸收国有资本甚至社会资本整理开发,采取有条件和有偿的运营方式,可以是“政府持有+政府预算投入”“政府持有+国有资本投入”“政府持有+混合资本投入”等多样化模式。[30]不同的模式会影响政府数据对外开放的条件与收费情况。
从现有实践来看,基础公共数据的开发利用完全由政府投资和运营也不现实。可以考虑区分开发和运营的授权模式。政府承担数据开发只是将数据整理成为可开放的可重用数据,而向社会提供(数据供给)可以单独授权给专门机构运营。这是因为从政府控制的安全域进入社会各组织控制域必须有中转安全空间需要专门的组织运营。同时,数据供给还涉及供需匹配、使用控制、风险管控等复杂的问题,也不是政府或政府授权组织(通常为数据中心)能够胜任的。即使政府为满足数智转型目的开发和整理基础公共数据,仍然需要授权专门组织运营需求发现、数据提供、使用控制等业务。在这种情形下,仍然会发生运营成本,在财政预算不能覆盖的情形下,就仍然需要向使用人收费。通常将之解释为技术服务费或者管理费。如此,上述开发模式最终差异是使用者付出的费用不完全一样。由政府开发基础公共数据的供给的费用限于运营费,而授权组织开发情形下,则包括开发和运营成本。多样化授权和运营模式有助于政府数据得到有效开发和供给。
(二)政府数据持有者权:管理权配置和行使
政府作为公共管理和公共服务产生的数据持有者与各个部门的职责密切联系在一起。由于数据产生与业务相连,而业务与职责或职权有关,所以数据持有和管理本质上反映的是“权力”。政府数据持有者地位及其相应的权利配置就成为有效实施数据开发利用,充分实现数据价值的关键。因此,对于政府数据持有者权的配置必须与政府部门的业务职责相匹配。这也是《意见》要求“加强顶层设计,厘清部门和地方的管理边界,逐步形成权责清晰、条块协同的公共数据资源开发利用格局”的题中之义。
1.政府数据持有者权的配置原理
政府数据持有者权本质上是配置政府数据开发利用的管理义务,因而必须与数据持有事实或实际状态相联系。数据整理是与数据生成场景和业务联系在一起的,一旦脱离原生场景,或者整理人员不熟悉行业知识,数据整理就变得困难甚至难以实现。[31]因此,数据整理的基本原则是“谁生产、谁治理”,这是实现政府数据可重用最有效率的数据整理制度安排。按照我国的行政体制,我国政府分为乡镇、县、省和中央四级,同时每个层级又分为不同的业务部门。按照“谁生产、谁治理”的原理,每一级政府的每个部门都有权利和义务按照统一标准将各自产生的数据整理成为可重用的政府数据资源,并在本级政府进行汇集或者集成。也就是说,各级政府的各业务部门都是数据整理的责任主体,每个部门整理好的数据应当在本级政府层面汇集或集成,支撑本级政府基于数据智能的决策。
若将数据整理看作是数据资源化的过程,那么对于整理形成的数据资源的权利配置原则应当是“谁治理、谁持有、谁管理”。这不仅是数据与各级各部门政府的职权和业务相关联,而且因为数据整理本质上服务于政府业务,因而每一级政府都应当是本级政府数据资源的持有者,享有管理和使用其整理数据资源的权利,这也符合“权责利一致原则”。因为每一级政府为整理数据均要有预算投入,而有投入就要有“回报”,能够管理和使用整理好可重用数据以支撑本级政府决策和公共服务,就是对整理的最重要的“回报”。因此,在将数据整理定位于数字政府的新职责的情形下,政府数据持有者地位与持有者权的配置应当与既有政府管理体制和分工相一致。
2.数据开放管理:集中与分散
为了避免数字化建设过程中从分散到集中的弊端,[32]公共数据开放采取了统一平台开放模式。2015年《促进大数据发展行动纲要》提出“建成国家政府数据统一开放平台”和“推进公共机构数据资源统一汇聚和集中向社会开放”,体现了国家在数据开放方面的总体指导思想。地方政府积极响应,通过立法将统一规划管理和统一数据开放平台有关政策规定上升为地方性法律,以有效地实施政府数据开放计划。统一机构负责公共数据开放,通过统一数据开放平台进行开放,实施统一公共数据目录管理已成为地方政府的普遍做法,例如《浙江省公共数据条例》第9条的规定。然而,在大数据时代,数据的持续产生使得集中存储、整理和管理变得几乎不可行。数据开放意味着向社会提供经过整理的可机读、可重用的原始数据。从技术实现角度来看,在数据产生的源头进行整理,然后实时提供利用是数据开放最高效的方式。而继续“先集中存储、再整理、再开放”的现行模式,可能难以支撑数据量级不断翻倍增长的数据整理工作。因此,最有效的公共数据开放方式是源头整理,源头存储,统一通道(平台)开放。统一开放平台只起数据查询、匹配、调用或数据分发的作用。这在技术上被概括为政府数据的“物理分散、逻辑集中”[33]。政府数据是各政府部门职责体现和业务运营的“副产品”,[34]即使为开放目的的数据也无需物理移动、改变其管理责任和开放义务的主体,因而最恰当的方式是原地生产、原地存储、原地整理,统一窗口(平台)开放。
现代的分布式存储和逻辑汇集分析利用或联邦学习技术均可以支撑各级政府对自身数据的汇集利用。[35]考虑到不同层级政府对数据使用的便利性,本级政府职责范围的数据在本级政府的数据中心存储,而源自下一级政府的原始数据不需要向上级集中存储。从政府数据的用途来看,越是基础性的政府数据越适合集中管理,而特定的、行业或专业性的政府数据则需要源头、分散存储。这种集中与分散,上下级政府分级的数据管理模式并不妨碍上一级政府的逻辑汇聚与使用,其前提是各级各部门应当按照统一的数据标准履行数据整理职责,使政府数据具有互操作性。
3.数据授权运营审批权的分级配置
在现阶段,为了与统一数据开放平台相适应,政府数据资源开放的管理权上收至省级人民政府。社会主体获取政府数据需先向区县业务主管部门申请,再由省级业务主管部门决定或上报办公厅审批;审批通过后,数据从省数据中心调取和使用。这种完全依赖行政审批且高度集中的数据开放方式效率低下、运行成本高,不符合数据资源社会化和要素化利用的趋势。[36]
按照上述政府数据持有者权配置,每一级政府都应当享有对本级政府数据资源的管理权。若开放管理仅限于各级各部门数据主动公开社会可用数据资源(无条件开放),那么原则上各级政府部门均应当有这样的管理权(义务)。也就是说,政府作为数据持有者首要义务向社会提供可开放的数据资源。但是,当授权运营也成为数据开放管理权限范围时,就必须在每一级政府实施集中管理。每级政府应当由数据主管部门专门集中管理,行使政府数据授权运营审批权,以避免各部门数据持有者权的行使而导致的权力分散。[37]之所以要集中,是因为集中更有效率,实现一部门统办效果;之所以每一级政府都应有授权运营审批管理权,是因为必须审批权与数据持有范围相一致。授权运营本质上是政府数据持有者权的体现,授权经营的数据必须是本级政府部门生产、控制和管理的数据。若上级部门越权行使审批权,必定挫伤下级不同管辖地政府部门开发整理数据的积极性。鉴于政府数据开放和授权运营需要一定规模的数据才具有经济性,可将数据开放审批权下放至县级人民政府,并赋予省级政府协调不同县市乃至全省可开放数据资源进行开放或授权运营的权力。在中央政府层面,各部委原则上对本系统的数据资源开放享有管理权,但不直接审批决定。对于金融、医保、海关等垂直管理的行业,授权运营的管理权可以上收至省甚或中央主管部门。
在探索政府数据开放管理体制过程中出现的数据集中和管理权集中现象,与当前政府仍采用信息化理念和架构实现数据资源利用密切相关。在推进大数据开发应用和数据要素市场建设过程中,我国倾向于数据集中存储、集中治理、集中决策,将各条线数据汇聚于省级大数据中心,并将数据开放管理权赋予省级人民政府。在以业务结果数据、统计报表等信息资源为主体的时代,数据集中和管理集中是可行的。但在数据作为支撑各级政府决策及其辖区社会发展生产要素的情况下,过度集中的数据持有者权不利于数据要素化、社会化利用。我们需要从政府数据有效开发和利用,支撑各级政府实现数据驱动智能决策的角度进一步探讨更为可行政府数据持有者权的权责配置。
(三)政府数据社会供给的实现:数据开放与授权运营
从目前地方政府立法和实践来看,对于公共数据授权运营方式及其与数据开放的关系还存在着不同的认知。本文认为,政府数据无条件开放应限于可以直接发布于统一数据开放平台上的信息资源,它既不需要投入资源进行整理,这些数据的使用通常也不会带来额外侵权或违法风险,因而不限制获取主体和不控制数据使用目的或场景。这样的数据开放,可以纳入政府日常事务管理之中,将此类信息资源开放作为数字政府的一项基本服务。但是,为了实施原始数据集的开放,政府必须投入资源进行整理,将数据整理成为可重用、可开放的数据资源,并实施数据开放管理,包括设置数据开放条件、匹配符合条件的数据需求者、管理数据传输和使用过程安全等。显然,这是一项现有政府人、财、物资源无法承受和实现的新工作,需要通过有条件开放甚至授权运营的方式来实现。
1.政府数据开放管理
如前所述,进入数字经济时代,政府应当建设社会共用的基础数据资源池,既能够支撑政府转向基于数据的智能决策,又能够为社会提供可用的数据资源。这种基础数据资源以水文地理空间数据、人口数据、法人组织数据、经济统计数据最为典型。四大类型的数据资源是未来社会发展的基础数据资源,国家应当作为未来社会的基础设施进行开发建设,形成全社会可调用资源。因此,此类数据开发利用宜采取“政府开发整理+委托开放管理+非市场化利用”模式。
其中,政府开发整理是指基础类数据应当由政府预算内资金投入,每年纳入政府预算。这意味着不将数据开发视为一种投资行为,而是政府生产公共产品或服务的行为。政府开发整理形成的数据资源视为公共数据资源或公共数据产品,首先用于政府公共管理和公共服务,用于支撑政府基于数据的智能决策。在支撑政府运营的同时,整理好的基础数据可以提供给有需求的社会主体使用。
为了更好地匹配社会的需要,管控数据开放使用的安全,政府也需要委托特定的技术支持主体对数据开放进行运维管理,通过专门主体管理基础数据的开放事业。这类开放管理主体并不从事数据开发活动,只管理政府投资形成的公共数据产品。由于管理的系公共数据产品,因而理论上应当免费向社会提供。若数据开放管理过程中投入了成本或资源以维护政府数据开放秩序,管控数据社会化使用的安全风险,[38]且政府预算不能承担这类管理成本,那么应当允许开放管理主体向社会允许收取一定服务费用,以弥补管理成本的投入。因此,此类数据开放利用宜采取非市场化方式免费开放或者根据使用者的情形由政府指导定价。
2.政府数据授权运营
除了基础性通用数据资源外,政府在从事各条线业务管理过程中还会生成大量行业性数据或者具有明确应用领域的数据。典型的如健康、医保、交通、能源、金融、文化、体育、各类制造业、农业等的行业主管部门,在从事公共管理和服务过程中会形成行业性数据,这类数据开放可满足不同行业或产业需求。对于这些行业性数据,笔者认为适合采纳“授权开发+授权经营+市场化获取使用”模式,也就是政府数据授权运营。
授权运营指符合条件的运营机构对政府数据进行治理、开发,并面向市场公平提供数据产品和技术服务的活动,属于数据产品化开发和经营行为。因而,授权运营包含了两重授权:一是授权开发,使开发者可以合法地加工使用数据,将数据整理成为可重用、可开放的数据产品;二是授权经营,即授权运营者有权经营管理开发的数据产品,通过许可他人使用特定数据产品而获得收益。这两重授权使开发者成为数据产品的持有者,依据授权合同享有自主开发经营并通过市场交易实现数据价值(获取投资回报)的权利。基于这样的理解,授权运营者享有在合同授权范围的数据经营自主权,可以自主定价,以市场可接受的费用流通数据使用权。因此,授权运营模式使政府持有的数据资源得以接入数据要素市场,为社会提供高质量数据。授权运营主体一方面从政府获取原始数据,另一方面向社会提供数据产品,使政府持有的数据转换为市场化经营的数据产品。此类数据的潜在使用者不具有普遍性,用全体纳税人支撑的财政收入进行开发,满足特定行业或群体的需求,不具有正当性和公正性,而引入社会资本按照市场规则开发此类数据更具有正当性和合理性。
其一,政府持有的数据经开发整理才能成为数据资源,而数据整理需要资源投入。任何资本(包括国有资本)均追求投资收益,因而应当允许授权运营主体依据整理成本和市场需求进行定价。其二,基于授权协议,数据授权运营者对数据产品享有的权利受到合同约束(包括期限约束等),政府对授权运营者的开发和后续经营行为仍然具有监督义务,以确保授权运营者的经营行为符合公共政策。其三,授权运营者对来源于政府的数据的使用为有偿使用,以体现政府财政预算形成资源的价值。至于有偿使用的形式则取决于授权运营模式,如政府可以收取固定使用费,由授权运营者独立自主经营,还可以数据资源作为投资合作开发,以收取投资回报。这些收益或回报最终应当反哺数字政府建设,以提升整体社会福利。[39]
目前授权运营面临的主要质疑可能来自授权运营者准入条件和政府数据有偿使用两个问题。授权运营的数据源自政府,谁可以获得授权以经营政府数据,的确是需要设置授权运营主体的准入条件,同时考虑一定的公平竞争性。出于数据安全、政府信任、监督手段等多角度的考虑,一般选择国有企业或混合制企业作为授权运营主体。但是,随着在政府授权运营方面积累一定经验后,可以考虑吸收社会资本实施政府数据授权运营,或者在每个领域至少授权两家公司,形成一定的竞争关系,以减少独家授权运营的垄断风险。
四、结论
在数据开发利用视角下,政府部门和社会主体在数据要素化利用方面存在共性,即需要将数据开发为可重用资源并在安全合规管控下实现数据利用。从开发利用的角度重新思考公共数据开放体制机制是一个正确的方向,因为它将公共数据纳入数据要素化利用的一般轨道,不再把政府运营生成的数据当然地作为可利用的资源,只有经过开发(整理)才能成为可重用的数据资源。数据重用(共享和开放)需要匹配需求、构建秩序、管控风险等运营管理。这就意味着公共数据的要素化与社会化利用是一种需要投资和运营的事业。公共数据开发利用体制机制问题本质上就是解决谁来投资、整理和管理数据的共享和开放。在数据整理之前并不存在可用的公共数据,而对公共数据的描述只是体现了开发之后数据利用的方式。这在本质上否定了目前主流对公共数据的宽泛定义,并将其纳入数据开放事业的模式。这种做法在模糊了政府与社会边界,加重了政府数据开放责任的同时,也损害了社会主体(尤其是公共企事业单位)自主开发利用数据的权利和为公共或公益事业提供数据的积极性。
本文以政府在公共数据供给中的角色为视角,认为政府既有将从事公共管理和服务过程形成的数据开发并向社会提供公共数据的义务,也有作为公共事务的管理者激励、规范甚或强制社会主体向社会提供公共数据的职责。这两种角色分别对应政府的两类权利(力),其一是政府数据持有者权,其二是数据资源管理权。前者是政府数据开发利用的制度基础,目的在于支撑政府实现基于数据的智能决策,提高政府公共管理和服务的质效。后者是政府构建数据社会利用秩序,有效激发各社会主体开发利用数据能力,促进整个社会数据资源的价值实现,包括个体利用价值、共同利用价值和公共利用价值的实现。
目前各地的公共数据开发利用实践未区分上述两种角色和权利(力)。政府一方面从社会主体获取“公共数据”,另一方面又授权给特定主体开发利用。虽然我们需要时间来检验制度设计的可行性和效率性,但其至少在理论上模糊了政府和社会的边界,背离了市场在资源配置中起主导作用的基本原理。实质上,在人类迈向数据驱动发展新阶段,政府应当实施数据整理和利用,支撑政府实现基于数据的智能决策,然后再向社会提供政府数据以赋能社会。政府单纯以开放为目的并运用行政手段获取数据和实施开发利用的行为是偏离政府“主业”的行为,将政府塑造为社会中最大的“数商”。这可能是目前地方实践的公共数据开放利用制度所面临的最大制度风险。在笔者看来,只有充分调动社会多元主体的数据开发与利用的积极性,划定政府数据、公共数据与社会数据的边界,以“行政逻辑+市场逻辑”的方式有效激励公共数据的多元化、高质量供给,厘清数据开发与利用各环节的权责利关系,才能真正形成权责清晰、条框协同的公共数据资源开放利用格局。当然,本文对公共数据开发利用体制机制的论述是框架式的理论探讨,期待更多学者进一步深入研究和评判,以探索出切实可行的公共数据开发利用体制机制。
|参考文献
[1]“目前我国信息数据资源80%以上掌握在各级政府部门手里,‘深藏闺中’是极大浪费。”早在2016年5月9日的全国推进简政放权放管结合优化服务改革电视电话会议上,时任国务院总理李克强就指出了数据工作中的突出问题。参见《李克强:信息数据“深藏闺中”是极大浪费》,中国政府网,https://www.gov.cn/xinwen/2016-05/13/content_5073036.htm.(最后访问时间:2025年3月11日)。
[2]参见《公共数据开放水平为何不足?刘烈宏谈国家数据局六项破解对策》,南方都市报网,https://static.nfapp.southcn.com/content/202312/08/c8383029.html.(最后访问时间:2025年3月11日)。
[3]参见王晓冬:《我国公共数据开放面临的问题及对策》,载《中国经贸导刊(中)》2021年第10期,第78-79页。
[4]目前地方法规政府中数据、政务数据和公共数据三个概念,政府数据最窄,仅涵盖政府机构产生和管理的数据;政务数据居中,包括政府机构及其政府授权的事业单位生产的数据,而“公共数据”则最宽,涵盖了政府、授权执行公共事务机构和公益企事业单位的数据。这种“主体+业务”为公共性质逐渐为国家政策所接受。
[5]关于公共数据的定义的相关研究参见胡凌:《论地方立法中公共数据开放的法律性质》,载《地方立法研究》2019年第3期,第1-18页。
[6]参见高富平:《公共机构的数据持有者权——多元数据开放体系的基础制度》,载《行政法学研究》2023年第4期,第19-36页。
[7]这里的数据资源管理权主要指政府对于全社会数据资源的管理、流通与利用的宏观调整规范的权力,亦有学者称之为宪法意义上的公共数据国家所有权。参见张素华、王年:《公共数据国家所有权的法理基础及实现路径》,载《甘肃社会科学》2023年第4期,第146-158页。
[8]参见王敬波:《政府信息公开:国际视野与中国发展》,法律出版社2016年版,第10页。
[9]参见高富平:《公共机构的数据持有者权——多元数据开放体系的基础制度》,载《行政法学研究》2023年第4期,第19-36页。
[10]任保平、豆渊博:《数据、算力和算法结合反映新质生产力的数字化发展水准》,载《浙江工商大学学报》2024年第3期,第92页。
[11]参见 [英] 维克托·迈尔·舍恩伯格、肯尼斯·库克耶:《大数据时代:工作、生活与思维的大变革》,盛杨燕、周涛 译,浙江人民出版社2013年版,第134页。
[12]参见刘权:《政府数据开放的立法路径》,载《暨南学报》(哲学社会科学版)2021年第1期,第92-102页。
[13]参见张素华、王年:《公共数据国家所有权的法理基础及实现路径》,载《甘肃社会科学》2023年第4期,第146-158页。
[14]有学者亦主张公共数据的定义应当采用“功能主义”方案。参见宋烁:《公共数据识别宜采用功能主义进路》,载《政法论坛》2024年第4期,第63-76页。
[15]参见黄文艺、范振国:《公共利益内涵的法哲学界定》,载《南京社会科学》2010年第9期,第108-113页。
[16]张夏恒、刘彩霞:《数据要素推进新质生产力实现的内在机制与路径研究》,载《产业经济评论》2024年第3期,第171-184页。
[17]参见冉高苒、高富平:《“公益数据私人控制”的破解:确立私主体的数据开放义务》,载《中南大学学报》(社会科学版)2023年第4期,第73-84页。
[18]See Pollack Michael,Taking Data,University of Chicago Law Review,Vol.86,pp.77-141(2019).
[19]相关研究参见张韬略、熊艺琳:《拓宽数据共享渠道的欧盟方案与启示——基于欧盟〈数据治理法〉的分析》,载《德国研究》2023年第1期,第84-106页;司马航:《欧盟公共数据共享的制度构造和经验借鉴——以欧盟〈数据治理法〉为视角》,载《德国研究》2023年第4期,第67-87页。
[20]参见高富平:《数据经济的制度基础——数据全面开放利用模式的构想》,载《广东社会科学》2019年第5期,第5-16页。
[21]See Martens, Bertin and de Streel, Alexandre and Graef, Inge and Tombal, Thomas and Duch-Brown, Néstor, Business-to-Business Data Sharing: An Economic and Legal Analysis. EU Science Hub, 2020, pp. 40-45.
[22]See Tenopir C, Rice NM, Allard S, Data sharing, management, use, and reuse: Practices and perceptions of scientists worldwide, https://doi.org/10.1371/journal.pone.0229003. (2025-04-17 accessed).
[23]沈斌:《政府数据开放收益分配模式探究》,载《北方法学》2024年第5期,第87页。
[24]例如《全国人大常委会关于加强网络信息保护的决定》明确了网络服务提供者应履行的自查义务和相应的报告义务。相关研究参见冉高苒、高富平:《“公益数据私人控制”的破解:确立私主体的数据开放义务》,载《中南大学学报》(社会科学版)2023年第4期,第75页。
[25]关于数据财政的研究,参见童楠楠、杨铭鑫、莫心瑶等:《数据财政:新时期推动公共数据授权运营利益分配的模式框架》,载《电子政务》2023年第1期,第23-35页。
[26]参见周民、贾一苇:《推进“互联网+政务服务”,创新政府服务与管理模式》,载《电子政务》2016年第6期,第73-79页。
[27]参见宋烁:《公共数据开放中用户需求导向的高价值数据认定》,载《求索》2024年第5期,第176-185页。
[28]参见高富平、冉高苒:《数据要素市场形成论——一种数据要素治理的机制框架》,载《上海经济研究》2022年第9期,第70-86页。
[29]例如《江苏省公共数据管理办法》第4条规定,县级以上地方人民政府统一领导本行政区域公共数据管理工作,将公共数据管理工作纳入本行政区域国民经济和社会发展规划,建立健全工作协调机制,统筹解决公共数据管理重大问题,落实数据安全责任,组织开展监督考核。公共数据管理工作所需经费纳入本级财政预算。
[30]参见王伟玲:《政府数据授权运营:实践动态、价值网络与推进路径》,载《电子政务》2022年第10期,第20-32页。
[31]参见王芳、陈锋:《国家治理进程中的政府大数据开放利用研究》,载《中国行政管理》2015年第11期,第6-12页。
[32]此处的从分散到集中主要是指各地方政府自建信息公开网站到打造全流程一体化在线服务平台的发展过程。
[33]《天津市促进大数据发展应用条例》即非常明确地提出“物理分散,逻辑集中”的政府数据开放机制,其中第8条规定:“市人民政府统筹规划全市政务数据管理,建立物理分散、逻辑集中、资源共享、政企互联、安全可靠的大数据体系,制定全市政务数据共享和开放的政策措施,部署推动全市政务数据共享和开放工作。”
[34]See Farboodi, Maryam and Veldkamp, Laura, A Model of the Data Economy (February 2021). NBER Working Paper,No. w28427, p.5.
[35]参见胡业飞、陈美欣、张怡梦:《价值共创与数据安全的兼顾:基于联邦学习的政府数据授权运营模式研究》,载《电子政务》2022年第10期,第2-19页。
[36]参见王克稳:《我国行政审批制度的改革及其法律规制》,载《法学研究》2014年第2期,第3-19页。
[37]参见陈那波等:《把层级带回技术治理——基于“精密智控”实践的数字治理与行政层级差异研究》,载《南京大学学报》(哲学·人文科学·社会科学)2021年第5期,第51页。
[38]参见宋烁:《公共数据授权运营中的权责分配》,载《法学论坛》2024年第5期,第99-111页。
[39]参见彭诚信、龚思涵:《公共数据资产质押的理论澄清与规范构造》,载《法学杂志》2024年第5期,第36-52页。
评论(0)
请先 后发表评论~