原载于《数字法治》2026年第1期,第11-39页
01
杨东:数据作为一种新型客体,其权利本质如何界定?相应地,数据产权制度重点是“确权”以提供清晰、稳定的法律预期,还是构建一套能够保障和促进数据动态流通与使用的行为规则体系?
高富平:数据是特定事实或存在的数字表示,是认知客观世界(自然和社会)的媒介。它并非固定地存在,而是随着客观世界(认知对象)的变化而改变,因而关于特定认知对象的数据集总是随时间和场景而变化。一旦数据集的构成要素保持不变,那么它仅能反映特定时间、特定场域的状况,而非认知对象真实、全面的现状,就会导致认知偏差。无论在小数据时代,还是在大数据时代,人们在做研究或决策分析时都力求使用最新、最全、最真实的数据。这样,数据集的生产端与使用端均不断增删和调整,以使其具备适配分析目的的质量。而数据流通(交换、共享等)就是使用者不断完善其数据集、实现分析目的的手段。
数据这种动态生成与持续演化的存在形态,对传统产权逻辑构成了深刻挑战。产权是清晰界定资源利用秩序的工具。传统的产权成功解决了资源利用的两个问题:一是通过清晰界定资源拥有者(以占有或控制为基础)的主体边界,构建排他使用特定资源的权利(定分止争),又给予投资经营(使用物获取价值)的激励,避免了“公地悲剧”;二是赋予拥有者排他处分权,通过权利让与来支撑市场交易,实现资源的社会化配置利用(资源利用社会效用最优)。然而,实现这两个目的,对产权客体同样有两个要求:其一,客体确定,在主体与客体之间建立明确的支配关系;其二,支配关系(产权)可为外人判断。为了方便外人判断、保障交易安全,人类社会为不同客体创制了不同的公示和判断规则,例如,权利登记公示制度,以及对有形物的占有在特定情形下推定为所有。由于产权适用于客体确定且边界可界定的资源,而数据集随时间和场景的变化性使得主体与特定数据集的稳定支配关系(产权)无从建立;即使有可识别的支配关系,也仅服务于特定分析目的或流通目的,其“使命”因使用(一次认知)而结束,确认其产权的价值并不大,可能还要支付一定的成本。因此,我们无法通过建立稳定排他支配(产权)来借助产权交易实现数据流通。
那么,数据流通如何实现?在我看来,数据流通可以借助稳定的数据持有关系来实现。2023年,我提出数据持有者权。数据使用均需先获取和控制数据,而数据的获取与控制主体均为持有者。由于数据具有异构性,从不同来源获取的数据需要进行整理,形成可用或可重用数据,才能用于特定目的或形成具有一定使用价值的数据资产。数据资产可视为持有者持续维护更新的数据资源池,具有一定边界(借助控制系统可识别)和相对稳定的客体(架构、数据模式、不断更新的数据),能够清晰界定数据持有者。但是,我们不能简单依据持有(控制)关系来推定持有者所享有的权利。这是因为,数据源于社会,各社会主体的利益并不因使用者的获取而消灭。持有者的权利不能仅以持有事实为依据,而应建立在不侵犯数据上的合法利益(包括其他私主体利益、公共利益和国家安全利益等)且不违反法律规定的基础之上。如此一来,持有者仅在法律允许的范围内享有使用权。持有者是否有权对外提供数据,不能依据事实控制进行判断,也就不能借助公示机制(如数据登记)来保障交易安全。
持有者权只是对数据持有者享有权利的概括性描述,它既不是一种独立的权利类型,也不是用来交易的权属标的。在数据流通场景中,持有者始终负责管理和维护数据资产,为自身业务运营提供支撑。由于数据的使用是一个不断与不同数据进行汇集、整合的过程,为了避免重复整理、提升汇集与集成使用效率,由每个加工整理数据的持有者对外提供数据或进行许可使用,便成为一种最经济的安排,也是现实需求。因此,赋予持有者对外提供数据的流通权,即可开启数据社会化重用。这里不存在交易标的的确权,也不用走产权交易的“老路”。其关键在于构建一套能够保障和促进数据动态流通与使用的行为规则体系,让数据持有者和使用者在安全可信的交易环境中实现供需对接与价值交换。
因此,在数据流通体制中并不存在传统意义上可流通的数据产权,也未必需要数据产权登记。如果存在支撑数据流通的数据登记,其功能定位可理解为服务于流通便利与信任构建的存证。考虑到数据是覆盖整个社会的动态变化的资产形态,建立统一的数据登记体系存在现实困难,领域性或行业性的数据登记或许更能发挥一定作用。
王锡锌:数据法律制度的重点不在于规定谁来“控制”,而在于如何促进“流通”。数据权利并非法定主体对客体的绝对支配关系,而是围绕数据价值开发利用所形成的多元主体利益互动关系。这是因为,作为信息媒介的数据并非天然具有固定用途的稀缺物,其社会功能和经济价值并不由其物理载体或初始生成目的单独决定,而是取决于不同行为者在特定场景中,基于自身技术能力、生产架构与认知框架对数据的分析、整合、调用及持续互动。正是这种高度的情境依赖性、多方互动性与制度嵌入性,使得数据难以被纳入传统物权法中“稀缺物—排他支配—使用权切割”的配置逻辑。
在这一意义上,数据法律制度不宜通过强行确权来裁断权利归属,而应通过对数据流动与使用行为的调控来塑造可预期的秩序。需要强调的是,不强行确权并不意味着放任无序,恰恰相反,只有避免过度物权化,以市场秩序与交易环境保障为导向进行制度设计,才能为数据流通、利用提供真正清晰且稳定的法律预期。与其试图通过“控制视角”来“整体性”“一次性”解决数据归属问题,不如通过“关系视角”界定“哪一主体可以在何种条件下、以何种方式使用数据”,从而在动态中实现秩序的稳定。从信任构建的视角看,关键问题是:何种制度能够促使数据提供者自愿参与数据交易、数据使用方安心开发数据;何种界权方式能够减少交易达成前各方当事人的信息搜寻和核验成本,降低交易达成后当事人的履约监督、执行与再协商成本。应该看到,并非所有数据都需要通过新的数据产权制度加以规范。对于不以流通为主要目的,并且本身已经具备明确封闭性和整体性管理逻辑的特定经营信息、商业秘密信息或安全敏感信息,其治理重心可置于既有的知识产权法、数据安全法框架之内,并无必要引入新的动态化的数据产权制度。真正迫切需要在“控制”与“流通”之间寻求制度平衡的,是那些具有显著聚合性、关联性、场景依附性与非独占性的数据类型——正是在这一类数据上,各行为方在数据生产和数据利用的大量环节中都表现出了持续的共生与依存关系,单纯依赖排他控制或绝对确权,既难以实现效率,也难以兼顾公平,因而更有必要通过交易与流通制度的精细化设计予以调控。
因此,法律上的数据“权属”更宜理解为:在特定关系结构与用途下,对不同主体围绕数据的访问、共享、加工、再利用等行为所享有的权利束和所承担义务的规范化表达,而非对数据本身归属于某一主体的抽象确认。这一理解在制度选择上必然指向行为规则体系的优先性:立法与监管的重点不在于赋予某个主体排他性的“数据所有权”,而在于通过规则设定明确数据收集、使用、加工、转让与共享的许可条件、利用边界、基本义务与责任配置,以便在多方互动中实现关系的动态调适。
这种关系型、过程型、行为规则导向的数据治理模式,契合数据的信息媒介特征,有助于根据数据类型与使用场景的差异展开灵活配置,在同一制度框架下同时容纳个人信息保护、数据利用效率与公平竞争等多重价值目标。相比之下,生硬地将数据确权为类似传统财产权的对象,不仅在理论上面临“确给谁、确什么”的根本难题,在实践中也极易因权利边界僵化而抬高交易成本,反而阻滞数据流通。
事实上,当前绝大多数数据交易并未呈现出标准化、独立型的商品交换形态,而是采取了高度嵌入式、场景化、关系化的合同安排。仿照证券交易所或一般商品市场构建的数据交易场所,往往交易规模有限。其原因正在于,数据并非独立于使用情境、价值可统一计量的标准化商品。数据并没有固定、通用的价值,而是在持续聚合、匹配与再利用中释放新的价值。从数据的实际利用方式看,数据交易行为具有伴生性,往往嵌入主营业务活动,难以作为独立业务进行剥离和界定。多数所谓“数据交易”,本质上是市场主体通过数据为彼此提供服务、优化决策或开展合作。例如,互联网平台通过数据分析为企业提供流量排序与推荐服务,其核心交易标的并非数据本体的转让,而是数据所支撑的决策能力与服务过程,关键在于数据交易背后的“数据交互”。这类协议在法律性质上更接近服务合同或商业合作合同,而非物权意义上的数据买卖。在此情形下,若仅着眼于数据的确权安排,容易“一叶障目”,忽视数据价值实现所依赖的制度与组织条件。
熊丙万:在相当长的一段时间里,学界和实务界都在寻找数据“所有权”的归属。但实践证明,直接套用传统物权法中的“所有权”概念来界定数据权利的本质不仅是困难的,而且是徒劳的。这是因为,数据之上天然存在着复杂的利益共生与相互依存关系。一宗数据的产生常常不仅包含了信息来源主体的贡献,也凝聚了数据处理主体在采集、加工过程中的劳动与资本投入。例如,一宗完整的消费者购物数据的形成,需要电子商务平台记录商品内容数据,也需要支付平台记录支付数据,还需要物流公司记录物流数据等。各类主体在数据生产、利用过程中呈现出紧密的利益共生和相互依存关系。数据从一开始就承载了多元主体的不同利益期待,各主体可以同时在一宗数据上分别主张并行不悖的数据权益。这些权益,既可能是信息来源者的人格权益,也可能是数据处理者的财产权益。这与“所有权”概念所强调的所有权人绝对、完整地控制财产存在根本的不同。因此,以有体物为原型的传统物权制度在解决数据产权配置时必然力有不逮。为此,“数据二十条”决定“跳出所有权思维定式”,转而将“数据相关权利结构性分置”作为建构数据产权制度的基本思路。这一思路致力于同步满足各个数据利益相关方的正当权益期待,科学反映了数据权利样态的复杂特点。
“数据二十条”提出的产权“结构性分置”政策可分为两个层次:一是明确信息来源主体的法定在先权益与数据处理主体的权益分置。贡献信息“原材料”的信息来源主体享有个人信息权益、商业秘密等法定在先权益,而数据财产权益则应当配置给为数据的采集生成、加工处理作出实质性投入的数据处理者享有。也就是说,在充分尊重和保护数据承载的个人信息权益等法定在先权益的基础上,数据处理者对数据可享有独立的财产性权益。二是为了让数据能够被充分利用并在市场上高效流通,将数据处理者享有的财产性权益“标准化”,进一步分置为法律上可识别的、标准化的权利模块。对此,国家数据局发布的《数据领域常用名词解释(第二批)》以及《国家数据局等部门关于促进企业数据资源开发利用的意见》(国数资源〔2024〕125号)等政策文件已探索将“数据二十条”提出的“数据资源持有权、数据加工使用权和数据产品经营权”进一步更新为“数据持有权、数据使用权和数据经营权”。新近的国家数据产权基础制度很可能也将继续采纳这一界定,以便更全面、准确地指涉数据要素上的产权样态,提升数据产权概念的周延性。
从“结构性分置”的视角出发,数据权利的本质不是“所有权”,而是一组“标准化的权利束”。多个主体都可以对同一数据享有相同或者不同的权利束。数据产权制度的构建,需要着重回应“数据处理者对数据享有怎样的权利”以及“多个数据处理者对数据的权利如何协调”两个方面的问题。对于数据权利的界定,数据持有权重在“控制”,主要发挥的是防御功能,旨在确认并保护对数据的持有秩序,防范他人的不法侵害;数据使用权重点在于“自用”,旨在保障数据处理者自主使用、分析数据的权利,消除其使用数据的后顾之忧;数据经营权则解决“营利性处分”的问题,核心是赋予权利人自主处分数据的权利,即通过交易或许可他人使用获取收益,从而推动数据的市场化流通。
对于多个处理者之间的权利关系,新近的数据产权制度建设动向是引入数据权利的可共存原则(又称“一数数权”原则)。这意味着,持有权、使用权、经营权互相独立,同一权利人可全部享有,也可享有其中一项或多项权利。数据持有权、使用权和经营权这三项标准化的权利,既可以由某个主体单独享有全部权利,也可以根据数据流通、利用的需求,分置给多个主体分别享有。同时,鉴于数据具有可复制性、可以同时被多个主体利用的特点,数据上常常发生不同主体同步持有同一数据的“平行持有”现象。对此,新近的数据产权制度建设动向是引入“平行财产权”的架构,明确对同一数据的同一权利不同权利人都可以享有且互不排斥,并针对“共同生产经营活动中采集生成数据”和“多方合作融合数据”两类具体场景的产权配置作出指引。
在正确理解数据产权“结构性分置”政策的基础上,针对数据产权制度的构建无须再纠结于“确权”与“行为规制”的争论。事实上,“数据二十条”发布以来,学界的讨论已经超越“确权说”与“行为规制说”的简单对立,转而专注于构建一套既能明确权利归属、提供稳定预期,又能保障数据动态流通与公平利用的现代产权制度。在制度构建的思路上,我们不应将“确权”与“流通”对立起来。相反,科学的确权恰恰是高效流通的前提。因为,仅仅依赖“一事一议”的行为规制模式及个案中的合同磋商来明确各方对数据享有的权利,既无法为数据的生产提供必要的激励,也无法促进数据的流通。试想,如果缺乏清晰的权利界定,每一次数据交易中,交易双方都需要反复谈判“你到底拥有什么”“你能卖给我什么”,并对“交易的权利内容是什么”作出详细的界定。这种状态下的市场充满了模糊与不确定性,在经济学上讲就是交易成本高企。而确权正是为了解决这种困境,为市场主体提供清晰、稳定的法律预期。具体而言,通过将数据权利标准化为“持有、使用、经营”等模块,并配套相应的登记公示制度,市场主体不再需要花费巨资去调查每一个数据的权属背景,也无须对交易标的作事无巨细的谈判界定,而可以基于标准化的权利进行交易、登记。这能大幅减少数据流通过程中的权属纠纷,降低数据产权人的财产守护和缔约谈判成本。
需要强调的是,在构建数据产权制度的同时,需要同步引入一套包括合理使用在内的权利限制机制,避免产生“数据垄断”和“反公地悲剧”等负面效应。在妥当设定财产权限制规则的前提下,确权非但不会阻碍数据的流通,反而能够促进非公开数据的有限开放。正如所有的权利都存在限制一样,数据因其具有显著的公共性特征,需要受到比传统的有体物财产权更严格的限制。因此,在数据产权制度的建构中,除了正面确立数据产权以外,还有必要从反面规定数据产权应当受到的限制。具体而言,数据产权人除了需要尽可能满足社会大众日常生产生活中的合理利用需求、不得滥用数据产权损害市场竞争秩序,还应满足公共管理机构依法提出的数据获取与利用要求。一般而言,为个人研究学习、教学科研等目的,在合理范围内访问和使用他人已经自行公开或者合法公开的数据,不应被认定为侵权行为;对他人数据小范围的商业化利用,例如,搜索引擎为提供搜索服务对网站公开数据的获取和展示、个体网店经营者为改善经营在一定范围内对网络平台同类经营者销售数据的采集和分析等,只要不影响网站或平台的正常运行、不违背诚信原则和公认的商业道德,也应界定为合理使用的范畴。
刘诚:三位学者从法学视角对数据确权所持的审慎立场,深刻揭示了数据区别于传统有体物的独特属性。从经济学视角观察,制度的最终目的是实现资源的有效配置,而这一目标的达成,恰恰要以权利的清晰界定为前提。现有研究普遍认为,数据要素具有边际成本递减、边际收益递增,以及非竞争性、非排他性特征,这不利于数据要素市场化配置。实际上,要利用好数据要素,就必须承认数据的价值;而要承认数据的价值,就必须强调数据的稀缺性、竞争性和排他性,并通过市场化方式确权、管理和使用数据。
一方面,数据具有稀缺性。数据所含信息的价值在公开之后会有所下降,甚至完全失去价值。在数据传播过程中,复制一份数据的新增成本几乎可以忽略不计(这一判断未考虑知识产权因素)。对单个企业而言,数据的边际收益是下降的,也就是说,数据“边际收益递增”的说法并不准确。所谓数据“边际收益递增”,是对全社会而言的一种总体判断,或者说是相对于数据边际成本的快速下降而言其边际收益递减速度较慢,再或者是因为数字技术创新和业态革新导致数据收益提高,究其原因实则是传统经济理论早已论证的规模经济、范围经济、技术效率、组织效率,这在对土地、劳动、资本等生产要素的分析中也存在,并无理论上的明显突破。例如,随着产业革命的发生,从农业到工业和服务业,单位土地的经济产出出现大幅上升,但我们不能据此认为土地的边际收益递增。
另一方面,数据的非竞争性和非排他性也是一种误解。数据的竞争性和排他性不容置疑。生产或创造第一份新的有用数据的代价昂贵,不仅需要很高的研发投入,还面临很高的失败风险,甚至颗粒无收,因而存在一个经风险调整后的高昂沉没成本。尽管互联网企业尤其是以消费者为中心的互联网企业通常只需要很低的新建成本,但必须考虑其在研发创新和高风险承担环节的巨额投入。而且,数据是一些企业的核心竞争力,科技企业提供的服务产品本质上就是以数字信号形式呈现的数据、知识或信息。
数据的非竞争性和非排他性的判断,是对现实制度缺失的一种写照,不利于数据的确权和交易,会影响数据价值的实现。在现实中,当然也存在数据开放共享,但这属于公共领域数据,有特定范围与管理方式,并非全社会数据治理的常态化、标准化做法。如果将数据开放共享作为常态,过度宣扬数据的非竞争性和非排他性,可能导致市场主体积极性下降、交易市场萎缩、数据资源配置的市场失灵,甚至退回计划经济模式,由政府主导收集、存储、处理、公开、规制数据。这在税务大数据等领域已被证明是低效的,在电商、工业互联网等领域可能更加无效率。可以说,非竞争性和非排他性等说法,凸显了数字经济的特殊性,但可能导致相关研究对经济学经典理论“无所适从”,进而侧重现象描述而缺乏理论深度。
从法理上讲,若将数据界定为可私有的客体,则可能存在一种数据所有权,尤其是个人对其个人数据的所有权。但在现实中,数据无法与电子载体相分离,不具有物的独立性,且可被无限复制、任意删除,不同复制体亦可由不同主体控制,在支配上无法实现完全的排他性。因此,数据所有权的主张并不强调唯一的独占权利,而是强调数据访问和利用的权利,即个人对其个人数据的自决权。事实上,我国及西方国家的现行法律体系均未赋予数据生产者相应的财产权或知识产权,但这不妨碍法律赋予其一定的具有财产权或知识产权特征的权利。例如,欧盟在数据库、版权和商业秘密保护等相关领域,均规定了数据所有者的权利。
杨东:四位专家分别从数据属性、制度逻辑与经济学视角,对数据权利的本质内涵及数据产权制度的核心要义展开深入探讨,形成了富有启发性的学术对话。综合各方观点不难发现,数据产权制度的构建既需正视数据的独特属性,也需兼顾效率与公平的双重价值。作为一种新型客体,数据要素的权利本质不应局限于传统物权的排他性逻辑,而应立足于其价值共创性与动态流通性等内在特征。数据产权制度的重点不应是静态的确权,而应是构建一套能够保障和促进数据动态流通与使用的法律规范体系。原因在于,成为应用端产品前的数据要素难以确权:一是单一传统权利范式在主体之间关系上难以实现数据要素的“定分止争”;二是在主体与对象关系上难以实现数据要素的“物尽其用”;三是在数据要素与社会的互动关系上,单一传统权利范式存在私人性与公共性的矛盾。
数字经济时代,市场经济从确权、交易以形成市场,逐步发展到明确利益激励和分配机制、通过共享创造价值以形成生态,即从“确权—交易—市场”向“利益—共享—生态”转变。因此,数据行为规则体系应以价值实现与激励机制为核心,实现从市场范式到生态范式的转型,通过确立开放共享、贡献分配、场景化利用等规则,在激励数据价值创造的同时,确保多元主体在数据流通中各得其所,从而超越传统产权范式,构建数据要素“利益—权利”双元共生的制度安排,形成适应数字经济发展的新型治理框架。我所提出的“共票”理论,正是聚焦解决数据价值创造的核心命题。“共票”是中国原创概念,是基于数据创造形成的新利益综合凭证,通过区块链技术对数据价值创造中多元主体的贡献进行标识,建立激励数据要素价值链条主体充分共享的机制,依托技术措施锚定的收益凭证在数据要素流通共享中实现收益,发挥数据要素的乘数效应。
值得关注的是,目前我国正开展《数字经济促进法》的研究、起草与制定工作。该法在制度设计中也应当贯彻这一思路,着眼于构建激励相容、开放合作的制度环境,充分发挥数据要素的乘数效应与价值赋能作用,为数字经济持续健康发展提供坚实的法治保障。
02
杨东:当前,我国已在数据产权登记、数据知识产权登记等领域开展多维度实践探索。例如,中国人民大学法学院研发的“涉外法治大模型”已在上海完成数据产品知识产权登记。这些探索引出一个核心问题:登记制度对于数据产权而言,其法律效力如何定位?是具有权利推定、对抗第三人效力的确权基础,还是服务于流通便利与信任构建的存证机制?立足这一定位,我们又应如何构建全国统一的数据产权登记体系?
王锡锌:数据登记制度应服务于具体的数据使用场景,促进数据的高效与公平利用,而非“为确权而确权”“为登记而登记”。在法律效力定位上,数据产权登记更适合作为“存证机制”(登记证明效力),而非强确权模式(登记生效或登记对抗效力)。数据登记制度的核心功能,应当是降低交易不确定性,为交易相对人提供可信的权益线索,为企业匹配关联更多的同类企业或有相同需求的数据商,从而减少信息不对称,防范潜在的侵权行为。这一制度功能定位,既有助于避免因权利边界僵化而抬高交易成本,也符合当前登记机构的现实能力和组织职能,有利于合理厘清市场、行政与司法的边界。
从数据交易的现实运行情况来看,处于流通进程中的数据往往呈现出大体量、动态化特征,权利关系并非静态存在,而是伴随数据的持续加工、整合与再利用而不断发生变化。尤其是当数据集规模越大、维度越多、结构越复杂时,从原始数据中提炼出可用于决策的结论所需的加工深度和工作量将显著提升,权利状态也愈发难以在单一时点被稳定把握,而是在不同的应用场景、需求主体、控制技术中动态呈现。在此背景下,要求登记机构“一锤定音”,对数据权属作出整体性、实质性、概括性的确认,本身就超出了其制度功能与现实能力。尽管区块链、智能合约、可信时间戳等技术手段,已经能够对部分数据主体、数据操作行为和数据流转节点进行记录,但在当前技术条件下,大部分登记机构事实上难以对所谓“确权结论”进行持续、充分的实质性审核。即便个别机构具备审查能力,在应对复杂的信息流通场景时也需要付出高昂的信息核查成本。从比较法来看,欧盟、美国等法域也都没有采取登记生效或对抗等强确权模式,而是通过行为规制来保障数据的合理控制与使用,目前尚无采取登记生效或登记对抗的实例。
还应看到,数据作为要素的潜力常常处于待开发或未完结状态,难以完全预设,过早设限可能阻断创新路径,尤其是在数据价值尚未显性化之前强行设定权属边界,实质上将高潜力数据排斥于交易场域之外。例如,登记确权模式可能形成一个“使用空窗期”,使得数据在登记完成前无法投入利用,导致数据增值推迟,进而削弱数据资源在关键使用环节中的活力与流通性。又如,强登记效力可能导致关联的数据生产架构变得碎片化,阻碍各种潜在的创新和数据的汇集融合利用。特别是对于多方主体共同生成的数据,一次性、个别化、静态化的确权登记将破坏数据生产的复杂网络结构,大幅增加交易成本,降低资源配置效率。除此之外,将数据比附传统财产进行登记,还可能为头部企业巩固优势提供便利,诱发严重的结构性垄断。归结而言,与其试图制造一种虚假的、象征性的权利确定性,不如将登记制度转向进程性、开放性的信息呈现机制。关键不在于一次性界定“数据属于谁”,而在于不断提高时间标识与过程记录的精细程度,并为数据状态的持续演化预留制度空间。即,在登记机构能力范围内,呈现初步权利判断线索,提升资源配置效率,构建数据流通的“服务平台”。
因此,在技术与组织能力尚未匹配之前,对于数据产权而言,将登记制度理解为一种以证据化与信任构建为核心的存证机制,比直接赋予排他性权利并产生全面对抗效力的确权制度更为稳妥。数据登记制度的功能不在于替代市场对权利配置的判断,而在于通过降低信息不对称与交易成本,为市场协商、司法裁判与竞争规制提供一定的事实基础。
从既有裁判观察,当前我国司法实践中亦未对不同类型的数据登记证书采取“一刀切”的效力认定,而是根据登记机构的法定资质、审查程序的严谨程度、登记内容的具体性与可核验性,在个案中动态判断其证明力强弱。这种差异化采信路径,既避免了登记制度被过度物权化,也为不同登记探索保留了制度弹性。例如,北京知识产权法院在“人工智能语音数据集不正当竞争”案中明确了数据知识产权登记证的初步证据效力,为数据登记制度的司法定位提供了重要指引。法院在该案中明确,登记证书在诉讼中具有初步真实性推定的效力,表明持有人对特定数据集合享有某种权益,有助于法院认定事实。然而这种效力是有限的、非绝对的:法院强调,登记证仅在个案中提供初步证明力,利害关系人可以通过相反证据推翻该证明力。同时,登记证书并非主张数据权益的必要前提,未登记的数据权益人并不当然丧失法律保护或诉讼资格。此举没有简单照搬传统工业时代的产权处理模式,避免将登记形式绝对化,以免损及未登记权利人的实质权益。这种动态平衡处理,使登记制度成为促进数据要素流通的配套支撑,而非强制确权的工具,更有利于保障数字经济的活力。
目前,从地方立法表述上看,各地政府正在探索双轨并行的数据登记模式:一轨是由政府的大数据管理部门(如发改委或数据局)及其授权机构(如授权或监管数据交易所)主导的“数据资产/产权登记”,另一轨是由知识产权管理部门(如知识产权局及其下属机构,或通过授权及政府采购委托其他机构)推动的“数据知识产权登记”。尽管在概念表述与管理部门上有所区分,但这两类登记主要承担的都只是事实记录、权利线索公示与交易信任构建的功能,而非确认排他性实体权利。进一步,从运行模式看,地方实践大致可归纳为政府主导模式、行业自律模式与政府监管下的第三方认证模式,其中以政府主导及政府监管下的第三方认证模式为主流,即在各省、市知识产权局或发改委等部门的总体统筹管理下,各类服务机构承担具体工作。不过,目前的地方登记中存在标准不一、互认困难的问题。各省、市的登记制度在整体趋同性之外,仍存在一些差异:登记对象边界不够清晰,登记主体范围有待统一,审查标准尚未完全一致,登记效力的表述也存在一定的模糊性。
首先,登记对象的边界尚不清晰。不同地区对可登记客体的界定标准不一,有的构建逻辑与框架以“数据集合”为核心,强调需经规则处理、具有实用或商业价值;有的则扩展至“数据产品”乃至算法模型、数据技术成果。对于公开数据、原始数据是否可以登记,以及数据需达到何种加工深度方可登记,各地规定差异明显。这种客体界定的不一致,导致同一数据在不同地区可能面临“可登或不可登”的不同结论,削弱了登记制度的稳定性与可预期性。
其次,审查标准与审查强度存在显著差异。多数地区采取以材料完整性和形式合法性为核心的形式审查模式,少数地区则探索“第三方机构实质审查”模式——其考量在于,若登记门槛过低、仅作形式审查,较低的信号成本将削弱可信度。由此,登记证书可能流于形式,无法实质改善信息不对称。不同审查模式下,数据登记的审查内容在数据来源合法性、个人信息合规、智力成果属性等方面宽严不一,这也导致不同地区登记证书的专业性与可信度存在差异。
最后,登记法律效力的表述仍显模糊。多数地方文件将登记证书定位为权利的初步证明或交易凭证,但个别地区出现疑似“登记生效”或“公示对抗”的规则表述。这类模糊与差异无疑增加了数据跨区域流通的制度成本。
综上而言,规则差异导致各地登记制度难以互认,容易诱发“区域数据岛”现象:登记证书的效力和含金量随地区而异,企业跨区域数据交易仍需反复确认权属,增加了交易成本,削弱制度公信力。这种复杂多元的探索阶段暴露出数据登记制度在客体界定、权属效力、审查模式上的共识缺失,迫切需要在国家层面加以统筹协调。
值得注意的是,从立法权限来看,数据权利登记是一种财产权登记,涉及数据流通的基础性服务,属于民事基本制度范畴。因此,依据《立法法》第11条之规定,不得在无法律授权的情况下将其交由地方立法自行探索,而宜通过法律或立法性决定加以系统规范与授权试点。在此背景下,建设“统一数据产权登记体系”的目标,其实施路径的关键并不在于简单整合或取代地方既有探索,而在于通过顶层制度设计,对多元登记实践进行规范化、协调化与职能优化,将其逐步设置为为未来统一制度积累经验的过渡性安排。统一并不意味着一步到位实现单一登记主体或行政登记权的高度集中,而应当着力于实现审查能力与审查事项相匹配、审查方式与数据处理进程相匹配。
具体而言,统一登记体系的构建应以统一标准与程序规则为核心:在全国层面明确登记的基本客体类型、审查要素清单、证据效力定位与信息公示要求,使不同部门、机构在适用同一套实体与程序标准的前提下开展登记工作,避免因部门职能划分差异导致的判断冲突与权限模糊。同时,应通过完善组织法与程序法安排,建立信息共享、异议处理与协同审查制度,防止出现多头确权、重复登记或责任空转。
在制度演进路径上,可以采取“先标准统一、后主体整合;先程序协同、后职能集中”的渐进策略:在尊重地方探索与部门专业能力特点的基础上,通过中央层面的规则整合与技术平台对接,逐步实现数据登记制度的“统一标准、互联互通”。这种以能力配置为导向、以程序协同为抓手的实施路径,更有助于在秩序稳定与制度创新之间取得平衡,也更契合数据登记制度“存证为主、确权从缓”的功能定位,从而真正为数据流通提供一个降低信息搜索成本和交易成本的平台。
杨东:王锡锌教授的分析精准契合数据的动态属性与登记制度的实践逻辑,对登记制度的功能定位、实践困境的研判都十分透彻,也为后续探讨提供了重要的思路支撑。数据登记制度融贯于实体法与程序法之间,需要依据契合的治理范式来构建制度框架。登记制度的法律效力应结合数据要素的特征予以界定,其核心目标在于激励数据要素实现最大程度的流转与利益合理分配。
从长远来看,若登记制度仅停留在存证功能层面,其对数据流通的激励作用,以及对数据后续价值充分释放的推动作用将较为有限。此外,在司法实践中,单纯依赖登记作为存证,难以有效解决利益分配纠纷,相关争议往往仍需通过诉讼等事后机制处理,无法实现定分止争的制度初衷。因此,在登记审查机制的构建上,应破除实质审查与形式审查相对立的观念,依托区块链等新兴技术,塑造登记制度“事前—事中—事后”的全流程动态规制框架。数据登记制度的实质性审查模式,应体现为动态双维建构:在数据登记审查阶段,登记部门仅审查核心数据以保障核心利益;同时,将登记数据不可篡改地存储于链上,实现全流程溯源,以便在争议发生时,能够全场景、全周期调取涉争议数据。例如,目前上海市知识产权局针对数据产品开展的知识产权登记工作,正在深度研究实质性审查的细则规定,这应成为未来制度建设的重点方向。此外,制度设计还应体现成本与收益的平衡原则:既不宜赋予登记过高的排他性效力,避免增加不必要的制度成本;也不应完全放弃其在明晰利益状态、稳定交易预期方面的积极作用。
对于统一数据产权登记体系的建设,未来应构建多元化、场景化的登记体系,针对数据要素、数据资源、数据资产、数据产品、数据知识产权、数据收益凭证等不同形态与应用场景,设计差异化的登记规则与效力安排,使其更贴合数据要素的动态性与利益复杂性。利益激励机制是数据登记制度建构的核心支柱,制度设计中需明确所登记的“元利益”结构,基于“共票”理论建构数据收益凭证的新型登记模式,保障数据要素生命周期中各参与主体依据其动态贡献获得合理利益分配。这一数据登记的新理念,已在《浙江省优化营商环境条例》中被创新性地吸纳为“收益凭证登记”并予以明确,值得高度关注并在全国推广。
03
杨东:作为人工智能训练数据高质量供给的基石,高质量数据集登记在登记客体、审查标准、法律效力、权利配置等方面,与普通数据登记相比存在哪些特殊性?基于这些特殊性,该如何进行针对性设计?
高富平:一般认为,数据集的质量取决于数据的准确性、完整性、相关性、有效性、及时性和一致性。高质量数据集是数据获取(使用)者持续进行数据生成、汇集和加工整理,并实施相应合规和安全管理的结果,使特定数据合法满足相应需求,兼具实用性与合法合规性。这是需要持续投资的“生产性管理活动”,所形成数据的使用需遵循经济规律,兼顾数据生产者的回报诉求,赋予投资方(实施整理工作的主体)使用/经营权。在数据整理运营领域,仍应遵循营利性与非营利性两类运营模式:非营利性模式下,高质量数据集的供给可免费提供或实行国家定价;营利性模式下,则由高质量数据集的生产者自主定价或遵循市场定价。不过,高质量数据集的生产和供给还面临数据“原料”的来源问题。若数据可开放获取,那么经整理后的数据供给,只要遵循对应模式要求,即可实现社会化供给。但在数据存在初始生成主体的情形下,这些原始数据主体是否愿意提供,以及如何获取其数据,就成为高质量数据集生产和供给制度构建中必须考虑的问题。
为了明确原始数据的获取路径,可将数据大致分为三类:公开数据、政务数据和社会数据。公开数据是社会各类组织(包括政府机构)公开的、允许任何人采取合法手段(包括通过自动程序)获取的数据。政务数据是政府部门持有的、在依法履职中收集和生成的数据,具有向社会开放(提供)的义务。社会数据则是政府部门之外的各类社会组织运营产生的数据,由组织自身持有,没有向社会提供(开放)的义务,除非自愿“捐赠”。据此,数据获取规则可分为两类:一是开放获取规则,对于公开数据、政务数据和社会主体捐赠的数据,可以采用开放获取规则,各主体只要手段合法、遵循既有流程、不损害原数据持有者的权益,即可获取;二是受控获取规则,在数据作为资源的背景下,社会数据的生产者具有自身利益,任何数据使用者均须在承认和尊重数据持有者权益的前提下,获取和使用数据。
在开放获取规则下,数据汇集整理后的供给方式主要取决于汇集整理业务的运营模式:若采取商业投资方式(含国有资本投资)运营数据整理(开发),则应采用营利性模式,按照市场或商业规则供给数据;若采取公益性资金投资运营或采用混合模式(融合开发),则可按照公益逻辑向社会供给数据。然而,当数据由具有个体利益的主体持有时,则需在承认并保护其权益的前提下,通过多种数据汇集和集成方式,推动高质量数据集的开发与供给。在我看来,至少存在以下四种模式。
第一,互换数据模式。在相互具有数据需求的生态中,宜建立合作交换使用的机制。在这样的生态中,每个参与者既是数据供给者,也是需求者,因而最经济的方式是参与者各自负担成本,按照统一标准整理数据,将可交换的数据集制作成可检索的数据目录;同时,将该目录集成为可供所有参与者检索、访问和调用的系统,通过API或连接器实现按需访问和提供。每个提供者或使用者所提供或使用的数据均可溯源、质量可控、流动过程可控、使用数量可计量、使用责任可追究。这正是数据空间的初衷,该模式的成功关键在于参与者通过共同治理,共享数据交换或集成使用的收益。因此,本质上,它是数据持有者或使用者相互协商的合作共治模式。
第二,数据共同资源池(data pooling)模式。在这种模式中,基于共同目标或特定行业,数据持有者将各自的数据汇集到一起,建立联合运营组织或共同授权特定实体负责数据的运营管理,以向参与者(或会员)或为特定目的(如公益事业)提供数据。所汇集的数据是各持有者初步整理的数据,在汇集过程中还需要再次进行结构化和分类整理,以形成整体可用的数据资源。共同资源池的参与者通过贡献自身数据,换取更广泛的数据或使用到更多数据。
第三,高质量数据集的个体生产和供给模式。数据是覆盖整个社会的,因而每个社会主体都属于数据生成或生产者,都有权利从社会合法获取数据并与自己的数据融合汇集,形成可重用数据,在满足自身需要的同时向社会提供。由于数据具有非排他性、非消耗性,在数据持有者自用的同时,仍可以产品化思路整理数据,满足不同的数据需求。只要每个社会主体具备数据整理、分析使用能力,且有对外许可使用数据的意愿,则每个社会主体均可以,也应当成为高质量数据集的生产者和供给者。这需要社会为整理完成的数据集的供需匹配提供通道。
第四,专业数据集成商的供给模式。这种模式首先需要精通行业需求、具备多源数据整合能力的数据集成商,由其联结一定规模的原始数据供给者,并确认数据供给关系。将分散数据整理为合格质量数据的成本由集成商承担,其集成形成的数据集亦由集成商持有。集成商可自主经营数据集,通过向数据提供者回馈数据或有偿提供数据集实现数据价值。数据集成商的数据通常源于前述三类数据,仅当数据源于特定提供者时,需考虑原始数据提供者的贡献与回报。在无法准确计量贡献的情形下,亦可通过赋予其一定规模集成数据的使用权作为对价。
高质量数据集的生产和供给需要解决两个核心问题:其一,如何将分散于不同持有者管理的数据联合或聚合起来;其二,谁来负责数据整理,以确保聚合数据的质量。在上述四种模式中,前三种均是数据持有者自主组织下实现的开发利用,而最后一种则是由专业数据公司主导,在保护数据供给者权益的前提下聚合使用。其实,前面提及的三类数据,无论是否经过专业公司集成开发,均可加入这四种模式中融合开发。整理形成的数据集可以为参与者使用,也可以为社会使用,通过有偿或无偿方式满足社会数据需求。在数据行业实践中,一个公认的有效数据汇集整理供给方式是,每个数据生成源头均按照统一标准进行整理,再按需配置和供给。凡是实施整理、确保汇集数据质量的数据持有者,均需通过交换、合作或某种对价方式获取回报。这需要在共同认可的标准下,建立所有参与者(数据提供者、整理者、集成者、分发者、使用者等)权责利分配的共识与规则体系。因此,亟待探索多方参与的合作治理机制,探寻多样的数据整理、供给和使用模式,破解高质量数据供给难题。
综上,数据使用具有非排他性、应用多场景、价值多元性等特征;数据又是在社会不断流通利用中实现价值的,因而数据不能也不需要配置排他支配意义上的产权;数据可能关联多个主体的合法利益,且不会因先占控制或加工整理而使持有者成为所有权人。因此,数据的社会化重用不宜采纳传统经济范式。目前,各地试点的各类数据登记制度,尚不足以支撑数据集的流通和社会化重用。
王锡锌:对这一问题的分析,应当采取功能主义的路径:不仅仅把目光放在“高质量数据集应当如何确权”这一问题上,更要追问——界定高质量数据集并设置登记制度,究竟服务于何种制度目标?为了实现这一目标,登记制度又需要与哪些配套规则展开联动?
例如,在政务数据领域,高质量数据集的识别与登记,并非为了创设类似不动产的排他性权利,而是服务于相应的数据管理、开放与责任配置目标。比较法上,欧盟《开放数据指令》引入“高价值数据集”(High-Value Datasets, HVD)概念,即明确体现了这一功能主义取向。该指令将高价值数据集界定为:其再利用能够为社会、环境和经济带来显著公共利益,尤其适合开发增值服务、应用并创造高质量就业,且潜在受益者范围广泛的数据文件。值得注意的是,欧盟在筛选和排序高价值数据集时,并非以“权属清晰”或“财产属性显著”为核心标准,而是以市场效益、创新潜力和社会收益为导向,并辅以下载量、复用潜力等技术指标来确定优先开放顺序。根据该指令附件I,高价值数据集主要集中于地理空间、地球观测与环境、气象、统计、公司及公司所有权、交通流动性等主题领域。这些领域的数据之所以被优先标识,并非因为其更“像财产”,而恰恰是因为其公共性强、基础性显著、对人工智能和数字经济具有系统性支撑作用,故而需要优先和广泛开放。在我国,政务数据中的高质量数据集登记,同样更多承担着数据开放利用与财政监督的前置性功能。其核心目的在于“摸清家底”,明确哪些数据应当优先开放、广泛开放、规范开放,而非通过类似“土地式登记”的方式对数据进行物权化确认与分割。因此,从制度目标上看,高质量政务数据集的登记并不以确权为中心,而是以配置公共资源、引导数据流向和强化责任约束为导向。
相较于政务数据,市场中的“高价值数据”则不能一概而论,而应进行类型化分析,至少需要从价值来源与社会功能两个维度加以区分。
在价值来源上,部分高质量数据集主要依赖于数据处理者的专业投入、创新需求与整合能力。例如,人工智能领域中蕴含高浓度专家知识的训练数据集(如法律专家参与标注并代码化的案件集合、法条解释),其价值主要源于数据清洗、标注、质量校验等高强度智力与技术投入。训练数据集在很大程度上决定了生成式人工智能的性能和效果。这类数据如果缺乏合理的权利保护与激励机制,可能削弱企业持续投入的动力,因此,在登记与权利配置上,应当更加强调对加工者、整合者的激励功能,通过数据登记来发挥一定的凭证、提升信任和降低竞争侵权风险的功能,鼓励交易并提升数据的流通收益。在实践中,深圳等地已经探索将高质量数据集纳入专门的流通交易机制,通过数据交易所和要素流通服务平台,对优选的数据集进行确权、登记、评估、交易和结算全流程安排,并推出了数十个严选数据集挂牌交易。亦即,在一般登记规则基础上,增设质量评估和授权使用方面的特殊规范,起到政策激励效果。这也提出了公平竞争审查与规制影响评估的要求。此外,在人工智能时代,高价值数据的“质量”不仅指准确性、代表性和数据规模,还指“安全性”和“合规性”,对这类数据的安全与合规问题也需要在登记中予以关注。例如,数据处理者在训练数据集的选择、标注、优化等过程中,可能故意或者无意地引入或者放大某些特定的价值观、立场、偏好等,诱发歧视与信息茧房风险。
相较而言,另一部分高质量数据集则深度依托于公共性或社会性生成机制。例如,政企合作、众包采集、研究机构公益开放或由海量个人信息汇聚形成的数据池,其生成机制、内容结构与使用场景自始即承载着一定的公共性或社会性。这类数据的价值并非源于单一主体的独占投入,而是来自大规模社会参与和持续互动。就此,对数据来源者权益的承认与分配需要慎重对待,否则容易引发民众对于数据资源利用的排斥情绪。尤其是掌握着海量个人信息的大型数据企业,其在利用数据过程中确实能够产生巨大的经济效益与社会效益,对数字市场和数字经济发展具有重大影响。但正因为数据的形成高度依赖广大主体的来源贡献,这类高质量数据集就不可能被完全抽离为纯粹的私人财产,在规制上必须更加强调收益公正分配、互联互通与共享开放。例如,许多医院规模很大,院内特色专病库中积累的病例数据量,足以训练出垂直领域基础模型(或称专科智能医生基础模型)。由于担心数据出院会带来不可控的患者隐私泄露风险,医院大多采取与科技公司及医药公司签约合作的方式,在医院内使用这些数据训练模型,进行科研项目开发和学术研究。这类数据利用方式具有很强的公共性,有必要在契约中明确风险规制以及加工后数据的交互共享要求。
在社会功能维度,高质量数据集并非“价值越高,义务越轻”。恰恰相反,一些数据因其对社会公正、经济公平、公共安全具有基础性意义,基于财产权的社会义务理念,反而应当承担更高强度的开放与公平利用义务。而另一些主要面向特定消费群体、文化或娱乐属性较强的数据,其公共义务则相对有限。因此,要实现高质量数据集的公平利用,立法者既不能仅从“单个数据来源者—数据处理企业”的关系出发,也不能寄希望于通过简单的权益分割或确权来解决问题,而应在允许和促进数据合理汇聚的同时,引入社会正义与市场公平维度的行为约束。例如,当某一高质量数据集属于重要领域基础数据,且登记人同时享有市场支配地位时,登记制度就应当与反垄断法、不正当竞争法形成制度联动,防止企业凭借登记取得的“权利外观”封锁数据、排除竞争甚至扭曲市场结构。互操作标准、接口开放条件、合理许可原则等,均可作为连接登记制度与竞争法的制度桥梁。在此框架下,高质量数据集登记制度不再是单纯的权利确认机制,而应被作为提示行为边界、为互操作与竞争规制提供制度接口的基础性安排。
杨东:高质量数据集的有效供给,离不开开放的数据获取渠道与完善的制度设计,二者缺一不可。两位教授的观点为高质量数据集登记制度的构建指明了方向——既要以供给效率为前提,又要以功能定位为锚点。基于此,可对高质量数据集作出定义:经过采集、加工等规范化数据处理,可直接用于人工智能模型开发与训练,且能显著提升模型性能的数据集合,是数据的核心类型。因此,相较于普通数据登记,高质量数据集的登记审查标准更为严格。唯有如此,方能保障其高度泛用性,实现价值的最大化挖掘。
总体上看,高质量数据集结构明确、边界清晰、财产性利益相对固定,具有突出的价值属性,理应在数据产权登记制度中予以重点设计。需要强调的是,高质量数据集与具体应用场景紧密关联,在登记制度设计中必须充分考虑场景化因素,从应用场景、数据类型、使用条件等维度进行精细化分类与描述,以提升登记内容的精准性与实用性。与此同时,为确保高质量数据集能够支撑大规模、高频次的流通与使用,有必要在登记环节引入高标准的事前质量审查机制,重点核验数据的来源合法性、合规性以及是否存在权利争议,在法律层面尽量降低后续使用中的纠纷风险,保障数据流通的稳定与高效。此外,高质量数据集本质上属于经加工形成的数据产品,其登记方式更契合数据产权登记、数据产品知识产权登记等的内在逻辑,也为其在人工智能训练、数据产品开发等高价值场景中的广泛应用提供制度支撑。与之相配套,针对高质量数据集的登记体系,为实现动态公平的价值分配,需进一步完善数据贡献度记录与全流程溯源机制,基于“共票”理论,构建数据利益的动态分配系统,进而在人工智能训练等价值创造场景中,细化数据价值公正分配的制度安排。
04
杨东:数据开发利用的实践对传统的财产权、人格权等权益保护模式构成了哪些新的挑战?数据治理是否需要,以及在何种条件下需要专门立法?
高富平:无论是“数据二十条”还是近期发布的数据产权相关政策文件,其核心思想均是在数据流通汇集或融合利用过程中动态配置使用权。之所以需要在流通使用过程中配置使用权,是因为数据(集)的价值在于使用,使用一次产生一次价值,因而需要在流通过程中为控制和使用数据的主体配置权利,以激励价值创造。从社会层面来看,汇集使用(流通使用)的次数越多,创造的价值就越大,因而基于数据使用的权利配置符合数据价值创造和实现的原理。但这很难说是一种产权配置,而是以具体流通场景的自治规则或合同为基础的权利与义务安排,属于一种治理机制。
传统的市场经济治理分为两个层次:先确认特定资源与特定主体之间的支配关系,赋予所有者以独立产权,通过主体自主行使所有权实现资源的社会化配置与有效利用,构建市场秩序;仅在市场失灵或利益失衡时,国家予以校正。但是,数据资源具有社会性与公共性,无法借助传统产权建立社会化利用秩序,故而需要寻求一套能够保障和促进数据重用的替代产权的规则体系。既然数据使用均有对应的持有者,那么制度设计理应以持有者的权、责、利为核心,构建数据流通和重用的制度规则和机制。它是通过各持有者协商互认和诚信守约机制实现的数据流通利用秩序,美国亚历山大教授称之为治理财产(governance property)机制,以区别于排他机制。因此,在缺乏产权机制的前提下,可将传统经济治理的两个层次压缩整合,通过一套治理机制实现高效、公平、有序的数据社会化复用,进而形成数据可持续利用的制度安排。
数据治理是数据领域最常见的词汇,但实践中在不同“语义”上使用,甚至大相径庭。比如,国家推荐标准将数据治理(data governance)定义为对数据进行处置、格式化和规范化的过程。这是中文“整治、修复”意义上的数据处理概念,即对数据本身的整治,涵盖收集、清理、定义、丰富和管控数据等环节。此种技术处理旨在提升数据可用性或可重用性,使其最终成为具有使用价值的资产。这类做法在行业中称为数据整理(data curation)。
而从学理层面看,治理(governance)一词,更多是指规范和协同利益相关者行动的决策与实施过程。这种意义上的数据治理,是以数据使用行为的规范形成机制以及监督和约束机制为核心。因此,人们通常在组织层面上定义和构建数据治理。例如,国际数据管理协会(DAMA)将数据治理定义为“确保数据准确、可用、安全和负责任使用的数据管理学科”。它建立了必要的制度、流程和角色,以确保数据值得信赖并与业务目标保持一致。简言之,数据治理被理解为组织通过制定数据治理制度、实施具体管理措施,推动数据资产化利用。但是,各组织的数据治理服务于自身使用和自身利益,因此我们必须建立社会层面的数据治理机制,以引导和约束组织的数据治理,实现数据社会价值(利益)最大化。
在社会层面,数据治理关注的是数据重用:数据不仅为初始持有者使用,也为更多社会主体使用;不仅为初始收集目的使用,而且能够为新的、不同的目的使用。这涉及如何定位数据资源的法律性质和构建数据流通利用机制,以实现社会化重用。在这方面,数据不宜也难以作为“私有物”而产权化;相反,数据应作为“公物”或“半公物”而由持有者按照一定规则构建使用和重用秩序。一种可行的制度安排是合法数据持有者以各自数据使用权为基础进行交换和合作,推动数据聚合或集成、价值共创和共享。数据流通的目的,并非获取交换价值,而是实现数据的使用价值,通过共享或交换实现数据集成、融合计算、联合计算等功能。在这个过程中,所谓“权利配置”基本上不触及归属意义上的产权,而是与其贡献一致的利益和责任。因而我们首先应当在社会层面建立数据社会化重用机制,引导和约束数据持有者形成权、责、利一致的合作治理框架与规则,让各参与者依托数据集成与聚合成果开发和经营产品与服务,创造更大社会价值。
这便是以数据持有者权为基础的“可信数据流通治理框架”的制度目标。数据持有者权不是单一权利(数据支配权),而是基于持有者地位而作出的权、责、利统一的制度安排。其核心是承认合法获取数据并进行加工整理的主体(持有者)享有数据使用权,以使其负责地管理和使用数据,包括通过流通机制(交换、共享等)开启数据社会化重用。这意味着每个组织(数据持有者)的数据治理责任,不仅包含自身的数据使用,更要延伸至数据重用,在社会层面的数据治理规则和责任框架下,构建相应的数据流通治理体系(制定流通规则、使用规范、问责机制等)。
现在最为迫切的是构建社会层面的数据治理机制。每个参与者既是数据的持有者(供给方),也是数据的使用者(接收方),通过数据合作赋能各组织提升其在最终产品或服务上的竞争力。这样的数据合作不是界分或交换产权,而是基于每个持有者的数据使用权进行交换。持有者在法律限定的使用权范围内,负责任地流通数据(供他人使用),构建数据重用秩序。在制度设计上,我们既要赋予每个社会主体从社会获取数据的权利,又要设定其向社会供给数据的义务。获取和控制数据的目的是数据使用。保护数据的使用权,而非单纯的控制权(支配权),是数据基础制度的重要价值导向,也是数据利益保护的唯一正当性基础。如果说,组织层面数据治理追求的是个体价值或利益最大化,那么社会层面的数据治理则是以数据社会价值或利益最大化为目标;只有在组织层面的数据治理中,两种目标相一致,让每个组织的数据治理承载社会目标,才能最终实现整体治理目标。显然,这既需要形成制度共识,也需要有效激励和约束每个主体在实现各自使用目标的同时,兼顾数据的社会目标。
王锡锌: “若无必要,勿增实体。”数据产权的制度构建不宜简单通过另起炉灶、创设全新的实体性权利和法律框架来解决问题,而应当优先善用既有的制度工具与法律概念,并将其有针对性地匹配到新的数据利用场景之中。例如,在反垄断与反不正当竞争法的适用中,可以通过对隐私定价、个人信息可携带权以及拒绝数据接入等问题的分析,回应平台利用数据优势排除竞争或不当攫取价值的行为。在此基础上,数据治理需要引入可操作的制度安排,如数据可携带权、互操作义务、强制缔约义务、算法透明与审计要求等工具,使数据权利不仅仅停留于抽象宣示。又如,在数据资产破产处置场景中,结合企业自身独特的数据、企业在经营活动中所产生的数据、企业作为平台媒介而获取的数据等不同类型数据的技术特征与管理方式,考量数据资产剥离与独立运营、技术授权与分拆出售、数据服务捆绑交易等多种可能的处理方案,在破产法框架内回应管理人职责缺位及变价规则缺失的问题。上述路径并非创设新的法律框架,而是通过“以技术约束技术”的方式,为既有的合同法、破产法、竞争法框架提供可操作、可执行的制度载体,从而弥补传统权利在数字环境下实现不足的问题。
与此同时,鉴于数据具有显著的聚合性、关联性与场景依附性,在不同场景下具备不同的政治、经济与社会效益,其治理逻辑亦不能仅停留在以经济价值最大化为核心的合同法、商法与竞争法视角之中。对于由海量个体数据汇集而成,并在社会运行中发挥基础性作用的数据资源,除适用竞争法防止结构性垄断与不公平利用外,还可以从民主治理与数据收益公正分配的角度,探索引入公共参与、公共信托等理念,回应数据利用所蕴含的公共性与民主正当性问题。
因此,数据治理的制度演进应体现为在既有法律体系中的嵌合与适度延展,而非彻底的新建与重构。应当通过结构优化与工具性补强,使传统制度在数字技术条件下继续发挥规范与引导功能,确保治理机制的连续性展开。
刘诚:数据作为新型生产要素,其开发利用已成为推动数字经济发展的核心动力。然而,这一过程深刻冲击了传统以有体物为基础构建的财产权与人格权体系。一方面,数据具有可复制性、多主体关联性等特征,难以简单套用物权或知识产权规则;另一方面,数据往往承载个人信息,涉及隐私、尊严等人格利益,其利用与保护之间存在天然张力。因此,数据治理亟须通过专门立法,在厘清不同来源数据权利归属的基础上,系统协调财产权激励与人格权保障之间的关系,并在动态发展中实现制度平衡。
首先,数据的不同来源决定了其权利结构的根本差异,也凸显了统一立法框架下分类治理的必要性。自有数据(如企业内部运营生成的非个人信息数据)主要体现企业的投入与创新成果,应赋予其较强的数据财产权,以激励数据积累与加工。用户数据则同时包含个人的人格利益与平台的数据资产属性,其权利配置需兼顾“知情—同意”机制下的人格权保护与平台对数据集合的合理使用权。公共数据源于政府履职或公共服务,具有公共产品属性,其开放共享应以增进社会整体福祉为目标,但亦需防止滥用或不当商业化。这三类数据在权属、使用边界和监管强度上各不相同,若缺乏专门立法进行类型化规范,极易导致权利模糊、责任不清,甚至引发“数据垄断”或“数据掠夺”。
其次,在要求企业对外开放数据(如通过数据共享、API接口或强制开放特定数据集)时,利益冲突尤为突出。企业主张其对数据的实质性投入应获得排他性回报,而监管者或公众则强调数据的社会价值应被广泛释放。若无法律明确界定数据持有者的权利边界与义务范围,企业可能因担心商业秘密泄露或竞争优势丧失而抵制开放;若过度强调开放而忽视企业权益,则会削弱其收集、清洗、标注数据的积极性。因此,“数据二十条”创造性提出建立数据资源持有权、数据加工使用权和数据产品经营权“三权分置”的数据产权制度框架,既承认企业在合法合规前提下对数据的实际控制与收益权,又设定合理的开放义务与公共利益例外,从而在激励与约束之间取得平衡。
更重要的是,数据治理立法的核心任务是在隐私保护与开发利用之间寻求动态平衡。有研究指出,严格的隐私保护措施(如匿名化、去标识化、差分隐私)可能导致数据失真或信息缺失,降低模型训练效果与决策精准度。但越来越多的实证研究表明,清晰、可预期的隐私保护法律框架,能显著提升企业数据活动的效率与合法性。当企业明确知道哪些数据可以收集、如何处理、在何种条件下共享时,便无须在灰色地带“偷偷”操作,从而减少合规风险与诉讼成本。例如,《个人信息保护法》确立的“最小必要”“目的限定”等原则,虽限制了部分数据使用场景,但为企业构建了可信赖的数据治理体系,增强了用户信任,从长远来看,促进了数据生态的健康发展。
值得注意的是,技术演进正在优化调整这一平衡关系。随着联邦学习、安全多方计算、同态加密等隐私增强技术的发展,数据“可用不可见”“可控可计量”成为可能。这意味着,在不暴露原始个人信息的前提下,仍可实现高质量的数据分析与模型训练。在此背景下,立法的价值导向有望逐步向开发利用一端适度优化——前提是技术手段能有效保障人格权不受实质侵害。专门立法应前瞻性地纳入对新兴技术的认可与规范,建立“技术+制度”双轮驱动的治理模式,使法律既能守住人格权底线,又能为技术创新留出空间。
熊丙万:对于数据权益的保护,学界过往确实有一种相对保守的倾向,即通过合同法、反不正当竞争法等既有规则来保护数据。然而,面对数据本体的可复制性与高频流转等特征,传统方案已明显“捉襟见肘”。我认为,数据领域的法律治理无法仅仅依靠对既有法律框架的“修修补补”来实现,而有必要构建一套崭新的、适应数据要素特征的产权与流通规则体系。当然,这种“新”并非完全脱离现行法,而是在现行法基础上展开必要的制度创新。
合同法与反不正当竞争法无法完全解决数据财产权益保护的问题。首先,关于合同,有一种流行的观点认为,多个持有人之间的数据使用和经营权限分配等问题可以通过各方的合同安排与技术措施解决,无须立法专门确立财产权。但是,合同的谈判磋商与技术措施的设计维护本身也是有成本的。在实践中,当事人往往受制于有限理性和交易成本等因素,无法达成完备的合同,甚至为了确保合作关系的稳定而有意对产权问题“留白”。这在事后常常引发有关产权归属与行使的争议。其次,关于反不正当竞争法,其虽然能够用来规制不正当数据获取与利用行为,从而为数据提供底线性的排他保护,但其保护仍然存在很大的不确定性。反不正当竞争法主要规制的是那些违反商业道德的数据获取与利用行为,关注的更多是行为本身是否正当,而非数据持有人享有怎样的排他性权益。尽管此种“行为规制”模式背后也隐含了一套“反向确权”的逻辑,但其更多依靠的是“一事一议”的事后确权,容易引发机会主义的试探获取行为,无法为权益主体提供清晰稳定的产权预期。
更重要的是,合同法与反不正当竞争法都难以有效解决非侵权场景下数据财产权益“对抗第三人”的难题。例如,数据持有人将数据委托给云存储服务商存储或交给加工服务商进行加工,若服务商破产或被强制执行,数据持有人仅仅依据合同债权无法对抗服务商的其他债权人,进而面临数据被作为责任财产处置的风险。这将反向激励持有人采取更为保守的商业策略,不选择第三方提供的数据服务而选择自己存储、加工数据。这既不利于云存储等数据服务行业的发展,也可能给数据持有人带来额外的成本投入。如果确立了具有绝对权属性的数据持有权,并明确服务商是为权利人的利益持有数据,权利人就能够在破产、执行等场景下主张取回权或排除强制执行。这有助于提升其参与数据加工和流通利用活动的信心。
从交易成本的视角来看,事前明确的产权能为市场提供稳定的法律预期,减少权属纠纷,不仅有助于激励数据持有人生产数据,从而增加高质量数据供给,还有助于提升其将数据投入市场流通的信心,符合“有恒产者有恒心”的逻辑。如果缺乏统一的产权界定,每一次数据交易都可能变成一场充满不确定性的“个案博弈”。交易双方需要花费大量的时间和费用,通过合同条款界定双方各自的权益。这种依赖“个案磋商”的模式对于偶发的交易尚可忍受,但对于海量、高频的数据交易而言,将产生极其高昂的缔约成本和谈判摩擦。因此,确权的经济意义,就在于通过法律预设一套标准的权利样态(以及与此相匹配的标准示范合同),为交易提供一套“通用语言”,从而降低交易成本。此外,数据产权制度通过明确“权利人可以作用于权利客体的方式”,也能为其提供合法性确认,消除其利用数据进行衍生创造、开发数据产品和投资入股等活动的合法性担忧,进一步激发数据市场活力。
值得注意的是,曾有观点主张参照既有的知识产权框架,构建“数据知识产权”。但数据与知识产权的保护客体、保护重心存在根本性差异。一方面,作品、专利、商标和商业秘密等知识产权的客体主要是人类的智力创造成果。单个作品、技术方案和商标所蕴含的信息内容,也能产生显著经济价值。但大量数据往往是通过机器批量、自动生成或者记录的,很难说是智力创造。而且,规模化的数据才是主要的价值来源,单条数据的价值十分有限。另一方面,知识产权保护的主要是作品、技术方案、商标背后的知识和智慧。这些知识和智慧,无须借助数字化工具也可形成理解和记忆,可能被第三人剽窃、盗用。这些知识和智慧一般也不存在永久性消灭的损害可能性,即便载体消灭,智力成果的创造人也很可能根据记忆恢复。因此,知识产权也无意保护这些成果的载体。与此相反,数据的利用和价值创造方式往往是通过对作为信息载体的规模化数据的分析得出人类社会运行的客观规律。对数据要素的利用通常需要利用数据处理工具进行实质接触,如算法分析来实现。仅仅通过肉眼浏览数据,或者了解数据的个别内容,而不通过数字化工具去整体性地接触数据,通常难以实现对数据整体的有效利用。数据的载体一旦灭失,便很难恢复,故对数据的保护重在通过保护数据载体,防止他人对数据的不当获取和利用。因此,在数据上也不宜直接应用知识产权的权利概念和形态。
新近数据产权基础制度建设的共识是继续坚持“数据二十条”提出的产权结构性分置政策,并结合近年来我国数据要素市场中出现的大量新场景和新实践,以重点场景中的实践问题为导向,制定一系列具体场景中的产权配置规则。未来,有必要在数据产权结构性分置的框架下,继续以数据生产、流通各环节中的数据社会关系为原型,提炼总结具体产权规则,并配套建设数据产权登记制度,以回应数据要素市场的制度需求,最终形成一套具有中国特色和国际引领性的数据产权制度体系。
杨东:在几位专家的精彩论述之后,我也结合自身参与修法的实践体会,谈谈对数据开发利用与权益保护路径的认识。以《反不正当竞争法》为代表的法律,在应对数据特性与价值动态化所带来的保护不足问题上,发挥了重要作用。我全程参与了2025年《反不正当竞争法》第13条至第15条的修订工作。其中,“数据专款”完善了数据不正当竞争行为的认定要件,充分回应了保障数据要素公平竞争的社会期待与规范需求,为维护当前数据流通与竞争秩序提供了重要的制度支撑。在当前数据产权制度供给有限、数据登记体系仍处于地方层面探索的阶段,依靠行为规制路径保护数据利益,在执法和司法实践中均发挥了重大作用,应当予以高度肯定。
从治理路径来看,数据的行为保护与权利保护并非相互对立,而是可以兼容并行、相互支撑的制度选择。数据治理的革新,既需要《反不正当竞争法》等既有法律在规范数据获取、使用与竞争行为方面的持续完善,也需要推动数据产权制度的建立与登记体系的落地,从而在数据保护与流通之间构建更加稳定的制度预期。更重要的是,无论是行为规制还是权利确认,都应服务于数据价值共享与利益公正分配这一根本目标,推动形成开放、协作、可持续的数据利用生态。因此,未来的数据治理应在既有法律框架的基础上,积极构建与“利益—权利”双元共生理念相适应的新型规则体系,实现数据保护、价值激励与利益分配的有机统一。
05
杨东:当多源数据经清洗、标注、质量核验等核心环节融合加工形成高质量数据集,或基于该数据集进一步开发算法模型时,如何衡量初始数据来源者的贡献、高质量数据集加工者的质量提升投入,以及后续创新开发者的算法与场景适配投入?
熊丙万:在讨论这个问题之前,我们有必要先厘清“数据来源者”的概念。“数据二十条”采用“数据来源者”的概念来指代自然人等信息来源主体,但这一概念容易引发与数据流通利用环节中原始数据提供方的混淆。严格而言,所谓“数据来源者”实际上指的是为数据生成贡献信息原材料的主体,称其为“信息来源者”更为准确。
关于多源数据融合,由于数据的价值具有“报酬递增”的属性,多源数据的汇聚、融合可以使数据的价值倍增,让更多主体有机会利用数据,有助于打破“数据孤岛”,充分释放数据要素价值。数据融合因此也成为数据分享与利用的重要合作形式。但是,在实践中,一些数据融合参与方往往未能在事前清晰约定融合后数据的使用权限,也没有就利用融合数据开发的衍生数据的权利归属加以明确。在前述情形下,各方是否享有数据的持有、使用和经营等权利,极易引发争议。因此,明晰数据融合利用过程中各方的产权配置就显得十分重要。对此,新近数据产权基础制度建设的基本设计思路是:引导各方通过协议对各自的权利内容和边界进行约定。
在数据融合各方对数据产权的内容和边界没有约定或约定不明的情况下,新近数据产权制度的建设动向是就数据融合利用过程中的产权配置作出指引,特别是引入“平行财产权”的理念,让参与融合各方均有机会利用已融合数据,而非按照各方的贡献度切分大小不一的财产权益。值得注意的是,受以有体物为原型的物权共有制度的影响,实践中存在以贡献度确定产权份额的思维惯性。但是,数据价值并非线性增长,不能仅以各方提供的数据条数确定各方的贡献。在数据融合开发利用过程中,各方的贡献往往相互交织且动态变化,客观上难以确定各方的贡献比例。强行界定各方的份额,不仅成本高昂,实践中甚至可能无法实现。因此,采取传统的物权共有规则来确定已融合数据的权属并不可行。
实际上,“数据二十条”提出的“按贡献确权”并不等于必须按照各方贡献的大小切割不同比例的财产权。相反,数据要素的非竞争性为财产法规则创新提供了更为广阔的空间。多个处理者对同一数据的利用,并不需要像有体物一样通过时间或空间上的权利分割来实现。既然同一数据可被多主体同时持有、利用,那么在不违背各方当事人的合作目的以及重大利益期待的前提下,允许平行持有人平等地、互不排斥地享有和行使同一数据的使用权乃至经营权,无疑能够更加高效、公平地满足数据要素各个贡献主体的利益期待。
确认数据融合各方均享有“平行使用权”的意义在于,各方均有权对已融合的数据进行加工、分析、整合,形成衍生数据,并基于衍生数据的确权规则,对衍生数据享有独立的数据产权。同理,如果数据融合参与方之间没有作出特别约定,各方基于该融合数据集独立开发的衍生数据或算法模型,无须与其他参与方分享。这是因为,尽管这些衍生数据是在已融合数据的基础上加工、处理所得,但其已经在内容、形式和结构上发生了实质性改变,在价值上有了显著提升,从而与原数据形成了“质”的差别,应认定为新的数据。其他融合参与方虽然提供了作为“原材料”的数据,但对使用人开发衍生数据的过程并未作出增量贡献。同理,基于已融合数据开发的算法模型,除非当事人之间有特别约定,否则算法模型的开发者也无须与其他数据提供方分享基于该数据集开发算法模型的相关权益。这有助于防止其他融合参与方“搭便车”,避免削弱各方自主挖掘数据价值的经济激励。
关于如何合理评价数据加工者为提升数据质量而作投入及其回报的问题,有必要区分其加工活动的性质,分别适用不同的规则。数据产权人自主加工数据的,其投入通常可以从加工后数据价值的提升及使用、经营获取的收益中得到合理回报;而数据加工服务商受托为他人加工数据的,其可基于委托合同或服务合同请求委托人支付约定的对价。需要注意的是,除非法律另有规定或合同另有约定,受托方对他人委托其处理的数据,不因加工行为而取得数据产权。这是因为,加工商仅提供了数据处理服务,故原始数据和加工后的数据在法律上均应直接由委托人享有数据产权。根据《民法典》第927条的规定,受托人处理委托事务取得的财产,应当转交给委托人。
刘诚:数据开发使用过程中所涉及的多元主体,均有不同程度的经济贡献。下面,以人们使用人工智能工具生成一定的生成物为例,来具体拆解不同主体的不同贡献。
其一,原创作者(初始数据来源者)。原创作者的贡献较为直观,即其创作的原创作品。但经过人工智能对多个作品的学习和“黑箱”处理后,很难确定生成物的思想具体源于哪个原创作品。现实中,有原创作者认为,人工智能生成物包含了其原创作品,因此向人工智能设计者和使用者提起侵权诉讼。从著作权法角度分析,如果生成物的思想源于原创作者,依据“思想与表达二分法”的基本原则,受保护的是对思想的独创性表达,而非思想本身。而人工智能生成物的具体表达是由人工智能根据使用者指令生成的,原创作者并未参与这一表达的形成过程。因此,只能说生成物可能侵犯了原创作者的著作权,并不能说生成物著作权归原创作者所有。再退一步讲,如果生成物的表达,一部分源于原创作品、另一部分源于其他主体(如人工智能使用者)的独创性输入,则可能构成合作作品或演绎作品。此时,涉及原创作者与使用者之间如何分配著作权的复杂问题。总之,原创作者难以独立享有对生成物的完整著作权。
其二,人工智能使用者(高质量数据集加工者)。使用者对人工智能生成物的贡献主要体现为向人工智能系统输入提示词,以及其反复提示多次试错的探索过程。在这个过程中,人工智能更像是一个执行工具,而使用者始终主导创作过程。根据“选择的幅度”理论,可以通过提示词数量、次数和个性化选择来判定使用者的贡献。使用者能否对生成物享有著作权,关键在于其输入是否体现了独创性表达。如果使用者通过具有独创性的提示词、对生成结果的筛选与编排,体现了其独立的智力判断与个性化选择,则可能满足著作权法对作者的创造性要求,从而对生成物享有著作权。反之,如果使用者仅输入简单的指令,生成物主要由人工智能自动完成,则难以构成著作权法意义上的作品。在实践中,国内外一些高校明确表示不允许学生使用人工智能工具撰写论文,主要出于两个方面考量:一是所撰写论文可能无原创思想;二是即便有原创思想,也可能是由人工智能生成的而非学生本人构思的。
其三,人工智能设计者。主张将人工智能生成物作者判定为人工智能设计者的观点,主要体现为在初始权利配置上的安排。但从著作权法角度看,设计者难以被认定为生成物的作者,原因在于:著作权法保护的是对作品的“创作”行为,而非对创作工具的“设计”行为。人工智能设计者对学习架构有创意性投入,但这种投入指向的是人工智能本身,而非人工智能生成的具体表达。根据著作权法“作者必须是直接从事创作行为的主体”的基本原则,设计者并未直接参与生成物的形成过程,因此不能因其设计了创作工具而自然取得生成物的著作权。值得关注的是,人工智能设计者尽管没有著作权,但因为享有人工智能技术专利、软件使用权、平台资产收益权等权利,现实中往往承担较大的责任与风险。换言之,设计者享有对技术的专利及其相关设备设施的财产权,但这不代表其自然享有生成物的著作权。
其四,人工智能本身。自不待言,人工智能可以通过深度学习综合提炼并生成原来没有的内容。但人工智能是否提供了生成物的原创思想贡献,对此有两种相反观点:一是人工智能只是创作工具。一些人采用工具主义的方法论,笃信无论人工智能在创作过程中有何贡献,其都只是工具性的贡献,思想总是人类的。从法律主体制度来看,人工智能不具备法律人格,不能成为权利的享有者和义务的承担者。其存在是为了更好地服务于人类,具有鲜明的工具属性,生成物是借助大数据、算力、算法的加持,模拟人类的思考过程和思维特征,从而实现高度社会化的表达。二是人工智能对生成物具有原创思想贡献。如同纸张是人类创作的工具,互联网也是,人类才是创作的主体。但当这个工具变成人工智能之后,最大不同在于这个工具本身具有一定的“智能”——有思想和自主创造力。若承认人工智能对生成物具有原创思想贡献,它却不是人类,如何确立著作权归属?主流观点大多坚持著作权法上的“作者”仅限于人类,这从根本上否认了机器、计算机和人工智能本身成为著作权主体的可能。一个折中的观点是,即便人工智能本身不具备法律人格,其生成物的著作权归属亦可追溯至那些以独立思维指导人工智能运作的人类主体,也即人工智能设计者或使用者。
王锡锌:制度设计首先应当尊重市场内生的资源配置规律。在商业主体(非个人主体)之间的数据利用场景中,原则上应在私法自治与市场调节的基础上,通过合同安排与竞争机制来完成价值分配,而无须由法律进行实质的价值衡量。商业主体通常具备对数据价值的基本认知能力,能够围绕数据的使用方式、共享范围与对价条件作出相对理性的决策。在不存在市场支配地位或显著结构性优势的前提下,数据公平利用的秩序往往能够通过竞争自发形成。数据企业通常愿意就数据利用问题与合作方进行谈判,并根据数据价值提供相应对价;若其忽视合作方的合理诉求,合作方亦可通过转向其他数据企业来实现替代选择。由于数据具有一定的非竞争性与非排他性特征,数据企业本身也具备通过共享数据扩大生态规模的内生动力。在实践中,不少平台会向入驻商家免费提供销售数据、运营分析数据,或开放相应接口,以帮助商家提升经营能力,并吸引更多合作主体进入平台。通过这种数据开放与共享机制,数据不断汇集、加工、再利用,平台既增强了下游商家的盈利能力,也提升了自身生态的黏性与规模效应。
当上述市场机制无法正常发挥作用时,监管介入才具有必要性和正当性。此时,应当从数据权益分配的角度,审查是否存在合同法意义上的显失公平,以及是否出现不公平竞争或垄断行为。就合同法路径而言,法律介入应当优先采取程序性调节而非直接的实质替代判断。在程序层面,可以基于数字产品合同、数据许可利用合同、数据转让合同等具体交易架构,引入合同法中的信息披露与提示义务(例如,对数据利用方式、再利用范围、是否开放或开源等关键事项的明确说明),来缓解数据交易中普遍存在的信息不对称问题,减少“搭便车”等策略性行为的发生。上述规则通过标准化的合同条款、信息披露与提示规则,降低交易各方获取、理解与评估相关数据权益信息的成本,以及交易达成后的履约监督、执行成本,从而为市场主体在充分知情的基础上开展协商创造条件。
只有当程序性保障仍不足以纠正明显失衡时,才有必要进入实体层面的显失公平与竞争侵权判断。在作出该判断时,不能简单沿用传统私法中静态、线性的价值衡量标准,而应当充分考虑数字经济所具有的结构性特征,尤其是“赢家通吃效应”、规模化优势(包括资本规模化与数据体量规模化)以及价值实现过程中的非线性增长机制。具体而言,应综合评估数据产品在不同阶段所产生的预期收益与实际收益,合理审视短期回报与长期增值之间的分配关系。
值得警惕的是产业链中可能出现的结构性不对等。头部企业凭借对高质量数据集、算力与算法能力的集中控制,对上下游中小企业形成持续性的谈判优势甚至事实性支配地位。尤其是,随着人工智能在平台中广泛应用,相关数字市场甚至有可能变成某种脱离市场样态的“极端市场”,即市场整体经济效率和要素流动性并非靠自发的经济活动得到提升,而是由掌握大量经济数据和算力的平台企业主导推进。在此情形下,单纯依赖合同自由与市场选择,可能导致初始数据贡献者与中小创新主体在价值分配中被系统性挤压,从而抑制整体创新活力。正是在这一意义上,数据产权制度与竞争法的衔接,应当以识别和纠正此类结构性失衡为重点——其核心任务不是替代市场对数据价值与收益分配的常态性判断,更不是在微观层面“精确计量每一环节贡献”,而是通过竞争法的行为规制、数据可携带与互操作义务等工具,保障基础设施可得性与跨平台流动性,防止平台利用架构性优势将数据与算法能力转化为排除竞争的制度化壁垒,从而为多层次创新主体保留进入、议价与持续发展的空间。
杨东:正如三位专家所言,数据融合利用过程中的贡献界定确实复杂。熊丙万教授从立法实践出发,厘清“信息来源者”的内涵,并引入“平行财产权”观点,为我们打破思维定式提供了法理支撑。刘诚研究员则通过对人工智能生成物相关主体的精细拆解,将这种复杂性具象化,生动展现了原创作者、使用者、设计者在贡献认定上的困境与张力。而王锡锌老师更进一步,从尊重市场内生规律出发,递进至市场机制失灵时监管介入的必要性与正当性,并围绕合同法上的显失公平与竞争法上的不公平竞争或垄断行为,构建了一套完整的制度回应框架。
综合各位的洞见,我认为,在多源数据融合加工与创新使用过程中,有必要建立一个能够兼容各方贡献且具备操作性的动态利益分配机制。这正是“共票”理论的价值所在——依据数据要素价值共创的特点,建构多方主体参与分配的新路径,使数据价值链各环节的主体能够根据其贡献度从价值创造中获益。初始数据来源者的贡献可依据数据质量、稀缺性、合规性,以及其在最终数据集中的价值占比进行评估;高质量数据集加工者的投入,应基于其清洗、标注、质量核验等技术复杂度与成本投入进行量化;后续创新开发者的算法与场景适配投入,则可通过其创造的增量价值、市场应用效果等进行衡量。建议通过边际贡献分析,结合智能合约等技术工具,依托“共票”等分配凭证,实现贡献的可记录、可溯源、可分配,进而在数据价值链中实现公正、透明、激励相容的产权配置。
针对数据多利益相关者的公正利益分配问题,实践探索极为关键。当前,中国移动咪咕公司已经落地“共票”机制,打造数据要素内容传播体系,将数据贡献者作为影响因子,结合业务成效,构建优质数据贡献者筛选机制并写入区块链智能合约,为体系共建者分配“共票”凭证,基于“共票”分享利润,定向配置资源,通过区块链技术记录数据要素价值增值情况,扩大价值传播链条,推动数据要素价值收益最大化,形成商业闭环和良性内容生态,最终实现社会共同富裕和商业利益的兼容。此外,中国人民大学法学院开发的涉外法治大模型,已开展数据清洗与标注的试点工作并形成高质量数据集。此过程同样以贡献度为核心,通过对各类主体的贡献度进行衡量和标识,从而激励涉外法治数据的开发利用和价值创造。
06
杨东:在公共数据开放利用中,如何平衡数据安全、个人隐私、公共利益与价值释放等多重目标?
王锡锌:首先,要明确公共数据开放的治理理念。政务数据开放的价值目标,不应被简化为“向市场提供数据资源”,而应定位于保障多元的市场和社会主体在公平合理条件下获取与利用公共数据,推动政务数据利用的经济、政治效益和社会福利的整体增长。在这一意义上,数据开放只是治理过程的起点,而非制度目标本身。市场与社会主体是否能够、是否愿意,以及是否持续性地利用已开放的政务数据,才是衡量数据开放制度成效的关键。因此,政务数据开放并非“一放了之”。政府不仅负有开放数据的责任,还承担着激励数据利用、持续评估利用效果、保障数据利用可持续性的制度职责,从而促成社会治理与经济发展的协同效应。近年来开始流行的“可信数据空间”理念,正体现了这一治理转向:在各方认可的规则框架下,联通完成身份与资质确认的主体,借助统一的开放标准与治理结构,克服数据垄断、不透明与不可互操作等技术与制度障碍,构建安全、透明、可持续的数据共享生态系统,推动跨组织、跨领域的数据交换与复用。
其次,政务数据公平利用中的“公平”,不应仅限于竞争法语境下的企业间公平竞争,而应扩展为一种面向多元社会主体的数据利用公平。在继续完善竞争法框架下公平利用规则的同时,制度视角需要从“企业—企业”的横向关系,拓展至公众、社会组织、中小企业、研究机构等多类主体共同参与的数据利用生态。这既要求在制度顶层设计上构建兼顾多元利益的系统性开放流程,也需要通过配套措施为不同主体的平等参与提供坚实保障。
具体而言,从顶层设计层面,有必要完善政务数据开放利用的管理机制,形成一套兼顾多元利益、具有系统性与整体性的开放流程。在政务数据开放方案的决策与评估过程中,数据管理机构应当综合考量政务数据利用在不同维度上的价值,分析不同开放方式所附随的技术与管理成本,实现多重目标之间的协调与融贯。比较法经验表明,这种统筹并非抽象要求,而是可以通过制度化的评估机制(如财政监督)加以落实。例如,瑞典在评估与监督地理空间数据开放成效时,并未仅将经济收益作为单一指标,而是同时纳入公共服务质量提升、公民参与程度、社会治理改进等多项因素,并赋予不同权重,促使行政机关在资源配置与政策执行中进行整体权衡。这种做法提示,政务数据管理机构在不同利用场景中,应当采取反思性、动态化的监管策略,适时调整监管手段与开放方式。唯有厘清政务数据开放所承载的多元价值目标,才能避免单向度、功利化的数据开放路径。
从主体权益保障层面,国家还应当围绕社会主体实现公平利用政务数据的现实条件,完善相应的辅助性与担保性制度安排。若无视不同主体在技术能力、资源禀赋与知识结构上的差异,简单将所有潜在利用者置于一个完全自由竞争的公共数据市场之中,反而可能放大既有的“数字鸿沟”,削弱数据开放的社会效益。因此,国家有必要通过多种制度工具,保障公众对政务数据的平等获取与有效使用:包括提供技术支持、能力建设、标准化工具,以及面向弱势群体的专项扶助,尤其应当着力提升数字弱势群体通过政务数据开放进行生活规划、公共参与及权利表达的能力。
在此基础上,公共政务数据授权运营制度的建构,亦应当围绕政务数据开放的多元价值目标,实行“目标—手段”相匹配的制度设计。具体而言,可以构建并完善一种“二元授权运营机制”。其一,在数据基础设施层面的授权运营中,发展以“公私合作履职”为核心的授权模式,在合理引入社会力量协助完成行政任务的同时,防止单纯商业导向和过度资产化倾向,优化政府与社会之间的合作结构,提升政务数据开放的可及性与数据生态的整体活力。其二,在具体政务数据利用许可层面的授权运营中,应当将以特许经营并收费为中心的“国有资产增值式授权运营”,转向以风险防控与市场秩序维护为导向的“利用资格调控式授权运营”。在该模式下,政务数据管理机构可以针对市场失灵、高风险场景设置必要的准入条件与使用限制,以降低制度与技术不确定性,但应恪守必要限度原则,落实公平竞争审查机制,尊重市场内生秩序与利用主体的自我负责机制,避免将授权运营异化为新的行政垄断或市场壁垒。
因此,在关于政务数据开放的规则供给方面,应当建立国家级公共数据开放、授权运营的基本立法与统一披露登记机制,增强这一制度的规范性、统一性与透明度,避免出现基于数据财政冲动而进行的“政务数据权属立法竞赛”。一方面,对当前地方有关政务数据管理的规范性文件进行合法性评估和清理,合理引导地方政府将政务数据资源资产化的探索方向;另一方面,尽快启动国家层面的立法,完善“公私合作履职式”与“利用资格调控式”授权运营模式的基本架构,明确授权运营的制度目标、实质性要求与程序规则,建立更加统一、融贯、友好的数字市场竞争格局与数据利用生态。
杨东:王锡锌教授所强调的“开放是起点而非目标”与“二元授权运营”框架极具启发性。公共数据的高效开发利用是数字经济时代世界各国所普遍面临的重大基础问题。随着公共数据被政策明确为国家重要的基础性战略资源,公共数据开发利用的重要性和紧迫性被提升到更为重要的层面。充分发挥我国社会主义制度的优越性,结合新型举国体制和海量数据优势,建构契合我国实际发展需求的公共数据多元目标框架,已成为当前的重中之重。
首先,国家和各级政府部门应当明确公共数据作为“资源”的属性,从面向社会供给公共数据、保障其有效开发利用的角度来审视公共数据的各项制度目标。因此,我国应当培育一体化公共数据市场,其核心在于建立有效的利益分配与价值实现机制,通过授权运营、“共票”机制等制度设计,使公共数据提供者、加工者与社会公众等主体共享数据价值。
其次,对于满足特定前置性要求的公共数据类型,国家也需要探索其从“资源”到“资产”的转变。2025年12月22日,十四届全国人大常委会第十九次会议审议了《国有资产法(草案)》。公共数据正经历从资源到资产的定位深化,这更意味着其管理逻辑需从单一的行政供给向“行政—经济”双维架构转型,纯粹的无偿开放难以匹配其资产属性与价值实现需求,应当建构一个层级化、立体化、多目标的公共数据供给体制,避免供给制度的单一化和目标局限性。
最后,公共数据的基本特性与其他数据类型是一致的。其治理本质是利益与价值的公正分配,需在保障安全与隐私的前提下,以开放促流通、以分配促激励,构建政府、市场与社会多元共治、价值共享的公共数据生态,实现数据安全、隐私、公益与价值释放之间的精细平衡与动态优化。
07
杨东:在不同场景(如医疗健康、金融征信、市场营销、社会治理)中,数据流通规则如何因应其核心法益的差异进行精细化设计?这是否意味着需要构建一套基于场景风险与价值的“领域细则”?
王锡锌:从实践看,数据要素具有特殊性和复杂性,关联于各种数据利用的生产架构与服务方式。不同类型的数据在内容属性、合规要求、交易方式和损益计算等方面千差万别,往往只有在具体场景中才能对这些问题作出恰当判断。除了一些基础和底线规则(如个人信息保护和数据安全的最低要求),很难形成普适的市场交易原则和通用模式来适用于所有情境。
尽管难以建立普遍适用于一切场景的数据流通规则,但为促进数据要素的有序流动,仍可根据数据的来源、功能与风险特征,设立一套一般性的分类分级与风险评估框架。立法可设定框架边界,由行政机关据此制定并动态调整细化的标准,同时在制度设计中嵌入评估、听证等程序机制,吸收私主体特别是数字平台等实践者所积累的知识资源,为既有法律规则注入动态反馈机制,以提升标准和规则形成的合理性和民主性。司法则通过解释与监督,确保这些创新和场景细化始终符合法治与权利保障的要求,实现多方的良性互动。
这一类型化治理框架的核心,在于以具备形式逻辑的概念体系与可验证的评估指标,识别不同数据类型在特定使用场景下的价值区间及其引发的风险,从而划分共性规则与个性要求的适用边界。立法者可以确立统一的基本制度(如登记的总体法律效力、公示原则、基本审查要求等),同时授权根据数据类型或应用领域制定配套细则,实行分级分类管理。这样既能避免数据治理中“万能规则”无法适配场景差异的困境,又可防止规则碎片化、部门差异所带来的治理分裂,有助于形成兼具体系性、差异适应性及融贯性的制度结构。
在规则设计的基本方法上,应摆脱以物权为范式进行整体、概括、一次性确权的倾向,转而坚持以下三个基本立场:第一,强调数据作为信息媒介的制度属性,反对“物权化想象—排他控制”式的财产观。在不同场景下,数据作为媒介承担着身份链接(如医疗健康中的服务个性化)、声誉评估(如信用评价)、知识压缩(如人工智能大语言模型)等多重功能,这要求根据其功能维度设计差异化的合规路径与权利配置方式。其中,需要警惕以数据类型来决定数据开放价值及利用模式的观点。以政务数据为例,统计、登记、税收方面的政务数据往往能够直接揭示政府运行过程中的程序性问题,可以更加突出地发挥政治监督与促进公众参与的价值;文化、教育、景观类数据的公共服务效用更加显著,对提升公民生活品质的作用较为直接;金融、空间、能源、电信、建筑相关的政务数据的经济利用价值较为突出,更受到数据企业的青睐。然而,这些政务数据在一个层面发挥重要价值的同时,并不排斥其他层面的功能发挥。政务数据的价值并不能仅凭数据类型来判断,而是依赖于具体的应用场景和使用方式。某种类型政务数据的开放往往能够同时实现多重价值和目标,这也需要持续性的探索与创新。在数据来源方面,应考虑不同数据生成场景中的私人性、社会性及公共性要素,为流通规则提供分类依据。第二,采纳关系进路对数据权利进行建构,而非整体化的财产权确认逻辑。换言之,要依据数据的生成、共享、使用各环节中的角色和关系来明确权利义务,而不是将数据视为一种静态财产。“数据二十条”提出数据资源持有权、数据加工使用权、数据产品经营权分置,对数据生产、流通、使用过程中各参与方享有的合法权利予以保障。这属于产权运行机制,本身是对法律关系的动态界定,而非对静态权属结构的确认。第三,坚持程序理性与反思理性。应通过透明、可审计、合理分工的制度安排确保治理过程可控,避免利益相关者既作为“运动员”又兼任“裁判员”。在场景化规则设定中,治理机制应允许行业机构、数据持有者、使用者以及公众代表共同参与标准研制与规则反馈,构建一种可循环学习与纠偏的开放架构,提升规则。适配性与正当性。
总之,在数字经济语境中,数据产权制度的体系性与场景适配性并非互斥关系。通过嵌入“类型化+功能导向+关系界权”的方法,辅以相应的规则制定程序与反馈机制,完全有可能构建一个既能回应复杂实践又能保持规范融贯的数据流通制度。
杨东:王锡锌教授提出“类型化+功能导向+关系界权”框架,深刻回应了场景化治理的核心命题,与我们构建统一治理理念下的差异化规则体系高度契合,为后续领域细则的落地提供了重要指引。在不同场景下,数据流通规则应当基于场景风险与价值进行构建。当前正在研究制定的《数字经济促进法》同样旨在通过多场景、多领域的促进性规则,在统一的利益分配和价值共享法治目标下激发数据要素在各行业、各领域的价值潜能。然而,无论场景如何变化,其治理理念都应保持一致,即核心仍应立足于价值分配与利益共享,注重如何在安全合规的前提下促进数据的有效利用与有序流通,在“利益—权利”双元共生的框架下实现不同场景领域细则的制度协同,避免不同领域因理念分歧导致规则冲突或价值割裂。通过制定具有统一治理理念的领域细则,可以形成既统一于国家数据基础制度,又灵活适应不同场景需求的治理体系,最终实现数据安全、权利保障与价值释放的多元目标。
在该理念的统一指引下,领域细则的构建还应与高质量数据集认定、数据登记制度等一系列基础制度相衔接。不同行业和场景中产生的衍生数据在权属形态、利益结构和流通需求上存在差异,数据流通规则设计和登记制度需充分反映其特点,以在规则的共性框架下体现其灵活性。
感谢各位专家的真诚分享与深入交流。本次研讨汇聚法学与经济学的多元视角,既有对数据权利本质的学理剖析,也有对数据要素市场运行逻辑的深层观察。研讨中形成的共识为制度设计提供了有益参考,而观点的分歧更显珍贵——正是这些交锋与碰撞,为理论创新与实践突破开启了新的可能。期盼各界深化对话,共同探索契合中国实践的数据产权制度与治理规则体系,在数据价值的充分释放中,为数字经济高质量发展注入持久动能。