研究院

构建数据产权制度的核心要义

文章发布时间:2024-01-28作者:王春晖、方兴东

作者简介


王春晖:浙江大学网络空间安全学院双聘教授,国际数据协会(IDA)主席,南京邮电大学信息产业发展战略研究院首席教授、乌镇数字文明研究院专家

方兴东:浙江大学传媒与国际文化学院教授、博士生导师,乌镇数字文明研究院院长

摘要:数据已经成为数字经济时代的基础性资源、重要生产力和关键生产要素,正在引发新型社会经济形态的变革,带动“数据生产力”的快速发展。为了更好地协调和处理与数据生产力发展相适应的数字化生产关系,有必要率先构建完备的数据基础制度。中共中央、国务院“数据二十条”系统构建了数据基础制度体系的“四梁八柱”,数据基础制度体系的核心是数据产权制度,创新数据产权制度体系要跳出所有权的思维,重点聚焦数据资源持有权、数据加工使用权、数据产品经营权的分置运行规则,促进公共数据、企业数据、个人数据分类分级确权授权使用机制,充分激发数据要素活力。

关键词:数据生产力;数据生产关系;数据产权;数据确权授权

数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。数据要素商品化、社会化形成数据生产要素市场,是数字经济时代数字新生产力发展和技术进步的重要标志。2020年4月,中共中央、 国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,《意见》明确提出,构建土地要素、劳动力要素、资本要素、技术要素、数据要素等五大要素市场,“数据要素”正式被列为五大要素市场之一。

数据要素市场的发展要遵循其发展规律,应当在探索中发展,在实践中完善,最终形成与数据生产力相适应的新型生产关系。目前,数据要素市场仍处在培育期,构建适应数据生产力的数据要素基础制度是数据要素市场培育期的主要任务和重点工作,这对于充分释放数据要素价值,激活数据要素潜能,以数据流促进生产、分配、流通、消费各个环节高效贯通,推动数据产品、应用范式、商业模式和体制机制协同创新,均具有重要的推动作用。

一、解放和发展数据生产力


当前,数据已经成为数字经济时代的基础性资源、重要生产力和关键生产要素。以数据为关键要素的数字经济正在强势崛起,引领人类社会由工业经济时代进入数字经济时代。数字经济与工业经济最大的不同在于,数字经济代表一种新的经济形态,是以数据作为关键生产要素、以现代信息通信网络作为重要载体、以数字经济技术的有效使用作为效率提升和经济结构优化的一系列新经济活动。

“数智”化时代,数据作为关键生产要素正在引发新型社会经济形态的变革,带动“数据生产力”的快速发展。火爆全球的“ChatGPT”(chat Generative Pre-trained Transformer),中文意思是“生成型预训练变换模型”,GPT主要分为两大部分:超大模型和训练数据,只有具备海量且高质量的数据集,才可以训练出超大模型。可见,“GPT”的技术运行逻辑是基于海量数据持续训练,以此构建起巨大模型,其底层是依托于强大的算力支撑,尤其是智能算力的支撑。如果没有强大算力支撑下的深度的学习算法和万亿级别数据语料的喂养,GPT不可能进行学习和迭代。然而,ChatGPT火爆提醒我们一定要守住伦理底线和法律红线。

作为人类生产力更高层次的延续,数据生产力以数据为基础和核心,“建立在‘经验型数据’和‘理论型数据’发展到‘数字化数据’基础之上”,标志着人类生产方式“依次从‘以土地为起点’‘以劳动为起点’和‘以资本为起点’向‘以数据为起点’深入发展”。以数据、算法、算力为主要代表的数据生产力是一个结构复杂的系统,算力是算法和数据的底座,算力规模的大小直接决定了数据处理能力的强弱,没有强大的算力支撑,算法和数据就犹如“空中楼阁”,特别是智能算力不仅能够提供海量的数据处理能力,而且可以支撑高性能的智能计算,进而直接影响数据生产力的发展。因此,“数智”时代需要重构生产力三要素:一是具有一定“数智”技术应用技能和生产运营能力的劳动者;二是与一定数字与智能技术相结合,以数字化和智能化生产工具为主的劳动资料;三是劳动对象的数字化和智能化应用水平。

数据生产力决定数字化生产关系,其中数据生产力在两者关系中居支配地位、起决定作用的方面。数字化生产关系是人们在数字化生产过程中形成的一种新型社会经济关系,它包括生产、流通、分配、交易、消费过程中形成的各种经济关系,其中数据作为新的生产资料是数字化生产关系中最基本的问题。

当前,数据生产力的发展已经领先于数字化生产关系,工业时代形成的生产关系已经不能适应数据生产力时代的需要,需要在数字产业化,尤其是产业数字化的进程中不断创新数字化生产关系,以适应数据生产力的快速发展。同时,数字化生产关系的进步又反作用于数据生产力,当数字化生产关系适合数据生产力发展的客观要求时,对数据生产力的发展起推动作用,而当数字化生产关系不适合数据生产力发展的客观要求时,就会阻碍数据生产力的发展。然而,数字化生产关系一定要适应数据生产力的发展,这是一条基本规律,当数据生产力超越数字化生产关系的发展时,就必须对数字化生产关系进行调整以适应快速发展的数据生产力。因此,为了更好地协调和处理与数据生产力发展相适应的数字化生产关系,必须先行构建完备的数据要素基础制度体系,统筹推进数据产权、数据要素流通与交易、数据要素收益与分配、数据要素治理等基础制度体系的建设,激发数据生产力乘数效应的发挥,逐步推动数字经济走向高级阶段。

二、数据基础制度体系的“四梁八柱”


数据要素市场不是一个单独的要素市场,而是一个横跨各领域的综合要素市场,比如土地要素市场、劳动力要素市场、资本要素市场、技术要素市场等,凡涉及数据的驱动和引领,均需要与数据要素市场融合。数据要素与其他生产要素融合,对其他生产要素具有放大、叠加、倍增作用,可以推动资源快捷流动、市场主体加速融合,提升经济社会各领域资源配置效能。

2022年6月22日,中央全面深化改革委员会第二十六次会议审议通过了《关于构建数据基础制度更好发挥数据要素作用的意见》,习近平总书记在主持会议时指出:“数据基础制度建设事关国家发展和安全大局,要维护国家数据安全,保护个人信息和商业秘密,促进数据高效流通使用、赋能实体经济,统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系。”习近平总书记强调要“构建数据基础制度体系”,“数据基础制度体系”不能简单地理解为“数据要素制度”,而是要遵循数据要素发展规律,形成以数据产权制度体系为基础,并基于多类数据要素之间相互联系和相互作用的规则和组合,建设良好的数据要素生态系统。

2022年12月,中共中央国务院全文公布《关于构建数据基础制度更好发挥数据要素作用的意见》(共二十条,以下简称“数据二十条”)。“数据二十条”除“指导思想”“工作原则”和“保障措施”中的六条外,其他十四条的核心内容是建立四大类数据基础制度体系。体系一是建立保障权益、合规使用的数据产权制度体系,包括五项制度:数据产权结构性分置制度、公共数据确权授权机制、企业数据确权授权机制、个人信息数据确权授权机制、数据要素各参与方合法权益保护制度。体系二是建立合规高效、场内外结合的数据要素流通和交易制度体系,包括四项制度:完善数据全流程合规与监管规则体系、统筹构建规范高效的数据交易场所、培育数据要素流通和交易服务生态体系统、构建数据安全合规有序跨境流通机制。体系三是建立体现效率、促进公平的数据要素收益分配制度体系,包括两项制度:健全数据要素由市场评价贡献和按贡献决定报酬机制、建立保障公平的数据要素收益分配体制机制。体系四是建立安全可控、弹性包容的数据要素治理制度体系,包括三项制度:创新政府数据治理机制、压实企业的数据治理责任、社会力量多方参与的协同治理体系。

从上述四大类数据基础制度体系可以看出,数据要素流通和交易制度体系、数据要素收益分配制度体系、数据要素治理制度体系,属于数据要素基础制度体系;数据产权制度体系不属于要素制度体系,它是其他三大类数据要素基础制度体系的根基, 数据产权制度体系下的基础制度在“数据二十条”中多达五项,从数据产权结构性分置,到公共数据、企业数据、个人数据的确权授权,以及对数据要素各参与方合法权益的保障等,构建起了数据产权运行的基本规则,为其他三类数据要素制度的建设奠定了基础,因此,没有归属清晰、合规使用、保障权益的数据产权制度,就无法形成高效公平、安全可控的数据要素市场。“数据二十条”系统性布局了数据基础制度体系的“四梁八柱”,历史性绘制了数据要素发展的长远蓝图,具有里程碑式的重要意义。“数据二十条” 明确了数据作为重要生产要素发展的主要路径,对于加强数据资源整合和安全保护,提高数据质量和规范性,丰富数据产品,推动数据产权结构性分置,促进数据的开发利用,构建多元化的数据交易体系,优化数据要素治理体制机制,均具有全局性、战略性作用。随着“数据二十条”中四大数据基础制度体系的逐步完善和细化,将极大地激活数据要素价值,推动数据要素与其他要素深度融合,进而促进数据生产力的快速发展。

三、数据生成的机理


我国《数据安全法》第三十一条规定:“关键信息基础设施的运营者在中华人民共和国境内运营中收集和产生的重要数据的出境安全管理,适用《中华人民共和国网络安全法》的规定;其他数据处理者在中华人民共和国境内运营中收集和产生的重要数据的出境安全管理办法,由国家网信部门会同国务院有关部门制定。”《数据出境安全评估办法》第二条规定:“数据处理者向境外提供在中华人民共和国境内运营中收集和产生的重要数据和依法应当进行安全评估的个人信息,应当按照本办法的规定进行安全评估;法律、行政法规另有规定的,依照其规定。上述法律和规章主要是针对数据出境的安全评估,但是笔者关注的不是“数据出境评估”的问题,而是上述规定中出现的两个关键词:数据的“收集”和“产生”。数据的“收集”是使原始数据聚集在一起,“产生”则是将已有的原始进行加工,进而派生出新的有价值的数据,这表明“收集”的数据和“产生”的数据是两类性质完全不同的数据。我国《数据安全法》和《个人信息保护法》关于数据处理行为的外延,包括数据的收集、存储、使用、加工、传输、提供、公开、删除等。“数据处理”的首个行为就是“收集”,数据处理中的“收集”主要是通过智能化方式对原始数据的获取和聚集,但是法定意义上的八个“数据处理”行为并不包括数据的“产生”,数据的“产生”是对原始数据进行加工,而派生出新的数据价值。由此,数据的“收集”是“因”,而数据的“产生”是“果”,不同的数据处理方式,会产生不同的数据价值,这是数据生成的基本机理。

从数据生成的结构看,大致可划分为三种,即结构化数据、非结构化数据和半结构化数据。“结构化数据”的特征是可以用行为单位表现的数据,主要是由二维表结构来逻辑表达和实现的数据,其特征是严格地遵循数据格式与长度规范,如个人的身份证(信用卡)号码、出行日期、电话号码、家庭地址等;“非结构化数据”的特征是结构不规则或不完整的数据,是一种很难用数据库二维逻辑表来表现的数据,如通过卫星收集的图像数据,通过摄像头、红外传感器、指纹传感器、麦克风等传感器收集的数据等;“半结构化数据”基本是介于结构化和非结构化之间,但趋向于结构化数据。据IDC预测,到2025年全球数据总量将达到175ZB,而非结构化数据将占据数据总量的80%至90%。

通过对上述原始数据的“收集”方式,以及经过加工“产生”的数据进行分析发现,在非结构化数据规模呈指数级增长的大趋势下,不可能出现组织或个人拥有数据所有权的命题。由此,数据产权制度最大的特征是“去所有权化”,不存在对数据的占有、使用、收益、处置的所有权问题。

四、数据产权的内涵


数据产权是适应当代数据市场经济发展要求而出现的新兴经济范畴。目前,国家数据主权、企业商业利益和个人隐私保护等方面均面临确权困境。在谈及数据产权时,通常情况下会把所有权与产权混为一谈。需要指出的是,所有权不同于产权,所有权指对财产归属关系的权利规定,强调财产关系的物质属性;产权是基于财产权的一组权利的有机结合体,强调财产关系的社会属性。数据产权是持有和使用数据资源的权利,并不是对数据资源占有、使用、收益、处置的权利。

有学者试图通过传统物权理论,设定数据原发者拥有数据所有权与数据处理者拥有数据用益权的二元权利结构,即“可以借鉴自物权—他物权和著作权—邻接权的权利分割模式,在数据权利体系设计上,根据不同主体对数据形成的贡献来源和程度的不同,设定数据原发者拥有数据所有权与数据处理者拥有数据用益权的二元权利结构,以实现用户与企业之间数据财产权益的均衡配置”。也有学者认为,在产权理论框架下,原始数据/数据产品应采用绝对排他性私有产权,赋予数据控制者/数据源加工处理者占有、使用、收益和处分(处置)数据的权利。数据集合应采用有限排他性私有产权,赋予数据源加工处理者使用、转让、分配数据集合,以及对抗他人不当获取和利用数据集合行为的权利。

根据《民法典》第二百四十条对“所有权”的定义:“所有权人对自己的不动产或者动产,依法享有占有、使用、收益和处分的权利”;《民法典》第三百二十三条对用益物权的定义是:“用益物权人对他人所有的不动产或者动产,依法享有占有、使用和收益的权利。”从上述定义可以看出,《民法典》确立的用益物权是由所有权派生的物权,主要指在他人所有的财产上设立占有、使用、收益的权利。因此,所有权是“自物权”,而用益物权是“他物权”,“自物权”最明显的特征是具有完全性和恒久性,“他物权”是建立在“自物权”基础上的用益权。因此所有权没有期限的限制,而用益物权作为“他物权”则有期限的限制,一旦期限届满,就应将其占有、使用的物权归还给所有权人。从数据生成的机理以及数据产权下的数据确权授权机制上看,所谓“数据原发者拥有数据所有权与数据处理者拥有数据用益权的二元权利结构”的情形,在数据要素市场几乎不可能出现。

我国《数据安全法》对“数据”的定义是:“数据,是指任何以电子或者其他方式对信息的记录。”《个人信息保护法》对“个人信息”给出的定义是:“以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息。”笔者一直坚持,“数据”(Data)与“信息”(information)应当严格区分,前者是附着在电子信息系统载体上的对客观事物的记录,是未经过处理的原始信息记录,其不能脱离电子信息系统载体而独立存在,如个人在医院电子信息系统留下的体检的原始记录;后者是指数据经过加工处理后,形成的具有使用价值的内容——信息,而且可以脱离电子信息载体而独立存在,如个人体检的电子数据通过专业人员从信息系统提取后,再经过分析和加工,形成的具有使用价值的体检报告,其存在的形式可以是电子状态,也可以是其他状态。

总之,电子数据一定是附着于电子信息系统载体,是基于计算机应用和信息通信等技术手段形成的对客观信息的记录,没有信息系统作为载体就无法生成数据。电子数据的来源和结构极其复杂性,原始数据基本上是以非结构化数据的形式存在,就个人数据而言,有平台交易数据、通信移动数据、机器和传感器数据等,且数据的形成过程需要多方参与,根本无法确定谁是“数据原发者”,数据要素很难像土地、资本和技术要素那样清晰地确定其所有权。

数据作为生产要素,是现代社会生产经营活动所需要的基础性资源,构建数据产权制度的核心是激活数据要素市场,因此,应淡化数据所有权,强化数据产权,聚焦数据资源持有权、数据加工使用权和数据产品经营权的“三权分置”的数据产权制度,促进公共数据、企业数据、个人数据分类分级确权授权使用机制。对此,国家发改委也明确提出,要推动数据产权结构性分置,跳出所有权思维定式,聚焦数据在采集、收集、加工使用、交易、应用全过程中各参与方的权利,首先,通过建立数据资源持有权、数据加工使用权、数据产品经营权“三权分置”,强化数据加工使用权,放活数据产品经营权;其次,加快数据产权登记制度体系建设,为推动数据有序流转、鼓励数据开发利用、引导数据产品交易、释放数据要素价值提供制度保障。

五、数据产权的特征与运行规则


在数据要素市场条件下,数据产权的属性主要有四大特征:一是数据产权具有经济特性;二是数据产权具有可分离性;三是数据产权流动具有独立性;四是数据的财产属性具有可复制性。数据要素与其他四大要素,如土地要素、劳动力要素、资本要素、技术要素最大的不同在于数据要素具有“非竞争性”特征,数据要素的生产是无穷尽的,尤其是数据要素的可无限复制性,导致其边际成本几乎为零,从根本上打破了稀缺性生产要素的制约。

数据产权制度的确立,需要解决数据产权在两个层面上的清晰问题:一是数据在法律层面的清晰,这要求数据产权的确立要有明确的法律保障,否则很难实现市场主体享有依法依规持有、使用、获取数据收益的权益;二是数据在经济层面的清晰,这要求数据产权的合法持有者对数据产权具有极强的约束力,这需要构建数据产权的约束依据,并通过约束依据明确数据产权的收益目标。

数据产权制度化的含义是要构建数据资源持有权、数据加工使用权、数据产品经营权(三权)的分置运行规则。首先,数据资源持有权,是指在相关数据主体的授权同意下,对数据资源管理、使用、收益和依法处分的权利。要重点聚焦数据的依法取得和合规持有,在此基础上确定其归属功能,但是一定要弱化所有权的定势思维;其次,数据加工使用权,是指在授权范围内以各种方式、技术手段使用、分析、加工数据的权利。数据加工使用权应当在数据处理者依法持有数据的前提下,才具有加工和使用数据的权利,但是在开展转换、汇聚、分析等数据加工活动中,如果发现可能危害国家安全、公共安全、经济安全、社会稳定和个人隐私的数据,应立即停止加工活动;再次,数据产品经营权是数据处理者作为数据市场主体,对合法处理数据形成的数据产品和服务,依法获得自主经营权,并拥有取得收益的权利。数据产品,主要指通过对数据资源投入实质性加工和创新性劳动形成的数据和数据衍生产品,包括但不限于数据集、数据分析报告、数据可视化产品、数据指数、API 数据、加密数据等。


六、公共数据确权授权机制


作为一个技术型、工具性概念,公共数据并不存在固有的内涵和外延,在“数据二十条”和我国法律法规中也尚未对“公共数据”给出定义。然而,在一些地方的数据立法中,对公共数据的内涵基本达成了共识,最有代表性的是《上海市数据条例》《四川省数据条例》和《浙江省公共数据条例》,其中《浙江省公共数据条例》是全国首部公共数据领域的地方性法规。总体来说,地方立法中的公共数据概念虽然各自有别,但整体上经历了一个“政务信息—政务数据—公共数据”的扩展性演进历程。

《上海市数据条例》对“公共数据”的定义是,国家机关、事业单位,经依法授权具有管理公共事务职能的组织,以及供水、供电、供气、公共交通等提供公共服务的组织,在履行公共管理和服务职责过程中收集和产生的数据;《浙江省公共数据条例》对“公共数据”的定义是,国家机关、法律法规规章授权的具有管理公共事务职能的组织以及供水、供电、供气、公共交通等公共服务运营单位(以下统称公共管理和服务机构),在依法履行职责或者提供公共服务过程中收集、产生的数据;《四川省数据条例》对“公共数据”的定义是,国家机关和法律、法规授权的具有管理公共事务职能的组织为履行法定职责收集、产生的政务数据,以及医疗、教育、供水、供电、供气、通信、文化旅游、体育、交通运输、环境保护等公共企业事业单位在提供公共服务过程中收集、产生的涉及公共利益的公共服务数据。

从上述地方数据条例中关于“公共数据”的定义可以看出,“公共数据”具有以下特征,一是“公共数据”的持有者(主体),包括政府、管理公共事务的组织和提供公共服务的运营机构等;二是“公共数据”是上述组织在依法履行公共管理或提供公共服务职责过程中收集和产生的数据;三是公共数据从数据的收集到加工产生,需要经过管理相对人和接受公共服务运营组织提供公共服务产品的多方利益相关主体的参与,其中包括各级党政机关、个人、企业和其他组织。

目前,“公共数据”和“政务数据”这两个词经常交叉重叠地出现在中央和国家的政策性文件中,而我国的首部《数据安全法》只涉及了“政务数据”,未提及“公共数据”,但是在一些地方数据立法中,基本采用了“公共数据”概念。笔者认为,从数据服务的社会属性看,“公共数据”的内涵更丰富,而政务数据相对狭窄,“公共数据”的外延比较广,其中就包含了“政务数据”,因此,使用“公共数据”的概念更符合公共数据服务的社会属性和公益目的。“数据二十条”没有对“公共数据”进行定义,但是进一步扩大了持有公共数据主体的范围,包括了“各级党政机关、企事业单位,以及依法履职或提供公共服务的组织”等。

从公共数据服务的范围看,公共数据主要有两大类,一类用于公共治理和公益事业的公共数据;另一类是用于产业发展和行业发展的公共数据。前者主要是基于公益目的,应当无偿使用和分享,后者是与社会经济发展有关的数据,可以探索有偿使用。为此,“数据二十条”提出,推动用于公共治理、公益事业的公共数据有条件无偿使用,探索用于产业发展、行业发展的公共数据有条件有偿使用。

实际上,探索公共数据的有偿利用不是“数据二十条”首先提出的概念,2021年3月3日,全国人大表决通过的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》提出,要开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用;2021年12月,国务院印发的《“十四五”数字经济发展规划》进一步明确,对具有经济和社会价值、允许加工利用的政务数据和公共数据,通过数据开放、特许开发、授权应用等方式,鼓励更多社会力量进行增值开发利用。

“数据二十条”提出:“鼓励公共数据在保护个人隐私和确保公共安全的前提下,按照‘原始数据不出域、数据可用不可见’的要求,以模型、核验等产品和服务形式向社会提供。”这主要是依托联邦学习以及多方安全计算等隐私计算技术,形成“原始数据不出域,数据不动价值动”的数据增值开发利用新范式,这些新范式可以实现以模型、核验等产品和服务形式向社会提供有价值的数据,这是公共数据融合创新利用的新方向。

探索公共数据的有条件有偿使用,是赋予公共数据要素价值,激活公共数据价值创造的重大举措。公共数据的有条件有偿使用,应重点聚焦实体经济领域和民生服务领域,如生产制造、科技研发、金融服务、商贸流通、航运物流、现代农业,以及公共卫生、医疗卫生、文化旅游、交通物流、健康养老等。无论是公共数据的无偿使用还是有偿使用,均要附带一定的条件,比如需要经过公共数据提供部门的审核同意,并与公共数据提供单位签订公共数据无偿或有偿使用协议,明确公共数据利用的方式、使用范围,以及安全保障等。

关于公共数据的开放,“数据二十条”要求:“依法依规予以保密的公共数据不予开放,严格管控未依法依规公开的原始公共数据直接进入市场,保障公共数据供给使用的公共利益。”因此,政府、管理公共事务的组织和提供公共服务的运营机构要定期制定公共数据开放的重点清单,凡涉及国家安全数据,个人信息,尤其是敏感个人信息,以及企业商业秘密数据,或者法律、法规规定不得开放的数据,均应列入非开放类公共数据清单。

七、企业数据确权授权机制


作为一种新型生产要素,企业数据具有财产属性,必须考虑其“权利主体多元性、客体构造独特性、利益关系复杂性等特征”。“数据二十条”提出:“对各类市场主体在生产经营活动中采集加工的不涉及个人信息和公共利益的数据,市场主体享有依法依规持有、使用、获取收益的权益,保障其投入的劳动和其他要素贡献获得合理回报,加强数据要素供给激励。”上述内容有三层含义,一是企业作为市场的主体,在生产经营活动中采集加工的数据,依法享有依法依规持有、使用、获取收益的权益;二是在企业在生产经营活动中收集的数据,除了生产运营有关的数据,还包括个人信息和公共利益数据,但是企业依法持有、使用和获取收益的数据,不应包括个人信息和公共利益数据;三是企业对收集的数据要进行加工处理才具有要素价值,因此,企业要投入资本和人力要素,按照“市场评价贡献、按贡献决定报酬”的原则操作,而国家应依法保障企业投入的劳动和其他要素贡献获得合理回报。

企业在生产经营活动中对数据的采集基本上是采用智能化手段,以汽车数据的“收集”为例,汽车数据的收集主要集中在四类,即“车外数据”“座舱数据”“运行数据”和“位置轨迹数据”:1.“车外数据”收集包括,通过摄像头、雷达等传感器从汽车外部环境采集的道路、建筑、地形、交通参与者等数据,以及对其进行加工后产生的数据;2.“座舱数据”收集包括,通过摄像头、红外传感器、指纹传感器、麦克风等传感器从汽车座舱采集的数据,以及对其进行加工后产生的数据;3.“运行数据”收集包括:通过车速传感器、温度传感器、轴转速传感器、压力传感器等从动力系统、底盘系统、车身系统、舒适系统等电子电气系统采集的数据;4.“位置轨迹”数据收集包括:基于卫星定位、通信网络等各种方式获取的汽车定位和途经路径相关的数据。

通过对以上四类原始数据资源的来源和采集手段观察发现,数据量不仅规模巨大和数据结构复杂,而且数据的获取、存储、管理、分析远远超出了传统数据库软件工具能力范围的数据集合。企业在汇聚多个维度、多个来源、多种结构的数据之后,先要对数据进行预处理,在数据的预处理过程中,除了更正和修复系统中的一些有瑕疵的数据之外,更多的是对数据进行归并整理,并储存到新的存储介质中等。可见,企业在生产经营活动中采集和加工海量数据将付出大量的资本、人力和技术成本,因此,应当依法确认企业数据采集和加工等过程中的劳动付出和收益权,这是激励数据要素供给的重要保障。

数据作为要素资源具有“排他性”特征,主要体现在一些数字行业龙头企业上,一些大型互联网平台企业聚合了海量的数据资源,他们通过平台自身营造的数字生态系统对海量进行控制和独占,形成了对数据的垄断,这不仅提高了市场进入壁垒和获取数据的门槛,而且带来了“赢者通吃”数据的局面。为此,“数据二十条”在“工作原则中”强调,坚持共享共用,释放价值红利。合理降低市场主体获取数据的门槛,增强数据要素共享性、普惠性,激励创新创业创造,强化反垄断和反不正当竞争,形成依法规范、共同参与、各取所需、共享红利的发展模式。同时,鼓励探索企业数据授权使用新模式,着力发挥国有企业带头作用,引导行业龙头企业、互联网平台企业发挥带动作用,促进他们与中小微企业双向公平授权、共同合理使用数据,以此赋能中小微企业数字化转型。

八、个人信息数据确权授权机制


“数据二十条”提出:“对承载个人信息的数据,推动数据处理者按照个人授权范围依法依规采集、持有、托管和使用数据,规范对个人信息的处理活动,不得采取‘一揽子授权’、强制同意等方式过度收集个人信息,促进个人信息合理利用。”上述内容明确了“推动数据处理者按照个人授权范围依法依规采集、持有、托管和使用数据”。关于“授权”是指数据处理者接受个人信息主体的委托处理其个人数据的行为,上述授权的范围包括四项内容,即依规采集数据、持有数据、托管数据和使用数据。上述“授权”行为可以参照《个人信息保护法》第二十一条有关委托处理个人信息的规定,一是个人信息处理者委托处理个人信息的,应当与受托人约定委托处理的目的、期限、处理方式、个人信息的种类、保护措施以及双方的权利和义务等,并对受托人的个人信息处理活动进行监督;二是受托人应当按照约定处理个人信息,不得超出约定的处理目的、处理方式等处理个人信息;三是委托合同不生效、无效、被撤销或者终止的,受托人应当将个人信息返还个人信息处理者或者予以删除,不得保留;四是未经个人信息处理者同意,受托人不得转委托他人处理个人信息。上述规定中的“个人信息处理者”,是指在个人信息处理活动中自主决定处理目的、处理方式的组织、个人。


目前,大量的移动应用程序(APP)通过与其他授权捆绑,一揽子授权,强制过度索取非必要个人信息极为严重,如果用户个人不同意,APP就拒绝提供服务。对此,我国《个人信息保护》第十六条明确规定:“个人信息处理者不得以个人不同意处理其个人信息或者撤回同意为由,拒绝提供产品或者服务;处理个人信息属于提供产品或者服务所必需的除外。”该条有两项规定,第一项是禁止性规定,即不得以个人不同意处理其个人信息或者撤回同意为由,拒绝提供产品或者服务;第二项是除外性规定,即信息属于提供产品或者服务所必需的除外。至此,用户不同意APP收集个人信息,就无法使用APP将视为违法,且收集个人信息也必须限定在“必要个人信息范围”,只要超过“必要个人信息范围”的收集和处理行为,均属于超范围收集个人信息,必须严格予以禁止和惩处。

网络时代,海量的数据和信息以聚合形式存在于社交网络、电子商务、移动智能终端等网络平台,特别是一些大型的网络运营商已经形成对个人数据和信息的实际控制和垄断,公民作为数据内容的主体完全不能控制自己的个人数据和信息,根本无法了解自己的信息和数据在何时、何地、被何人、以何种方式非法收集、使用、加工、传输。事实上,个人信息保护的核心不在于“个人信息”本身,而重点在于如何规制第三人对公民个人信息的收集、使用、加工、传输等行为。因此,公民行使信息权利的基础,是基于公民作为信息内容的主体有权决定其个人信息在何时、何地及以何种方式被何人收集、使用、加工和传输。

我国《个人信息保护法》第四章的名称为:“个人在个人信息处理活动中的权利”。从上述名称可以看出,自然人的个人信息权是,个人信息处理者在对自然人个人信息的收集、储存、使用、加工、传输、提供、公开等过程中,自然人所享有的请求权,包括七项权利:知情权、决定权(限制、拒绝和撤回权)、查阅复制权、个人信息转移权、更正补充权、删除权、规则解释权。以上请求权大部分是包括排除个人信息的处理者违法侵害的消极请求权,很少有个人控制、支配个人信息的积极请求权。因此,“数据二十条”确立的“健全个人信息数据确权授权机制”的前提,是严格规范平台企业处理个人信息的行为。从我国《个人信息保护法》的立法目的看,主要是两大功能:一是“保护个人信息权益”,二是“促进个人信息合理利用”,但是“规范个人信息处理活动”则处于《个人信息保护法》的核心地位,只有夯实“规范个人信息处理活动”这个关键环节,才能确保实现保护个人信息权益和促进个人信息合理利用之目的。

个人信息具有财产属性,但是个人信息主要涉及的是自然人的人格权,这其中就包括大量的个人隐私信息。我国《民法典》“人格权编”(第四编)第六章专门就个人信息中私密信息的保护作出规定,即“个人信息中的私密信息,适用有关隐私权的规定;没有规定的,适用有关个人信息保护的规定。”为了保障使用个人信息数据时的信息安全和个人隐私保护,“数据二十条”建议,要创新技术手段,推动个人信息匿名化处理。我国《个人信息保护法》第四条规定:“个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息。”《个人信息保护法》关于个人信息的定义,与我国《民法典》《网络安全法》、“两高”《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》以及欧盟的GDPR关于个人信息的内涵最大的不同在于增加了“不包括匿名化处理后的信息”。这就从法律层面上确认,个人信息经匿名化处理后,数据处理者采集、持有和使用的信息就不属于个人信息,无须适用个人信息保护法的相关规定。《个人信息保护法》第七十三条(四)将“匿名化”定义为:“个人信息经过处理无法识别特定自然人且不能复原的过程。”将经过匿名化处理后的个人信息排除在个人信息保护法的框架之外,这对于促进个人信息的合理利用具有巨大的数据要素价值。

综上,建立保障权益与合规使用的数据产权制度,应当在确保各参与方数据产权关系清晰的基础上,依靠数据产权规则使数据资源持有者、数据加工使用者、数据产品经营者承认和尊重数据产权制度,并合理与合规地行使数据资源持有权、数据加工使用权、数据产品经营权(三权),如果违背或侵犯它,就要受到相应的制约或制裁。因此,数据产权制度的核心要义是:“归属清晰、合规使用,保障权益”。

结 语


当前,人类社会正在经历数据革命,数据作为关键生产要素正在引发新型社会经济形态的变革,带动“数据生产力”的快速发展。马克思在《哲学的贫困》中曾这样论述到:随着新生产力的获得,人们改变自己的生产方式,随着生产方式即保证自己生活的方式的改变,人们也就会改变自己的一切社会关系。手推磨产生的是封建主为首的社会,蒸汽磨产生的是工业资本家为首的社会。这意味着“传统的生产关系也需要相应地做出改变”。当前,数据生产力的发展已经领先于生产关系,工业时代形成的生产关系已经不能适应数据生产力时代的需要,所以需要在数字产业化,尤其是产业数字化的进程中不断创新数字化生产关系,以适应数据生产力的快速发展。

在数据四大基础制度体系中,数据产权制度体系是根基,没有清晰合规的数据产权制度体系,就无法促进高效的数据要素流通和交易,也无法保障公平的数据要素收益分配。构建数据产权制度体系的核心是激活数据要素市场,因此必须淡化数据所有权,强化数据产权,聚焦数据资源合法持有权、数据加工使用权和数据产品经营权的“三权分置”的数据产权制度。

(参考文献已省略)

囿于篇幅,此处舍去注释,完整版本请见《南京邮电大学学报(社会科学版)》2023年第1期。