大数跨境

专家视点 | 数据知识产权保护的规则设计

专家视点 | 数据知识产权保护的规则设计 杭州市知识产权交易服务中心
2025-11-12
2
导读:点击蓝字关注我们摘 要 通过知识产权部门法的比较研究,从知识产权一般原理和规则出发,论证数据知识产权概念的适格

点击蓝字

关注我们

摘 要 通过知识产权部门法的比较研究,从知识产权一般原理和规则出发,论证数据知识产权概念的适格性,厘清数据知识产权与数据产权、数据产品、数据知识产权构建方案等概念的区别。分析了数据知识产权与数据“三权分置”的关系,从鼓励数据流转使用角度分析数据知识产权制度的适用性,梳理数据知识产权持有者的权益。结合知识产权制度发展和案例,提出对“依法依规获取、经过一定规则处理、具有实用价值、智力成果属性、数据集合”要件的理解,数据知识产权登记的指导原则、登记审查思路、具体审查标准及数据知识产权应当具备的实质性要件,在此基础上论证登记证书的作用、知识产权属性的判断标准。
关键词 数据知识产权; 数据知识产权构建方案; 数据知识产权持有者; 登记


DOI:10.11959/j.issn.2096-0271.2025082 

引用格式:

范理. 数据知识产权保护的规则设计[J]. 大数据, 2025, 11(4): 30-43. 

FAN L. Design of rules for data intellectual property protection[J]. BIG DATA RESEARCH, 2025, 11(4): 30-43.

0 引言  

数据确权是数据要素改革、构建数据基础制度的关键。《关于构建数据基础制度更好发挥数据要素作用的意见》提出淡化所有权,建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制,体现了我国对数据要素流通本质的深刻把握和重大理论贡献,也是进一步繁荣数字经济、实现安全有序可控发展的必然要求。此前,《知识产权强国建设纲要(2021—2035年)》和《“十四五”国家知识产权保护和运用规划》都提出要研究构建数据知识产权保护规则;国家知识产权局自2021年开始在全国17个省区市陆续部署推进数据知识产权地方试点工作,累计登记数据知识产权近3万件。 

数据是不是知识产权?这个命题在2017年3月对《中华人民共和国民法总则(草案一次审议稿)》征求意见后基本明确。随着国家知识产权局两轮试点实践推进和理论探索,在充分考虑数据安全、公共利益和个人隐私,充分把握数据的特有属性和产权制度的客观规律,充分尊重数据处理者的劳动和相关投入,充分发挥数据对产业数字化转型和经济高质量发展的支撑作用的“四个充分”原则下,“数据知识产权”的保护对象定位于依法依规获取的、经过一定规则处理形成的、具有实用价值和智力成果属性的数据集合。数据知识产权保护的不是单条数据或信息,而是经过规则处理、体现劳动付出、借鉴知识产权制度保护的数据集合,与现有知识产权门类的保护客体,以及《中华人民共和国数据安全法》(简称《数据安全法》)、《中华人民共和国个人信息保护法》等侧重于数据承载的信息的保护都有本质区别。

对数据知识产权的认识

数据知识产权是什么?数据知识产权是指数据的知识产权,还是将其看作一种新形态的“类知识产权”?一般认为,数据知识产权是对数据集合形成过程中数据处理者的智力劳动和其他要素投入的肯定。从这个角度出发,人们可以认为数据知识产权是数据的知识产权,比如对于数据处理的算法规则创新达到专利权保护要求的,算法规则可以申请方法专利。但从实际情况来看,大部分算法规则,以及有实用价值的数据集合不符合现有知识产权客体标准,达不到部门法规定的创新性高度要求,而不得不寻求《中华人民共和国反不正当竞争法》(简称《反不正当竞争法》)的一般性保护。在数据产权制度构建的大背景下,以及赋予数据以类似于确权登记保护机制的期待下,对数据加工处理的结果——“数据集合”的登记进入视野。因此,狭义上的“数据知识产权”以数据集合为保护对象,并依此来肯定数据处理者对数据处理过程的创造性劳动付出,有学者也认可从数据使用创造数据价值的理念出发,数据财产赋权的首要主体是数据处理者。在未分析其适格性的前提下,暂且将其看作一种“类知识产权”。 

数据知识产权制度对数据集合的保护同当下对数据保护的需求相吻合,但同数据产权制度构建在理念上有一定差异。数据产权包括发现和持有未经处理的数据资源的持有权、未经脱敏处理数据的持有权、实质处于商业秘密保护状态下的数据持有权、数据处理者对数据资源的加工处理权以及承载数据知识产权的数据产品的经营权等,在形态上包括API、数据文档等,其范围也远大于数据知识产权。数据产权规避了所有权,侧重于从过程的角度按照“谁投入、谁贡献、谁受益”的原则,着重分阶段保护数据要素各参与方的投入产出收益。而数据知识产权是将符合登记对象要求的数据集合,按照知识产权的一般制度安排推定为登记人具有持有、使用、收益、处分的权益,它更侧重于从数据处理者的角度保障各种要素投入的收益。 

此外,数据知识产权通过对数据结构、更新频率等数据集合外部特征的把握,达到对没有形态、没有边界的数据集合的控制,而不仅是对固定的、已经产生的数据的保护,这种控制适应数据开放性、流动性、扩展性的特点。数据知识产权概念的提出,是在深化认识的基础上,对数据这一“无形无体”物的客体性质在理论和制度上的创新,其区别于具体数据产品、具体数据存储介质,具备与其他知识产权相通的无形性,并进一步通过权益主体登记对持有者与这种控制进行关联,从而实现对数据集合的保护。数据知识产权的保护对象不是数据选择、编排的技巧或其结果(如数据结构、计算机代码),如果陷入保护编排技巧或其结果的误区,既搞错了制度设计的初衷,也混同于汇编作品、软件著作权等的保护方式。数据知识产权保护的对象同商业秘密也不一样,商业秘密要求被保护的数据未公开、采取了保密措施、有商业价值,而数据知识产权对数据公开与否没有要求。

数据知识产权保护客体的适格性

数据知识产权制度和以“三权分置”为代表的数据产权制度都是数据确权基础制度的探索,符合《关于构建数据基础制度更好发挥数据要素作用的意见》提出的“研究数据产权登记新方式”要求。那么,数据集合保护为何可以借鉴知识产权保护制度?

2.1 与知识产权一般特征的契合 

知识产权首先表现为客体的无形性、非物质性,所有的知识产权都将其客体与承载物进行明确区分。比如《中华人民共和国商标法》(简称《商标法》)对“地理标志”含义进行了阐述,《地理标志产品保护办法》从名称上进行了区分。数据知识产权与承载其的数据产品是两个概念:数据产品是数据知识产权的一个应用场景;数据产品是数据报告或数据文件表现为物权,是调用的数据接口或在线软件产品表现为债权,一个数据产品可以载有一个或多个数据知识产权。企业购入专利或数据知识产权并不一定能够得到有效运用,要整体引入包含专利的技术或包含数据知识产权的数据产品或数据服务以实现商业化。 

广义知识产权是人的智力劳动成果,创作主体是自然人,客体主要是智力劳动的产物。比如著作权将人的因素明确规定为“创作作品的自然人是作者”;专利权将发明人或设计人限定为“对发明创造的实质性特点作出创造性贡献的人”;动物和植物品种的生产方法可以授予专利权但不包括主要是生物学的方法,是否“主要是生物学的方法”取决于该方法中人的技术介入程度;美国最高法院在1980年Diamond v. Chakrobarty案中给出“阳光下由人创造的所有事物都可专利”的宽广表述。除了著作权法,在定义中直接表述知识产权是智力劳动成果的不多。《伯尔尼公约》对汇编作品的定义是对英美法系著作权早期采用“额头流汗”标准的回应,一般认为著作权“独创性”法律要件中包含了其仅是“智力创造”成果的内涵,只有智力创造部分才应该被区分出来作排他性保护;一概对体力劳动成果和智力劳动成果不加区分地作强排他性保护,与知识产权整体上鼓励创新原则相悖,但若创新成果中智力劳动和体力劳动成果难以分割且又有必要对其整体进行保护,可以采取以行为规制为主的非排他性或弱排他性保护方式。 

信息、记录(来自自然界的记录或人工的记录,不一定是数据的形式,但都是数据处理的来源)、数据、衍生数据、数据产品,依次递进,在从记录到数据、数据到衍生数据的跨越中离不开处理。不同处理程度的数据集合,其智力劳动贡献度很不均衡,因此整体应摒弃强排他性保护方式。 

处理可分为机器处理和承载人的智力劳动的处理,按照知识产权制度逻辑,后者的处理方案、结果必要时可以被保护。就数据集合的形成而言,形成构建方案和形成数据集合是两个层面的问题,前者在满足主体要求的前提下属于智力劳动过程不存在争议,而后者在大数据时代大多只是根据一定的规则不断重复地累积。强调数据集合的智力成果属性,实质是人对数据知识产权形成方案的智力介入程度,而不是看数据集合本身是否具有智力劳动付出或占有的贡献比例。因此,强调借鉴知识产权制度来保护数据集合,比直接认定数据集合是智力成果更合适。 

再者,人的智力劳动成果表现为思想、创意、表达等层次。著作权、集成电路布图设计保护表达方式而“不延及思想”(TRIPS协定第9条、《集成电路布图设计保护条例》第5条),表达清晰才能明确其保护边界;专利权保护技术方案、设计方案(《专利法》第2条),技术特征表达的技术内容不清楚时要对权利要求进行解释。为弥补权利要求的表述局限性引入等同侵权判定方式,确权成本有了提高,当然也不能仅是设想而未给出能够实施的技术手段。物权之所以有明确的排他性在于它的有形边界,而知识产权由于无形性,要与他人产权区分必须通过描述划定明确的界限。如果客体过于抽象导致边界无法确定,很难想象如何进行保护,并且这种保护容易阻碍他人的创新创造;同时是否智力劳动处于表达层面就保护表达、处于创意层面就保护创意也不尽然,要考虑表达、创意是否有保护的必要。比如对专利方法的保护还延伸至依照该专利方法直接获得的产品(TRIPS协定第28条、《专利法》第11条);植物新品种保护比较复杂,虽然各国制度差异导致或有保护真空、或有重叠,但以专利模式保护育种方法(不延及品种)(《专利法》第25条第2款)、植物新品种权模式保护植物品种(《种子法》第4章)成为通行做法,美国专利制度还专门设有植物专利同植物新品种权一起与育种实用专利权形成互补甚至是重叠。 

获取来源数据、发掘数据间的联系、匹配一定的处理规则应用于来源数据、为处理后的数据所形成的规模性数据集合找到应用场景,或者利用一定的算法规则创造一个具有应用场景的数据集合(如科学数据),这个架构用知识产权方式来保护非常贴切。数据知识产权的形成过程通常用数据来源、处理规则、形成的数据结构、应用场景来描述,数据来源、应用场景是客观事实,属于“发现”而非“发明”,对其赋予独占权利侵占了公有领地,处理规则本身可以是公知的,也可以是被知识产权保护的,但根据应用场景的不同,将处理规则架构在来源数据上不一定是公知的,而数据结构是基于处理规则和应用场景的必然结果。通过对这个数据知识产权构建方案的剖析能看出,虽然其边界相对还是比较清晰的,但除非处理规则本身能够申请方法专利或软件著作权,构建方案的其他部分还是一个智力投入创新性程度较弱的部分,对其进行“强”保护不合理,也不具有可行性;而对“结果”即形成的数据集合进行保护边界清晰、可操作性强,也更能彰显数据知识产权制度与其他知识产权制度的差异化价值取向,即保护有应用价值的数据汇集成的数据集合,不在于其数据结构的编排是否有独创性、规则是否有创新性。因此,数据知识产权保护对象宜定位于“结果”,即形成的数据集合,构建方案达到一定创新性要求的,可以用专利或软件著作权等对算法规则进行保护,应用场景创新不是保护对象。 

最后,各类知识产权都对保护对象的创新性提出了不同要求,并转换为法律要件。如商业秘密的“非公知性”要件、著作权的“独创性”要件(不同作品的独创性要求也不尽相同)、植物新品种提高到“新颖性”“特异性”要件、专利的“新颖性”“创造性”要件(发明和实用新型对“创造性”要求也不同)。在不同创新性要求下采取差异化的保护,如针对非排他性的商业秘密提供不正当竞争保护,著作权、集成电路布图设计(以登记内容为保护对象)较专利权(以公开内容换保护)的排他性弱一些,实用新型和发明保护期限不同,随着创新性要求的增强,知识产权保护的强度也渐增。对于数据知识产权这一创新性程度差异较大的对象,其最低程度的创新性宜定位在本身不是公知的数据,区别于公知数据这一要件也是法院审判时确认数据主体享有数据权益的必要条件之一。而“经过一定规则的处理”就将处理后的数据与来源数据或者说是处于事实状态中的数据区分开来,是一种简单易行的区分数据知识产权和来源数据的方法。 

此外,学者还从数据知识产权赋权符合劳动财产理论、功利主义理论、交易成本理论,以及知识产权制度的激励理论等方面验证了其合理性。

2.2 定义要件的理解

数据知识产权在我国之所以不列入邻接权,是因为其权利基础大多不是具有独创性的作品;数据知识产权之所以同著作权不同,不仅因为其数据集合大多缺乏独创性,还在于制度设计中,其包括了根据一定的算法规则和更新频率,对将来会产生的数据预期。 

首先,针对“智力成果属性要件”来看,对数据知识产权的保护是否应当区分智力劳动和其他要素投入的劳动,单独剥离出智力劳动贡献因素对数据集合形成结果按比例进行保护?专利是技术方案、设计方案,是智力劳动成果没有异议,但对于专利实用性的验证需要大量要素投入,在法院裁判时并没有对这部分是不是智力劳动或其他要素投入、分别占多大比例进行划分;著作权只保护作品这一表达形式。1883年《保护工业产权巴黎公约》后,更多“表达”层次的客体被纳入知识产权;1889年《集成电路知识产权条约》对集成电路布图制度的设计更多集成著作权法的理念,明确只保护表达;1961年《国际植物新品种保护公约》开启植物新品种本身的专门法保护方式,培育植物品种的新方法仍可采用专利保护;1996年欧盟《数据库保护指令》对无独创性数据库提供具有一定排他性的保护,较1993年TRIPS协定对汇编作品的要求(数据汇编的选取或安排构成智力劳动、保护不延及数据本身)更进了一步。多边协定《全面与进步跨太平洋伙伴关系协定》在知识产权章节提出了对农用化学品和新药上市有关未披露实验数据和其他数据的排他性保护规则 

综上,从发展轨迹看,随着经济科技的发展,对创新保护的需求也在不断提高,知识产权客体越来越呈现出体力劳动或其他要素投入同智力劳动难以分开或者难以衡量谁占主导的状态。知识产权的体系不限于保护智力创造的成果。数据知识产权制度的创设契合数字经济发展对数据本身价值的放大需求和流通中确权的需要,数据集合的构建并不是重点,在保护数据集合本身时不需要也不可能对智力劳动和其他要素投入进行区分。 

数据知识产权的“经过一定规则处理形成”要件蕴含着“智力成果属性”要件,除此之外,数据来源的选择和应用场景的创新也有智力劳动贡献。从数据集合的整个形成过程来看,其他要素的投入并不总是处于次要地位的。过于强调数据知识产权的智力成果属性,甚至认为其形成过程或结果形式必须达到一定创新性高度才能成为保护客体,不仅造成数据知识产权与其他门类知识产权保护界限不清(是保护数据不是保护加工处理规则)、要件内涵错乱(将人的智力劳动要求混同于创新性高度要求),也使制度的包容性、开放性受限(排除了人工智能辅助的数据集合的受保护),狭隘理解了数据知识产权的制度创新功能;同时,一定的创新性要求对应着相应的保护强度,目前定位于弱排他性或非排他性的保护不宜对数据集合有过高的创新性要求。对数据集合形成过程中数据处理规则、应用场景构建等创新创造的智力劳动进行保护,归根结底要落到数据集合上,“经过一定规则处理形成”要件已经明确了数据知识产权的创新性高度要求,目前的法律实践也并没有强调智力投入强度。 

考察“实用价值”要件。早期“数据知识产权”概念提出时采用的是“商业价值”要件。用“商业价值”而非“实用价值”可以追溯到《反不正当竞争法》)2017年的修改,理由是技术信息价值认定,一个重要的衡量标准是该技术信息是否已被权利人自己使用或者侵权人使用,一部分技术信息虽然没有实用性但是却具有商业价值,如很多技术研发是在大量的试错中成功的,故而该过程积累的失败方案或相关数据也是有价值的,可以使后续研发少走弯路,基本判断点在于是否能给权利人带来竞争优势。在证明该技术的商业价值时,权利人只要证明将该技术使用在自己产品或侵权方产品上即可。 

反观《专利法》的思路,“实用性”指能够在产业上制造或者使用,并且产生积极效果;《专利审查指南》进一步指出,实用性与所申请的专利是否已经实施无关。《专利法》的“实用性”或“实用价值”也是同国际上对专利的定义相一致的,司法上也并没有因为专利权人没有实施过专利而否定其对侵权人的起诉。 

数据知识产权一些地方立法的解释中认为,实用性判断主要基于数据集合是否具有现实或潜在的应用价值。数据经过加工处理后,如果能够为特定应用场景提供有用的信息或支持决策,则可以认为其具有实用性。商业价值一般是置入商业市场环境的判断视角,在登记审查时,只能从客观上判断数据集合能否解决应用场景中所述的主要问题,而无法判断其在市场环境中商业价值的有无和大小。因此,数据知识产权登记很难对数据集合的商业价值进行审查,但实用性判断却是可行的,只要通过应用场景判断其具有现实或者潜在的应用价值即具备实用性。此外,这一要件采用“实用价值”表述是为了突出数据知识产权除了商业价值外的社会价值等 

最后,数据堂(北京)科技股份有限公司与隐木(上海)科技有限公司间不正当竞争纠纷一案是全国首例涉“数据知识产权登记证书”效力认定案,两审法院对数据知识产权登记证书的效力达成了共识,确认了数据知识产权登记证书在司法程序中的初步证据效力。法院认可数据知识产权登记证书作为收集行为合法性的初步证据,以及登记人享有该数据集合相关财产性利益、作为权利归属的初步证明,是对“依法依规获取”和“经过一定规则处理形成”要件的肯定。此外,有学者认为两审法院认可的是通过这种做法来把握大数据集合的登记新方式,具有突破性意义。

数据知识产权保护落实了数据权利分置构想

数据权益现阶段主要依据《反不正当竞争法》第2条和第12条得到行为规制保护,数据知识产权保护对象是在这两个条文下随着时代和技术发展衍生的一种数据类别。由于这两个条文对数据知识产权的保护预见性较差,法院必须个案判决,有很大的不确定性,而借鉴现有知识产权保护模式,通过数据知识产权自愿登记,形成相对完整的包括存证公证、申请、公示异议、颁证公告、撤销、信用监管等程序的多方共同参与的规则,能为稳定保护预期、降低信息成本和执行成本探索一种特定类型数据的确权机制,通过公开必要的数据知识产权构建方案又兼具了知识产权激励数据创新的制度功能,同时知识产权的转让、质押、许可、跨境流通等方式国际通行且成熟,能为畅通数据知识产权的运用提供制度借鉴。

3.1 数据知识产权与“三权分置” 

首先,数据知识产权主要是指经加工处理后的数据集合的“数据资源持有权”,以此为基础,数据处理者对经其处理生成的数据集合享有使用、收益、处分的权益。数据处理者是指在数据处理活动中自主决定处理目的和处理方式的个人或组织,非纯粹的数据处理技术提供方,只要待处理数据的获取是合法合规的,数据处理者在数据处理过程中构思和实施了处理行为,对于处理后的数据集合在物理上“持有”是显然的,这同衍生专利、以还处在著作权保护期内的作品为基础的邻接权一样,尽管数据来源可能存在各种“权利簇”“权益簇”且不一定已消亡,也不应否认数据处理者在数据处理过程中的劳动和付出,以及对这部分叠加的投入应得的收益。没有法律上的“持有”,获得相应收益也是不成立的。在这个前提下,只要后续使用、收益、处分行为不违反相关法律法规、不违背数据来源提供方协议的前提,就应承认数据处理者有使用、收益、处分的权益。数据知识产权登记后的主体变更,也是在进程确权路径下对新主体“数据资源持有权”的承认。 

现行知识产权登记部门一般不会对申请人是否适格申请专利或登记著作权进行核实,即使错将一项知识产权授予了恶意占有他人成果的“权利人”,法律上也赋予了司法机关纠错的机制。知识产权登记制度完全可以适用于数据知识产权“持有权”登记。此外,个别数据上的在先权利与数据知识产权作为加工处理后数据集合的整体权益是两种不同的权利,强调数据处理者对数据知识产权享有的权益不妨碍与单条数据上的人格权、著作权等的共存。 

数据“三权分置”应从淡化所有权的角度理解,而不是排除某些数据已被法律赋予所有权的存在。比如体现独创性的数据集合本身就可以被著作权保护,符合商业秘密保护要件的数据被商业秘密保护。这些可以被现有知识产权制度保护的数据已具备所有权属性,不能将其从数据资源持有权政策范围剔除。 

其次,数据知识产权登记和保护的根本目的在于便利数据流通使用,以知识产权制度的基本原理来驾驭数据知识产权登记后的“数据加工使用权”是相通的。一是,数据知识产权持有人可以行使或让渡加工使用权,使用数据知识产权得到持有人许可,许可费可以包括向持有人分配承载该数据知识产权的数据产品的收益;二是,得到持有人许可,在基础数据知识产权基础上行使数据加工使用权形成衍生数据知识产权;三是,形成的衍生数据知识产权虽是一项新的数据权益,但数据来源仍然是原来的基础数据知识产权,使用衍生数据知识产权要得到衍生数据知识产权持有人许可,是否需要得到基础数据知识产权持有人许可?一方面,数据知识产权采用非排他性或弱排他性保护原则,对于非独占性权利来说,很难确定衍生数据知识产权的源头是基于基础数据知识产权还是独立采集,这部分权益在许可给衍生数据知识产权形成时往往已经让渡;另一方面,从鼓励数据流通使用的角度,分阶段构建数据资源持有权实际确认了衍生数据知识产权持有人对衍生数据的权益控制,数据权益主体复杂多元且难以追溯、第三方是否尽到注意义务也往往无法从登记公开信息中完全了解;再一方面,知识产权已有制度中基本遵循“客体创新性程度较低的,享受的法律保护水平也相对较低”的原则,比如录音制作者使用他人已经合法录制为录音制品的音乐作品制作录音制品,同直接使用他人作品制作录音制品相比,除另有声明外,可以不经著作权人许可,因此除非基础数据知识产权持有人另有声明,使用衍生数据知识产权只要得到衍生数据知识产权持有人许可并向其支付许可费用即可,衍生数据知识产权持有人可以在协议基础上向基础数据知识产权持有人分配对应收益。四是,现有知识产权运用方式基本符合数据知识产权流通使用实际,持有人也可以通过融资增信、保险、证券化、作价入股、数据资产入表等途径,在不影响持有人对数据知识产权持有的情况下,促进数据价值变现、拓宽价值实现路径。 

再次,按照知识产权与产品分离原理,“数据产品经营权”表现为将数据知识产权固化在产品或服务载体上获得收益的权利,在权益主体自身实施数据知识产权或许可他人使用并形成数据产品时实现了数据产品经营权。权利用尽原则是知识产权制度的一个基本原则,承载数据知识产权的数据产品交易后,任何人可以使用、销售、许诺销售、进口该数据产品,这也符合鼓励数据自由流通的原则。《欧盟数据库指令》对数据库制作者的特殊权利也规定:权利人或经其许可将数据库的复制件首次在欧共体销售后,该复制件在欧共体内再次销售的支配权即被用尽。 

在各国因国家安全、公共利益、个人信息保护以及其他原因对数据跨境出台各种管制措施的背景下,数据知识产权的跨境流通完全可以在知识产权制度通行的地域性(国别性)原理下,由数据主管部门或行业主管部门对数据建立禁止、重要(限制)、自由的数据分类,申请人在对重要(限制)类数据知识产权办理对外转让或许可时,将出境安全评估认证作为证明材料。违反相关规定的,既追究法律法规规定的责任,也对其登记的数据知识产权以违反相关管理规定为由予以撤销或不予登记。

3.2 数据知识产权权益研究 

赋予数据权益更有利于形成稳定有序的数据市场秩序。传统的行为规制保护方式包括禁止他人不正当获取以及不正当披露和使用相应数据集合。《欧盟数据库指令》还规定“若屡次和系统地撷取或反复利用数据库内容的非实质部分,且带有违背正常利用数据库或不合理地损害制作者合法权益的行为”也是不允许的。《关于构建数据基础制度更好发挥数据要素作用的意见》提及的数据权益主要基于法律规定或合同约定的数据财产性权益,但就数据知识产权登记后持有者的正当权益而言,有必要结合数据特性研究其精神性和财产性权益,丰富其内涵。 

(1)精神性权益 

 署名权:数据知识产权的形成主要得益于数据处理者对处理方法的选择和应用场景的适配,在这个过程中起主要贡献的人员应当享有表明其身份的权利。 

 公开权:数据知识产权不是商业秘密,也不以公开换取保护,除了已被其他法律保护的内容,数据处理者享有决定是否公开、公开多大部分数据的权利,这也有利于数据在更大程度上被复用并主张其权属。公开并不意味着可以被自由使用,未经数据处理者本人同意而公开获得收益的,将构成不当竞争行为或违反其他法律规定。 

 有限的修改权:数据知识产权受制于数据来源和处理规则,为保证其真实性,允许对局部数据进行更正和勘误,以使数据集合具有切实的实用价值。数据集合的各个部分都有其潜在的应用场景,合法被许可人必然会按照新的应用场景来使用被许可的数据,截取一部分并不妨碍权益主体对其整体的实际控制。被许可人在原数据知识产权基础上衍生创造的新数据集合是一项新的数据权益,不属于修改。 

 有限的扩展权:数据知识产权不是固定不变的数据集合,在一定的更新频次下,随着时间的推移,数据集合的规模会得到扩展。不允许他人通过不正当手段获取权益主体的数据知识产权构思方案后,以数据内容与原登记时数据内容不同为由,变相窃取数据知识产权。 

 收回权:基于数据安全性和个人数据被遗忘权的考虑,当数据集合整体上涉及的数据不再适合提供,且这种改变不能通过局部数据修改进行完善,对数据整体价值也有较大影响时,持有人的全部或部分收回权就显得尤为必要。 

(2)财产性权益 

 有限的复制权:数据处理者以各种技术手段复制其数据集合是其所有财产性权益的基础。从禁止他人不正当行为角度来说,数据来源、处理规则、应用场景都是数据知识产权权益主体所构建或被授权使用的,依其产生的数据集合就是该权益主体的劳动成果。数据知识产权目前的定位是弱排他性,他人进行一定投入,合法地照这种构建方案获得的数据集合也是他人的成果;但登记时会考虑到这种投入更多是智力劳动以外的,本身不是数据知识产权保护所依赖的创新,会以重复登记为由不予登记;如果这种模仿产生了实质性替代后果,也可作为反不正当竞争法行为规制的一个考量要素。 

 发行权:主要表现为将被许可数据知识产权复制在有形载体上,提供给被许可人使用的权利。许可后,如无其他相关协议合理约定,按照知识产权的权利用尽原则,包含数据知识产权的数据产品一经交易后,数据知识产权权益主体无权干涉后续占有、使用、收益、处分该数据产品的行为。 

 密态利用权:数据知识产权的许可不一定是将数据复制在有形载体上,数据可以以“可用不可见”的密态方式加以传播或利用,密态利用权本身是数据使用许可或数据产品经营权的一种表现形式。在跨境数据流通中,密态利用权可以兼顾数据跨境管制和使用的需求。 

复制权、发行权和密态利用权是数据知识产权权益主体的核心财产权益,是数据产生价值的关键性权益,复制、发行与否取决于实际应用场景的需要和持有人的控制方式。 

有限的汇编权、改编权、翻译权延自著作权。数据知识产权权益主体有复制权,决定了其有禁止他人未经同意汇编的权利;改编不是修改(对局部数据进行更正和勘误)或产生衍生数据知识产权,是指将数据知识产权由一种载体按照某一种固定处理方式改变为另一种载体,如将图片转变为数字;将数据集合进行文字上的机械翻译则有利于促进数据在更大范围传播利用。 

承载数据知识产权的数据产品涉及更多的财产性权益。在知识产权制度框架下,数据本身的特性得以兼顾,登记后数据知识产权的权益主体权益可得到明确和保障。 

数据知识产权登记

以数据知识产权登记来肯定数据处理者在数据加工处理中的劳动,有助于将数据产权涉及的各数据主体之间错综复杂的权利关系简单化,更可以借助知识产权相对完备的制度和运行体系,借鉴各门类知识产权在基本制度框架内自我调节的灵活性,为数据权益的保护设置合理的空间。

4.1 数据知识产权登记的指导原则 

数据集合的数据结构和数据规模可以体现包括智力劳动在内的各种要素投入,以及对数据处理规则和应用场景构思的协同创新。在这里,有两个关键词:“创新”和“数据”。对数据知识产权的保护,实质是通过对数据集合的外部特征的登记,承认数据处理者在要素投入、协同创新上的付出。目前对数据知识产权的审查流程为:数据存证或公证→登记申请→初步审查及答复→公示异议→登记公告。审查方式定位为初步审查,包括形式审查和明显实质性缺陷审查。 

一是数据知识产权登记不以公开换保护。虽然在登记时申请人说明了数据来源、简要加工处理规则、数据结构和应用场景,但应从其是对数据集合的外部特征描述来理解。数据知识产权登记本身并不是以信息公开的充分性为保护条件的。登记人可以对数据本身采用商业秘密保护,通过数据知识产权登记仅公开必要的数据集合外部特征,以实现对数据权益的控制和信息交互。 

二是采用初步审查方式,包括核实申请材料是否齐全、格式是否正确、是否符合基本要求的形式审查,以及确认数据来源、处理方式、数据结构是否合规等的明显实质性缺陷审查。从数据变动角度看,申请登记时产生的数据仅为数据集合中的部分,并非全部;从数据知识产权登记时审查员能够接触的信息看,除了样例数据外无法接触到数据本身;从审查效率和承担的审查责任看,采取实质审查明显超越了必要性;从数据创新主体顾虑看,数据知识产权不以公开换保护,实质审查不利于制度的推广实施。 

三是数据知识产权登记的落脚点在保护数据上,不是保护处理规则、应用场景。数据知识产权通过处理规则勾勒数据集合的形态,给人还保护“处理规则”或“数据+规则”的错觉,但其本身不是对处理规则的保护。第一,无论是狭义上的“规则”,还是广义上的“规则”,都是使数据集合中的数据不同于数据来源中的数据的原因,产生的数据集合中的每一条数据都要符合这样的“规则”;“规则”并不是使数据集合中每一条“数据”组成“数据集合”的原因,数据知识产权的保护对象并不是由“规则”造成的。以“数据+规则”来形象化解释“数据知识产权”的初衷是突出“规则”是数据集合的外部特征,因为数据知识产权实际并不仅限于登记时产生的数据,还包括在一定规则下往后产生的数据,并由此形成的“数据集合”。第二,达不到现有知识产权门类的创新性要求高度的处理规则本身是常见的,或是与应用场景等相协调的小改进,通过数据集合的保护可以覆盖对这些小改进的肯定。第三,“数据+规则”看似扩大了对数据知识产权持有人的保护,实则相反。法院在裁判阶段不会对处理规则进行比对,在进行数据鉴定时也不可能通过处理规则去推导数据。第四,数据处理规则有很大部分是开源的算法规则,对“规则”的保护反而会引起研发人员对开源规则的权属忧虑,削弱研发人员选择数据知识产权保护方式的意愿。数据知识产权也不是对应用场景的保护,被许可方通过许可获得的数据集合一般会应用于有别于数据知识产权登记人登记时披露的数据集合应用场景以实现数据复用,但除非另有权利保护形式或协议约定,原数据知识产权登记人也可复现该新应用场景。 

四是数据知识产权在创新性高度上满足其作为整体“非公知性”即可,不因为个别条目数据的公开影响其“非公知性”,也因整体的非公开性而非新颖性,不涉及在先登记影响在后效力问题。 

五是对数据知识产权保护对象进行分析。在确权阶段,对数据来源、处理规则、数据结构、应用场景等的描述要主要从其是数据集合的特征角度来看待,并且关注其形成数据知识产权的逻辑,必要时还可对该数据集合包含的数据是否符合描述的“性状”进行类似“一致性、稳定性”的核查。在维权阶段,要考虑在数据知识产权边界框架下已经生成的数据(并非登记时已经生成的数据)。这类似于技术型专利在确权时对包含的功能性限定的技术特征,应当理解为覆盖了所有能实现所述功能的实施方式,而裁判时应当结合说明书和附图描述的该功能或者效果的具体实施方式及其等同的实施方式来确定该技术特征的内容。 

六是数据知识产权登记证书作为数据知识产权持有人持有相应数据的初步证明,在数据交易流通、收益分配、权属纠纷处理、激励创新中将起到积极作用。作为无形资产,在产权制度下赋予了数据集合“有形”权属证明,增强了数据主体维护自身权益的主动性,数据知识产权持有者可以独立提出侵权赔偿请求,而不论是否违反了合同义务承诺,并且提供了执行的灵活性,司法机关可以采取发出禁令、转移举证责任等方式来保护被侵犯的数据知识产权权益。同时数据知识产权登记借鉴知识产权保护模式,既平衡了数据需方准确高质量的数据需求和据供方保护需求,也促进了公众进行数据创新开发。 

七是正确看待未经登记数据知识产权。《反不正当竞争法》已对擅自获取和使用他人数据损害竞争秩序的行为予以规制,未登记的数据集合符合数据知识产权客体要求的,也享有相应权益保护,应坚持登记后类型化保护和未登记的权益保护相结合。《商标法》第59条和《专利法》第69条均对未经注册商标、未经申请专利的技术在原有范围内使用作出规定,数据知识产权因为非排他性或弱排他性,相比之下更不能把登记作为保护的前提。

4.2 登记审查思路 

在审查阶段,总的来说,“依法依规获取”侧重于对数据来源的要求,但在审查时仍要对形成的数据集合是否明显违反数据安全管理和知识产权管理规定进行审查。“经过一定规则处理”是其知识产权属性的体现,审查时要对处理规则如何架构在来源数据之上、能否形成数据结构作可行性分析。“一定规则”是指数据处理规则与要实现的场景相适应,不能因为处理规则过于简单而对其否定,同时要对处理规则的合法合规性作出判断,必要时提供相关证明。“具有实用价值”要对数据集合的数据结构与应用场景的适配性作出审查,结构规模与拟解决问题没有关联或无法实现的,不能登记。在现行定义下,数据处理不应理解为《数据安全法》对“处理”的广义定义,即“数据处理,包括数据的收集、存储、使用、加工、传输、提供、公开等”,而要看适应一定应用场景的处理规则的设计与数据集合的相关性、是否针对要解决的问题采用了合适的数据处理方式,“智力成果属性”体现于此。“数据集合”表明其价值实现依赖于一定的数据规模,而不是若干条数据,比如一张图片作为单条数据不是数据知识产权的保护对象,但经过一定处理的大规模图片集合可以作为登记客体,并关注集合内数据结构在同一“处理规则”下的一致性和稳定性。 

登记审查要从整体上把握客体是否符合定义要求,可以按照“处理规则-数据来源-应用场景-集合规模”的思路,从数据知识产权构建方案这个“前端”着眼,处理规则过于简单的考察其数据来源,来源过于便捷的进一步考察其应用是否已产生一定价值,尚未产生价值的对其数据规模有更高的要求。此外,要对数据知识产权存续期限是否超越数据来源授权使用协议约定时间,以及登记后是否会对数据流通、交易、使用、分配、治理及安全管理等造成严重阻碍或不利影响作出评判。 

真实性、一致性、实用性、集合性是数据知识产权应当具备的实质性要件,在登记审查、异议、撤销阶段都可作为不予登记的理由。真实性体现了民法诚实信用原则,数据的无形性特性、安全合规性要求,以及登记审查时实质不可能接触到实际数据的客观情况都决定了真实性的重要地位。实行初步审查的知识产权一般会对实物的提交作出要求,因此在数据知识产权登记前对经规则处理的数据集合进行存证或者公证的首要目的是保证数据知识产权真实性、证明数据知识产权登记申请人数据处理能力,其次才是提升数据的可追溯水平。一致性是确保数据知识产权稳定、准确地传递数据集合信息,保证需方准确获取信息和得以实施的要求,主要指数据结构的连贯性。实用性指数据知识产权具有现实或潜在的应用价值,能够实现数据流通和复用,最低标准是体现出数据知识产权的应用场景,仅满足单位内部管理用途的不视为满足实用性要求。集合性是区分数据集合和数据的关键,不仅要看数据量,更要关注其数据结构体现出来的数据项之间的协同效应,能否满足应用场景需要。

结束语

将归属不明或难以归属的物予以产权化的主要优点之一是可以降低信息成本,而交易流通的前提条件是至少以某种形式进行登记,对数据知识产权持有人、数据集合特征、合法合规来源信息、样例数据进行登记和公告,既起到公示监督作用,又起到传递必要信息目的,促进数据合法合规流通。数据知识产权以最小的改进成本提出了适合数字经济发展、适应数据流通、基本符合各方利益的制度设计方案。随着新技术的发展和分级分类保护的不断深化,智力劳动特征愈发明显的数据集合会在各个细分领域不断涌现,也会需要不同保护强度的制度设计。当下,应当先设计一套符合高附加值数据开发保护需求、具备可预展性的制度框架,聚焦数据流通红利,缩小各方共识差异,探索一条符合国际通行的知识产权话语体系的数据流通规则。未来,可以借鉴植物新品种的制度安排,在促进数字经济发展的制度里专章提出关于数据知识产权定义、登记程序、实质要求、权益内容、促进流通交易措施、数据安全、多部门共同参与登记分工、合理使用和强制许可例外等内容的总体方案。


作者:范理,男,浙江省知识产权研究与服务中心副研究员、副主任,主要研究方向为知识产权管理及专利分析、侵权判定、数据知识产权。


来源|大数据期刊

 专业赋能   知创杭州

识别二维码 关注我们

【声明】内容源于网络
0
0
杭州市知识产权交易服务中心
本中心由杭州市市场监督管理局(知识产权局)、拱墅区人民政府、浙大城市学院、浙江知识产权交易中心四方联合发起设立,运营主体是浙知交(杭州)知识产权运营有限公司,旨在集成专业机构资源、创新科技金融产品、推动知识产权交易转化、服务区域经济发展。
内容 1554
粉丝 0
杭州市知识产权交易服务中心 本中心由杭州市市场监督管理局(知识产权局)、拱墅区人民政府、浙大城市学院、浙江知识产权交易中心四方联合发起设立,运营主体是浙知交(杭州)知识产权运营有限公司,旨在集成专业机构资源、创新科技金融产品、推动知识产权交易转化、服务区域经济发展。
总阅读20
粉丝0
内容1.6k