大数跨境
0
0

融合数据出版的科学数据汇交新模式探索

融合数据出版的科学数据汇交新模式探索 科情智库
2025-02-21
0

科情智库


/

/

背景介绍

2018年,我国颁布的《科学数据管理办法》中提出政府预算资金资助的各级科技计划项目产生的科学数据必须汇交。2019年,我国建设形成20个国家科学数据中心,开展国家重点研发计划项目科学数据汇交工作。随后,在2021年发布的国家标准《科技计划形成的科学数据汇交技术与管理规范》(GB/T 39912—2021)中规定了科学数据汇交的原则、主要内容与操作流程,该标准指出,数据汇交流程的最后两个阶段为科学数据发布与共享、使用与维护更新,即数据汇交的最终目的为科学数据的共享和利用。然而,数据汇交在实践过程中存在一些问题,如科研工作者积极性不高、汇交数据质量难以保证等。同样以科学数据开放共享为目的的数据出版,在长期的实践过程中,形成了较为成熟的出版模式,因其能够有效保障数据质量、提高数据发表者或发表机构在科研领域的知名度和影响力等优势被科研工作者广泛接受,这些正是数据汇交的不足之处。基于此,本文融合数据出版的工作模式探索数据汇交新模式以期改善数据汇交实践中存在的问题。


/

/

科学数据汇交与科学数据出版内容及对比分析

《科技计划形成的科学数据汇交技术与管理规范》(GB/T 39912—2021)规定,科学数据汇交的内容包括科学数据实体、科学数据描述信息、科学数据辅助工具软件。科学数据实体是指在科技计划项目中形成的原始数据以及由原始数据或研究分析数据形成的数据库或数据文件。科学数据描述信息可以分为三类:第一类是为帮助用户能够在互联网上发现数据的元数据;第二类是比摘要更为丰富的描述信息,这类信息多来自于汇交计划的介绍、数据质量报告的相关内容;第三类为用户使用数据的说明性文档。第二类和第三类即为科学数据详细描述信息。项目中使用到专有科学数据辅助工具软件时则需汇交。由此可见,科学数据汇交的主要内容为科学数据实体与科学数据描述信息,其中科学数据描述信息包括元数据描述信息和内容详细描述信息。

目前数据出版可以概括为三种模式。模式一“作为论文辅助资料的数据发布”出版内容为科学数据实体,模式二“数据仓储库”出版内容为科学数据实体及其元数据描述信息,模式三“数据论文”出版内容为科学数据实体和数据论文。科学数据汇交的元数据描述信息包括数据集基本信息、数据集发布信息、数据集服务信息,而数据仓储库的科学数据元数据信息包括数据集基本信息、数据集出版信息和数据集服务信息。根据内容判断,数据集发布信息即为数据集出版信息。由此可知,数据汇交与数据仓储库发布的科学数据元数据描述信息基本一致。

数据论文一般包含2个具体信息对象—数据集和数据论文本身,数据集一般发布在数据仓储库中。数据论文包括内容信息、出版信息和服务信息。数据论文的内容信息包括科学数据的描述、数据的采集和处理过程、数据质量控制和评估、数据的使用说明等,基本涵盖了数据汇交科学数据详细描述信息的内容。

数据汇交和数据出版都涉及科学数据实体及其描述信息。数据论文的内容信息不仅包含了科学数据实体及相应的元数据描述,还涵盖了科学数据的详细描述信息。这表明,数据论文实质上是数据出版的一种高级形态,几乎包含了数据汇交的所有要素。


/

/

融合数据出版的科学数据汇交新模式探索及实践

数据论文与数据仓储库的关联出版模式使得科学数据及其描述信息的发布、访问和共享变得更加便捷。借鉴这一模式,本文提出了数据汇交新模式,以进一步优化科学数据的管理与利用。

3.1 数据汇交新模式探索

在数据汇交过程中,数据提交方仅需提交数据论文和数据集,其中数据论文提交至数据论文平台,数据集提交至数据仓储库。随后,数据管理方将分别对数据论文和数据集进行审核。审核完成后,数据论文和数据集将分别在数据论文平台和数据仓储库中发布。此外,数据论文平台与数据仓储库之间建立了关联,实现两者之间的互相访问。

图1 科学数据汇交新模式


3.2 数据汇交新模式的优势与不足

优势:(1)优化数据汇交的流程,缩短数据发布的周期,采用数据论文的形式代替传统的数据说明材料提交,可以减轻科研人员的数据汇交工作负担。(2)数据论文能够将汇交的科学数据及其描述成果化,有助于保护数据拥有者的权益,激发研究人员共享数据的积极性。(3)数据论文丰富了原有汇交模式中科学数据的描述信息,更加有利于科学数据的利用和理解。(4)通过署名机制,数据论文使科研人员成为科学数据的第一责任人,在提交数据论文时,作者需首先对数据质量进行严格把关,从而保障数据的质量水平。

不足:(1)尽管已在国家基础数据中心进行了实践,但实践的规模相对有限,尚需扩大应用范围及验证其广泛适用性;(2)以数据论文形式提交和发布汇交数据的社会认可度目前还不够高,需要进一步宣传和推广。


作者:胡良霖1,2,马晓萌1,2,高瑜蔚1,2,朱艳华1,2,赵欢1,2,李坤1,2

1.中国科学院计算机网络信息中心 北京 100083;

2.国家基础学科公共科学数据中心 北京 100083


来源:此文为缩减版,《中国科技资源导刊》2024 Vol.(6)


文章观点不代表主办机构立场。


推荐阅读 >

北京大学等研发实现零下60度充放电循环的全固态电池

美韩提出新型硫化物固态电解质加工方法

【科技参考】欧盟研发框架计划改革方向

【声明】内容源于网络
0
0
科情智库
宣传科技信息资源及科技情报研究成果,关注产业最新动态、发展热点和重大变革,为科技创新提供新媒体渠道。
内容 2085
粉丝 0
科情智库 宣传科技信息资源及科技情报研究成果,关注产业最新动态、发展热点和重大变革,为科技创新提供新媒体渠道。
总阅读1.4k
粉丝0
内容2.1k