
科情智库
屈亚杰1 ,黄国彬2
(1.北京舞蹈学院图书馆,北京 100081;2.北京师范大学政府管理学院,北京 100875)
数据密集型科学的发现,使得科学数据的价值逐步凸显,由于自下而上的数据管理需求和自上而下的共享政策的共同推动,使得越来越多的科学数据发布平台被建立起来。所谓科学数据发布平台,指的是依托网络数字化技术建立,采集、存储、管理与发布科学数据及其相关描述性文件的数据仓储。它是管理和共享科学数据的重要载体,为科学数据的生产者、管理者与利用者提供了一个协作的平台,可以使研究项目收集和产生的科学数据供其他研究者了解和共享,增强科学数据的价值。建设科学数据发布平台时需要考虑很多因素,比如选择何种系统软件进行构建、建设的资金从哪些渠道获取、科学数据的采集存储与组织如何开展、平台的检索和使用有哪些注意事项等等,本文将科学数据发布平台的组织管理作为研究重点,以英美国家建设较好的8个科学数据平台为调研样本,从依托软件、建设模式、资金来源和管理政策四个维度分析平台的组织管理机制。
科学数据发布平台的组织管理机制,指的是为保证平台的顺利建设所需要的前提条件,可细分为依托软件、建设模式、资金来源和管理政策,它是平台建设的基础保障。
1.1 依托软件
系统软件是平台建设的技术基础,当前可用于构建科学数据发布平台的软件类型主要有商业软件和开源软件。调研发现:开源软件因其便于开发、节省成本等优点而更受平台建设主体的青睐;但在具体建设时依托软件的选择受到多种因素的制约,包括建设主体的资金情况、平台所存储和管理数据的学科范围、平台拟实现的核心功能情况等,因此平台建设主体应综合考虑。
1.2 建设模式
建设模式,指的是建设者协调分配所需资源的具体方法和形式。从建设参与主体类型的角度,可将平台的建设模式分为自行建设与合作建设。调研发现:对于收录范围和服务对象不大的机构级存储库来说,选择自行建设方式能够提高建设效率;对于联盟性质的数据存储库或大型数据中心而言,合作建设的方式有助于获取多个主体在资金、技术及管理方面的支持。
1.3 资金来源
稳定、充足、集中的经费支持是保障科学数据发布平台顺利建设的重要条件之一,那么,能够从哪些途径获取平台建设的所需资金是建设主体必须思考的问题。而所谓资金来源,指的是科学数据发布平台建设所需资金的获取渠道。调研发现:平台获取建设资金的渠道较为多样化,包含科研资助机构资助、政府机构拨款、高校科研基金、其他渠道(比如基金会、会员费用)等。
1.4 管理政策
管理政策,指的是为促进平台顺利建设及持续发展而制定的关于平台数据资源与用户管理的各项制度与规则。调研发现,样本平台的数据管理政策主要包括数据采集、数据存储、数据访问、用户使用条款及隐私等方面的内容。这些管理政策一方面有助于平台建设者有序开展科学数据管理工作,另一方面也使用户明晰科学数据的管理流程,提升其对平台的信任度,从而愿意将研究中产出的科学数据存储到相应的平台进行管理。
2.1 理性选择依托软件
国内科学数据发布平台的建设者在选择开源软件时,需要结合实际情况,对开源软件在学科范围、核心功能、服务模式等方面进行比较评估,必要时对这些软件进行实地部署测试,以选择适合的开源软件。另外,在二次开发时可适当增加一些本地化功能,如平台与单位统一认证系统的对接、数据申请与审核功能的优化、权限管理更加灵活等。
2.2 密切机构合作交流
我国科学数据发布平台在开展建设时,无论是采用何种建设模式,都要积极加强机构或部门间的合作交流,可积极寻求如国家自然科学基金委员会或国家哲学社会科学规划办公室的经费支持,或者与单位内的技术部门进行合作,以推动平台的顺利建设。
2.3 拓宽资金来源渠道
国内科学数据发布平台的建设者借鉴国外平台的相关经验,积极拓宽资金来源渠道,丰富经费获取方式。例如,除了以申请项目的方式从科研资助机构(国家自然科学基金委员会、国家哲学社会科学办公室等)和政府部门获得经费支持外,还可以通过行业内专业学会、公益基金会寻求建设资金,部分联盟性质的平台建设者可以采用收取少量会员费用的方式。
2.4 完善平台管理政策
国内科学数据发布平台建设者应重视平台管理政策的制定工作,以发挥其对平台建设的指导与约束作用。具体而言,完善的平台管理政策应包括数据管理政策和用户管理政策。其中,数据管理政策应对数据全生命周期的各个阶段予以规范,包括数据采集指南、数据分类依据、数据描述标准、数据质量控制流程、数据存储要求、数据访问权限等;用户管理政策主要是关于用户获取使用数据与用户个人信息保护的相关规定,如用户使用条款、用户隐私政策等。
来源:此文为缩减版,全文请见《中国科技资源导刊》2021,(6):66~73
推荐阅读 >

