大数跨境
0
0

我国科学数据组织与管理研究探析

我国科学数据组织与管理研究探析 科情智库
2021-04-28
0
导读:本文从科学数据管理的内涵与特征入手,阐述了我国科学数据管理在政策体系建设和科学数据管理平台建设两个方面取得的主要成效,初步分析了科学数据的存储及平台建设、技术支持及检索服务等方面的动态。



   科情智库   



赵捧未1,2,丁献峰1,3,闫淼1,段娜1,王艺帆1

(1.西安电子科技大学经济与管理学院,陕西西安  710126;2.陕西信息资源研究中心,陕西西安  710126;3.陕西师范大学图书馆,陕西西安  710119)


随着科学数据管理实践的开展,以及不同类型数据的快速增长,科学数据的组织管理、检索服务面临着极大的挑战,特别是在科学数据语义化组织管理与科学数据检索的研究与应用领域明显不足。为此,在科学数据管理研究及平台建设基础上,探索研究科学数据语义化组织、检索及应用服务,对于充分挖掘科学数据在科学研究、发展趋势分析与预测等方面的潜在价值,更好地发挥大数据时代科学数据作为生产要素在支撑科技创新、决策支持与经济发展中的作用,具有重要的理论和实践意义。


本文从科学数据管理的内涵与特征入手,阐述了我国科学数据管理在政策体系建设和科学数据管理平台建设两个方面取得的主要成效,初步分析了科学数据的存储及平台建设、技术支持及检索服务等方面的动态。分析表明,目前科学数据管理研究与平台开发在我国已经有序展开,而对科学数据管理环境下的检索研究与应用的进展缓慢,存在着明显的不同步现象。基于此,为了充分发挥科学数据在科学研究、发展趋势分析与预测等方面的潜在价值,从科学数据语义化组织管理、科学数据跨平台检索技术、科学数据检索优化算法、科学数据一站式检索服务和可视化检索服务五个方面对我国科学数据组织管理与检索研究提出了建议。




一、科学数据语义化组织与管理研究


目前,科学数据仍然采用传统的文献资源描述方式对数据进行加工、组织与管理,缺少对数据内容的深度揭示与语义关联,造成不同领域、不同机构间的数据相互孤立。随着语义网技术、关联数据技术及领域本体技术的成熟与发展,研究科学数据的语义化组织与管理工作,必将为进一步打破不同机构、不同领域数据之间的壁垒,实现数据与数据之间的深层次关联与融合,推进以数据为支撑的科技创新提供数据保障。



二、基于数据集成的跨平台检索技术研究


随着我国科学数据管理研究与实践的快速开展,越来越多的科研机构和专业的数据中心建立了科学数据管理平台,导致不同类型、不同领域的数据库越来越多,数据体量逐步增大,数据结构也更加复杂,加之不同数据之间的相互关联关系,导致跨平台检索的需求正在扩大。因此,加大开展基于数据集成的跨平台检索技术研究,突破不同的科学数据管理平台、不同类型数据间的障碍,为跨学科或交叉研究提供方便快捷的检索服务,将是该领域重点关注的问题之一。



三、基于大数据环境的检索优化算法研究


面对多领域、海量的科学数据,缩短检索时间、提高检索效率是大数据时代面临的一大挑战。传统信息检索仅提供关键词匹配的记录,缺少结果排序算法,导致检索用户难以在第一时间获得自己所需要的信息,需要探索大数据管理平台或环境下的检索算法优化。而这就需要深入研究大数据环境下的索引技术、分布式或并行检索技术、检索结果优化技术,以及元数据技术,以提高科学数据的检全率、检准率和检索效率。



四、基于语义的一站式数据检索服务研究


基于语义搜索技术的实现与应用一直是计算机领域和图书情报领域学者们研究的目标,基于互联网的语义搜索也取得了不少成果。然而,在语义搜索与科学数据管理服务结合的研究相对不足,面对当前海量、多源、异构的科学数据,构建基于语义的一站式数据搜索服务可以挖掘和发现隐藏于数据网络中未知的规则和规律,通过一站式服务为用户提供真正需要的有价值的数据,促进数据的二次利用与创新。因此,探索研究基于智能、语义搜索技术的优化与创新,实现基于语义的一站式数据检索服务,为用户提供快速、精准、全面的检索服务,是后科学数据管理时代关注的重点内容之一。



五、面向数据管理人员的可视化检索服务研究


随着科学数据服务能力的提升,在搜索引擎中融入自然语言处理、机器学习等计算机技术,综合利用可视化技术,将结果以图的形式展示给用户并揭示出检索结果之间的内部关系,提高检全率和检准率,易于用户理解,提升用户搜索体验和效率。另一方面,科技管理人员需要通过检索可视化服务实现对科学数据管理平台中海量的科学数据进行实时分析,通过数据分析对前沿研究热点进行预测,为科技管理部门提供决策支持。通过动态监测科学数据管理平台资源利用情况为用户提供精准的数据服务,提升服务质量。因此,研究面向数据管理人员的可视化检索服务,有利于提升科学数据管理者的管理水平,提升大数据时代科学数据的利用效率。



六、结语


随着我国各领域的科学数据管理研究与平台开发的全面展开,科学数据的语义组织、检索研究及应用服务面临着极大的挑战,科学数据环境下面向用户及管理人员的智能语义检索、多媒体检索、分布式并行检索、可视化检索,以及跨平台/领域检索、实时数据分析与挖掘、领域前沿热点预测等方面,均有待于系统研究和开发。


来源:此文为缩减版,全文请见《中国科技资源导刊》2021,(2):44~49,58


  推荐阅读 > 

我国科学数据标准体系研究

基于实践的科技计划项目科学数据汇交共性机制研究

OECD发布《为数据密集型科学培养劳动力和技能》报告

【声明】内容源于网络
0
0
科情智库
宣传科技信息资源及科技情报研究成果,关注产业最新动态、发展热点和重大变革,为科技创新提供新媒体渠道。
内容 1586
粉丝 0
科情智库 宣传科技信息资源及科技情报研究成果,关注产业最新动态、发展热点和重大变革,为科技创新提供新媒体渠道。
总阅读6
粉丝0
内容1.6k