
基于CiteSpace的地质大数据与人工智能研究热点及前沿分析
朱彪彪1,2,3,曹伟1,2,3,虞鹏鹏1,2,3,,张前龙1,2,3,郭兰萱4,原桂强4,韩枫1,2,3,王汉雨1,2,3,周永章1,2,3
2 中山大学地球科学与工程学院
3 广东省地质过程与矿产资源探查重点实验室
4 深圳市中金岭南有色金属股份有限公司
第一作者:朱彪彪,硕士研究生,研究方向:地质大数据挖掘与智能找矿。
通信作者:虞鹏鹏,博士,副教授,主要从事造山带演化与成岩成矿作用研究工作。
为研究地质学领域的大数据和人工智能研究现状、热点和前沿,本文收集了中国知网(CNKI)核心期刊和Web of Science(WoS)核心数据库2000—2022年相关中文文献3600篇、英文文献1803篇,利用社区结构分析软件CiteSpace,从发文作者、研究国家、研究机构、关键词聚类、关键词时空分布图谱等进行可视化分析,并统计了2021—2022年间,地质学领域国际顶级期刊的文献进行前沿分析,还统计分析了一批著名学者和研究核心团队的影响力。
(1)地质大数据和人工智能研究机构,主要为国内外著名高校和研究所,国内以中国地质大学为代表的研究机构与国内研究机构之间的交流合作居多,与国外的研究机构交流合作较少;国外以法国国家科学研究中心为代表的研究机构则与之相反。
(2)地质大数据与人工智能研究热点,有人工神经网络、遗传算法、深度学习等常见机器学习算法,研究方向聚焦在地质灾害防治、地震解释、石油与天然气勘探和固体矿产资源预测等方面。
(3)地质大数据与人工智能研究前沿,以深度学习、迁移学习、卷积神经网络、集成学习和智能平台搭建等为手段,涉及重大地质事件分析、全球气候变化、数字地质建模及定量分析、地震预报和地灾易发性精准评估等。
基金项目:国家重点研发计划项目(2022YFF0801201);广东省重点领域研发计划项目(2020B1111370001);国家自然科学基金联合基金项目(U1911202);广东省引进人才创新创业团队项目(2021ZT09H399);广东省自然科学基金青年提升项目(2024A1515030216)。
0 引言
1 数据处理
1.1 数据来源
1.2数据处理
2 结果分析
2.1 发文量统计分析及时间特征
2.2 发文期刊分析
2.3 国际、国内研究分析
2.3.1 国际研究分析
2.3.2 发文机构分析
2.4 合作作者关系网络分析
2.4.1 从作者发文维度分析
2.4.2 从作者被引维度分析
2.5 研究热点及研究前沿分析
2.5.1 关键词分析
2.5.2 顶刊文献分析
3 结论
传统的地质学研究主要以问题驱动为导向开展相关的野外地质调查、地质年代学、地球化学和地球物理等研究。然而,尽管经历了上百年的发展,地质学中还有许多人类未知的问题等待探索,这是传统地质学研究范式难以完成的。近年来,大数据与机器学习的崛起使地质学研究的范式产生转变,它不再以因果关系为必然前提,大数据与数学地球科学的跨越式发展,为解决地球科学问题提供了新思路。
大数据社区发现和知识图谱,属于大数据挖掘和人工智能的科学范畴。作为大数据网络社区和社区结构发现的工具,CiteSpace软件广泛应用于特定领域文献计量分析和可视化呈现,在地质学领域该方法亦获得了应用。但针对蓬勃发展的地质大数据与人工智能学科领域,基于Cite Space的社区分析尚未开展。
为此,本文基于CNKI核心期刊和WoS核心数据库的学术论文文献,应用CiteSpace对地质大数据领域文献进行社区分析,给予可视化呈现,旨在通过对地质大数据与人工智能方向的研究现状、热点和前沿进行分析,为地质科技工作者提供参考。
本文所用数据来自CNKI核心期刊和WoS核心数据库,统计年份为2000—2022年,选择领域为地质学、地球化学、地球物理学、地质灾害与防治等地学相关领域,搜索与大数据和人工智能领域相关的学术期刊文献,并对检索到的文章进行人工筛选确保其相关性。累计获得CNKI中的SCI、EI、中文核心期刊、CSSCI、CSCD和AMI六大核心期刊文献共3600篇,WoS核心数据库文献1803篇,具体见表1。
表1 CNKI和Web of Science文献检索细化表
将检索到的CNKI和WoS文献分别以Refworks和纯文本文件导出,命名为download_+序号。在对合作作者社区分析时,分别从作者的发文数量和作者被引两个维度进行了相关统计分析。在进行前沿分析时,考虑到国际顶级期刊的影响力、代表性和时效性,统计了这些期刊的近两年文献,以起到对科学前沿有更好的把控作用。
将在CNKI和WoS检索到的文献导入Cite Space6.2.R2,Time Slicing选择2000—2022,Year Per Slice选择1,Pruning选择Pathfinder、Pruningslicednetworks。其余选项及参数都为默认认值。WoS文献在NodeTypes分别选择Author、Institution、Country、Keywords和Reference进行可视化,得到各类知识图谱;CNKI文献分析则选择Author、Institution、Country和Keywords进行可视化,得到各类知识图谱,并对相关重要的节点进行细化分析,以了解更为深层的信息。
一个领域的科研发展,能在学术论文数量的时间分布上体现出来。图1展示了CNKI和WoS发文量随时间变化的关系。从图中可以看出,我国对于地质大数据与人工智能的研究基本与世界同步,发展历程相似,2006年和2016年是两个明显的拐点。据此,地质大数据与人工智能的研究可以大致划分为3个时期。第一个时期为2000—2005年,这个阶段地质学领域对于大数据理论及方法的使用处于起步阶段,发文量普遍不高且趋势平缓。第二个时期为2006—2015年,这一阶段的发展总体处于较为波动状态,发文总量缓慢上升。2016年以来的第三个时期为蓬勃发展时期,发文量持续增高,并且一直到现在没有下降趋势,仅2022年一年CNKI数据库的累计发文量超过500篇。
图1 WoS和CNKI发文量随时间变化图
可见,地质大数据与人工智能的研究在未来地质学研究中的分量将越来越重,有越来越多科研人员从事该领域的研究。
学术期刊一定程度上是文献质量的体现,也是对本文分析数据可靠性的反映。表2统计了WoS中收录量前10的期刊信息。数据显示,这些期刊上的文献数量占WoS总文献数的36%,发表在中国科学院分区地球科学2区以上的期刊占收录量前十位期刊的50%,文献数量占比20%,其中有44篇文献发表于地球科学1区Top期刊Economic Geology上。发表在OREGEOLOGYREVIEWS上的文献最多,共计138篇,该期刊2022年影响因子3.71,在中科大分区中属于地球科学2区,其他期刊详细信息如表2所示。可见本次数据中的文章整体质量较高,分析结果具有一定的参考价值。
图2展示了国家及地区的合作网络关系。从图2可以看出,该领域的研究可大致分为亚洲和欧美两大阵营。亚洲以中国、日本、伊朗、印度和澳大利亚(本为大洋洲,但离亚洲较近,算入亚洲)为代表,其中中国的发文量最多,达483篇,约占发文总量的27%。欧美以美国、法国、德国、西班牙、英国和加拿大为主要代表,其中美国发文量为424篇,约占发文总量的24%,仅次于中国。
图2 国家及地区发文量及合作网络图谱
数据显示,欧美国家的中介中心性较高,而亚洲国家则较低(图3节点外围的紫色圈层越宽,中介中心性越高)。中介中心为一个节点在网络中处于中枢位置,连接几个其他节点,起着枢纽的作用。中介中心性的数值越大,其在网络中的位置越重要,究其可能原因有两点:一是亚洲国家之间的学术交流没欧美国家之间紧密,可能是大多数留学生多往欧美留学,而在亚洲留学的较少;二是欧美国家在该领域的学术研究整体略早于亚洲国家,这导致一些理论、方法的借鉴或发展是以欧美国家的学术研究为参考的。
(1)国际发文机构分析。对科研机构进行分析,有助于了解该研究领域的重点科研机构,可为学者选择合作交流机构提供指导。通过对两数据库中统计到的发文机构进行可视化分析,从图3可以看出,国际上以中国地质大学、中国科学院、“UDICE-French Research Universities”(法国研究型大学)、“Centre Nationaldela Recherche Scientifique(CNRS)”(法国国家科学研究中心)、“Helmholtz Association”(亥姆霍兹联合会)和“University of California System”(加州大学系统)等为主。其中,中国地质大学发文132篇,排名第一,其次是中国科学院,发文88篇,排名第二,其他研究高校的数据如表3所示。将图谱节点按照以中国地质大学的节点和“Centre Nationaldela Recherche Scientifique(CNRS)”(法国国家科学研究中心)的节点聚类,左边为国内研究机构合作网络,右边为国际研究机构合作网络,中间为与国内和国外均有交流的网络团体(图3),由其结果可以看出,中国地质大学的合作机构大部分都是国内其他高校、研究所,而法国国家科学研究中心的合作机构大部分为其他国家的高校或研究院,这就导致其在国际上中心性较强,而中国地质大学和中国科学院在国内中心性强,这也启示国内的相关研究机构,要积极与国外的高校、研究院合作,以在国际上取得更为重要的学术地位。
(2)国内发文机构分析。图4展示的是国内研究机构合作关系网络,共有节点465个,关系线609条,节点颜色选择彩虹色(颜色越暖时间越新,下同)。从中可知,国内研究机构之间交流合作相对密切,以吉林大学地球探测科学与技术学院、中国地质调查局发展研究中心等为代表的这类研究机构节点颜色跨度大,可见其研究起步较早,而中山大学地球环境与地球资源研究中心等机构的研究与地质大数据蓬勃发展期基本同步,北京大学地球与空间科学学院、成都理工大学地球物理学院等是近几年在该领域研究较多的机构。
了解一个研究领域的核心作者,有利于掌握该领域的研究热点和研究前沿。学术论文是体现学者学术水平的一个重要指标,表4展示了CNKI数据库作者发文数量。国内作者在该领域的研究中,发文10篇以上的共计20人,这里统计前15位,发文数量最多达25篇。从图5(节点和线条颜色随着时间由冷色变为暖色)可见,在国内该领域的研究以周永章、张旗团队和殷坤龙、黄发明团队为核心;WoS数据的作者合作网络如图6所示,以左仁广团队和Johnson与Paul团队等为核心,其中左仁广发文数量最多,达42篇。从文章发文数量上看,我国学者在该领域具有一定的优势,但从作者的合作关系网线数量及分布来看,国内(图7)除了目前较为核心的团队以外,其他作者分布较为散乱,没形成小型的合作团体。而国际(图8)上,除了核心团队,已有小型网络关系出现,这启示近年来国内该领域的学者要及时在同行之间交流合作,形成新生的科研力量。
图8 CNKI关键词共现图谱
了解一个研究领域的核心作者,除发表学术论文数量外,作者被引频次同样是一个重要参数。图7(节点和线条颜色随着时间由冷色变为暖色)展示了作者被引维度下WoS的作者互引关系网络,从图中可以看出,我国研究学者以左仁广等为中心形成了良好的被引关系网络。为进一步挖掘作者的核心程度,除了对CNKI和WoS上的论文被引次数进行了统计,还以文献共被引次数/发文量计算其被引率,结果分别如表4、5所示。表中可见,CNKI数据中殷坤龙文章累计被引量最多,为622次,以周永章文章被引率最高,达32.2;WoS数据中,文章共被引次数100次以上共5人,其中左仁广文章累计被引最高,达209次,文章被引率最高的是成秋明,被引率为24.8。
关键词是对文献研究内容的高度概括,在一定程度上可以代表一篇文献的主要研究内容。网络节点的中心性是反映节点核心程度的重要指标之一,用CiteSpace对CNKI和WoS的数据进行关键词可视化分析,CNKI的关键词节点共458个,线条1882条,WoS关键词节点共473个,网络线共2439条,Node类型选择“Treeringhistory”,颜色选择彩虹色(节点和线条颜色随着时间由冷色变为暖色)。从图8、9可见,地质大数据与人工智能方向的研究内容可分为3个阶段:第一个阶段是研究人工神经网络、遗传算法等,主要应用于地质灾害中的滑坡和泥石流监测、油气领域的储层预测、测井曲线识别和储层物性划分、地震研究方向的地震属性、地震相等研究,相对而言,此阶段的方法偏于传统,参与的数据量较小;第二个阶段是以研究机器学习、随机森林和支持向量机为重点,主要用于岩石力学、岩性识别、图像和其他分类任务等方向;第三个阶段是以深度学习、迁移学习、集成学习和语义分割为主,主要用于地质图像处理、矿物识别、智能识别和地灾易发性评估等。结合图10,可以看到各个关键词出现演进的历程,关键词有大数据、神经网络、滑坡、深度学习、测井解释、预测和地震预测等7个聚类,可以发现神经网络的搭建从始至终一直都是研究重点,这表明算法和各类神经网络在地质大数据发展过程中不断地更新,而机器学习、深度学习、大数据挖掘和随机森林等是目前乃至未来的一些热点研究方法,地质灾害、岩性识别、岩石力学、地震预测、测井解释和知识图谱等为热点研究方向。
图9 WoS关键词共现图谱
图10 CNKI关键词演进图谱
图11和图12是CNKI和WoS的关键词突现图谱,结合图10节点颜色变更情况,能更好地看出一个领域的研究前沿。研究前沿不同于研究热点,它是一组凸显的动态概念和潜在的研究问题,研究前沿术语出现频次快速增加的专业术语。由此可以发现,以机器学习、深度学习、迁移学习、集成学习、语义分割、图像分割、数据库、智能平台搭建、“earthquakeprediction”、“geochemicaldata”和“diagrams”为核心的科学问题成为地质大数据与人工智能方向的部分研究前沿。
研究一个领域的科学前沿,除了关键词演进和突变分析,领域内国际顶级期刊上的文章研究内容同样至关重要。本文在前述分析的基础上,统计了近两年发表在综合影响因子10以上的期刊上的文献(具体数目见表6),其中Chen等利用机器学习重建了全球氧合历史,Ghorbanzadeh等利用U-net和ResU-Net研究高精度滑坡检测,Rouet-Leduc等应用深度学习对InSAR时间序列毫米尺度形变实现自动提取,Li等用有监督的机器学习方法对南极沉积盆地进行了分类。再对这些文献的关键词进行分析,如图13所示,图片中的节点时间演化由早到晚表示为颜色从紫色到红色。结果发现:采用机器学习类方法,在这些顶级期刊文献中,地质学数据集处理、全球性地质大事件分析、全球气候变化、地质建模、断层变形识别、地震预报和滑坡精准预测等涉及较多。
图13 近两年地学类国际顶级期刊文献关键词网络图谱
本文收集了2000—2022年间CNKI和WoS两大数据库中与地质大数据与人工智能相关的文献,从CiteSpace社区发现的角度,进行相关分析,获得了有意义的结果。
(1)地质大数据与人工智能方向的研究目前主要以中国为代表的亚洲国家和以美国为代表的欧美国家为主,双方累计发文量相差不大,文章中介中心性欧美国家普遍较高。
(2)研究机构主要为国内外著名高校和研究所,国内以中国地质大学为代表的研究机构与国内研究机构之间的交流合作居多,与国外的研究机构交流合作较少;国外以法国国家科学研究中心为代表的研究机构则与之相反。
(3)地质大数据领域与人工智能领域的研究热点有人工神经网络、遗传算法、深度学习等常见机器学习算法,研究方向聚焦在地质灾害防治、地震解释、石油与天然气勘探和固体矿产资源预测等方面。
(4)研究前沿以深度学习、迁移学习、卷积神经网络、集成学习和智能平台搭建等为手段,涉及重大地质事件分析、全球气候变化、数字地质建模及定量分析、地震预报和地灾易发性精准评估等。
从本研究来看,大数据与人工智能和地质学的交叉还处于发展阶段,在地学领域拟解决的问题越发广泛,但是总体上还处于用不同的大数据与人工智能领域的方法来解决同一问题、类似问题、旧问题的研究阶段,比如在智能识别任务上,很多研究致力于搭建出对于该任务更为准确的网络,而不是更普适、多应用场景的网络,因此当应用场景更换以后,网络结构可能存在不能直接使用的现象。数字地质学应是一门有独立的方法论、独立的行业标准来推动解决新问题,发现传统地质发现不了的新规律的学科,而不只是用计算机领域的方法来处理数据、得出结论的工具,这也是我们国内的数字地质专家和学者把国内研究带到世界前列的努力方向。
热文推荐:
●矿业投资33条铁律,您同意几条?!
●史上最牛地矿院校!8年培养出22位地矿院士!
●地球最大采矿项目有进展了!只剩中国点头了
●影响你我10大矿业政策出炉,您觉得哪条最大?
●非洲最大的五大铜矿山,中国霸占前两席!
●《中国矿业报》专访阳光创译吕国博士
●阳光创译 | 矿业翻译服务
●专业矿业能源翻译服务,帮您开启全球合作之门
相关业务需求即可致电下方相关责任人
| 吕国博士 |
董事长 |
1127203572@qq.com |
| 电话:13401184506 |
微信:suntrans-mining |
| 孙玉梅 |
总经理 |
853495100@qq.com |
| 电话:010-82865216 |
微信:853495100 |
| Gary |
矿业外语猎头 |
582934973@qq.com |
| 电话:13311203631 |
微信:suntrans222 |
| 刘乾勇 |
英语翻译 |
1935014417@qq.com |
| 电话:13693672413 |
微信:13693672413 |
| 刘鑫 |
论文翻译 |
1749173384@qq.com |
| 电话:13683660873 |
微信:lvy_09260312 |
| 苗菁 |
地矿报告翻译 |
2534271235@qq.com |
| 电话:13683661813 |
微信:zyy-suntrans |
| Jerry |
口译 |
2268356581@qq.com |
| 电话:13681439112 |
微信:miningtranslation |
| 范瑞瑞 |
媒体合作 |
1985130191@qq.com |
| 电话:17310253590 |
微信:suntrans2014 |
| Tom |
全职招聘 |
347562171@qq.com |
| 电话:13661190472 |
微信:13661190472 |
| 赵宏 |
矿业咨询部主任 |
1583289628@qq.com |
| 电话:13683660397 |
微信:suntrans_1543 |
| Mary |
矿业咨询部副主任 |
3073107861@qq.com |
| 电话:15210897852 |
微信:suntrans-1938 |
| Mary |
矿产贸易总监 |
1529169438@qq.com |
| 电话:17310657953 |
微信:ha15313128283 |
| Bruce |
海外市场总监 |
3602237436@qq.com |
| 电话:15701297623 |
微信:suntrans_6787
|
阳光创译的核心定位已经由最初的“阳光创译=矿业翻译”——中国地质矿业翻译领军品牌逐渐延伸扩展成“阳光创译=中国国际矿业服务大平台”,涵盖矿业翻译、矿业会展、矿业咨询、矿业猎头、“一带一路”矿业商会、矿业媒体等国际矿业服务板块。
文章版权声明:本文来源 :朱彪彪,曹伟,虞鹏鹏,张前龙,郭兰萱,原桂强,韩枫,王汉雨,周永章.基于CiteSpace的地质大数据与人工智能研究热点及前沿分析[J].地学前缘,2024,31(4):73-86. 《覆盖区找矿》,版权归原作者所有,本文不代表阳光创译立场,并对文中观点保持中立,仅供各位阅读者交流参考之目的。本号所转载内容没有任何商业宣传目的,仅供交流,如有侵权,请联系主编删除(主编微信:suntrans2008),另外图片版权归原作者所有,如有侵权请联系我们,我们将会立刻删除!给您带来的不便,尽请谅解!
商务合作:请加编辑微信suntrans2008(添加时请您标明“公众号商务合作”意向);联系电话:15313128281
图片版权声明:部分图片来源于网络,版权归原作者所有。如涉及侵权或者对版权有疑问,请联系邮件1943581358@qq.com,我们会尽快处理!