
摘要:大数据正在影响着人类生活,改变着人类认识和研究世界的思维方式。作为典型数据密集型学科的地质学,正面临着前所未有的挑战与机遇。为了应对这一挑战,地质学家不仅需要改进传统的研究方法,更重要的是要改变传统思维模式,拥抱大数据时代的到来。地质学与大数据的结合不仅极大拓展了地质学的认知空间,提升了获取地质学新知识的能力,同时为地质学支撑的能源矿产调查、环境资源合理利用以及防灾减灾等社会生产和公共服务提供了创新活力。在分析国内地质学大数据研究现状的基础上,文章阐述了我国地质学大数据研究的前沿科学问题,提出了地质学大数据发展战略目标,探讨了地质学大数据发展面临的主要问题和解决途径。大数据将改变地质学家的思维方式,数据驱动的科学发现模式将为地质学的发展带来全新的面貌,文章呼吁地质学界对大数据给予更多的关注和支持。
原文:翟明国,杨树锋,陈宁华,等.大数据时代:地质学的挑战与机遇[J].中国科学院院刊,2018,33(08):825-831.DOI:10.16418/j.issn.1000-3045.2018.08.009.
0引言
1 地质大数据的特点
地质大数据是通过露头地质观测、勘查工程、地球物理与地球化学探测、遥感监测及实验测试等手段获取的综合性科学数据,涵盖地球各圈层的结构组成、形成演化过程、矿产资源形成与利用以及环境破坏与恢复等多领域信息。其既具备一般大数据的“4V”特性——数据体量巨大、类型多样、更新快速及价值密度低,又呈现出科学大数据的“三高”特点,即高维度、高计算复杂性和高不确定性。受地质作用过程尺度巨大、演化因素多样等特征影响,这些“三高”特性在地质领域表现得尤为突出。因此,地质大数据在数据结构、处理难度、时空异质性和过程不确定性等方面具有独特性,对地学分析方法、信息处理技术及认知模式提出了更高要求。
1.1 多源(元)异构性
地质数据的采集手段多种多样,涉及不同的技术平台和数据获取方式。常见的数据类型包括野外露头描述、钻孔岩芯分析、地质报告、野外填图、遥感影像及地质灾害监测数据等。数据存储和管理方式各异,部分数据以纸质形式保存,部分则通过结构化转换,汇聚至地理信息系统(GIS)并存入数据库。这些不同的采集手段和数据存储方式导致了数据的组织和结构差异,进而引发了同一地质对象描述中的时空差异和语义鸿沟。此外,多角度的描述和异构的数据采集方法使得地质大数据呈现出显著的异构性和多模态特征。这种复杂的异构性增加了数据整合和分析的难度,并对地质大数据的有效应用提出了挑战。
1.2 时空相关性
地质大数据具有独特的时空特性,尤其体现在时间维度上。由于地质体、地质结构、资源、环境及灾害通常涉及广阔的空间范围,并伴随长期或阶段性的演化过程,地质数据的时间维表现出长期性与阶段性复合的复杂特点,这是其他地球科学数据所不具备的。具体而言,地质对象具有特定的地质年代和区域性,导致在特定时段和特定区域内的研究对象呈现显著差异性。此外,地质数据常常用于描述某一时刻、某一位置的对象属性,这些固有属性在数据采集时即已形成。地质数据的时间尺度从分秒级到数十万年不等,且伴随着空间坐标系、投影参数及测量精度等变量,这进一步增加了数据的复杂度。因此,地质数据无法脱离其时间和空间维度独立存在,任何地质大数据的分析和融合都必须在统一的时空基准下进行。
1.3 复杂性与模糊性
地球作为一个复杂的巨系统,地质数据在一定程度上通过简化其复杂性,为建模与求解提供了可能。然而,由于地球各圈层间的相互作用以及地质过程的高度复杂性,许多地质规律的解释与结论仍存在争议。此外,地质数据在定量化描述上的困难,进一步增加了数据分析、建模与计算的难度。在大数据分析中,“重关联不重因果”是常见的技术取向,意味着我们不能单凭数据完全揭示地质现象的发生机理。当前,全球范围内的样本数据尚未完全采集,导致地质大数据分析的结果往往呈现模糊性与不确定性。因此,尽管地质大数据为地质科学提供了新的研究工具,但其分析结果仍需谨慎解读。
1.4 地质体的全球性与国家利益
地质体和地质单元的分布不以国家界限为界限,地质资源的分布不以国家和人口的需求而分布。这就造成“国家利益”干预造成的全球数据库建设的困难。
2 地质大数据研究进展
总体来看,我国地质大数据研究仍处于起步阶段。首先,部分学者对大数据在地球科学中的适用性存在质疑,认为其与地球科学这一观察性学科的特点不符;其次,许多研究人员尚未充分认识到数据积累与共享的重要性,这在一定程度上制约了地质大数据的发展。此外,大数据研究强调“相关性”而非传统科学研究中的“因果性”知识发现,这种研究取向与科学思维模式的转变存在较大矛盾,给科学家们带来了挑战。综上,国内地质大数据的研究现状可归结以下3点:
2.1 地质大数据的存储管理
随着地球信息探测技术的快速发展,地质学领域积累了大量定性和定量数据,同时还包括文字说明、地质图件、视频、音频文件等多种形式的资料。然而,长期以来的目录文件存储方式显著降低了数据查询、检索、统计、更新和挖掘的效率,导致地质数据服务能力不足。因此,构建一套能够有效整合结构化、半结构化和非结构化数据的地质信息系统变得尤为重要,这不仅包括静态和动态数据的一体化管理,还应将地质数据与地质模型进行结合。
目前,已有学者提出利用云平台、Hadoop 和 NoSQL 等技术,借鉴实时 GIS 时空数据模型,实现地质时空大数据的动态管理。Hadoop 作为大数据存储与处理的标准平台,通过 MapReduce 支持大规模数据的并行处理;而 NoSQL 数据库则通过分布式节点集动态处理负载,采用分布式文件系统技术提升数据存储的容错能力和可靠性。例如,中国地质调查局发展研究中心研发的中国地质调查云平台,基于该框架建设了非结构化地质数据的存储和组织模式,推动了智能地质调查的精确与快速服务。
2.2 地质大数据的挖掘分析
大数据时代的三个重要技术取向为:要全体不要抽样;要效率不要绝对精确;要关联不要因果。这一转变促使我们从数据类型、数据运维和大数据所带来的挑战三个维度重新审视数据分析方法。根据周永章等人的研究,大数据与数学地球科学的核心应用技术应包括高维数据降维、图像数据处理、无限数据流挖掘、机器学习、关联规则算法及推荐系统算法等。
数据挖掘是通过算法从海量数据中挖掘潜在信息的过程,区别于传统的数据检索和信息提取,其需要基于大数据和知识库的智能推理理论和技术支持。在地质大数据挖掘中,核心任务是从数据仓库中识别潜在特征和规律,并将其应用于地质规律研究、成矿预测、资源评价、环境保护及地质灾害防治等领域。该过程涉及人工智能、机器学习、模式识别、归纳推理、统计学、数据库、高性能计算与数据可视化等技术。数字地质的任务是推动地质科学数据挖掘与分析方法的创新,尤其是在从大规模但价值密度较低的数据中有效提取信息方面。
目前,地质大数据分析的关键技术集中在对多源异构数据进行综合分析,包括结构化数据的相关性分析、半结构化数据的信息提取及非结构化数据的验证分析。随着物联网、虚拟现实、云计算等技术的兴起,互联网基础上的地质数据资源共享平台的研制成为可能,也为复杂地学计算提供了新条件。云计算与人工智能的结合已经成为地质大数据挖掘与分析的新发展趋势。例如,部分学者通过贝叶斯网络探索矿床成因机制,构建了大数据驱动的智能矿床成矿与找矿模型,推动了地质科学从“数字地质”向“智能地质”的转型。
2.3 地质大数据的应用服务
地质大数据不仅改变了地质学家研究科学问题的思维范式,也为地质行业带来了技术革新。在各领域数据化水平不断提升的背景下,地质大数据有效打通了信息孤岛,使定量化分析得以深入推进。其应用服务主要体现在以下五个方面:
(1)基础地质调查。在《国土资源“十三五”科技创新发展规划》中,提出推动数字地质调查向智能化方向发展,实现地质数据的快速采集、实时汇聚、高效分析与建模。通过云存储、云管理和云服务体系的应用,可实现海量、碎片化、非结构化与多样化地质数据的高效存储。中国地质调查局开发的“地质云 1.0”系统已上线,为基础地质、矿产地质、水工环地质、海洋地质等领域提供专业数据共享服务,并向社会公众提供多类地质信息产品。智能地质调查系统已在基础地质和矿产地质调查中示范应用,推动了地质调查和服务模式的创新。
(2)国土资源管理。国土资源部门通过长期信息化建设,积累了海量土地数据,并提出全尺度数据整合与大数据构建技术。构建统一的数据共享与开放平台,实现国土资源“一张图”体系,为决策支持系统、智库信息化平台及“互联网+”智库运行提供技术手段。这些技术提升了国土资源宏观调控、管理监测、形势分析、政策评估和舆情分析等领域的决策支持能力。
(3)地质灾害监测。借助物联网和大数据技术,从海量地质灾害数据中挖掘潜在信息,并结合多轨道、多尺度、多时相遥感监测技术,构建智能化地质灾害、地下水、矿山环境、地面沉降、水土环境及地质遗迹的调查和监测数据采集及预警系统。该系统增强了灾害发生趋势研判和预测能力,实现实时监测与预警,用数据力量防治地质灾害。
(4)矿产资源勘查。矿产资源预测在资源发现与勘察中具有指导作用。传统方法依赖理论指导和经验判断,而在大数据驱动下,通过虚拟现实、3S 技术、数据库、三维建模与可视化技术的有机融合,可对矿床进行多维、多特征描述和建模,实现理论研究、数学模型与信息技术应用的三结合。大数据驱动的成矿预测理论促进了基于空间数据库的三维可视化软件与矿产资源预测系统的发展,为智慧找矿奠定基础。
(5)三维可视化。数据可视化是理解半结构化或非结构化问题关系和模型的重要手段。基于地质空间大数据,结合三维可视化与虚拟现实技术,可对地质体和地质结构进行三维动态建模,构建“玻璃地球”,辅助科研人员分析、预测、评估和决策。在数字矿山技术中,三维可视化能够生动展示矿山地质地貌信息,反映矿体赋存状态,从而指导矿体定位与成矿预测工作。
3 结语
大数据时代为地质学的发展带来了新的机遇与挑战。一方面,地质大数据为全面感知和理解地球提供了新的图景,为地质科学知识发现与科技创新提供了新的手段与途径;另一方面,地质大数据的“三高”特性——高维度、高复杂性和高不确定性——增加了数据挖掘与利用的难度。此外,数据交流与共享机制的不成熟也成为制约地质大数据发展的重要因素。因此,加快我国地质大数据建设进程,本文提出3点建议。
(1)推动“地质+大数据”人才培养体系的建立。高校应建立针对大数据时代的地质人才培养方案,通过项目育人模式,培育既具扎实地质学基础,又熟悉算法开发、数据建模与数据架构,能够胜任地质大数据系统研发、挖掘与分析及应用开发的交叉型专业人才。教育部和科技部应加大对地质大数据项目的支持力度,为人才培养提供保障。
(2)加快地质大数据共享交流平台的建立。数据自由流通和共建共享是发挥地质大数据价值的关键。当前大多数地质数据平台功能单一、检索效率低、数据库建设标准不统一,造成数据流通性和可用性不足。应由国家层面机构协调,整合高校、科研院所和地质生产单位,建立规范统一的地质大数据中心和共享交流平台,在保障国家利益的前提下推动数据的高效流通与协同研究。
(3)地质学家和地质工作人员的思维变革。随着数据密集型科学范式逐渐被接受,地质学家和地质工作人员应积极拥抱大数据,转变传统经验驱动的思维模式,以新的态度和方法处理数据,从中获取新知识、创造新价值。这一思维变革对于充分发挥地质大数据的潜力具有重要意义。
阳光创译介绍
如果您对我们的矿业咨询服务感兴趣或有任何疑问,欢迎随时与我们联系。我们将竭诚为您提供帮助和解答。让我们携手合作,共同开创矿业领域的新篇章
阳光创译的核心定位已经由最初的“阳光创译=矿业翻译”——中国地质矿业翻译领军品牌逐渐延伸扩展成“阳光创译=中国国际矿业服务大平台”,涵盖矿业翻译、矿业会展、矿业咨询、矿业猎头、“一带一路”矿业商会、矿业媒体等国际矿业服务板。
热文推荐:
● 西芒杜铁矿项目迎重大突破:2025 年 7 月钢轨落位,全球铁矿格局加速重塑
相关业务需求即可致电下方相关责任人
| 吕国博士 | 董事长 | 1127203572@qq.com |
| 电话:13401184506 | 微信:suntrans-mining | |
| 孙玉梅 | 总经理 | 853495100@qq.com |
| 电话:010-82865216 | 微信:853495100 | |
| Gary | 矿业外语猎头 | 582934973@qq.com |
| 电话:13311203631 | 微信:suntrans222 | |
| Bruce | 英语翻译 | 1935014417@qq.com |
| 电话:13693672413 | 微信:13693672413 | |
| 刘鑫 | 论文翻译 | 1749173384@qq.com |
| 电话:13683660873 | 微信:lvy_09260312 | |
| 苗菁 | 地矿报告翻译 | 2534271235@qq.com |
| 电话:13683661813 | 微信:zyy-suntrans | |
| Jerry | 口译 | 2268356581@qq.com |
| 电话:13681439112 | 微信:miningtranslation | |
| 范瑞瑞 | 媒体合作 | 1985130191@qq.com |
| 电话:17310253590 | 微信:suntrans2014 | |
| Tom | 全职招聘 | 347562171@qq.com |
| 电话:13661190472 | 微信:13661190472 | |
| 赵宏 | 矿业咨询部主任 | 1583289628@qq.com |
| 电话:13683660097 | 微信:suntrans_1543 | |
| 程波 | 矿业咨询部副主任 | 490148863@qq.com |
| 电话:13683660397 | 微信:13683660397 | |
| Mary | 矿产贸易总监 | 1529169438@qq.com |
| 电话:17310657953 | 微信:ha15313128283 | |
| 吕彦锦 | 翻译 | 3602237436@qq.com |
| 电话:15701297623 | 微信:suntrans_6787 |
|
打造中国地质矿业翻译领军品牌
阳光创译的核心定位已经由最初的“阳光创译=矿业翻译”——中国地质矿业翻译领军品牌逐渐延伸扩展成“阳光创译=中国国际矿业服务大平台”,涵盖矿业翻译、矿业会展、矿业咨询、矿业猎头、“一带一路”矿业商会、矿业媒体等国际矿业服务板块。
文章版权声明:本文来源 :《中国科学院院刊》,版权归原作者所有,本文不代表阳光创译立场,并对文中观点保持中立,仅供各位阅读者交流参考之目的。本号所转载内容没有任何商业宣传目的,仅供交流,如有侵权,请联系主编删除(主编微信:suntrans2008),另外图片版权归原作者所有,如有侵权请联系我们,我们将会立刻删除!给您带来的不便,尽请谅解!
商务合作:请加编辑微信suntrans2008(添加时请您标明“公众号商务合作”意向);联系电话:15313128281
图片版权声明:部分图片来源于网络,版权归原作者所有。如涉及侵权或者对版权有疑问,请联系邮件1943581358@qq.com,我们会尽快处理!

