大数跨境

自动识别岩石薄片矿物的一种人工智能方法

自动识别岩石薄片矿物的一种人工智能方法 阳光创译语言翻译
2023-11-08
3
导读:基于深度学习的岩石薄片矿物自动识别方法徐圣嘉1,苏程1,朱孔阳2,章孝灿11 浙江大学地理与空间信息研究所2


基于深度学习的岩石薄片矿物自动识别方法
徐圣嘉1,苏程1,朱孔阳2,章孝灿1

1 浙江大学地理与空间信息研究所

2 浙江大学地质研究所

           

作者简介:徐圣嘉,硕士研究生,主要从事数字图像处理研究.
通信作者:苏程,博士,副教授,副所长.
           
导读:

岩石薄片矿物识别是地质找矿和岩石学研究的基础工作,传统的矿物识别主要依靠光学显微镜进行人工鉴定时间长、效率较低,受制于鉴定者工作经验

随着人工智能技术的快速发展,深度学习方法使计算机能从图像中自动提取更准确的语义信息,从而为岩石薄片图像的智能分析提供有效途径。

本文提出了一种基于深度学习的岩石薄片矿物自动识别方法,利用深度卷积神经网络自动提取岩石薄片图像中不同矿物的有效特征,并对其进行语义分割与识别,综合利用单偏光与正交偏光2种光性图像实现了对矿物的自动识别经对南京大学岩石教学薄片显微图像数据集进行了矿物识别测试,结果表明,总体精度为86.7%,Kappa 系数为0.818,识别结果较传统图像分类方法更准确

             
------内容提纲------
           
引言
1 数据集
2 矿物识别方法
2.1 基于CNN的矿物颗粒语义分割
2.2 单偏光与正交偏光语义分割结果融合
3 对比实验与讨论
3.1 深度学习与最大似然法对比
3.2 单偏光与正交偏光融合对比
4 结论
---------------    
0  引言

矿物识别是岩石分类定名的重要依据,也是了解岩石成因机理、物质运移、演化历史的基础,在采矿学、岩石学、火山学等地质学科领域中发挥了极为重要的作用。通常,先将岩石磨制成薄片,再由专业人员在单偏光和正交偏光下从不同的角度观察待识别矿物的颜色、纹理、消光角、形状等特征,获取矿物信息,效率较低且受制于专家经验。除光学显微镜法,X 射线衍射(XRD)、扫描电镜-能量色散X 射线光谱仪(SEM-EDX)、QEMSCAN、MLA、电子探针、拉曼光谱等分析方法也能对岩石样品的矿物成分进行较准确的定量分析,但价格昂贵,人工成本和时间成本高,仅适用于样品数较少的情况。近年来,随着深度学习在数字图像处理领域的发展,利用计算机对岩石薄片图像上的矿物进行快速自动识别成为可能。矿物自动识别可有效提高岩石学基础研究工作的效率,避免受鉴定专家主观因素的影响,对“大数据+人工智能”范式在岩石学领域的应用起支撑与推动作用。

目前,已有很多针对岩石薄片图像的矿物自动识别研究最常见的方法是先依靠人工干预提取矿物特征,再通过图像算法进行特征学习,建立矿物识别模型,从而实现对矿物的自动识别。总体而言,识别方法经历了由依靠单一颜色特征进行识别到依靠颜色、纹理、亮度等多种特征协同识别的转变。例如,MARSCHALLINGE根据矿物图像的三原色(RGB)特征,采用最大似然分类法识别了4 种矿物。THOMPSON等基于色调-饱和度-强度(huesaturation-instensity,HSI)颜色空间,采用人工神经网络(ANN)法对10 种矿物进行了识别。BAYKAN等通过对比矿物在RGB、色调-饱和度-高度(HSV)和CIELab 3种颜色空间下的识别效果,提出了一种基于RGB 和HSV 颜色分量的ANN方法,并对矿物进行了分类。然而,对某些矿物而言,仅凭颜色特征较难区分,因此,后续研究又进一步加入了矿物的纹理特征以提高识别精度。例如IZADI等基于颜色、纹理特征,提出了一种2个ANN级联的矿物识别方法,取得了可靠结果。PEREIRA等基于颜色、纹理特征,通过最近邻算法和决策树算法实现了矿物识别。之后,为提高识别精度,又加入了更多的图像特征。例如MAITRE等依据颜色、纹理以及亮度特征,对比了3种机器学习算法对砂粒样本中矿物颗粒的识别效果。RUBO等从离散卷积滤波器中提取了75种卷积特征,结合5种非卷积特征,采用ANN和随机森林方法对碳酸盐薄片进行了矿物及孔洞的识别

近年来,以卷积神经网络(convolutional neural networks,CNN)为代表的深度学习方法得到了迅速发展,在数字图像处理领域显示了巨大优势。CNN方法无需人工干预,能从图像中自动捕获大量特征,并通过多层卷积运算在极大的感受野中累积丰富的上下文信息,非常适合图像特征的学习与表达目前,深度学习方法已成功应用于数字岩相学相关研究,如岩石分类和矿物识别,且取得了较传统图像算法更准确的结果。SU等提出了一种根据岩石薄片图像对岩性进行分类的级联卷积神经网络(Con-CNN),取得了良好效果,总体精度达89.97%。此外,也有不少对CNN 在矿物识别应用方面的探索,涵盖了不同尺度的矿物图像识别,即以手标本图像为代表的宏观尺度的矿物识别和以岩石薄片显微图像为代表的微观尺度的矿物识别。宏观尺度的矿物识别通常用于解决多种矿物图像间的分类问题。例如,彭伟航等基于Inception V3 模型,引入中心损失函数作为限制模型的收敛条件,实现了对16类常见手标本矿物图像的识别OKADA等则用高光谱相机拍摄了矿物图像,设计了一个CNN以区分黄铜矿、方铅矿和赤铁矿,并对3种不同粒度的赤铁矿进行了分类。微观尺度的矿物识别既有针对某种矿物的精细化提取,又有针对多种矿物的识别。例如,CHEN等采用带有修正权重函数的U-Net 架构,解决了将页岩薄片背散射图像中的黏土复合体从矿物基质中分离的问题,因为两者的灰度级相似,无法用传统的图像阈值算法分离。郭艳军等用ResNet-18研究了5种常见矿物对岩石薄片单偏光图像的识别。KOESHIDAYATULLAH等研究了基于深度卷积神经网络(deep convolutional neural networks,DCNN)耦合的图像分类和目标识别任务,能同时定位和识别多个碳酸盐岩薄片图像中的6~9种矿物颗粒、基质及胶结物。

已有研究表明,CNN方法在岩石薄片图像矿物自动识别显示了巨大的潜力和优势,但仍面临诸多挑战。其一,自然界中矿物的呈现形态复杂多样,图像的形状、大小、颜色、纹理等特征变化较多;其二,矿物在不同光性下的特征并未被充分、综合利用基于此,本文提出一种用于矿物自动识别的岩石薄片图像深度学习方法。通过构建基于CNN的语义分割网络,自动提取矿物的多尺度复杂特征和语义信息,分别将矿物的单偏光图像和正交偏光图像用于矿物识别建模。通过融合不同光性图像,获取更准确的识别结果。对南京大学岩石教学薄片显微图像数据集的测试结果表明,本文方法的总体精度为86.7%,Kappa 系数为0.818。对比实验结果表明,本文方法的矿物识别精度及效率更高

1  数据集

岩石薄片图像来自南京大学岩石教学样品显微图像数据集,包含28种沉积岩、40种火成岩、40种变质岩的单偏光图像及正交偏光图像,每幅图像的尺寸为1280像素×1 024像素。岩石样品主要来自我国境内,于1970—2019年间采集,后被制作成薄片,岩石薄片偏光显微照片分别于2014年和2019年拍摄。  

由于火成岩数据基本涵盖了常见的造岩矿物,这不仅是岩石分类命名的重要依据,也是理解岩石的化学成分、成因和成矿作用的基础。因此,将火成岩薄片在0°拍摄的透射单偏光图像及透射正交偏光图像分别作为训练样本和测试样本,岩石薄片包括石英闪长岩、花岗闪长岩、花岗岩、石英二长岩及黑云母花岗岩等。

通过人工镜下鉴定对数据集中的部分图像进行矿物标注,将其作为深度学习网络的训练样本。共标注石英、斜长石、碱性长石、角闪石、黑云母、绿泥石、不透明矿物、孔洞和其他等9类矿物。为方便使用深度学习网络,将标注完成的矿物标签图像及其对应的单偏光和正交偏光图像统一裁剪为512像素×512像素的子图,最终构建了330组(单偏光+正交偏光+标签图)数据。

2  矿物识别方法

由于矿物图像特征复杂多变,为在识别过程中充分地提取特征,提出一种岩石薄片图像矿物自动识别方法。如图1 所示,该方法的结构主要分为两部分:(1)构建深度卷积神经网络,通过多层深度卷积运算自动挖掘和提取图像的低层与高层特征,在保持图像原拓扑位置关系不变的前提下学习矿物的大量特征,最终以图像语义分割方式获取岩石薄片图像的像素级矿物识别结果;(2)基于矿物的单偏光特征和正交偏光特征是区分矿物种类的重要依据,人工鉴定需结合不同光性特征进行判断,因此,分别针对单偏光图像和正交偏光图像训练语义分割网络,在此基础上使用软投票法进行图像融合,综合利用不同光性图像特征,获取更准确的识别结果。

图1 基于深度学习的矿物自动识别方法结构

2.1 基于CNN的矿物颗粒语义分割

矿物颗粒语义分割网络整体遵循DeepLabV3+网络结构,如图2 所示。该网络结构为编码器-解码器结构,首先在编码器中提取图像的多尺度语义特征,然后在解码器中重构多尺度语义特征的空间信息,使得网络输出的预测图像的空间分辨率与原始输入图像的相同    

图2 语义分割网络结构

           

网络输入数据是单偏光图像或正交偏光图像(一种偏光图像训练一个网络模型),在编码器中由主干网络进行初步特征提取。主干网络选取ResNet-101的前5个卷积模块,除第1个模块是7×7的卷积层外,其余4个模块均由不同个数的残差瓶颈结构堆叠而成,如表1 所示。对残差的学习能避免网络在层数深度堆叠的情况下出现梯度消失和梯度爆炸的现象,有利于网络更充分地提取图像中的局部细节特征。

表1 主干网络结构

  注[]内是残差瓶颈卷积核的尺寸及通道数。

                

然而,仅通过局部细节特征识别矿物是不够的。通常,自然图像上的矿物特征具有较强的随机性,需通过更深层次的语义抽象进一步描述其特征。为此,在主干网络后,加入空洞空间金字塔池化(ASPP)模块,以提取更多具有统计性的深层次语义信息。ASPP用空洞卷积替代传统卷积,卷积核可在不增加参数与模型复杂度的条件下指数级地扩大感受野,从而避免牺牲太多图像中的空间分辨率,这意味着空洞卷积可在任意分辨率的图像上高效地提取密集特征。在此基础上,ASPP 采用4个并行的不同膨胀率的空洞卷积,分别为1个1×1的卷积和3个3×3的卷积(膨胀率分别为6,12,18),再对其做全局平均池化和卷积融合,从而获得大范围、多尺度的语义信息。

通常,通过ASPP提取的特征信息较抽象,且通道数非常大,缺乏包含图像边缘特征的局部细节信息,因此在输入网络解码器时,需先经过1个1×1的卷积层以降低通道数,然后融合由主干网络提取得到的图像低层特征,补充欠缺的局部细节信息。对于融合后的特征图,使用3×3的卷积降低特征通道维数,通过双线性插值上采样将其恢复至与输入图像大小相同的矿物语义分割结果。该结果实际上是一组多通道的矿物类别归属概率图,通道数等于可识别的矿物类别数,每个通道上图像的像素表示该像素从属于某矿物类别的概率。

2.2 单偏光与正交偏光语义分割结果融合

为有效融合不同光性特征,得到更准确的矿物识别结果,使用软投票法处理由单偏光图像与正交偏光图像得到的像素级矿物识别结果。软投票法允许从汇总的多个加权分类器的预测概率中取概率最高的类别作为模型最终的预测结果。对于经过软投票法融合的矿物预测图像的每个像素j,其所属的矿物类别Cj

其中,WPPL,WXPL=1WPPL分别表示由单偏光图像和正交偏光图像训练得到的矿物识别模型的权重,其最佳取值可由实验获得PPPL,PXPL分别表示由单偏光模型和正交偏光模型预测得到的该位置的像素从属于每个矿物类别的概率。将2 组加权后的概率分别相加,取概率最高的矿物类别作为融合后的类别。

3  对比实验与讨论

设计2组对比实验:(1)对比深度学习与传统图像分类法最大似然法的识别精度差异,以验证深度学习方法在解决复杂问题方面的优势(2)对比单个偏光的深度学习模型与融合软投票法模型的识别精度差异,以验证模型融合的提升作用。    

采用PyTorch深度学习框架,将数据集按7∶1∶2 划分为训练集、验证集、测试集,采用平移、旋转、缩放等组合方式对训练集进行5 倍的数据扩增,使网络能充分学习各类矿物的特征,避免产生过拟合现象。最终得到2个网络,即单偏光图像的语义分割网络和正交偏光图像的语义分割网络。在训练过程中,2个网络均使用相同的超参数,即基础学习率为0.00001,梯度优化算法为Adam,权重衰减项为0.0001,训练次数为100个epoch,每迭代5个epoch对训练结果进行一次验证。最大似然法使用ENVI图像处理软件,其训练样本和测试图像与本文方法相同。

采用像素级验证方法,在随机挑选的测试集切片图像中随机选取4万个像素点(约为每幅图总像素的15%),将其作为验证样本,用于计算混淆矩阵与分类指标。

3.1 深度学习与最大似然法对比

用混淆矩阵、总体精度(overall accuracy,OA)、Kappa系数等指标衡量两种方法对单偏光图像和正交偏光图像的矿物识别精度。这些指标是图像分类与目标识别领域的主要验证指标,用以指示分类器的表现。其中,混淆矩阵可详细地反映分类模型的性能,其中,列表示预测类别,行表示真实类别通过混淆矩阵,能清楚地看到各矿物像元被正确分类的个数以及被误分的类别和个数。矩阵对角线上的数值越高,说明模型给出的正确像元数越多。在混淆矩阵的基础上,进一步计算得到模型的OA和Kappa系数。OA反映的是被正确分类的像元数之和占总像元数的比例,仅统计混淆矩阵对角线方向上被正确分类的像元数。Kappa 系数同时考虑对角线方向被正确分类的像元以及对角线之外的各种误分、漏分像元,更具综合评价意义。通常,Kappa系数大于0.8表明模型具有很好的性能

基于深度学习得到的单偏光网络模型与正交偏光网络模型的混淆矩阵如图3所示。基于最大似然法得到的单偏光分类模型与正交偏光分类模型的混淆矩阵如图4所示。为便于标准化衡量,将混淆矩阵中的像元数比例转化为0~1

根据4个混淆矩阵,分别计算得到其OA和Kappa系数,如表2所示。由表2知,对于单偏光模型,深度学习方法的OA较最大似然法的提高了22.1%,Kappa系数提高了26.3%对于正交偏光模型,深度学习方法的OA 较最大似然法的提高了29.3%,Kappa系数提高了36.3%。结合图3和图4,可知深度学习方法不管是对混淆矩阵中多种矿物的识别精度,还是对模型整体的识别精度均优于最大似然法说明深度学习方法在矿物识别上具有更强的应对能力,可以取得更好的识别结果。    

图3 基于深度学习得到的单、正交偏光网络模型混淆矩阵

                

图4 基于最大似然法得到的单、正交偏光分类模型混淆矩阵

3.2 单偏光与正交偏光融合对比

为获得不同光性图像的矿物识别融合模型,首先需对融合模型中单偏光模型和正交偏光模型的权重进行实验,以获取最佳占比。为此,取0.1为步长,统计单偏光模型权重在0.1~0.9变化时,融合模型的识别精度变化趋势,如图5所示。由图5知,随着单偏光模型权重的增加,融合模型的精度呈先升高后下降的趋势。当单偏光模型权重为0.4,正交偏光模型权重为0.6时,融合模型的精度最高。该结果较合理且具可解释性,结合表2,基于深度学习得到的正交偏光模型的OA和Kappa系数均高于单偏光模型的OA和Kappa系数,故正交偏光模型权重占比相对较大。    

图5 OA,Kappa 系数与单偏光模型权重间的关系

           

           

表2 本文深度学习方法与最大似然法的精度对比

           

取单偏光模型权重为0.4,正交偏光模型权重为0.6,计算得到融合模型的混淆矩阵如图6所示。然后计算得到融合模型的OA和Kappa系数,如表3所示。可知,融合模型的OA较单偏光模型的提高了11.3%,较正交偏光模型的提高了6.1%;融合模型的Kappa系数较单偏光模型的提高了15.6%,较正交偏光模型的提高了7.8%,表明融合模型能进一步提高识别精度。

图6 融合模型的混淆矩阵

                
           

表3 不同模型的精度对比

           

为更直观地体现融合模型的矿物识别效果,以火16花岗闪长岩图像的矿物识别为例,对结果进行可视化展示,如图7 所示。由图7(c)和(d)可知,融合模型的矿物识别结果人工标注结果具有较好的一致性。预测得到的矿物类别和矿物图斑形状与人工标注结果基本吻合,例如红框A 中的石英、斜长石、碱性长石、角闪石、不透明矿物、孔洞等均得到较准确的识别,说明本文模型能对这些矿物进行良好的区分。值得注意的是,部分识别结果与实际不符,例如红框B中,部分角闪石被错分为黑云母。这可能是因为角闪石与黑云母在薄片图像上较相似,二者在单偏光下均偏黄绿色,在正交偏光下的干涉色重合较多,且角闪石图像上的局部纹理、形状等特征不明显,与黑云母产生了一定的混淆,导致模型做出错误判断。

图7 火16 花岗闪长岩单、正交偏光图像及矿物识别结果

4  结论

提出了一种基于深度学习的岩石薄片矿物自动识别方法,通过构建语义分割网络自动学习与提取岩石薄片图像矿物特征,获得像素级矿物识别结果。在此基础上,通过软投票法融合单偏光图像与正交偏光图像的识别结果,进一步提高了矿物识别精度。利用南京大学岩石教学样品显微图像数据集,实现了对石英、斜长石、碱性长石、角闪石、黑云母、绿泥石、不透明矿物、孔洞和其他等9 类矿物的自动识别。测试结果表明,总体精度为86.7%,Kappa系数为0.818,优于传统图像分类法最大似然法的识别结果。由于深度学习方法主要依靠对大量数据的训练与优化,可以预见,随着被标注矿物种类的增加以及图像数据的扩充,其矿物识别能力及准确性将不断提升。


热文推荐:

坐拥四川最大金矿,四川黄金上市,紫金矿业乐开了花!

加拿大要求中国锂企撤资?后续来了!

“80后”地质队员12年扎根野外为国找矿,所属地质队64年寻金2810余吨!

全球最大的未开发锂矿床之一,中国要收入囊中!

1150亿,世纪并购要来了?世界最大金矿公司疯狂扩张!

18年后风云再起,钼的春天,提前到来!

风向标来了!自然资源部直接部署,全面启动战略性矿产“找矿行动”!


  相关业务需求即可致电下方相关责任人  


吕国博士 董事长 1127203572@qq.com
电话:13401184506 微信:suntrans-mining
孙玉梅 总经理 853495100@qq.com
电话:13810694105 微信:853495100
Gary 矿业外语猎头 582934973@qq.com
电话:13311203631 微信:suntrans222
刘乾勇 英语翻译 1935014417@qq.com
电话:13693672413 微信:13693672413
刘鑫 论文翻译 1749173384@qq.com
电话:13683660873 微信:lvy_09260312
苗菁 地矿报告翻译 2534271235@qq.com
电话:13683661813 微信:zyy-suntrans
Jerry 口译 2268356581@qq.com
电话:13681439112 微信:miningtranslation
范瑞瑞 媒体合作 1985130191@qq.com
电话:17310253590 微信:suntrans2014
Tom 全职招聘 347562171@qq.com
电话:13661190472 微信:13661190472
赵宏 矿业咨询部主任 1583289628@qq.com
电话:13683660397 微信:suntrans_1543
Mary 矿业咨询部副主任 3073107861@qq.com
电话:15210897852 微信:suntrans-1938
Mary 矿产贸易总监 1529169438@qq.com
电话:17310657953 微信:ha15313128283
Bruce 海外市场总监 3602237436@qq.com
电话:15701297623 微信:suntrans_6787



阳光创译=国际矿业服务平台


打造中国地质矿业翻译领军品牌

阳光创译的核心定位已经由最初的“阳光创译=矿业翻译”——中国地质矿业翻译领军品牌逐渐延伸扩展成“阳光创译=中国国际矿业服务大平台”,涵盖矿业翻译、矿业会展、矿业咨询、矿业猎头、“一带一路”矿业商会、矿业媒体等国际矿业服务板块。


文章版权声明:本文来源 《浙江大学学报(理学版)》 2022年第6期 P743-752页 《覆盖区找矿》整理版权归原作者所有,本文不代表阳光创译立场,并对文中观点保持中立,仅供各位阅读者交流参考之目的。本号所转载内容没有任何商业宣传目的,仅供交流,如有侵权,请联系主编删除(主编微信:suntrans2008),另外图片版权归原作者所有,如有侵权请联系我们,我们将会立刻删除!给您带来的不便,尽请谅解!

商务合作:请加编辑微信suntrans2008(添加时请您标明“公众号商务合作”意向);联系电话:15313128281

图片版权声明:部分图片来源于网络,版权归原作者所有。如涉及侵权或者对版权有疑问,请联系邮件1943581358@qq.com,我们会尽快处理!

【声明】内容源于网络
0
0
阳光创译语言翻译
中国国际矿业能源服务大平台。矿业翻译、矿业咨询、矿业会展、专业技术服务等全方位信息技术服务
内容 10403
粉丝 0
阳光创译语言翻译 中国国际矿业能源服务大平台。矿业翻译、矿业咨询、矿业会展、专业技术服务等全方位信息技术服务
总阅读3.7k
粉丝0
内容10.4k