首页 > 行业资讯 > 基于深度学习的花岗伟晶岩型锂铍矿物识别研究

基于深度学习的花岗伟晶岩型锂铍矿物识别研究

时间:2023-12-20 来源: 浏览:

基于深度学习的花岗伟晶岩型锂铍矿物识别研究

覆盖区找矿
覆盖区找矿

gh_137bd1e52ced

宣扬地学成果,传播勘查技术方法!

- 宣扬地学成果,传播勘查技术方法 -

点击上方“覆盖区找矿”, 关注 更精彩!

           
基于深度学习的花岗伟晶岩型锂铍矿物识别研究
蒋果 2,3,4,5, 周可法 1,5, 王金林 1,2,3,4,5, 白泳 1,3,4, 孙国庆 5,6, 汪玮 1,2,3,4,5

1 中国科学院空间应用工程与技术中心

2 中国科学院新疆生态与地理研究所荒漠与绿洲生态国家重点实验室

3 新疆矿产资源与数字地质重点实验室

4 中国科学院新疆矿产资源研究中心

5 中国科学院大学

6 中国科学院空天信息创新研究院

           

作者简介:蒋果, 助理研究员,主要从事高光谱遥感地质应用工作。

通信作者:周可法, 研究员,主要从事地质遥感专业研究。

           

导读:
稀有金属是极其重要的战略性矿产资源 ,国家正在对其加大勘查力度。 遥感技术在大宗型金属矿产资源勘查方面 取得了非常卓越的成效,但将其应用于稀有金属矿物提取的成果较少, 尤其是 花岗伟晶岩型等 硬岩型锂铍矿物识别, 主要受光谱分辨率、含矿岩体与围岩物性差异小、锂铍矿物光谱区分差异小等因素限制。
为了探讨高光谱技术 在花岗伟晶岩矿物识别方面的潜力,同时探讨光谱增强技术和神经网络模型对识别精度的影响, 本研究 通过野外采集含锂铍矿物伟晶岩和围岩样品并测量其光谱数据,使用光谱增强技术凸显光谱特征,对比分析特征吸收参数相似度模型和深度神经网络模型 对矿物识别精度的影响。
研究提出了一种自动提取光谱吸收特征参数方法 ,应用效果较好, 能够避免人为因素,有助于定量化地理解地物光谱及其与其他光谱的差异。
研究发现 锂铍矿物在0.4~2.5μm范围内 具有规律性的吸收特征 ,且矿物之间具备可区分的吸收特征, 为矿物识别模型的构建提供了理论基础
研究认为, 相对于原始光谱, 变换光谱 能够在一定程度上 提高模型的识别精度 ,组合变换能够综合不同变换方法的优势, 从而提高模型的精度 迁移学习 能够在样本数量较少的时候取得较好的效果,而深度卷积网络 相比于浅层神经网络, 因其能够提取更多深层次特征,从而能够取得更好的识别效果。    
研究表明 利用高光谱技术和深度学习方法 能够实现对锂铍矿物信息提取。 研究成果 为航空-航天高光谱圈定区域锂铍资源有利区 提供了科学依据
           
------内容提纲------
           
0 引言
1 研究方法
1.1 光谱变换
1.2 光谱特征参数提取
1.3 光谱相似度法
1.4 神经网络模型
1.5 精度评估
2 数据采集及预处理
3 结果与讨论
3.1 光谱特征参数提取精度分析
3.2 锂铍矿物光谱特征分析
3.2.1 锂矿物光谱特征
3.2.2 铍矿物光谱特征
3.3 光谱变换对矿物识别模型精度的影响
3.4 建模方法对识别模型精度的影响
4 结论
---------------
0   引言
稀有金属是极其重要的战略性矿产资源 ,作为自然资源的一部分,不仅是国土资源重要的组成部分,更是新一代尖端武器、信息技术、节能环保、医药和医疗设备、高端装备制造、新材料、新能源汽车等所需要的功能材料、结构材料和关键性原料。 据美国地质调查局(USGS)2021年数据统计,中国的锂、铍资源对外依存度分别高达75%和90%。 铍作为原子能、火箭、导弹、航空航天等工业中 不可或缺的功能材料和关键性原料, 是我国高新产业发展的保障性资源和战略性资源之一 。据统计,2021年我国锂、铍资源量分别占全球总量的7.3%和1.8%。一旦国际形势发生重大变动,将严重影响我国的经济和国防安全。 因此,探明我国锂、铍矿产资源分布和储量 ,降低对外依存度, 是实现中国战略性产业稳定发展的基础    
遥感技术 具备覆盖面积大、周期短、成本低、省时省力等优势, 可以快速圈定成矿有利区,缩小工作范围,提高找矿效率 遥感技术在锂铍稀有金属资源勘查领域 取得了显著的成果。已有学者使用 光谱角匹配、混合匹配滤波、假彩色合成、波段比值和主成分分析等方法 直接或间接提取锂铍伟晶岩信息 。也有部分学者 尝试引入机器学习 (支持向量机、随机森林)和 多重分形理论 等方法 进行矿物识别,但这都是基于多光谱遥感, 因光谱信息有限,从而对光谱差异小的地物识别效果较差 。随着光谱技术的飞速发展, 从定性的识别矿物发展到定量-半定量的估算 。已有学者通过高光谱技术 发现1.9μm的吸收深度与锂显著相关,1.413μm的吸收宽度和2.207μm的吸收谷位置偏移量能够识别含锂辉石伟晶岩
另外, 随着计算机信息自动提取技术的不断完 善,尤其是在2006年Hinton等提出了深度信念网络, 之后越来越多的深度学习模型不断被提出 ,并在图像识别、目标检测等领域 取得了非常显著的成果 。同时也有部分学者将其应用到地质领域, 为地质勘探提供了一种更有利的技术手段
为了探讨高光谱技术在花岗伟晶岩矿物识别方面的潜力,同时探讨光谱增强技术和神经网络模型对识别精度的影响, 本研究拟通过采集含锂铍矿物伟晶岩, 在实验室测量光谱数据 并构建光谱特征参数自动提取技术,定量化地分析锂铍矿物光谱特征, 据此建立不同识别模型并验证模型在模拟混合光谱数据下的准确性和适用性。 如果利用高光谱技术和深度学习方法能够实现对锂铍矿物信息提取, 将为下一步航空-航天高光谱圈定区域锂铍资源有利区提供科学依据。
1   研究方法
1.1 光谱变换
针对光谱数据的采集过程 受仪器、环境等多种外界因素的影响, 会增加噪声信息,另外,直接使用原始光谱数据进行分类识别, 往往会因为光谱之间差异小而分类效果差 。因此, 本研究使用 指数光谱、幂次光谱、倒数光谱、包络线去除光谱、对数变换、导数变换及其组合光谱 等16种光谱增强技术对原始光谱进行处理,并以此为基础数据构建识别模型, 以期得到适用于矿物分类的光谱变换方法。    
包络线去除 能够有效突出光谱曲线中的谷峰特征,将其归一化到统一的光谱背景上, 有利于提取相似光谱之间的特征波段 。对数变换可以在不改变数据性质和相关关系的前提下, 对数据进行压缩,使得数据更加平稳,削弱了模型的共线性、异方差性等问题 ,有利于降低光照变化引起的乘性噪声影响。 幂次变换能够扩大光谱特征差异, 冥次大于1时,对高值部分进行增强 冥次小于1时,对低值部分进行增强 组合变换 是指两个或多个变换方法相结合,融合不同的增强效果。 如反射率倒数的对数、反射率倒数的一阶导数,可以很好地反映出不同物质组分的吸收特征差异 导数变换 能凸显不同地物光谱特征之间的细微差异, 一阶、二阶微分可以消除背景噪声、分辨率重叠光谱, 去除部分线性的背景、地形阴影,以及噪声对目标光谱的影响, 高阶导数如四阶导数可以消除大气瑞利散射的影响 。对于离散型光谱反射率,常使用差分技术来计算光谱导数。
1.2 光谱特征参数提取
为了快速自动地提取光谱吸收参数 ,本研究发现光谱曲线可以看成是一条高斯函数, 而高斯函数是一种用高斯概率密度函数精确地量化事物, 将一个事物分解为若干基于高斯概率密度函数形成的模型 。高斯混合模型 (Gaussian Mixture Model,GMM) 可以看作是由 N 个单高斯模型组合而成的模型, 每个子模型便是混合模型的隐变量。    
使用最大期望算法 (Expectation maximizationalgorithm,EM) L ( θ )进行不断迭代更新模型参数 ,最终是 L ( θ )最大,即完成GMM模型参数的估计。
1.3 光谱相似度法
光谱相似度方法 常被用于矿物识别 ,根据使用的波段区间 分为全波段相似度法(如光谱角法等 )和 特征波段相似度(如光谱吸收指数等 )。对于光谱差异较小的矿物, 使用全波段往往难以取得较理想的效果 ,因此本研究使用材料识别和表征算法(Material identification and characterization,MICA),该方法集成在光谱测量处理程序(Processing Rout in esinI Dl for Spectroscopic Measurements,PRISM)中, MICA的核心 是对参考材料光谱和未知材料光谱进行包络线去除 ,然后通过比较光谱库中参考材料的反射光谱中自定义 诊断吸收特征(波长位置和形状)与未知材料光谱的相似度,根据相似度的高低 定义未知材料光谱属于何种材料    
1.4 神经网络模型
相似度方法 需要交互式的提取特征, 结果的好坏取决于特征是否准确 而神经网络模型,尤其是卷积网络模型 可以通过设定的卷积核自动地提取不同的潜在特征。 大部分神经网络模型均是基于反向传播算法实现的 ,BP神经网络具有较完善的理论基础,能够模仿人脑神经元受外部刺激时的反应过程, 并结合信息的前向传递和误差的反向调节,通过多次学习,能够有效地建立输入与输出之间的关系。
极限学习机 最早由新加坡南洋理工大学教授Huang等 在2006年提出来的 ,与常规的神经网络相似, 不同之处在于极限学习机只有一个隐含层的前馈神经网络 ,通过随机选择输入权值和偏置的单隐层前馈神经网络(有 N 个隐藏节点) ,可以训练出 N 个有明显差别的观察值 。极限学习机没有迭代的过程 ,因此具有较高的运算效率 ,同时这种方法的泛化能力也较好,因此在回归预测、分类等多个领域得到广泛的应用。
深度学习 是机器学习中最流行的算法 ,其“深度”是相对于传统机器学习的“浅层”而言的,是浅层神经网络模型的延伸与发展 ,通过构建多层神经网络来提高网络模型对特征提取、转换、模式分析及分类的能力。 同时,不同领域学者使用深度学习 构建了不同的目标模型, 从而生成了大量性能良好的网络模型, 这也促进了机器学习中迁移学习的迅速发展。 迁移学习是深度学习领域的重要分支 ,其主要思想是将以往学习到的知识应用于另一个不同但相关的任务中,能够以较高的效率和效果完成新的任务。 另外,这种方法能够很好地处理因数据数量较少而导致预测精度低的情况 本文的主要目标是 对伟晶岩型矿物进行分类,由于样本数量较少, 因此将使用判别式的卷积神经网络模型来完成目标 。为此,本文选择迁移VGG16模型, 模型下载网址: https://github.com/fchollet/deep-learning-models/blob/mASTER/vgg16.py。
卷积神经网络 主要包括卷积层(提取特征信息)、池化层(减少数据处理量同时保留有用信息)、全连接层(将特征转化成目标形式)、Drop Out层(防止过拟合)以及输出层。 而迁移学习就是将一个环境中学习到的知识用到新的环境中的方法 常规的深度学习方法 需要大量的训练数据和硬件设备, 而迁移学习能够 在少量的数据和常规设备中取得较理想的结果 ,是运用已有的知识对不同但相关领域问题进行求解。 具体操作是使用已经训练好的深度卷积神经网络模型除去全连接的所有层 ,根据任务重新建立全连接层和输出层进而得到理想的深度卷积网络模型。    
常规的深度卷积神经网络 处理的是图片, 而我们的数据是光谱数据 。因此, 需要对光谱数据进一步处理 以便能够在模型中运行。 训练样本的制作以0.4~2.5μm为横坐标,0~1为纵坐标, 对每条光谱进行绘制并保存为图片格式( 图1a ),保存其相应的标签。然后对所有图片进行二值化处理( 图1b )。以上操作均是在Python中批量处理的。

图1 训练样本示意图

a—光谱曲线图;b—光谱曲线二值图。  

1.5 精度评估
为了对比分析不同分类方法 对不同矿物识别的差异和适用性 ,本研究使用总体精度和Kappa系数指标来评估模型的性能。 总体精度和Kappa系数值越大,模型性能越好。 计算方法如下。    
2   数据采集及预处理
本研究在 镜儿泉、小喀拉苏、可可托海三号矿、拜城 等锂铍矿区采集了大量花岗伟晶岩岩石样本 ,样品主要 包括含锂辉石伟晶岩、锂电气石伟晶岩、绿泥石伟晶岩和不含锂-铍矿物伟晶岩 ( 图2 )。对采集的岩石样品进行简单清理,去除表面尘土等杂质后带回实验室。在实验室暗室环境下 使用Analytical Spectral Device(ASD)FieldSpec4便携式高光谱仪 测量样品光谱数据,光谱仪光谱范围为0.35~2.5μm, 共计2151个波段 。同时,为了降低随机误差或仪器性能等因素对光谱质量的影响,测量前需对光谱仪和钨光灯预热半小时, 每一个点均采集5条光谱曲线,并逐一检查和去除差异较大的光谱 ,然后取剩余光谱的平均值作为该点的光谱数据。 为了避免手持测量不稳定导致光谱噪声 ,同时也降低钨光灯性能对测量结果的影响, 每间隔半小时测量一次白板 ,为获得光谱反射率数据提供基准数据。 为了探讨本文构建的模型的普适性, 光谱采集使用两种方式获取 ,一种是通过接触式的方法获取(701条光谱),另一种是非接触式的方式获取(246条光谱),因航空或航天影像获取的均为混合光谱,使用这种方式采集的光谱来验证模型的通用性具有代表性。 最后获得包含锂辉石、锂电气石、绿柱石、长石、云母和石英等6种矿物总计947条光谱数据 。将接触式方法获取的701条光谱按4 1划分成训练集(561条)和验证集(140条)。 将非接触式方法获取的246条光谱数据作为测试数据。    

图2 部分样品

a—锂辉石伟晶岩;b—锂云母伟晶岩;c—锂电气石伟晶岩;d—绿柱石伟晶岩。

           
光谱范围在0.35~0.4μm时 ,因光谱仪噪声影响, 光谱信噪比较低,数据质量较差, 因此本研究去除这一部分数据, 仅保留0.4~2.5μm的光谱数据进行分析, 并对每个样品使用二次多项式Savitzky-Golay滤波器进行平滑处理消除光谱的随机噪声,经过多次实验发现滤波宽度设置为7,平滑后的光谱数据效果最好。
3   结果与讨论
3.1 光谱特征参数提取精度分析
为了评估本文提出的自动光谱特征参数提取的精度, 从USGS光谱库中选取锂辉石、锂电气石、锂云母和绿柱石4种矿物光谱。 使用该方法提取矿物的光谱吸收参数, 并拟合光谱曲线,与原始光谱进行对比分析 ( 图3 )。从 图3a1-d1 可知, 使用特征光谱参数拟合的 光谱曲线与光谱曲线较为吻合 ,尤其是曲线中波峰区域拟合较好, 但曲线吸收谷的拟合效果较差,这对整体的影响较小 。因为曲线中的波谷区域对应原始光谱曲线中的反射峰,而我们关注的重点是原始光谱曲线中的波谷特征,在吸收光谱曲线中以波峰的形式表现。另外,通过 图3a2-d2 可以知道, 特征参数拟合的光谱与吸收光谱的整体拟合较好,R 2 均大于0.95, 能够较好地反映原始光谱的吸收特征。 表明本研究提出的光谱吸收特征 自动提取方法效果较好,能够定量化地描述光谱曲线吸收特征, 为定量化地了解光谱差异提供了快捷方便的方法, 同时也为分析光谱吸收特征与矿物及其组分之间的定量关系 提供了新的技术方法。

图3 光谱拟合吸收曲线及相关系数

a—锂辉石;b—锂电气石;c—锂云母;d—绿柱石;a1-d1—拟合曲线;a2-d2—回归系数。

           

3.2 锂铍矿物光谱特征分析
3.2.1 锂矿物光谱特征    
从USGS标准库中选择含锂矿物 (锂辉石、锂云母和锂电气石)光谱( 图4a )。从图中可以看出不同含锂矿物在0.4~2.5μm波段范围内的光谱反射率差异较大, 锂云母光谱平均反射率高于锂辉石和锂电气石,但在2.0~2.5μm短波红外范围内,反射率低于锂辉石而高于锂电气石 锂辉石光谱反射率总体较高 ,反射率值为0.5~0.8;2.0~2.5μm范围内,锂云母和锂电气石光谱反射率明显降低, 锂电气石具有多个吸收谷和反射峰,而锂辉石整体具有相对较高的反射率。
图4 锂矿物光谱
a—反射率光谱;b—包络线去除光谱。
           
为了更清晰地观测含锂矿物的特征光谱, 本研究对原始光谱进行包络线去除处理 ( 图4b )。 锂辉石包络线去除光谱在0.75~1.3μm具有一个宽的吸收带, 这可能是因为Fe 2+ 电子导致的 ;1.35~2.07μm范围内是包含3个吸收谷的吸收带 ,1.41和1.9μm具有尖锐的吸收谷,这可能与OH - 或水分子相关,1.49~1.85μm具有一个平缓而且宽的吸收谷;在2.2,2.35和2.44μm具有Al—OH和Fe—OH导致的吸收谷。 锂云母在0.4~2.5μm范围内具有多个显著吸收谷, 0.4~0.65和2.28~2.5μm范围内具有明显的双吸收谷, 前者可能与金属Fe和Cr相关 ,后者可能是Al—OH导致的。0.66~1.27μm具有较宽的吸收带。在1.35~1.5、1.86~2.05和2.06~2.28μm光谱区间内具有明显的尖锐吸收谷,且在2.06~2.14μm具有次级吸收谷。 锂电气石在0.4~2.5μm范围内具有多个吸收谷, 且在主吸收谷中包含多个次级吸收谷 ,如0.9~1.7μm区间为一个大的吸收谷,在1.012,1.25,1.317,1.43和1.473μm处是宽吸收谷内的尖锐吸收谷。2.09~2.5μm是第二个大吸收谷,包含2.188,2.253,2.306和2.385μm等4个尖锐吸收谷;0.44~0.61和0.62~0.82μm是两个小的吸收谷。在1.863,1.932和2.053μm具有尖锐小吸收谷。 总体而言, 3种含锂矿物在0.4~2.5μm范围内具有显著的吸收特征 ,且差异较大,具备可分性。    
为了对各类含锂矿物光谱特征进行定量化描述,本研究在包络线去除光谱的基础上 使用混合高斯模型提取光谱特征参数 ( 图6a-c )。 图6a-c 中可以看出3种矿物具有多个吸收特征,且吸收特征相差较大 。1.4和1.9μm附近3种矿物均具有吸收特征,吸收深度相差较大,吸收宽度相差较小,表明矿物均具有OH - 和水共同作用的吸收特征。 在2.2μm附近,3种矿物具有吸收特征, 吸收深度为锂电气石(0.429)>锂云母(0.321)>锂辉石(0.079) ,吸收宽度相差不大 。在2.35μm附近,锂电气石没有吸收特征,与锂辉石和锂云母具有明显的区分标志 。在1.315μm,锂电气石和锂云母均有吸收特征,锂辉石没有吸收特征, 据此可以区分锂辉石与锂云母和锂电气石 。锂电气石在此处吸收深度(0.146)明显高于锂云母的吸收深度(0.011), 可区分锂电气石和锂云母。

图5绿柱石矿物光谱

a—反射率光谱;b—包络线去除光谱。

           
               

图6 锂铍矿物光谱吸收特征参数

a—锂辉石;b—锂云母;c—锂电气石;d—绿柱石。            

3.2.2 铍矿物光谱特征
从USGS标准库中选择 绿柱石矿物光谱 ( 图5a )。从图中可以看出, 在0.5~0.95μm区间绿柱石的反射率相对较高, 1.49~1.75和2.0~2.3μm光谱区间的光谱变化较小,具有较高的反射率。 为了突显特征光谱位置,本研究对绿柱石原始光谱进行包络线去除 ( 图5b )。 图5b 可以明显地看出绿柱石具有显著的3个吸收谱带, 光谱范围分别为0.6~1.23、1.3~1.54和1.7~2.12μm。在0.6~1.23μm内具有两个吸收谷,主吸收谷波段在0.825μm,次级吸收谷波段在1.149μm。 1.3~1.54μm内具有3个吸收谷 ,1.402μm为主要吸收波段,在其两侧1.37和1.465μm分别具有一个次级吸收谷。 1.7~2.12μm具有两个吸收谷,在1.896μm具有尖锐且大的吸收 ,左侧1.836μm具有次级吸收谷。1.4和1.9μm的吸收带中主要吸收谷与矿物中水或羟基基团相关。
为了对绿柱石矿物光谱进行定量化描述 ,提取全波段光谱特征参数( 图6d )。从 图6d 中可以看出, 绿柱石的特征吸收主要表现在1.0~2.5μm(近红外-短波红外)区间,绿柱石具有3个明显的吸收特征 ,分别位于0.829,1.402和1.894μm,吸收深度分别为0.513,0.374和0.548。1.402和1.894μm的吸收可能与OH - 和水有关,0.829μm的吸收可能与Fe 2+ 有关。 绿柱石特征吸收位于1.144,1.373和1.459μm, 其吸收深度和吸收宽度分别为0.093和0.02、0.2和0.024以及0.13和0.02μm。在2.388μm具有弱的吸收特征,可能是Al-OH导致的。    
由此表明本文结合包络线去除和混合高斯模型构建 自动化提取光谱吸收特征效果较好, 该方法不需要人为设定参数 便可以提取曲线中的所有特征吸收参数,与以往针对某一个吸收特征需要初始设定起始和终止光谱范围信息的方法相比较, 该方法既方便,也不会因为光谱范围设定不合适导致特征参数不完整的现象 。此外,该方法也能够定量化地描述光谱曲线吸收特征,为了解光谱差异提供快捷方便的方法, 同时也为分析光谱吸收特征与矿物及其组分之间的定量关系 提供了新的技术方法。
3.3 光谱变换对矿物识别模型精度的影响
16种变换方法对光谱的增强效果不同( 图7 ), 包络线去除光谱能够很大程度上扩大吸收谷的位置信息 ( 图7a )。 图7b 是倒数光谱,与原始光谱表现形式相反, 即原来的“反射谷”转变成了“反射峰”, 很大程度上扩大了吸收位置的信息值, 与原始光谱的“反射峰”形成鲜明对比

图7 不同变换光谱

           

图7c 是原始光谱、指数光谱、对数光谱和幂次光谱图, 图7c 中可以看出除对数光谱之外,其余3种光谱非常相似 ,仅表现为数值的不同, 而对数光谱对数值小(吸收谷)的拉伸效果 明显优于对数值较大的拉伸。 图7d 为一阶导数光谱和二阶导数光谱,从中可以看出导数光谱在突出吸收位置的同时也削弱了基谱信息, 能够更大程度地突出吸收谷位置信息    
为了探讨不同光谱增强技术对模型精度的影响, 使用16种变换光谱输入ELM模型得到分类精度 ( 表1 )。从 表1 可以看出不同光谱变换取得的效果不同, 但整体效果较好,验证集精度均大于0.6,测试集精度均大于0.45 。使用原始光谱构建的模型在训练集、验证集和测试集中的精度分别为0.91,0.82和0.78。 指数光谱和幂次光谱构建的模型精度与原始光谱相近 。结合 图7c 可以看出,造成这种结果的原因可能是指数变换和幂次变换对原始光谱中特定波段的增强效果不够明显。 而倒数光谱和二阶导数光谱构建的模型精度明显降低 ,且二阶导数光谱构建的模型精度最低。 但对数变换和一阶导数变换能够明显地提高模型的精度 ,测试集精度分别高达0.82和0.83。结合能够提高模型精度的变换方法的组合光谱 可以取得更好的识别精度 。如对数-一阶导数光谱,其测试精度能够达到0.83, 相对于原始光谱提高了0.05左右 。结合 图7 表1 可知, 对数变换 是在不改变光谱性质的情况下,对数据进行压缩, 能够对低频噪声进行压缩,从而能够提高模型的精度 。以往大量研究表明导数变换可以在消除背景噪声的同时增强光谱特征, 从而突显光谱特征信息 。本研究发现基于一阶导数光谱构建的模型精度 明显优于二阶导数光谱,与以往研究结果相一致 。造成这种现象的原因可能是二阶导数虽然能更加突出光谱特征, 但对噪声也更加敏感,如在0.4~0.5和2.4~2.5μm两个波段区间, 噪声的存在导致二阶导数变换对这两个区间更敏感,进而降低了模型的精度。 另外,以往许多研究表明,没有一种变换方法能够实现对不同研究对象均取得理想的结果 。而本研究结果也表明恰当的光谱变换可以有效消除噪声在数据分析及应用中的影响, 从而对有用信息进行增强,进而提高模型的稳定性和准确性 。反之会增强背景信息,降低应用效果。 因此,在今后的研究中,应将研究重点放在突出光谱特征的光谱变换方法和提高光谱变换处理的效率方面

表1 不同变换光谱下ELM模型识别精度    

           
3.4 建模方法对识别模型精度的影响
为了探讨神经网络模型对矿物识别精度的影响, 本文将对数一阶导数光谱预处理成网络可接受的格式,并分别输入反向传播(BP)、极限学习机(ELM)和深度卷积神经网络(DCNN)模型, 而输入到MICA方法的数据为原始光谱数据,并对超参数进行调试 ,在BP模型(两个隐含层,激活函数softmax)、ELM(隐含层神经元个数78,relu激活函数)和DCNN(19层, 两个全连接层,softmax激活函数)的情况下取得最优结果 ( 表2 )。从 表2 可以看出, 神经网络模型明显优于相似度模型。 其中,卷积神经网络构建的模型效果最好,其次是ELM神经网络模型,接着是BP神经网络模型,最差的是MICA方法,总体精度和Kappa系数分别为0.78和0.72,0.73和0.65,0.55和0.42,0.496和0.431。 同时,研究发现ELM方法明显优于BP方法,导致这种结果的原因可能是ELM仅有一个隐含层 ,同时权重和偏置都是随机输入,并不需要多次迭代、反向传递得到, 从而避免了梯度消失而模型陷入局部最优的结果 。而BP方法需要多次正向、反向迭代更新每一层的权重和偏置,在误差反向传递中容易出现梯度消失,从而得不到最优解。 另外,我们发现DCNN明显优于BP和ELM,表明本文提出的将光谱曲线图像化 ,结合二维卷积网络中对图像特征信息提取的优势,通过不同的特征核自动得到不同的特征信息, 从而对矿物的识别具有较好的效果 。其次,之所以DCNN能够取得较好的效果, 主要是该模型在数字识别中已经取得了非常好的应用效果 ,仅对全连接层和输出层进行微调, 可以在样本数量不多的情况下取得较好的结果。

表2 不同方法精度比较

           
表2 表明 4种方法对花岗伟晶岩型锂铍矿物识别效果均较好,精度均大于0.5 。但MICA方法需要人机交互式的方法提取参考光谱的特征参数, 其结果的精度 依赖于特征提取和阈值设定的合理性 虽然BP方法和ELM方法 不需要人机交互式的方法提取光谱特征参数,但这种方法 需要大量的样品数量才能得到较好的效果 而DCNN方法 包含两个训练阶段, 一是预训练 ,使用VGG16去除全连接层和输出层之外的其余层获得多个潜在的特征信息,训练本文设定的全连接层和输出层, 只需要训练全连接层和输出层的特征参数,这不仅大大减少了模型复杂度,也提高了模型训练的速度 二是对所有层进行训练,从而得到了较理想的训练结果 。该方法能够在VGG16模型参数的基础上通过较少的改动取得较好的效果。 如果直接使用VGG16模型,会因为研究对象不同(数字和曲线)导致结果较差 。为此,迁移学习在样本数据较少时也能取得较好的应用效果。
4   结论    
本研究探讨了高光谱技术在花岗伟晶岩型锂铍矿物方面的识别潜力,并探讨了特征吸收参数、光谱值和光谱曲线3种数据形式,以及光谱相似度和神经网络两种方法在锂铍矿物识别方面的潜力。 主要研究结论如下
(1)本文提出的自动提取光谱吸收特征参数方法效果较好 ,能够避免人为因素, 有助于定量化地理解地物光谱及其与其他光谱的差异
(2)锂铍矿物在0.4~2.5μm范围内具有规律性的吸收特征 ,且矿物之间具备可区分的吸收特征, 为矿物识别模型的构建提供了理论基础
(3)相对于原始光谱,变换光谱能够在一定程度上提高模型的识别精度, 组合变换能够综合不同变换方法的优势, 从而提高模型的精度。
(4)迁移学习能够在样本数量较少的时候取得较好的效果, 而深度卷积网络相比于浅层神经网络, 因其能够提取更多深层次特征,从而能够取得更好的识别效果。
-----END-----

原文来源: 蒋果,周可法,王金林,白泳,孙国庆,汪玮. 基于深度学习的花岗伟晶岩型锂铍矿物识别研究[J]. 地学前缘,2023,30(5):185-196 DOI: 10.13745/j.esf.sf.2023.5.20

导读评论和排版整理等 《覆盖区找矿》公众号.
推荐读者下载、阅读和引用原文!
------------往期 精彩 回顾-------------
  1. 智能物探技术的过去、现在与未来
  2. 岩矿高光谱遥感原理、方法、进展及青藏高原应用前景
  3. 智能地质调查:喜马拉雅淡色花岗岩多源数据融合识别方法

------ 关注 “覆盖区找矿”,拥有更多新方法 ------

宣讲 成果 助力 转化 激励 创新

版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。
相关推荐