大数跨境

【高光谱应用专栏】基于随机森林分类法的陕西省林地提取

【高光谱应用专栏】基于随机森林分类法的陕西省林地提取 中科西光航天
2024-08-23
2

点击蓝字关注

中科西光航天

 ✦ @Xiopm SPACE  ✦

XIOPM SPACE

2024.8.23

随着空间遥感技术地不断发展,获取遥感数据的空间分辨率和光谱分辨率不断提升,高光谱图像能够获取地表物体上百个连续谱段的光谱信息,其光谱范围包含着紫外、可见光、近红外及中红外等波段,具有较高的光谱分辨率。利用高光谱数据图谱合一且波段覆盖范围广的特性,能够大大地提高其地物类别的分辨识别能,使得高光谱遥感技术被广泛地应用到精细化农业、军事、环境监控等方面。

高光谱图像分类是对图像中的每一个像素样本进行分门别类。机器学习的高光谱图像分类方法根据是否需要引入先验类别的训练样本,主要可分为无监督学习方法和监督学习方法。

在监督学习中,随机森林算法是一种基于分治法原理的集成学习算法,因分类精度高,训练和预测速度快,可以处理高维数据等诸多的优点,它在遥感领域分类应用十分的广泛。其在原始训练样本中通过bootstrapping方法随机有放回抽取n个样本,构成训练样本集, 每个训练样本集可构造一个决策树模型, 这样可生成n颗决策树模型。在每颗决策树的分裂节点处随机选取m个特征变量作为预测变量,根据节点不纯度最小原则来选取最优的特征变量作为该分裂节点的分裂特征,直到每个分裂节点不纯度最小时决策树停止生长。生成所有决策树后,用投票的方法对所有决策树的分类结果进行综合,得出最终结果。森林中每一棵树都依赖于一个随机向量,森林中的所有向量都是独立分布的。随机森林的预测精度与单个树的强度和树间的相关性有关。

  ●  ●  ●  ●  ●  ●  ● 

应用随机森林模型分类器需要设定2个关键参数: ①生成树个数(number-of-trees),该值决定了随机森林总体规模。取值一般在100~10 000之间,值越大模型越收敛,模型运行时间增加,且当树的个数不断增加时,模型会出现过饱和现象。② 随机抽取最大特征数(max-features),该值表示生成每一棵决策树时从特征空间中随机抽取特征的最大数,该值越大模型中每棵决策树强度越大,但决策树间相关性也增大。因此,max-features需根据误差率来调优,以达到一定精度。

本次利用收集的高光谱卫星序列图像,结合中国陆地使用/覆盖数据集(CLUDs)和高分辨率图像的人工解译,收集了大量的训练样本。使用随机森林分类器和时间序列特征,生成树个数取200,对陕西省的林地覆盖进行了分类。


根据光谱、光谱指数、气候和地理位置计算随机森林分类器的输入特征。首先,基于目标年内所有可用的地表反射率数据,计算了包括Red、Green、Blue、NIR、SWIR1、SWIIR2等12个光谱,以提高地表覆盖区分能力。此外,为了更好地区分植被和非植被以及水体,将反射率影像对应于最大NDVI(归一化差异植被指数)、MNDWI(修正的归一化差异水指数)、NDBI(归一化差异建成指数)的光谱值包括在光谱特征中。考虑到陆地覆盖类型与地形和地理位置的相关性,采用 Shuttle Radar Topography Mission(SRTM)的坡度和坡向数据,以及每个像素的地理坐标(纬度和经度)作为地理特征。这些特征选择可以减少输入特征的维度,同时保留时间信息,以及最大限度地减少云,阴影或其他干扰的影响。

基于以上分类特征,采用随机森林分类方法对陕西省林地覆盖进行分类提取,得到2016年、2019年、2021年、2022年陕西省林地覆盖分布图。

  ●  ●  ●  ●  ●  ●  ● 


编辑:刘晶

转载请注明出处

XIOPM  SPACE



中科西光航天

西安中科西光航天科技有限公司



MAIN BUSINESS

星座规划 卫星整星

卫星应用 数据开发



CONTACT US


TEL

029-85934757   029-38012090


ADD

陕西省西咸新区空港新城商务中心二期4号楼5层

西安市航天基地神舟三路532号十一科技西北大厦



【声明】内容源于网络
0
0
中科西光航天
国内唯一一家全自主研发高光谱卫星的商业航天公司
内容 1
粉丝 0
中科西光航天 国内唯一一家全自主研发高光谱卫星的商业航天公司
总阅读0
粉丝0
内容1