基于决策树的土地分类方法案例研究

  • 格式:doc
  • 大小:27.00 KB
  • 文档页数:6

下载文档原格式

  / 6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于决策树的土地分类方法案例研究

摘要:以鲁中地区为例,利用卫星遥感影像数据,探讨了基于决策树算法的土地分类方法,结果表明,基于决策树算法的土地分类方法可以自动生成分类规则,效率高,周期短,对于当前大面积土地综合利用的研究具有重要意义。

关键词:决策树鲁中地区土地覆被

土地利用的变化,反映的是人类为满足社会经济发展需要,不断调配各种土地利用的过程。因此土地利用/覆被变化(LUCC)研究一直是全球土地研究的重点内容[1]。随着社会发展进程的不断加快,传统的实地调查和定位观测已经跟不上土地资源变化的节奏。通用做法是利用遥感(RS)和地理信息系统(GIS)相结合的方法进行分析处理,而对大范围地域的土地覆被分析需要大量的遥感数据及辅助数据的处理、集成、解译过程[2],因此对高效率、高精度的遥感自动分类算法的需求非常迫切。近年来,机器学习算法由于其在效率和分类精度的优势开始取代传统的监督和非监督算法[3]。

决策树算法和人工神经网络是机器学习算法中比较典型的算法,他们在利用遥感图像对土地覆被分类中各有特点:决策树算法在分类规则上速度较快,而人工神经网络算法的精度较高[4]。本文通过利用C5.0决策树算法对鲁中地区的土地覆被进行了分析研究,在数据的处理方面选择了原始波段数据、纹理数据、非监督分类数据作为决

策树算法的原始数据,选择了2071个样本点,对样本点进行分类学习,之后学习得到的分类规则对整个研究区进行分类

1 研究区概况

鲁中地区,面积大约6.5万平方公里,整个地区南低北高,西侧为鲁西北平原,东侧为潍、沐河谷底和漫长海岸,北临莱州湾,南面与苏北平原接壤,省内四分之三的山地以近圆形集中于该区,属于一种典型的中尺度地形,具有特殊的研究价值。鲁中地区主要包含济南、淄博、东营、泰安、莱芜五个城市,随着城市发展步伐的加快,城市土地利用格局也随之发生很大变化。

2 数据获取预处理

在数据源的处理上,由于传统的监督、非监督分类方法在数据的选择上只能是原始波段数据和通过波段运算后获取的特征数据,还可以包干GIS数据及经过非监督分类后的初始数据等。本文选择了2013年鲁中地区30m分辨率ETM影像,时间为5月20号,ETM影像共有8个波段,包含可见光波段1-5、7,全色波段8,两个近红红外波段6-1,6-2,本文只研究了可见光波段,通过这些波段,将原始波段的DN值转化成地物的表观反射率数据。

本文采用均值、方差、均匀比、对比度、非相似度、熵、角二阶矩、相关度等八个特征作为统计量。对于非监督分类数据,采用在多光谱图像中搜索自然相似光谱,请将其分类组成的数据集群。

3 分析方法

3.1 工作流程

C5.0算法对地面覆被的分类主要分两个步骤:一是通过机器学习生成决策树,并建立相应的决策规则;二是决策规则对遥感影像图进行覆被分类。本文通过See5.0软件生成分类规则,之后利用NLCD 制图工具,利用分类规则对鲁中地区进行了覆被分类。其流程如图1所示。

3.2 波段组合与变量选择

遥感图像中有5个原始波段数据,波段合成的步骤是将5个原始波段数据与8个纹理波段、非监督分类数据进行波段合成,而后对合成波段进行采样,本身决策树算法的输入参数可以有DEM、坡度、坡向、地温土壤类型等等,但由于鲁中地区处于平原地区,坡度、坡向等数据对结果影响不大,因此没有使用。

3.3 土地分类与样本采集

鲁中地区的地形分类,主要包括耕地、林地、建设用地、水域。另外,由于鲁中地区地处平原,交通道路比较发达,因此,道路在分

类中也可作为一项分类标示进行分类;水域包含河流、湖泊,但是鲁中地区水域有个需要重点关注的点是黄河水域的光谱特征有异于湖泊的光谱特征;鲁中地区草地面积较少,且特征不明显,与林地不好区分,因此,将两者归为一类。在对地物覆被采样时,样本点的分布要均匀。

3.4 决策规则的构建

决策树算法自从被提出,到如今已经涌现出很多决策树的机器学习算法。本文采用的是Quinlan的C5.0决策树算法,该算法是在C4.5基础上的改进算法。该算法用两种修剪方法来构建决策树,一种是前剪枝,一种是后剪枝。它比C4.5的运算速度更快,树的结构更简单。当前See5.0软件中集成了C5.0算法,本文决策树学习将样本点作为输入数据,得到决策规则,决策树是有多条决策规则形成的树状决策规则的集合,由于机器学习的决策规则较多,决策树结构会比较庞大,所以本文无法用图形方式将决策树展现。

4 分类结果及精度评价

4.1 覆被分类

本文对影像图土地覆被的分类采用了NLCD制图工具,该工具集成了C5.0算法,可以读入See5.0软件的分类规则,而后运用规则对影像图进行分类,分类结果如图2所示。

4.2 精度分析

在土地覆被分类过程后,通常对分类结果进行精度分析,分类精度从一定程度上反映了分类模式的科学性和有效性,通过精度分析,可以对分类模式进行改进,进而进一步提高分类精度。本文通过对影像图进行解译,随机选取了2071个像元点构建混淆矩阵,通过混淆矩阵方法对分类精度进行了评价,结果如表1所示。

由分析结果可以看出,分析精度较高的是水域、林地和耕地,分精度较低的是道路,道路分类精度低的原因是在30M分辨率的遥感影像中,道路的光谱特征不明显,与其周围的覆被不好区分,因此造成样本像元点混淆较多,因此误差较大。对于道路的测算,需要更高精度的影像图来进行分类。

5 结论

本文利用决策树算法对鲁中地区的土地覆被进行了分类探索,研究通过手工采取样本点,而后利用决策树C5.0算法对样本进行学习,并生成分类规则,而后利用分类规则对样本进行了分类。通过研究,得出以下结论:

与传统的方法相比,决策树算法可以不用手工制定分类规则,算法可以通过机器学习,自动生成分类规则,效率高,周期短,对于当前大面积土地综合利用的研究具有重要意义。但该方法也有其不足之处:决策树算法对于样本的选取依赖性强,不同的样本点,在同一幅