分类与回归树及其应用研究_温小霓
- 格式:pdf
- 大小:164.76 KB
- 文档页数:3
信息可视化技术的分类研究
杨峰;李蔚
【期刊名称】《图书与情报》
【年(卷),期】2007(000)003
【摘要】信息可视化是情报学中快速发展的新领域.对其技术或系统进行分类有助于理解信息可视化.文章首先总结了早期一些分类的思想和方案,从可视化对象的不同层次出发,提出了新的分类方法,并总结了该分类的优点.
【总页数】5页(P81-85)
【作者】杨峰;李蔚
【作者单位】广东商学院广东省电子商务市场应用技术重点实验室,广东广
州,510320;广东商学院图书馆,广东广州,510320
【正文语种】中文
【中图分类】TP391;G354
【相关文献】
1.面向对象技术在管理信息可视化分类研究中的应用 [J], 张伟;王学义;马维宁
2.遥感信息专题分类不确定性的可视化研究 [J], 阿依姑丽·托合提;瓦哈甫·哈力克;玛依拉·麦麦提艾力
3.基于信息可视化技术的地理空间元数据可视化研究 [J], 徐少坤;宋国民;王海葳;陈令羽
4.专题地图量化信息图形可视化数学基础分类体系研究 [J], 张军海;胡文亮
5.可视化商品信息分类研究 [J], 余小鹏
因版权原因,仅展示原文概要,查看原文内容请购买。
我国科技型中小企业信用风险评价模型——基于MLP神经网络的实证分析温小霓;韩鑫蕊【摘要】针对科技型中小企业,首先建立了一个多层次的信用风险评价指标体系,并利用t检验和因子分析对指标体系进行简化和降维,然后在此基础上构建基于MLP 神经网络的科技型中小企业信用风险评价模型.最后,以中小企业板的66家科技型上市公司作为研究样本进行实证分析,检验结果表明,本文建立的针对于科技型中小企业的信用风险评价模型具有较高的准确率.【期刊名称】《科技和产业》【年(卷),期】2017(017)012【总页数】8页(P159-166)【关键词】科技金融;神经网络;信用风险;评估模型【作者】温小霓;韩鑫蕊【作者单位】西安电子科技大学经济与管理学院 ,西安710126;西安电子科技大学经济与管理学院 ,西安710126【正文语种】中文【中图分类】F276.44随着信息技术的高速发展和大数据时代的到来,我国越来越重视科学与技术的创新和发展,科技型中小企业作为创新的微观载体和实体经济的中坚力量发挥着越来越显著的作用。
在科技型企业成长的过程中,金融支持扮演着不可或缺的角色,国际华人科技工商协会主席李大西曾表示,“科技是第一生产力,金融是第一推动力”,足以见得科技创新与金融创新的深度融合是推动技术进步与经济增长的重要引擎。
目前,很多地区都在践行着这一理念,各级政府也在扶植科技型企业方面发挥着积极的引导作用,付诸了切实的努力,如鼓励创建孵化器、设立技术创新基金以及提供政策支持、减税补贴等等。
然而,对于企业最根本的信贷、融资问题却一直没有得到很好地解决。
出现这种困境,一方面是因为其投资风险普遍高于传统企业,具体表现为:研发周期长、轻资产运营、缺乏抵押物、信贷记录少,且市场对于新开发的技术和产品是否认同和接纳存在很大不确定性,这违背了银行谨慎性经营的原则,降低了金融机构为其提供贷款的积极性。
另一方面是因为我国科技金融的发展起步较晚,在风险识别、度量等方面仍以经验分析为主,主观性较强,并且金融机构对科技型企业进行贷款审查时,仍参照传统企业的信用风险评价标准,不能客观公正的反应科技型企业真实的信用状况。
可可的新分类系统
佚名
【期刊名称】《《世界热带农业信息》》
【年(卷),期】2009(000)006
【摘要】经过空前的、全面的研究,新筛选计划提出使用10个可可形态组(包含1200个个体),由法国国际农艺发展研究中心(CIRAD)联合执行。
该计划还集中了世界性的科研队伍,包括美国、法国、巴西和厄瓜多尔的研究人员。
【总页数】2页(P25-26)
【正文语种】中文
【中图分类】TU528.31
【相关文献】
1.慢性胃炎的新分类——悉尼系统与改订悉尼系统 [J], 杉山敏郎
2.中国苦苣苔科植物中王文采旧分类系统与Weber新分类系统的名实更替 [J], 符龙飞;黎舒;辛子兵;温放;韦毅刚
3.2018牙周病和植体周病国际新分类——牙周炎分期分级疾病定义系统临床应用体会 [J], 束蓉; 倪靖
4.刍议APG新分类系统在"树木学"教学中的应用 [J], 李蒙;段一凡;伊贤贵;王贤荣
5.六足总纲系统发育研究进展与新分类系统 [J], 袁锋;袁向群
因版权原因,仅展示原文概要,查看原文内容请购买。
近二十年来植物分类学的进展
徐炳声
【期刊名称】《《植物科学学报》》
【年(卷),期】1987(000)001
【摘要】过去近二十年中,可以看到在植物分类学和系统学领域里,异常丰硕的成果和各种不同形式的活动。
这些年在宏观系统学(macrosystematics)方面所获得的新资料和新的研究方法,充分说明这一领域的进展是令人鼓舞的。
本文主要以Heywood的近著《植物分类学当前的景象》为蓝本,对这一领域的新发展和新动向作一简要回顾。
【总页数】16页(P77-92)
【作者】徐炳声
【作者单位】复旦大学生物系上海
【正文语种】中文
【中图分类】G6
【相关文献】
1.莎草属植物分类学研究进展 [J], 田雪芬
2.润楠属植物分类学研究进展 [J], 钟义;程欢;邓雄;彭晓春;白中炎;陈志良;钟志强
3.近二十年来植物分类学的进展 [J], 徐炳声
4.铁线莲属植物分类学及园艺学研究进展 [J], 张燕;黎斌;李思锋
5.蜘蛛抱蛋属植物分类学研究进展 [J], 刘安莉;吕定豪;王霞;叶新;封帆;曾真;何顺志
因版权原因,仅展示原文概要,查看原文内容请购买。
基于迁移学习和逻辑回归模型的花卉分类研究
陈卫国;莫胜撼
【期刊名称】《南方农机》
【年(卷),期】2024(55)1
【摘要】【目的】不同种花卉之间的相似性以及同种花卉内部的多变性加大了花卉图像分类难度,其难点是要人工设计出能充分体现花卉颜色、形状和花瓣形态等特征的特征提取方法。
传统的花卉图像分类方法的精度不高且模型的泛化能力较差,这些问题亟待解决。
【方法】课题组提出一种基于数据增强的VGG16迁移学习卷积神经网络提取花卉图像特征,再训练多类逻辑回归模型的花卉图像分类识别方法;并且通过在flowers17和flowers102花卉数据集上进行测试,来验证课题组所提出的花卉分类识别方法的有效性。
【结果】课题组所提出的花卉分类识别方法在flowers17和flowers102数据集中分别达到了97.89%和92.10%的分类精度,高于现有其他花卉图像分类方法。
【结论】通过预训练的深度人工神经网络提取的高区分度的花卉图像特征,优于人工设定的花卉图像特征,能训练出更高效精准的花卉识别分类器。
基于本研究内容,下一步可对VGG16网络进行降维改进,让模型参数减少,从而实现快速实时应用。
【总页数】6页(P139-143)
【作者】陈卫国;莫胜撼
【作者单位】广西机电职业技术学院电气工程学院
【正文语种】中文
【中图分类】TP391.4;S126
【相关文献】
1.基于显著性检测和迁移学习的花卉图像分类
2.基于卷积神经网络和迁移学习的花卉图像分类
3.欧盟内选民赞成脱欧的动机分析——基于政党分类与逻辑回归模型的实证分析
4.一种基于逻辑回归的柴油机工况分类模型
因版权原因,仅展示原文概要,查看原文内容请购买。
第52卷第3期东㊀北㊀林㊀业㊀大㊀学㊀学㊀报Vol.52No.32024年3月JOURNALOFNORTHEASTFORESTRYUNIVERSITYMar.20241)国家自然科学基金项目(42161057)㊂第一作者简介:王洁,女,1999年10月生,江西理工大学土木与测绘工程学院,硕士研究生㊂E-mail:187****9219@163.com㊂通信作者:李恒凯,江西理工大学土木与测绘工程学院,教授㊂E-mail:giskai@126.com㊂收稿日期:2023年10月11日㊂责任编辑:王广建㊂应用多时序特征的哨兵系列影像对南方丘陵区树种识别1)王洁㊀李恒凯龙北平张建莹(江西理工大学,赣州,341000)㊀(江西省煤田地质局测绘大队)㊀(江西理工大学)㊀㊀摘㊀要㊀树种分类是森林资源调查和监测的重要工作,杉木和油茶作为袁州区主要经济树种,准确获取树种空间分布信息,对产量估算和资源管理具有重要意义㊂以江西省宜春市袁州区为研究区,试验融合时序哨兵-1(Sentinel-1)㊁哨兵-2(Sentinel-2)等数据,结合中国南方丘陵区树种特点,提取植被指数㊁红边植被指数㊁地形特征和纹理特征等构建特征变量组合,分别利用分离阈值法(SEaTH)和特征权重算法(ReliefF)进行特征重要性排序和特征优选,分析各特征对树种分类的影响㊂结果表明:①在使用光谱特征和植被-水体指数的基础上加入不同特征后,树种分类精度均有提升,其中纹理特征的加入更有利于树种分类㊂②结合随机森林算法和特征权重算法(ReliefF)对树种分类的精度最高,总体精度为85.33%,Kappa系数为0.81,优于相同特征组下的支持向量机算法和分类回归树算法㊂关键词㊀树种分类;哨兵-1;哨兵-2;特征优选;随机森林;中国南方丘陵分类号㊀S771TreeSpeciesIdentificationinSouthernHillyAreasUsingSentinelSeriesImageswithMulti⁃TemporalFeatures//WangJie,LiHengkai(JiangxiUniversityofScienceandTechnology,Ganzhou341000,P.R.China);LongBeiping(JiangxiProvincialCoalGeologyBureauofSurveyingandMappingBrigade);ZhangJianying(JiangxiUniversityofSci⁃enceandTechnology)//JournalofNortheastForestryUniversity,2024,52(3):60-68.Treespeciesclassificationisanimportanttaskinforestresourceinvestigationandmonitoring.IntheYuanzhouregion,Chinesefirandcamelliaoiltreestandoutastheprimaryeconomictreespecies.Accuratelyobtainingspatialdistributionin⁃formationoftreespeciesisofgreatsignificanceforyieldestimationandresourcemanagement.TakingthestudyareaofYuanzhouDistrict,YichunCity,JiangxiProvince,theexperimentfusedthedataoftime-seriesSentinel-1(Sentinel-1)andSentinel-2(Sentinel-2),andcombinedwiththecharacteristicsofthetreespeciesinthesouthernhillyareasofChi⁃na,andextractedthevegetationindices,thered⁃edgevegetationindexes,thetopographicfeaturesandthetexturalfeaturestoconstructthecombinationsofthecharacteristicvariables.Thefeatureimportancerankingandfeatureselectionwereper⁃formedusingtheSEaTHmethodandtheReliefFalgorithm,respectively.Theimpactofeachfeatureontreespeciesclassi⁃ficationwasanalyzed.Theresultsshowedthat:(1)Theadditionofdifferentfeaturesimprovedtheaccuracyoftreespeciesclassificationonthebasisofspectralfeaturesandvegetation⁃waterindex,withtexturefeaturesbeingmorebeneficialfortreespeciesclassification.(2)ThecombinationofRandomForestalgorithmandReliefFalgorithmachievedthehighestac⁃curacyintreespeciesclassification,withanoverallaccuracyof85.33%andaKappacoefficientof0.81,outperformingSupportVectorMachinealgorithmandClassificationandRegressionTreealgorithmwiththesamefeatureset.Keywords㊀Treespeciesclassification;Sentinel-1;Sentinel-2;Featureoptimization;Randomforest;Chinasouth⁃ernhills㊀㊀森林生态系统变化的长期调查监测与评价是实现经济㊁社会与环境和谐快速发展的保障[1]㊂中国南方丘陵地区位于秦岭-淮河以南㊁青藏高原以东的山地和丘陵分布区,区域内森林资源丰富,植被覆盖面积广㊁林分结构复杂㊁地形破碎,传统的森林资源调查方法成本高㊁周期长㊂通过遥感影像能快速㊁准确地进行树种识别和分类,已有多种类型遥感影像应用于树种识别和监测[2-5]㊂利用时序遥感影像提取和分析植被物候信息,能够准确的反映植被生长过程中明显的季节周期性变化,进而提升树种分类的效果[6-7]㊂近年来,欧洲空间局(ESA)哥白尼计划发布的哨兵-2(Sentinel-2)时间序列影像数据,为树种分类提供了具有高空间分辨率的数据源㊂其红边㊁近红外和短波红外等波段提供了多种光谱信息,在树种识别研究中具有巨大潜力[8]㊂然而,在大尺度多云雨的南方丘陵地区,光学影像数据的获取极易受到限制㊂合成孔径雷达(SAR)具有全天时㊁全天候等特点,雷达后向散射系数能够提供不同于光学影像的信息,包括植被的含水量㊁土壤含水量以及地表的几何特征等,广泛用于植被监测及分类㊂杨丹等[9]利用时序哨兵-1(Sentinel-1)数据和深度循环网络方法对植被进行分类制图,总体精度为82%㊂为了提高树种分类精度,将光谱数据和其它数据相结合,发现对树冠形状不同的树种,纹理特征具有重要作用[10]㊂不同空间分布的树种的地形特征也有所不同,地形特征对地形复杂区域树种的提取也具有重要作用[11]㊂黄翀等[12]利用Sentinel-2和Sentinel-1对人工林进行分类,总体精度为85%,验证了纹理特征㊁后向散射特征在树种精细分类上的能力㊂Maetal.[13]通过实验证明地形特征能提高树种提取精度㊂因此,利用雷达㊁光学影像数据和地形数据提取不同树种特征,可实现多源遥感互补[14]㊂除影像数据外,算法也是影响树种分类精度的重要因素,遥感数据和机器学习的结合已成为树种分类的主要方法㊂Wangetal.[15]使用随机森林(RF)算法结合多时相㊁多特征Sentinel-2数据对长白山树种进行分类,总体精度为99.79%;Huetal.[16]采用支持向量比(SVM)算法应用多源遥感数据对树种进行分类,总体精度为89%;Chenetal.[17]采用决策树算法(CART)和QuickBird图像进行树种分类,总体精度为80.50%㊂表明随机森林算法(RF)㊁支持向量机算法(SVM)㊁决策树算法(CART)等机器学习算法均可以用于树种分类㊂本研究以江西省宜春市袁州区为例,结合研究区林地实地调查数据,将时序Sentinel-1㊁Sentinel-2和数字高程模型(DEM)数据相结合,提取不同树种特征,利用分离阈值法(SEaTH)和特征权重算法(ReliefF)进行特征优选,通过RF㊁SVM和CART分类算法进行对比分析,构建适用于南方丘陵山地的最佳树种分类算法模型,并验证多源数据相结合对大范围树种分类提取的可行性㊂分析适合南方丘陵地区树种分类的最佳特征因子组合,提取不同树种的空间分布信息,提高森林资源调查和监测的时效性㊂1㊀研究区概况袁州区位于中国江西省宜春市西南部,地理坐标位于113ʎ54ᶄ 114ʎ37ᶄE㊁27ʎ33ᶄ 28ʎ5ᶄN,土地总面积2532km2㊂区域内地貌以山地㊁丘陵为主,地势西高东低,是典型的南方丘陵区㊂气候属亚热带季风湿润性气候,森林资源丰富,植被物种多种多样,森林覆盖率达60.15%㊂袁州区主要树种为杉木(Cunninghamialanceolata)㊁油茶(Camelliaoleif⁃era)㊁松树(Pinus)等㊂其中,杉木㊁松树和桉树(Eu⁃calyptus)并称为中国南方三大用材树种,具有较高的经济价值㊂油茶产业是袁州区的特色优势产业,其产量和面积均位于中国前列㊂根据袁州区林地实地调查数据提取边界,划分区域总面积为2221.5km2(见图1)㊂本研究采用的行政区划数据来源于全国地理信息资源目录服务系统(https://www.webmap.cn)㊂2㊀研究方法2.1㊀数据来源与处理本研究所使用的Sentinel系列数据来源哥白尼开放存取中心(https://scihub.copernicus.eu/),Sen⁃tinel-1为干涉宽幅模式(IW)的地距多视产品(GRD),分辨率为10m,极化方式为VV+VH㊂Sen⁃tinel-2拥有13个不同空间分辨率的光谱波段,试验选取10m和20m空间分辨率波段共10个㊂数字高程模型(DEM)数据下载于地理空间数据云平台(http://www.gscloud.cn)㊂影像数据采集时间见表1,研究所使用的Sentinel-2影像波段信息见表2㊂图1㊀研究区地理位置表1㊀影像数据采集时间表月份哨兵-1哨兵-21月2019-01-08㊁2019-01-20-2月2019-02-01㊁2019-02-13-3月2019-03-09㊁2019-03-21-4月2019-04-02㊁2019-04-14-5月2019-05-08㊁2019-05-20-6月2019-06-01㊁2019-06-13-7月2019-07-07㊁2019-07-19-8月2019-08-12㊁2019-08-24-9月2019-09-05㊁2019-09-172019-09-2210月2019-10-11㊁2019-10-232019-10-0211月2019-11-04㊁2019-11-162019-11-0112月2019-12-10㊁2019-12-222019-12-06表2㊀本研究使用的哨兵-2波段信息波段中心波长/nm分辨率/mB2(蓝光波段)㊀49010B3(绿光波段)56010B4(红光波段)66510B5(红边波段1)70520B6(红边波段2)74020B7(红边波段3)78320B8(近红外波段)84210B8a(狭窄近红外波段)86520B11(短波红外1)161020B12(短波红外2)219020㊀㊀Sentinel-1数据通过轨道校正㊁热噪声去除㊁辐射定标㊁滤波㊁地形校正和分贝化处理将其转化为后向散射系数图,最后进行裁剪得到研究区雷达影像㊂16第3期㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀王洁,等:应用多时序特征的哨兵系列影像对南方丘陵区树种识别Sentinel-2数据通过大气校正,将其从L1C级数据转化为L2A级别数据,剔除60m分辨率波段后,将20m分辨率波段重采样至10m分辨率,最后进行裁剪拼接㊂DEM数据经过拼接裁剪后重采样至10m分辨率,并生成地形因子㊂样本点数据来源于2019年袁州区林地实地调查数据㊂根据研究区植被覆盖情况,确定分类类别为油茶㊁杉木㊁松树㊁其它树种㊁耕地㊁裸地㊁水体和建设用地等8类㊂根据林地调查图生成油茶㊁杉木㊁松树和其它树种等4类样本随机点,然后通过谷歌地图(GoogleEarth)高分辨率影像和实地调查数据剔除异常点㊂通过目视解译得到耕地㊁裸地㊁水体和建设用地等4类样本㊂最后得到油茶样本2710个㊁杉木样本3184个㊁松树样本810个㊁其它树种样本2873个㊁耕地样本658个㊁裸地样本177个㊁水体样本128个㊁建设用地样本321个,按照7ʒ3的比例随机分为训练样本和验证样本㊂利用预处理后的Sentinel-1㊁Sentinel-2和DEM数据提取不同特征㊂在光谱特征㊁水体指数和植被指数的基础上,通过不同的特征组合,构建多特征随机森林树种分类模型,然后分别利用分离阈值法和特征权重算法(ReliefF)进行特征优选,筛选出最佳分类特征组合,然后与SVM和CART分类算法进行对比分析㊂利用混淆矩阵评估3种算法分类结果,选择最优树种分类模型(见图2)㊂图2㊀技术路线与特征变量组合方案信息2.2㊀树种分类特征提取选取Sentinel-2影像的B2(蓝光)㊁B3(绿光)㊁B4(红光)㊁B5(红边1)㊁B6(红边2)㊁B7(红边3)㊁B8(近红外)㊁B8a(狭窄近红外)㊁B11(短波红外1)㊁B12(短波红外2)波段作为研究波段,并提取水体指数㊁植被指数和红边指数(见表3)㊂采用灰度共生矩阵(GLCM)提取纹理特征(均值㊁方差㊁同质性㊁对比度㊁差异性㊁熵㊁二阶矩和相关性),为了避免数据冗余,首先对Sentinel-2数据进行主成分分析,提取第一主成分数据,根据第一主成分进行纹理特征提取㊂利用DEM数据提取高程㊁坡度㊁坡向作为地形特征㊂根据Sentinel-1雷达数据提取后采用VV和VH双极化方式的后向散射系数(后向散射系数VV㊁后向散射系数VH)作为雷达特征㊂共获取适应南方丘陵山区的35类特征变量[18]㊂2.3㊀树种分类特征优选综合利用多种特征分类,能够充分利用遥感数据信息,提高树种提取精度㊂但相关性较弱的特征在分类时会造成特征冗余,导致分类精度的降低㊂特征优选的原则是在确保分类精度的前提下使用较26㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀东㊀北㊀林㊀业㊀大㊀学㊀学㊀报㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第52卷少的特征子集,对特征集进行特征优选能够有效提升分类效率㊂表3㊀各特征变量及表达式特征类型特征变量特征变量的表达式光谱特征光谱波段B2(蓝光)㊁B3(绿光)㊁B4(红光)㊁B8(近红外)㊁B8a(狭窄近红外)㊁B11(短波红外1)㊁B12(短波红外2)植被指数比值植被指数(IRVI)IRVI=B8a/B4归一化植被指数(INDVI)INDVI=(B8a-B4)(B8a+B4)绿通道植被指数(IGNDVI)IGNDVI=(B8a-B3)/(B8a+B3)植被差异指数(IDVI)IDVI=B8-B4改良版土壤调整植被指数(IMSAVI)IMSAVI=((2B8a+1)-(2B8a+1)2-8(B8a-B4))/2水体指数归一化水体指数(INDWI)INDWI=(B3-B8a)/(B3+B8a)改进归一化水体指数(IMNDWI)IMNDVI=(B3-B11)/(B3+B11)多波段水体指数(IMBWI)IMBWI=2B3-B4-B8a-B11-B12红边特征红边波段(B)B5(红边1)㊁B6(红边2)㊁B7(红边3)红边归一化植被指数(IRNDVI)IRNDVI=(B5-B4)/(B5+B4)红边近红外归一化植被指数(IREDNDVI)IREDNDVI=(B8a-B5)/(B8a+B5)改良红边土壤调整植被指数(IMSRre)IMRre=((B8a/B5)-1)/(B8a/B5)+1红边叶绿素指数(ICIre)ICIre=(B8a/B5)-12.3.1㊀分离阈值法的特征优选分离阈值法(SEaTH)采用贾弗里斯松下距离(JM)[19]对类间可分性进行分析,并确定最佳特征组合㊂JM距离的计算公式如下:㊀㊀B=18(m1-m2)22σ21+σ22+12ln(σ21+σ222σ1σ2);㊀㊀J=2(1-e-B)㊂式中:m1和m2分别为两个类别的特征均值;σ1和σ2分别为两类别特征值的标准差;B为巴氏距离;J为样本间的分离度,J值范围为[0,2],数值越大,代表类间可分性越好㊂2.3.2㊀ReliefF算法的特征优选Kiraetal.[20]提出的特征权重算法(Relief)通过赋予每个特征的权重判断特征的重要性,但特征权重算法只适用于二分类的特征选择㊂Kononenko[21]在其基础上提出了多类特征选择的ReliefF特征权重算法,特征权重算法在处理多类问题时,每次从训练集D中随机抽取一个样本R,然后从该样本的同类样本集中选择k个最近邻样本Hj(C)(j=1㊁2㊁ ㊁k),从样本的每个不同类样本集中选择k个最近邻样本Mj(C)(j=1㊁2㊁ ㊁k),分别计算样本R与同类和不同类样本的距离和,然后根据距离更新特征权重(WiA)㊂权重计算公式如下:㊀WiA=Wi-1A-ðkj=1dA(R,Hj(C))mk+ðCʂclass(R)p(C)1-p(class(R))ðkj=1dA(R,Mj(C))mk㊂式中:A为某个分类特征;C为样本类别;class()为与R不同的样本类别;dA()为2个样本在特征上A的距离;Hj(C)为样本R最邻近的同类样本;Mj(C)为样本R最邻近的不同类样本;p()为某类样本在训练集D中所占比例;m为迭代次数;i为权重更新时当前迭代次数(i=1㊁2㊁ ㊁m);k为最邻近样本个数㊂2.4㊀树种分类算法随机森林算法(RF)是以决策树为基本分类器的集成学习算法,适用于高维遥感数据集,比其它机器学习算法更加高效和低成本[22-23]㊂RF还可以解决过拟合的问题,适用于时间序列遥感林地植被分类[24];支持向量机算法(SVM)是将非线性分类问题转化为高维线性问题,并在高维特征空间中构造线性判别函数,同时引入核函数减少运算量;分类回归树算法(CART)是通过对由测试变量和目标变量构成的训练数据集的循环分析形成二叉树形式的决策树,CART算法生成的决策树没有人工干预,减少了主观误差㊂2.5㊀树种分类精度评价为评估树种分类的准确性,本研究利用混淆矩阵和验证样本对树种分类结果进行精度验证,精度评价指标为用户精度(UA)㊁生产者精度(PA)㊁总体精度(OA)和Kappa系数(KPa)㊂计算公式如下:㊀㊀㊀㊀UAi=NiiNi+;㊀㊀㊀㊀PAi=NiiN+i;㊀㊀㊀㊀OA=Niiðki=1NiiN+i;㊀㊀㊀㊀KPa=Nðki=1Nii-ðki=1Ni+N+iN2-ðki=1Ni+N+i㊂36第3期㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀王洁,等:应用多时序特征的哨兵系列影像对南方丘陵区树种识别式中:N为总样本数,k为总类别数,Nii为被分到正确类别的样本数,N+i为第i类的真实值,Ni+为第i类的预测值㊂3㊀结果与分析3.1㊀树种光学和雷达特征由表4可知,各树种9 12月归一化植被指数(NDVI)均值,整个时间段内变化趋势基本相同,均呈下降趋势,归一化植被指数值为0.4 0.6,树种分离程度不明显,原因是油茶㊁杉木㊁松树都属于常绿树种㊂表5展示了不同树种在各光谱特征下的像元均值,树种在光谱特征上没有明显差异,仅松树和油茶在比值植被指数和红边叶绿素指数上与其它植被有所区分㊂表4㊀不同时间各树种归一化植被指数树种各树种归一化植被指数均值9月22日10月2日11月1日12月6日杉木0.5840.5670.5280.511松树0.5260.5100.4740.467油茶0.5050.4820.4450.419其他树种0.5770.5480.5130.482表5㊀不同树种光谱特征光谱特征不同树种光谱特征的像元均值杉木松树油茶其他树种蓝色(B2)0.0260.0260.0340.024绿色(B3)0.0490.0510.0600.044红色(B4)0.0300.0300.0470.029近红外(B8)0.2950.2550.2850.269狭窄近红外(B8a)0.3050.2660.2990.281短波红外1(B11)0.1470.1250.1880.159短波红外2(B12)0.0670.0580.0980.074比值植被指数(IRVI)3.8953.2353.1913.777归一化植被指数(INDVI)0.5840.5260.5050.577绿通道植被指数(IGNDVI)0.7250.6770.6720.724植被差异指数(IDVI)0.2650.2250.2380.240改良版土壤调整植被指数(IMSAVI)0.4920.4260.4390.453归一化水体指数(INDWI)-0.725-0.677-0.672-0.724改进归一化水体指数(IMNDWI)-0.502-0.414-0.525-0.564多波段水体指数(IMBWI)-0.451-0.377-0.512-0.454红边1(B5)0.0800.0830.1000.075红边2(B6)0.2350.2100.2320.210红边3(B7)0.2820.2440.2720.255红边归一化植被指数(IRNDVI)0.4740.4710.4040.450红边近红外归一化植被指数(IREDNDVI)0.5840.5250.5070.576改良红边土壤调整植被指数(IMSRre)0.9670.7960.7750.939红边叶绿素指数(ICIre)2.8952.2352.1912.777㊀㊀由图3可知,根据Sentinel-1雷达数据统计不同树种在对应日期VV和VH极化下的树种时序后向散射系数曲线㊂不同植被全年时序后向散射特征与植被的生长物候和形态相关,所有树种在两种极化下的后向散射系数变化趋势基本相同㊂VV极化下,其它树种在6月中旬左右后向散射强度明显升高,其后向散射强度全年高于其它植被;1 9月松树后向散射强度持续低于其它植被,杉木后向散射强度在12月呈现同其它植被不同的下降趋势㊂VH极化下,油茶VH极化后向散射强度全年低于其它植被,2月左右出现明显增幅和减幅,9月末到12月初出现明显减幅,12月松树和杉木呈现同其它植被不同的下降趋势㊂图3㊀树种VV/VH极化时序特征曲线通过对不同特征变量的叠加分析,可以近似分离出不同树种,雷达数据弥补了光学影像的不足,结合光学和雷达数据可以增强对树种的识别能力和提高分类精度㊂3.2㊀南方丘陵山区树种特征优选结果本研究分别利用分离阈值法和特征权重算法(ReliefF)对所构建的树种分类特征集进行特征优选㊂树种分类特征集共171个特征变量,通过试验获取样本的特征均值和标准差,根据公式计算树种之间的分离度,计算单个特征的巴氏距离以及同类特征巴氏距离的均值㊂同类特征中选取高于均值的特征,完成同类特征优选㊂由表6可知,利用特征权重算法(ReliefF)进行特征优选及排序,排名前15和后15的特征,根据重要性对特征进行排序分组,并利用随机森林算法进行分类,共分为7组㊂由表7可知,分类精度随着分类特征的增加呈先上升后下降的趋势,第5组分类精度最高,因此选取第5组作为特征权重算法(ReliefF)最优特征集㊂3.3㊀南方丘陵山区树种分类精度评价由表8可知,方案1仅使用光谱特征㊁植被指数和水体指数,分类结果总体精度为80.97%㊂在方案1的基础上分别加入红边特征㊁雷达特征㊁地形特征㊁纹理特征,总体精度分别提高了2.75%㊁2.26%㊁3.93%㊁2.81%㊂方案6融合所有特征后,总体精度提高了2.35%㊂方案7在方案6的基础上分别利用46㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀东㊀北㊀林㊀业㊀大㊀学㊀学㊀报㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第52卷分离阈值法与特征权重算法(ReliefF)对所有特征进行优选,不仅取得了更高的精度,而且有效降低了数据量,减少了运算时间㊂特征优选后的总体精度比方案6分别提高了1.89%和2.01%,其中ReliefF算法优选的结果精度最高,总体精度为85.33%,Kappa系数为0.81㊂表6㊀特征重要性排名排名特征名称重要性㊀19月22日红边叶绿素指数0.04222高程(DEM)0.041539月22日比值植被指数0.0399410月2日红边叶绿素指数0.0398510月2日比值植被指数0.0396611月1日归一化植被指数0.0392711月1日红边近红外归一化植被指数0.0392812月6日红边叶绿素指数0.0392912月6日改良红边土壤调整植被指数0.0391109月22日改良红边土壤调整植被指数0.03891111月1日改良红边土壤调整植被指数0.03871212月6日比值植被指数0.03701311月1日红边叶绿素指数0.03601412月6日归一化植被指数0.03541512月6日红边近红外归一化植被指数0.03541574月14日VH极化0.008515810月2日红光波段0.008415910月2日均值0.008316012月6日差异性0.008016111月1日方差0.00751629月22日方差0.007016310月2日方差0.00611649月22日对比度0.006116510月2日绿光波段0.005416611月1日均值0.005416710月2日对比度0.005216811月1日对比度0.004916910月2日蓝光波段0.004817012月6日对比度0.002817112月6日方差0.0012表7㊀分组情况及分类精度组别分组阈值特征个数随机森林(RF)分类精度/%10.0351571.0020.0303380.5930.0255082.5140.0206583.4150.0158485.3360.01012684.967017184.87㊀㊀由图4可知,水体在所有方案中都具有较高的分类精度㊂方案2在加入红边特征后,不同树种分类精度均有所提高,证明红边特征的加入有助树种提取;方案3加入雷达特征后树种精度提高,因为雷达波段能够穿透冠层获取树种信息,提高光谱特征相似的树种的类间差异;方案4在加入地形特征后,与其它方案相比杉木和油茶的生产者精度提升最大,南方丘陵山地山体阴影严重,不同树种混合分布㊁相互渗透,很难进行区分,地形特征变量能够有效减少错分概率;方案5加入纹理特征后,树种的分类精度提升没有地形特征高,主要是因为丘陵山区地形破碎㊁植被树冠茂盛,影像上纹理特征不明显,同时油茶在种植初期会和耕地存在误分㊂表8㊀各方案分类精度方㊀案总体精度/%Kappa系数方案180.970.75方案283.720.79方案383.230.78方案484.900.80方案583.780.79方案683.320.78方案7(SEaTH)85.210.81方案7(ReliefF)85.330.81㊀㊀由表9可知,随机森林算法比支持向量机算法和分类回归树算法总体分类精度分别提高了3.99%和4.55%,Kappa系数分别提高了0.05和0.06㊂结合各地物生产者精度,随机森林算法分类的松树生产者精度比分类回归树算法高了13.75%,油茶生产者精度比支持向量机算法提高了10.34%㊂表9㊀不同分类方法的分类精度分类方法总体分类精度/%Kappa系数随机森林算法85.330.81支持向量机算法81.340.76分类回归树算法80.780.75㊀㊀由图5可知,杉木和油茶作为袁州区主要树种,大面积混合分布,3种算法结果的树种分布区域大致一样,但某些区域的油茶和松树的提取结果存在明显差异;但对比不同分类方法的局部分类结果(见图6),随机森林算法与支持向量机算法和分类回归树算法相比,随机森林算法降低了分类结果的破碎度㊂4 讨论准确高效地获取树种的数量和分布信息对于林业的管理和监测至关重要㊂遥感影像为树种调查提供了有力的工具,Sentinel数据在树种分类上具有广泛的实用性[12,25],Sentinel-2影像的红边㊁近红外(NIR)和短波红外(SWIR)波段对于植被分类制图具有重要的作用[6,8,26]㊂本研究结合Sentinel影像和数字高程模型(DEM)数据,对南方丘陵山区的树种识别,结果发现重要性排名前15个特征中,红边特征所占比例最大,红边叶绿素指数在树种分类中56第3期㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀王洁,等:应用多时序特征的哨兵系列影像对南方丘陵区树种识别重要性最高㊂由于光谱特征相似,不同树种间存在不同程度的混淆,仅利用Sentinel-2光谱特征㊁植被指数㊁水体指数,树种的识别精度相对较低,将光谱特征与灰度共生矩阵(GLCM)纹理特征结合有效提高了树种分类精度[27]㊂本研究中纹理特征没有包含在最优特征集中,特征重要性排名中纹理特征处于靠后位置,由于研究区域过大导致细节纹理缺失,同时,树种纹理特征也受研究区地理位置和树种类别影响㊂不同树种受地形因子影响呈现不同的光谱特征,地形特征可有效降低山体效应带来的光谱差异,减少错分概率,地形特征比物候特征和纹理特征对树种分类更准确有效[15],地形特征在不同特征融合的南方丘陵山区树种分类中起着重要作用㊂图4㊀各地物生产者精度和用户精度㊀㊀加入雷达特征后,树种分类精度同样有所提升,证实Sentinel-1雷达特征能提高树种间的区分度㊂本研究只利用了Sentinel-1的雷达后向散射系数,杉木㊁松树㊁油茶都属于常绿树种,物候变化不显著,难以利用遥感提取植被物候[28]㊂由于雷达数据的特性,Sentinel-1数据同样含有丰富的纹理信息,可进一步提高纹理特征对南方丘陵山区树种的分类制图的精度㊂本研究最高准确率为85.33%,Kappa系数为0.81,仍有提升空间,可利用更有效的辅助数据或先进的深度学习技术,对大面积树种识别监测进行深入研究㊂5 结论以袁州区为研究区,结合Sentinel和数字高程模型(DEM)数据提取树种光谱特征㊁植被指数㊁水体指数㊁红边特征㊁雷达特征㊁地形特征和纹理特征,分别采用特征权重算法(Relief)和分离阈值法进行特征优选,通过不同特征组合对比,分析各特征对树种分类精度的影响,利用3种常用树种分类机器学习算法对最优特征集进行树种分类㊂树种在不同特征上具有一定差异性,可通过特征优选选取树种分类的有效特征,通过特征优选,能够在保证分类精度66㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀东㊀北㊀林㊀业㊀大㊀学㊀学㊀报㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第52卷的同时减少数据冗余,提高运算效率和精度㊂根据最优特征集分别使用3种机器学习算法(随机森林㊁支持向量机和回归决策树)对树种进行分类,随机森林算法分类精度最高,总体精度为85.33%㊂Sentinel影像和DEM数据的结合应用可提高树种分类的准确性,可为南方丘陵山区大范围树种调查监测提供技术方法㊂图5㊀不同分类方法树种分类结果图6㊀不同分类方法的局部分类结果76第3期㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀王洁,等:应用多时序特征的哨兵系列影像对南方丘陵区树种识别参㊀考㊀文㊀献[1]㊀何兴元,任春颖,陈琳,等.森林生态系统遥感监测技术研究进展[J].地理科学,2018,38(7):997-1011.[2]㊀栗旭升,李虎,陈冬花,等.联合GF-5与GF-6卫星数据的多分类器组合亚热带树种识别[J].林业科学,2020,56(10):93-104.[3]㊀QIANC,YAOCJ,MAHC,etal.Treespeciesclassificationu⁃singairborneLidardatabasedonindividualtreesegmentationandshapefitting[J].RemoteSensing,2023,15(2).doi:10.3390/rs15020406.[4]㊀杨丹,李崇贵,常铮,等.应用U-Net模型和多时相Landsat-8影像对森林植被的分类[J].东北林业大学学报,2021,49(9):55-59,66.[5]㊀郑奕,王瑶,刘艳.基于高光谱数据季相特征的山地草甸植被分类识别[J].光谱学与光谱分析,2022,42(6):1939-1947.[6]㊀PERSSONM,LINDBERGE,REESEH.Treespeciesclassifica⁃tionwithmulti-temporalSentinel-2data[J].RemoteSensing,2018,10(11).doi:10.3390/rs10111794.[7]㊀LEIZL,LIH,ZHAOJ,etal.Individualtreespeciesclassifica⁃tionbasedonahierarchicalconvolutionalneuralnetworkandmul⁃titemporalgoogleearthimages[J].RemoteSensing,2022,14(20).doi:10.3390/rs14205124.[8]㊀IMMITZERM,VUOLOF,ATZBERGERC.FirstexperiencewithSentinel-2dataforcropandtreespeciesclassificationsincentralEurope[J].Remotesensing,2016,8(3).doi:10.3390/rs8030166.[9]㊀杨丹,周亚男,杨先增,等.LSTM支持下时序Sentinel-1A数据的太白山区植被制图[J].地球信息科学学报,2020,22(12):2445-2455.[10]㊀LIMJ,KIMKM,JINR.Treespeciesclassificationusinghype⁃rionandSentinel-2datawithmachinelearninginSouthKoreaandChina[J].ISPRSInternationalJournalofGeo⁃Information,2019,8(3).doi:10.3390/ijgi8030150.[11]㊀李巧玉,陈娟,张小晶,等.川西亚高山彩叶林群落数量分类㊁排序与物种多样性[J].应用与环境生物学报,2021,27(3):519-528.[12]㊀黄翀,张晨晨,刘庆生,等.结合光学与雷达影像多特征的热带典型人工林树种精细识别[J].林业科学,2021,57(7):80-91.[13]㊀MAMF,LIUJH,LIUMX,etal.TreespeciesclassificationbasedonSentinel-2imageryandrandomforestclassifierintheeasternregionsoftheQilianmountains[J].Forests,2021,12(12).doi:10.3390/f12121736.[14]㊀宁晓刚,常文涛,王浩,等.联合GEE与多源遥感数据的黑龙江流域沼泽湿地信息提取[J].遥感学报,2022,26(2):386-396.[15]㊀WANGMC,LIMJ,WANGFY,etal.Exploringtheoptimalfeaturecombinationoftreespeciesclassificationbyfusingmulti⁃featureandmulti⁃temporalsentinel-2datainChangbaiMountain[J].Forests,2022,13(7).doi:10.3390/f13071058.[16]㊀HUBX,LIQ,HALLGB.Adecision⁃levelfusionapproachtotreespeciesclassificationfrommulti⁃sourceremotelysenseddata[J].ISPRSOpenJournalofPhotogrammetryandRemoteSens⁃ing,2021.doi:10.1016/j.ophoto.2021.100002.[17]㊀陈丽萍,孙玉军.基于不同决策树的面向对象林区遥感影像分类比较[J].应用生态学报,2018,29(12):3995-4003.[18]㊀李恒凯,王利娟,肖松松.基于多源数据的南方丘陵山地土地利用随机森林分类[J].农业工程学报,2021,37(7):244-251.[19]㊀NUSSBAUMS,NIEMEYERI,CANTYMJ.SEATH⁃anewtoolforautomatedfeatureextractioninthecontextofobject⁃basedim⁃ageanalysis[C]//InternationalSocietyforPhotogrammetryandRemoteSensing.1stInternationalConferenceonObject⁃basedImageAnalysis(OBIA),Salzburg,Austria,2006.[20]㊀KIRAK,RENDELLLA.Thefeatureselectionproblem:Tradi⁃tionalmethodsandanewalgorithm[C]//AmericanAssociationforArtificialIntelligence.AAAI 92:Proceedingsofthetenthna⁃tionalconferenceonArtificialintelligence.SanJose:AmericanAssociationforArtificialIntelligence,1992:129-134.[21]㊀KONONENKOI.Estimatingattributes:AnalysisandextensionsofRELIEF[C]//BERGADANOF,RAEDTLD.Proceedingsofthe1994EuropeanConferenceonMachineLearning.Heidelberg:Springer⁃Verlag,1994:171-182.[22]㊀BREIMANL.Randomforest[J].MachineLearning,2001,45(1):5-32.[23]㊀LINWY,WANGF,CHENGMM,etal.CODE:Coherencebaseddecisionboundariesforfeaturecorrespondence[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2017,40(1):34-47.[24]㊀PANGZH,ZHANGG,TANSQ,etal.Improvingtheaccuracyofestimatingforestcarbondensityusingthetreespeciesclassifi⁃cationmethod[J].Forests,2022,13(12).doi:10.3390/f13122004.[25]㊀LECHNERM,DOSTÁLOVÁA,HOLLAUSM,etal.Combina⁃tionofSentinel-1andSentinel-2datafortreespeciesclassifica⁃tioninaCentralEuropeanBiosphereReserve[J].RemoteSens⁃ing,2022,14(11).doi:10.3390/rs14112687.[26]㊀WESSELM,BRANDMEIERM,TIEDED.Evaluationofdiffer⁃entmachinelearningalgorithmsforscalableclassificationoftreetypesandtreespeciesbasedonSentinel-2data[J].RemoteSensing,2018,10(9).doi:10.3390/rs10091419.[27]㊀MOHAMMADPOURP,VIEGASDX,VIEGASC.VegetationmappingwithrandomforestusingSentinel2andGLCMtexturefeature:AcasestudyforLousãRegion,Portugal[J].RemoteSensing,2022,14(18).doi:10.3390/rs14184585.[28]㊀崔林丽,史军,杜华强.植被物候的遥感提取及其影响因素研究进展[J].地球科学进展,2021,36(1):9-16.86㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀东㊀北㊀林㊀业㊀大㊀学㊀学㊀报㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第52卷。
洛阳市13种绿化树种叶面积的回归测算
赵燕;刘晶;王辉
【期刊名称】《江苏农业科学》
【年(卷),期】2016(044)010
【摘要】以洛阳市13种绿化树种为研究对象,采用回归的方法,构建各树种叶面积与叶长、叶宽以及与叶长、叶宽乘积的线性回归和幂函数回归方程。
结果表明,各树种叶面积的回归方程均存在差异,幂函数是估算各树种叶面积的最佳回归方程,并给出了各个树种的叶面积回归方程,为各树种叶面积的快速测定提供了简便科学的方法,有较好的应用价值。
【总页数】4页(P254-257)
【作者】赵燕;刘晶;王辉
【作者单位】河南科技大学林学院,河南洛阳471003;河南科技大学林学院,河
南洛阳471003;河南科技大学化工与制药学院,河南洛阳471003
【正文语种】中文
【中图分类】S718.42
【相关文献】
1.主成分回归在阔叶树种叶面积测定中的应用
2.四个葡萄品种叶面积的回归测算
3.回归分析在葡萄叶面积测算中的应用
4.温带地区几种绿化树木叶面积的回归测算
研究5.城市绿化树种叶面积测算新方法
因版权原因,仅展示原文概要,查看原文内容请购买。
基于GF-2号影像的森林优势树种分类
随着遥感技术的不断发展和更新,遥感影像在生态环境调查、森林资源管理、景观格
局分析等方面的应用越来越广泛。
其中,通过遥感技术实现森林优势树种分类,成为了许
多森林资源管理者和研究人员的研究重点。
森林优势树种分类是根据植被类型、结构和化学成分等特征,对森林中的优势树种进
行分类和鉴定。
通过遥感技术实现森林优势树种分类,可以极大地提高森林资源管理的效
率和准确性,并为森林植被的研究和保护提供重要参考。
利用GF-2号卫星影像数据实现森林优势树种分类主要分为以下几步:
1. 遥感数据预处理
对GF-2号卫星影像数据进行预处理,主要包括辐射校正、大气校正、几何校正和噪声去除等操作。
遥感数据预处理的目的是提高数据质量和准确性,为后续的分类分析提供更
好的数据基础。
2. 特征提取
在预处理完成后,需要对影像数据进行特征提取。
常用的特征包括影像的光谱、纹理、形态等特征。
在森林优势树种分类中,常用的特征包括树冠、树干、枝干和叶子等特征。
通过对这些特征的提取和分析,可以得到不同树种之间的差异和特征,为后续的树种分类
和鉴定提供依据。
3. 树种分类和鉴定
在特征提取完成后,需要对不同树种进行分类和鉴定。
常用的分类算法包括最大似然
分类、支持向量机、决策树等。
根据分类算法的不同,可以得到各个树种的分类结果和准
确率。
在树种鉴定中,可以通过手动制定分类规则或利用样本库的方法进行鉴定。
通过对
遥感数据的分析和树种鉴定,可以准确地判断森林中各个优势树种的类型和分布情况。