基于均值置信区间带的高光谱特征波段选择与树种识别
- 格式:pdf
- 大小:278.32 KB
- 文档页数:5
第31卷,第9期 2 0 1 1年9月 光谱学与光谱分析 Spectroscopy and Spectral Analysis Vo1.31,No.9,pp2462—2466 September,201 1
基于均值置信区间带的高光谱特征波段选择与树种识别
陈永刚,丁丽霞,葛宏立,张茂震,胡 芸
浙江农林大学,浙江省森林生态系统碳循环与固碳减排重点实验室,环境科技学院,浙江临安311300
摘要 以柏木、雷竹和无患子野外高光谱数据为基础,在统计学理论和实践分析的基础上,提出了利用均
值置信区间带筛选树种问最佳特征区分波段及利用Manhattan距离和Min-Max区问相似度识别树种的问
题 研究结果表明:(1)柏木与雷竹之间的最佳区分波段为358 ̄386,452 ̄1 145和1 314 ̄2 500 niTl,柏木
与无患子之问的最佳区分波段为350 ̄446,497 ̄527,553~1 330,1 355 ̄2 400和2 436 ̄2 500 nl'n,雷竹
与无患子之间的最佳区分波段为434 ̄555,580 ̄1 903,l 914 ̄2 089,2 172 ̄2 457和2 475 ̄2 500啪;
(2)在最佳区分波段内,同种树种问的Manhattan距离远小于异种树种间的Manhattan距离,同种树种间的
MiniMax区问相似度远大于异种树种问的MintMax区问相似度,Manhattan距离和Min ̄Max区问相似
度可以有效区分和识别不同类型的树种。
关键词置信区间;高光谱;Manhattan距离;MiniMax区间相似度
中图分类号:¥771.8 文献标识码:A DOI:10.3964/j.issn.1000—0593(2011)09-2462-05
引 言
高光谱遥感技术的出现将为解决森林树种的精细识别难
题提供有效的途径 光谱识别方法的优点是反应迅速、结构
简单、成本低、易形成商业化,光谱识别技术已成为光谱分
析技术的重要组成部分。高光谱数据波段多、数据冗余度
大,利用高光谱数据进行树种识别时,选择提取特征光谱至
关重要l1 ]。Clark等在树种冠层尺度,利用高光谱遥感技术
识别提取热带雨林树种r5]。Gong等利用从Hyperion高光谱
数据提取的植被指数估算森林植被叶面积指数 j。王渊、王
志辉等分别利用光谱微分技术对油菜、南方常见树种叶片的
高光谱特征进行选择及提取,获得了良好的效果n]。但是鲜
见利用统计区间估计的方法进行特征提取和光谱识别南方树
种的报道。本文提出了在利用均值置信区间带筛选最佳特征
区分波段的基础上,利用Manhattan距离和Min ̄Max区间
相似度来区分识别树种,并在实验中验证了其有效性和可行
性。
1数据与方法
1.1仪器设备与数据获取
数据采用ASD Fieldspec Pro FR野外光谱辐射仪测量。 光谱仪波长范围为350 ̄2 500 Din,共2 151个波段,波长精
度为±1 D1TI,具有较高的抽样间隔和光谱分辨率。数据采集
地点为浙江省浙江农林大学校内植物园。以柏木、雷竹、无
患子三种常见的南方树种进行试验,选择向阳的成熟叶片,
每种树种采集49个叶片样本。数据采集在晴朗的天气进行,
数据采集后立即置于保鲜箱内保鲜,并迅速带到实验室内进
行光谱测量。为了得到准确和稳定的数据,使用光谱仪配套
的植被高密度探头进行测量,每测完l0片树叶进行一次标
准白板的校正。其中以4O个样本作为光谱基准数据,九个样
本作为测试数据。
1.2均值置信区间带与最佳区分波段筛选
均值是数据集中趋势的主要测度值,均值置信区间估计
是在均值点估计的基础上,而给出总体参数的一个区间范
围[7]。在光谱采集过程中,由于各种因素的影响,数据包含
有随机误差,而均值置信区间估计则将采样误差限制在一定
范围之内。根据统计学的中心极限定理可知,如果样本容量
足够大(”≥30)时,所有随机分布的均值皆收敛于正态分
布『7]。在1一n置信水平下,第i波段光谱反射率均值 置信
区间与置信水平n的关系为式(1)所示
C P Jx —zd,2{≤ ≤X。+Zo/z Ji I=1一口 (1) I 4n 4n J
式中:K为第i波段光谱反射率 次测量的平均值;S为样
本标准差;a为显著性水平。据式(1)可知,第i波段光谱反
收稿日期:2010-12-14。修订日期:2011一O3—28
基金项目:国家自然科学基金项目(30771725),国家自然科学基金项目(3o97236O)和浙江省教育厅项目(Y201017891)资助
作者简介:陈永刚,1980年生,浙江农林大学环境科技学院讲师 e-mail:cyg_gis@163.coi
n 第9期 光谱学与光谱分析 2463
射率均值 的置信区间为 ±乙/z堕f--。因波段i取值范围为 4n
350 ̄2 500 nm,所有波段的置信区间则构成了光谱反射率
均值置信区间带。同时,第i波段光谱反射率均值 ,为此
树种在第i波段反射率比对的光谱基准。
特征选择是从有N个特征的原始集合中选择M(M<
N)个特征子集,以降低特征空间的维度_8]。高光谱数据波段
多、波段窄,同时,也带来了数据量大、数据冗余度大的问
题。由于高光谱数据波段众多,如不进行特征筛选,那些能
有效区分树种的波段会被“淹没”在其他无用波段的信息中。
以光谱反射率均值置信区间带筛选树种最佳区分波段的原
理,如图1所示。
a b C d Wavelength/nm
Fig.1 Optimal discriminating band selection of tree speci’es
从图1中可以看出,在波段区间 ,6]和[c, ,树种1
和树种2的光谱反射率均值置信区间是重叠的,即在其内不
同树种不容易区分。通过剔除均值置信区间带重叠的部分,
就可以筛选出最佳的树种区分波段,以达到降低波段特征空
间维度且实现特征波段选择的目的。
1.3 Manhattan距离和Min ̄Max区间相似度
在N维空间中,数值型数据X 和X 之间的相似性,可
以通过X 和X,两个数据在特征空间中点之间的欧氏距离、
Manhattan距离、马氏距离等指标来度量【 lo3。用欧氏距离
计算时,较大值会更加突出,较小的值就会被淹没,而Man—
hattan距离能使较小的值也占有一定的比重l1 ]。本文使用
Manhattan距离来度量待测试树种与某种树种光谱基准的接
近程度。Manhattan距离为式(2)所示。
D( )一∑l 一 I (2)
式中:D( )为待测试树种与某种树种光谱基准的Manhattan
距离; 为光谱基准第i波段光谱反射率 次测量的平均
值;z 为待测试树种在第i波段上的光谱反射率;A为经特
征筛选后,波段的集合。Manhattan距离值越小,表明树种
越相似。
MiniMax区间相似度是判别测试树种在所有特征波段
上,“落在”已知某种树种基准光谱反射率测量值“束”中的概
率。
一— H(Yi) (3)
H(y,)一』 Mi Yi≤M (4) H‘ 一{o y,≥M
a 、or Y <Ma ’ 式(3)与(4)中:P为Min ̄Max区间相似度;M为此树种特
征区分波段的总个数;Yi为待测试树种样本的第i波段的光
谱反射率;H( )为第i波段反射率是否位于基准光谱数据
第i波段的最小、最大值之内,如果位于Mi 和MaN之间
则其值为1,否则,其值为0;其中,M —Min(xfl,妇,
…, ),Max—Max(x z∞…,z )。Min~Max区间相
似度值越大,表明树种越相似。
2试验与分析
2.1光谱曲线均值95 置信区间带
对野外测量得到的光谱数据,根据式(1)调用Excel的
VBA宏,以40个样本作为光谱基准数据,计算柏木、雷竹、
无患子三个树种光谱曲线的均值和均值的95 置信区间带,
结果如图2所示。
^ 一柏木
一要
一三 子
▲ l
-_,
Wavelength/nm
Fig.2 The 95%confidence interval for mean
of spectrum of three tree species
2.2以置信区问带筛选树种间最佳区分特征波段
利用C#开发程序分析3种树种置信区间带数据,剔除
图2中两两树种之间光谱曲线95 区间重叠的部分,结果即
为树种的最佳区分波段。提取结果发现:柏木与雷竹之间的
最佳区分特征波段为358 386,452 l 145,1 314~2 500
nm;柏木与无患子之间的最佳区分特征波段为350~446,
497 ̄527,553~1 330,1 355~2 400和2 436~2 500 nm;
雷竹与无患子之问的最佳区分特征波段为434 ̄555,58O~
1 903,1 914 ̄2 089,2 172 ̄2 457和2 475 ̄2 500 nn1。结
果如图3一图5黑色部分所示。
Fig.3 Optimal discriminating band
between Bai Mu and Lei Zhu o 蜀暑uo《 O 8 6 4 2 0 1 0 O 0 O 。g甚。岛 H
2464 光谱学与光谱分析 第31卷
Wavelength]nm
Fig.4 Optimal discriminating band between
BaiMuandWuHuanZi
2.3以Manhattan距离和Min ̄Max区间相似度区分识别
树种
分别以每种树种九个样本作为测试数据,对3种树种两
两组成的共6种组合,在特征区分波段下进行树种区分识
别。结果为表1一表6。 Wavdength/mn
昏5 Optimal discriminating band between
Lei ZhU andⅥ Huan Zi
显然,从表l表6可以发现同一树种测试样本和光谱
基准数据间的Manhattan距离远小于不同树种问的Manhat—
tan距离;同一树种测试样本和光谱基准数据间的Min
Max区间相似度远大于不同树种间的Min Max区间相似
度。Manhattan距离和Min ̄Max区间相似度都一致表明,
Table 1 The manhattan distance and the MiniMax iIltervaI similarity betwen Bai Mu
test samples and Bai Mu ̄Lei Zhu reference spectrum
Table 2 The Manhattan d ̄tance and the 1Vlin ̄Max intervaI similarity betwen Lei Zhu
test samplesandBmMu ̄LeiZhureference spectrum
Table 3 The Manhattan d ̄tance and the MiniMax iIlterval similarity betwen Bai Mu
test samples and Bai Mu ̄Wu Huan Zi reference spectrum
Tabk 4 The Manhattan d ̄tance and the MiniMax iIIterval similarity between Wu Huan Zi
test samplesandBaiMu ̄WuHuanZireference spectrum u目墨u0岛
∞ 暑 Q岛