KL变换与主成分分析
- 格式:doc
- 大小:299.50 KB
- 文档页数:8
实验三遥感图像的多光谱增强一、目的和要求学习和掌握主成分变换(K-L变换)的基本原理、方法及意义。
二、实验内容主成分变换(K-L变换)三、原理和方法主成分变换(Principal Component Analysis),又称K-L变换。
它的基本原理是:对某一多光谱图像实行一个线性变换,产生一组新的多光谱图像,使变换后各分量之间具有最小的相关性。
它是一种常用的数据压缩方法,可以将具有相关性的多波段数据压缩到完全独立的前几个主分量上;同时由于主成分变换后的前几个主分量包含了主要的地物信息,噪声较少,因而可以突出主要信息,抑制噪声,达到图像增强的目的;另外,它也可以用于分类前的预处理,减少分类的波段数并提高分类效果,即作为特征选择的方法。
四、实验步骤ERDAS 图标面板菜单条:Image Interpreter→Spectral Enhancement →Principial Comp →Pincipal Components对话框(图7-1)图7-1 Principal Component对话框在Pincipal Components对话框,需要设置下列参数:(1) 确定输入文件(InPut Fille)为1anier.img。
(2) 定义输出文件(output File)为principal.img。
(3) 定义坐标类型(Coordinate Type)为Map.(4) 处理范围确定(subset Definition),默认状态为整个图像范围。
(5) 输出数据类型(Ouput Data Type)为float single。
(6) 输出数据统计时忽略零值,即选中ignore zero in stats复选框。
(7) 特征矩阵输出设置(Eigen Matrix)。
(8) 若需在运行日志中显示,选中show in Session Log复选框。
(9) 若需写入特征矩阵文件,选中Write to File复选框(必选项)。
KL变换与主成分分析KL变换是一种通过数学变换来提取重要特征的方法。
KL变换是一种线性变换,它将原始数据从一个表示域转换到另一个表示域。
KL变换的主要思想是通过将数据在原始表示域中的协方差矩阵进行特征值分解,得到一组新的正交基向量,称为特征向量。
这些特征向量对应于协方差矩阵的特征值,表示变换后的表示域中数据的主要方向。
通过选择最重要的特征向量,可以获得原始数据的紧凑表示。
KL变换的应用非常广泛。
在图像处理中,KL变换可以用于图像压缩和去噪。
在语音处理中,KL变换可以用于语音识别和语音合成。
在模式识别中,KL变换可以用于特征提取和数据降维。
通过使用KL变换,可以提高数据的表示效率,并且在一定程度上保留原始数据的重要信息。
主成分分析(PCA)是一种与KL变换类似的数据变换方法,也用于特征提取和数据降维。
PCA的主要思想是通过线性变换将原始数据投影到一个新的坐标系中,使得数据在新坐标系中的方差最大化。
PCA的目标是找到一组正交基向量,称为主成分,它们能够最大化数据的方差。
通过选择最重要的主成分,可以实现数据的降维。
虽然KL变换和PCA在算法和应用上有一定的差异,但它们的目标是相似的,都是通过数学变换来提取原始数据的重要特征。
它们在很多领域都扮演着重要的角色,为实际问题的解决提供了有效的方法。
此外,KL 变换和PCA还可以通过适当的改进和扩展来满足具体问题的需求。
总结起来,KL变换和PCA是两种常用的数学方法,用于特征提取和数据降维。
它们的基本思想相似,但在具体算法和应用上有一些差异。
KL 变换通过特征值分解协方差矩阵来提取特征,而PCA通过求解特征值问题或奇异值分解来提取主成分。
两种方法都能提高数据的表示效率,并在实际问题中发挥着重要作用。
图像处理方法原理介绍(1)KL变换KL变换是遥感图像增强和信息提取中用得最多的线性变换,是对原波段图像进行波谱信息的线性投影变换,在尽可能不减少信息量的前提下,将原图像的高维多光谱空间的像元亮度值投影到新的低维空间,减少特征空间维数,达到数据压缩、提高信噪比、提取相关信息、降维处理和提取原图像特征信息的目的,并能有效地提取影像信息。
它可使原来多波段图像经变换后提供出一组不相关的图像变量,最前面的主分量具有较大的方差,包含了原始影像的主要信息,所以要集中表达信息,突出图像的某些细部特征,可采用主分量变换来完成。
(2)去相关拉伸变换通过去相关拉伸变换把相关性很高的波段进行去相关拉伸处理,减弱它们之间的相关性,然后进行拉伸,从而使深色区域的地物差异界线反映得更加清楚。
(3)纹理特征提取变换纹理特征的提取方法比较简单,它是用一个活动的窗口在图像上连续滑动,分别计算出窗口中的方差、均值、最大值、最小值及二者之差和信息熵等,形成相应的纹理图像,当目标的光谱特性比较接近时,纹理特征对于区分目标可以起到积极的作用。
选取适当的数据动态变化范围,进行纹理特征提取后,使影像的纹理特征得到突出,有利于提取构造信息。
(4)锐化增强调整图像的锐化程度使地物在图像上的差别便于人眼识别,可达到信息增强的目的。
对图像进行锐化增强实际上是利用变换函数把原图像进行灰度级转换,增大相邻像元的灰度值之差,从而达到突出图像细节的目的。
(5)定向滤波利用定向滤波对TM图像频率特征进行筛选,将图像中的线与边缘特征信息增强,突出给定方向的线性影像信息,抑制其他方向的无用信息。
采用45胺较蚵瞬ǎ 瞬ū尘爸涤?00%,滤波核设为3。
滤波后突出了断裂的线性影像,断裂两侧的色调影像花纹明显不同,断裂造成的山脊错断等特征在影像上非常明显。
(6)缨帽变换采用缨帽变换可以将TM图像除热红外波段的6个波段压缩成3个分量,其中的土壤亮度指数分量是6个波段的加权和,反映了总体的反射值;绿色植被指数分量反映了绿色生物量的特征;土壤特征分量反映了可见光和近红外与较长的红外的差值,它对土壤湿度和植物湿度最为敏感。
实验四遥感图像变换——主成分分析一、主成分分析的思想与原理主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数儿个综合指标。
在实证问题研究中,为了全面、系统地分析问题,必须考虑众多影响因素。
这些涉及的因索一•般称为指标,在多元统计分析屮也称为变最。
因为每个变量都在不同程度上反映了所研究问题的某些信息,并R指标Z间彼此冇一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。
在实际中研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
主成分分析正是适应这一要求产生的,是解决这类题的理想工具。
而把主成分方法用在遥感图像的变换处理上称为遥感图像的主成分变换(K ・L变换)。
原理如下:有矩阵:T-其中,m和n分別为波段数(或称变量数)和每幅图像中的像元数;矩阵中每一行矢量表示一个波段的图像。
对于一般的线性变换Y二TX,如果变换矩阵T是正交矩阵,并且它是由原始图像数据矩阵X 的斜方差矩阵S的特征向量所组成,则此式的变换称为K-L变换。
K-L变换的具体过程如F:第一步,根据原始图像数据矩阵X,求出它的协方差矩阵S, X的协方差矩阵为:■冈]—式中:I-QX--;(即为笫i个波段的均值);113 ;S是一个实对称矩阵。
笫二步,求S矩阵的特征值X和特征向量,并H成变换矩阵T。
考虑特征方程:式中,I为单位矩阵,U为特征向量。
解上述的特征方程即可求出协方差矩阵S的各个特征值人比坷3・心/排列,求得各特征值对应的单位特征向量(经归一化)UJ:若以各特征方虽为列构成矩阵,即u・・[气1—U矩阵满足:U T U=UU T=I (单位矩阵),则U矩阵是正交矩阵。
U矩阵的转置矩阵即为所求的K-L变换的变换矩阵To有了变换矩阵T,将其代入Y=TX,则:式中Y矩阵的行向护为第j主成分。
经过K-L变换后,得到一组5个)新的变量(即Y的各个行向量),它们依次被称为第一主成分、第二主成分、…第m主成分。
模式识别:主成分分析和KL变换什么是模式识别?模式识别是一种利用计算机算法和数学方法,通过对给定数据进行处理和分析,找出其内在规律和模式的一种技术。
模式识别在许多领域中都有应用,在人工智能、机器学习、数据挖掘等领域中都有广泛的应用。
主成分分析主成分分析(Principal Component Analysis,PCA)是一种数据降维技术,可以将高维数据降到低维,同时尽可能地保留数据的信息。
PCA的一般思路是找到一个新的坐标系,将数据映射到这个新的坐标系中,从而达到数据降维的目的。
主成分分析的基本实现步骤如下:1.数据中心化。
将各维度数据减去其均值,使其在新坐标系中保持原有的方差(即去除数据的线性相关性)。
2.计算协方差矩阵。
协方差矩阵的每个元素表示数据在不同维度上的相关程度。
3.计算协方差矩阵的特征值和特征向量。
特征向量描述了协方差矩阵的方向,而特征值表示协方差矩阵沿该方向的大小。
4.选择最大特征值对应的特征向量,作为新的坐标系。
5.将数据映射到新的坐标系中。
,PCA算法是将高维数据转化为低维数据的过程,它可以快速识别数据的内在结构,发现隐藏数据之间的相关性信息。
KL变换KL变换(Karhunen-Loève Transform,KLT)又称作Hotelling变换,它是一种优秀的信号处理技术,也常被用于模式识别。
KL变换的主要目的是分离信号中的信息和噪声成分,将重要信息提取出来,以便实现信号的压缩和去噪等操作。
KL变换的主要思路是将一组信号的协方差函数分析,然后求出其特征分解,从而得到KL基函数。
KL基函数是一组正交函数,它基于信号中的协方差函数进行计算。
KL基函数的特点是垂直于噪声分布的方向,能够很好地去除信号中的噪声成分。
对于一个N维随机向量X,KL变换可以描述为下列公式:KL变换公式KL变换公式式中,X是一个N维随机向量,K是一个N*N的矩阵,其列向量是单位正交向量。
KL变换可以针对任意信号类型进行处理,对于平稳信号而言,KL变换还可以处理非平稳性的问题,得到良好的结果。
浅析主成分分析法的原理张小丽(武汉大学遥感信息工程学院,湖北武汉,430079)【摘要】图像特征是图像分析的重要依据,获取图像特征信息的操作称为特征提取。
它作为模式识别,图像理解或信息量压缩的基础是很重要的。
在目前的遥感图像处理研究中,多利用光谱特征。
主成分分析也称为K-L变换,是在统计特征基础上的多维(如多波段)正交线性变换,也是遥感数字图像处理中最常用的一种变换算法。
本文就对光谱特征提取的主成分分析方法分析其原理,具体步骤及优缺点。
【关键词】遥感图像;特征提取;光谱特征;主成分分析1 引言以计算机自动分类为研究方向的遥感图像解译技术的一般工作流程是图像预处理、特征提取、特征选择、分类处理。
在这三项工作中,特征提取、特征选择是保证遥感图像分类精度的关键。
遥感图像模式的特征主要表现为光谱特征、纹理特征以及形状特征三种。
特征提取分为光谱特征提取、纹理特征提取,形状特征提取。
光谱特征提取和纹理特征提取分别对应于影像要素级序中的初级和第二级影像要素,目前应用较多的是光谱特征提取。
光谱特征提取常采用K-T变换、K-L变换。
2 光谱特征光谱特征是图像中目标物的颜色及灰度或者波段间的亮度比等。
光谱特征通过原始波段的点运算获得。
光谱特征的特点是,它对应于每个像元,但与像元的排列等空间结构无关。
光谱特征是一种地物区别于另一种地物的本质特征,是组成地物成分、结构等属性的反映,正常情况下不同地物具有不同的光谱特征(在一些特殊情况下会出现同物异谱、同谱异物现象),因此根据地物光谱特征可以对遥感图像进行特征提取。
在遥感图像的所有信息中最直接应用的是地物的光谱信息,地物光谱特性可通过光谱特征曲线来表达。
遥感图像中每个像素的亮度值代表的是该像素中地物的平均辐射值,它随地物的成分、纹理、状态、表面特征及所使用电磁波波段的不同而变化。
3 K-L变换(主成分分析)3.1原理K-L变换即主成分分析。
主成分变换具有方差浓聚、重新分配、数据量压缩的作用,并且可更准确、特征地揭示多波段数据结构内部的遥感信息。
K-L变换也常称为主成分变换(PCA)或霍特林变换,是一种基于图像统计特性的变换,它的协方差矩阵除对角线以外的元素都是零,消除了数据之间的相关性,从而在信息压缩方面起着重要作用。
K-L变换是一种线性变换,而且是当取Y的前p(p<m)个主成分经反变换而恢复的图像和原图像X在均方误差最小意义上的最佳正交变换。
它具有以下性质和特点:(1)由于K-L变换是正交线性变换,所以变换前后的方差总和不变,变换只是把原来的方差不等量的再分配到新的主成分图像中。
(2)第一主成分包含了总方差的绝大部分(一般在80%以上),其余各主成分的方差依次减小。
(3)可以证明,变换后各主成分之间的相关系数为零,也就是说各主成分间的内容是不同的,是“垂直”的。
(4)第一主成分相当于原来各波段的加权和,而且每个波段的加权值与该波段的方差大小成正比(方差大说明信息量大)。
其余各主成分相当于不同波段组合的加权差值图像。
(5)K-L变换的第一主成分还降低了噪声,有利于细部特征的增强和分析,适用于进行高通滤波,线性特征增强和提取以及密度分割等处理。
(6)K-L变换是一种数据压缩和去相关技术,第一成分虽信息量大,但有时对于特定的专题信息,第五、第六主成分也有重要的意义。
(7)可以在图像中局部地区或者选取训练区的统计特征基础上作整个图像的K-L变换,则所选部分图像的地物类型就会更突出。
(8)可以将所有波段分组进行K-L变换,再选主成分进行假彩色合成或其它处理。
(9)K-L变换在几何意义上相当于进行空间坐标的旋转,第一主成分取波谱空间中数据散布最大的方向;第二主成分则取与第一主成分正交且数据散布次大的方向,其余依此类推。
原始图像 1离散余弦变换2d DCT (type II) 与离散傅里叶变换的比较离散余弦变换(英语:DCT for Discrete Cosine Transform)是与傅里叶变换相关的一种变换,它类似于离散傅里叶变换(DFT for Discrete Fourier Transform),但是只使用实数。
博士□兽医硕士专业学位□硕士□农业推广硕士专业学位□同等学力在职申请学位□中职教师攻读硕士学位□工程硕士专业学位□高校教师攻读硕士学位□风景园林硕士专业学位□西北农林科技大学研究生课程考试试卷封面(课程名称:)学位课□选修课□补修课□研究生年级、姓名所在学院及专业任课教师姓名考试日期考试成绩评卷教师签字处K-L 变换实验报告摘要K-L 变换,又称霍特林(Hotelling )变换或者主成分分析(PCA)是均方差意义下的最佳变换,其突出优点是相关性好,得到的主成分是互相线性不相关的。
该方法是很多方面的常用算法,如人脸识别、图像压缩和信号传输等,其基本原理就是用较少数量的特征对样本进行描述以达到降低特征空间维数的方法,方法的基础是Karhunen-Loeve 展开式简称K-L 展开式。
本报告介绍了K-L 变换的基本原理,及其应用该方法进行人脸识别的基本步骤,并比较了基于总体散布矩阵和类间散布矩阵做为产生矩阵的K-L 变换进行的人脸识别,并对识别率进行了统计。
1. K-L 变换的基本原理特征脸方法是基于K-L 变换的人脸识别方法,K-L 变换是图像压缩的一种最优正交变换。
高维的图像空间经过K-L 变换后得到一组新的正交基,保留其中重要的正交基,由这些基可以张成低维线性空间。
如果假设人脸在这些低维线性空间的投影具有可分性,就可以将这些投影用作识别的特征矢量,这就是特征脸方法用于人脸识别的基本思想。
在人脸识别中,可以用离散K-L 变换对人脸图像的原始空间进行转换,即构造人脸图像数据集的协方差矩阵,对之进行正交变换,求出协方差矩阵的特征向量,再依据特征值的大小对这些特征向量进行排序,每一个向量表示人脸图像中一个不同数量的变量,这些特征向量表示特征的一个集合,它们共同表示一个人脸图像。
在人脸识别领域,人们常称这些特征向量为特征脸。
每一个体人脸图像都可以确切地表示为一组特征脸的线性组合。
这样我们首先通过有指导的训练(给定训练样本集已知分类)得到样本集在特征脸空间中的坐标。
基于主成分分析与K-L变换的双重属性优化方法赵加凡;陈小宏【摘要】利用主成分分析客观赋权原理计算地震属性在预测目标参数时贡献率的大小,通过去除权重系数较小的属性参数,实现了地震属性的敏感性分析,建立储层参数与有效属性之间的匹配关联;在此基础上,利用K-L变换将属性样本空间的高维属性映射为低维属性,去除了属性之间的相关性,有效地解决了属性组合的优化问题,表明了主成分分析和K-L变换相结合的属性双重优化方法克服了单纯使用每种方法时的局限性,充分发挥了各自的优点,有助于属性分析、关联以及组合优化问题的解决,提高了地震储层参数预测的运算速度和精度.【期刊名称】《物探与化探》【年(卷),期】2005(029)003【总页数】4页(P253-256)【关键词】地震数据处理;主成分分析;K-L变换;神经网络;属性组合与优化【作者】赵加凡;陈小宏【作者单位】石油大学,CNPC物探重点实验室,北京,102249;石油大学,CNPC物探重点实验室,北京,102249【正文语种】中文【中图分类】N37;P631.4地震属性优化是指利用专家的先验知识或数学方法,优选出对所求解问题最敏感的、属性个数最少的地震属性或地震属性组合,以提高储层参数预测精度,改善与地震属性有关的处理和解释效果。
属性优化是提高储层参数预测精度的重要途径[1]。
通常,属性优化过程包括属性的敏感性分析和多属性的优化。
近几年来,围绕多属性优化问题,涌现出很多新的方法,但是大多数方法或只针对属性选择,或者只针对属性样本分类,不能系统地解决属性分析和优化问题。
如何使选取的属性参数更具有代表性、如何有效地建立多属性与目标参数的关联,以及如何快速地优化属性,单纯地用一种方法都不可能很好地解决这个难题。
笔者提出了一种双重优化方法,即:利用主成分分析计算权重系数的客观赋权思想对地震属性进行敏感性分析,建立属性与目标预测参数的关联;然后利用K-L(Karhumen-loeve)变换进行属性组合的正交变换,从高维属性中优选出低维的属性组合。
KL变换去噪应用的若干方面阐述1 概述随着地震勘探的不断发展,人们对分辨率的要求越来越高,然而高分辨率资料处理的基础是资料的高信噪比,因此提高资料信噪比的重要性越来越明显,常见的叠后去噪有f-x域预测滤波,该技术是假定记录在f-x域相干信号是可预测的,而随机噪声是不可预测的,同时假定同相轴是线性的。
但这些假定条件在处理复杂地区地震资料时都难以满足。
如果使用不当容易造成剖面上的同相轴平化现象,模糊了有效反射和噪音之间的界限,损失剖面的波阻特征,同时子波旁掰能量太强,会掩盖掉剖面上许多真实的地质现象,如抹掉一些小断点等。
由于有效信号和随机噪声的不同特性,相邻地震道的有效地震信号之间具有较强的相干性,而随机噪声不具相干性。
经KL正交变换后噪音和水平反射轴表现不同的主成分分量,因此可根据处理需要提取有效信号,达到压制噪音的目的;对倾斜地层或双曲线反射层,利用小波变换进行多尺度分解,在分离出的噪音频率成分中应用KL变换进行去噪处理,该方法在最大限度保护有效波的同时改善了资料信噪比。
2 方法原理KL变换去噪的方法原理为:假设把某道地震记录一时刻的采样值构成的列向量用Xa表示,即:其实现KL变换的思路:首先要从信号求出其协方差矩阵,再由协方差矩阵求出正交矩阵。
设随机矢量X为某时刻N道地震记录的采样值,是N维随机矢量,Xa则是X的M次实验值,要寻求X的线性变换LTX,使得Y=LTX的协方差矩阵:为对角阵,除对角元素外其他全部为零,说明其变换后的各分量之间两两正交,互不相关,从而能量集中在较大特征值对应的特征矢量确定的分量上。
因为E(X)=0,所以E(LTX)=0,所以:对于cov X必存在一正交阵L=(L1,L2,…,LN),LN为N维矢量,使其满足LTcov XTL=Λ,Λ是协方差矩阵covX的特征值矩阵,所以对随机矢量X可以得:正交变换公式:Y=LTX;重建公式:X=LYKL变换的实质是对地震记录按其协方差矩阵的归一化特征向量进行正交分解,每个特征向量称为主分量,每个主分量的能量是由相应的特征值大小来度量的,因特征值λ1≥λ2≥…≥λn,所以λ1对应的y1也最大,为第一主分量,y2次之,以此类推。
1.比值增强与差值增强比值增强它是将图像每个像元的某一波段的数值(亮度值)与同一像元的另一波段的数值(亮度值)相除,用所得的新值作为该像元的新数值(亮度值),显示图像,即得到一幅得到比值增强的图像。
比值增强可压抑图像上不需要的影像信息,还可消除由于地形起伏而造成的阴影等干扰因素的影响,因此,比值增强常作为其它处理的前期处理,以得到更好的图像显示效果或分类精度。
差值增强它是将图像每个像元的某一波段的数值(亮度值)与同一像元的另一波段的数值(亮度值)相减,用所得的新值作为该像元的新数值(亮度值),显示图像,即得到一幅得到差值增强的图像。
差值增强可用于提取土壤背景的变化。
2.比值植被指数与归一化植被指数[2]比值植被指数RVI:RVI = NIR/R(1)绿色健康植被覆盖地区的RVI远大于1,而无植被覆盖的地面(裸土、人工建筑、水体、植被枯死或严重虫害)的RVI在1附近。
植被的RVI通常大于2;(2)RVI是绿色植物的灵敏指示参数,与LAI、叶干生物量(DM)、叶绿素含量相关性高,可用于检测和估算植物生物量(3)植被覆盖度影响RVI,当植被覆盖度较高时,RVI对植被十分敏感;当植被覆盖度<50%时,这种敏感性显著降低;(4)RVI受大气条件影响,大气效应大大降低对植被检测的灵敏度,所以在计算前需要进行大气校正,或用反射率计算RVI。
归一化植被指数NDVI:NDVI=(NIR-R)/(NIR+R)(1)NDVI的应用:检测植被生长状态、植被覆盖度和消除部分辐射误差等;(2)-1<=NDVI<=1,负值表示地面覆盖为云、水、雪等,对可见光高反射;0表示有岩石或裸土等,NIR和R近似相等;正值,表示有植被覆盖,且随覆盖度增大而增大(3)NDVI的局限性表现在,用非线性拉伸的方式增强了NIR和R的反射率的对比度。
对于同一幅图像,分别求RVI和NDVI时会发现,RVI值增加的速度高于NDVI增加速度,即NDVI对高植被区具有较低的灵敏度;(4)NDVI能反映出植物冠层的背景影响,如土壤、潮湿地面、雪、枯叶、粗糙度等,且与植被覆盖有关。
kl分解法
KL分解(Karhunen-Loève decomposition),也称为PCA(Principal Component Analysis,主成分分析),是一种常用的统计技术,用于将多变量数据转换为具有最大方差的线性无关变量,从而实现数据的降维。
这个技术是由芬兰数学家卡伦宁(Karhunen)和洛伊维(Loève)在20世纪40年代独立提出的。
KL分解的步骤如下:
1. 协方差矩阵计算:对于给定的多变量数据集,首先计算其协方差矩阵。
协方差矩阵描述了不同变量之间的线性关系。
2. 特征值分解:对协方差矩阵进行特征值分解。
这一步得到了特征值和对应的特征向量。
特征向量是描述数据集中变量之间关系的方向。
3. 选择主成分:将特征值从大到小排序,选择前k个特征值对应的特征向量作为主成分,其中k是希望保留的主成分的数量。
这些主成分捕捉了数据中的大部分方差。
4. 投影:将原始数据投影到所选的主成分上,得到降维后的数据。
KL分解的应用包括:
•数据降维:将高维数据转换为较低维度,保留数据中的主要信息。
•去相关化:通过主成分来去除数据中的相关性,得到相互独立的变量。
•特征提取:从数据中提取主要特征,用于分析和建模。
主成分分析在数据分析、图像处理、模式识别等领域得到广泛应用。
主成分分析(PCA)是多元统计分析中用来分析数据的一种方法,它是用一种较少数量的特征对样本进行描述以达到降低特征空间维数的方法,它的本质实际上是K-L变换。
PCA方法最著名的应用应该是在人脸识别中特征提取及数据维,我们知道输入200*200大小的人脸图像,单单提取它的灰度值作为原始特征,则这个原始特征将达到40000维,这给后面分类器的处理将带来极大的难度。
著名的人脸识别Eigenface 算法就是采用PCA算法,用一个低维子空间描述人脸图像,同时用保存了识别所需要的信息。
下面先介绍下PCA算法的本质K- L变换。
1、K-L变换(卡洛南-洛伊(Karhunen-Loeve)变换):最优正交变换
一种常用的特征提取方法;
最小均方误差意义下的最优正交变换;
在消除模式特征之间的相关性、突出差异性方面有最优的效果。
离散K-L变换:对向量x(可以想象成M维=width*height 的人脸图像原始特征)用确定的完备正交归一向量系u j展开:
这个公式由来我想应该是任一n维欧式空间V均存在正交基,利用施密特正交化过程即可构建这个正交基。
现在我们希望用d个有限项来估计向量x,公式如下:
计算该估计的均方误差如下:
要使用均方误差最小,我们采用Langrange乘子法进行求解:
因此,当满足上式时,
取得最小值。
即相关矩阵R的d个特征向量(对应d个特征值从大到小排列)为基向量来展开向量x时,其均方误差最小,为:
因此,K-L变换定义:当取矩阵R的d个最大特征值对应的特征向量来展开x时,其截断均方误差最小。
这d个特征向量组成的正交坐标系称作x所在的D维空间的d维K-L变换坐标系,x在K-L坐标系上的展开系数向量y称作x的K-L变换。
总结下,K-L变换的方法:对相关矩阵R的特征值由大到小进行排队,
则均方误差最小的x近似于:
矩阵形式:
上式两边乘以U的转置,得
向量y就是变换(降维)后的系数向量,在人脸识别Eigenface算法中就是用系数向量y代替原始特征向量x进行识别。
下面,我们来看看相关矩阵R到底是什么样子。
因此,我们可以看出相关矩阵R是一个实对称矩阵(或者严谨的讲叫正规矩阵),正规矩阵有什么特点呢学过《矩阵分析》的朋友应该知道:若矩阵R是一个实对称矩阵,则必定存在正交矩阵U,使得R相似于对角形矩阵,即:
因此,我们可以得出这样一个结论:
降维后的系数向量y的相关矩阵是对角矩阵,即通过K-L变换消除原有向量x的各分量间的相关性,从而有可能去掉那些带有较少信息的分量以达到降低特征维数的目的。
2、主成分分析(PCA)
主成分分析(PCA)的原理就是将一个高维向量x,通过一个特殊的特征向量矩阵U,投影到一个低维的向量空间中,表征为一个低维向量y,并且仅仅损失了一些次要信息。
也就是说,通过低维表征的向量和特征向量矩阵,可以基本重构出所对应的原始高维向量。
在人脸识别中,特征向量矩阵U称为特征脸(eigenface)空间,因此其中的特征向量u i进行量化后可以看出人脸轮廓,在下面的实验中可以看出。
以人脸识别为例,说明下PCA的应用。
设有N个人脸训练样本,每个样本由其像素灰度值组成一个向量x i,则样本图像的像素点数即为x i的维数,M=width*height ,由向量构成的训练样本集为。
该样本集的平均向量为:
平均向量又叫平均脸。
样本集的协方差矩阵为:
求出协方差矩阵的特征向量u i和对应的特征值
,这些特征向量组成的矩阵U就是人脸空间的正交基底,用它们的线性组合可以重构出样本中任意的人脸图像,(如果有朋友不太理解这句话的意思,请看下面的总结2。
)并且图像信息集中在特征值大的特征向量中,即使丢弃特征值小的向量也不会影响图像质量。
将协方差矩阵的特征值按大到小排序:。
由大于
的
对应的特征向量构成主成分,主成分构成的变换矩阵为:
这样每一幅人脸图像都可以投影到
构成的特征脸子空间中,U的维数为M×d。
有了这样一个降维的子空间,任何一幅人脸图像都可以向其作投影
,即并获得一组坐标系数,即低维向量y,维数d×1,为称为KL分解系数。
这组系数表明了图像在子空间的位置,从而可以作为人脸识别的依据。
有朋友可能不太理解,第一部分讲K-L变换的时候,求的是相关矩阵
的特征向量和特征值,这里怎么求的是协方差矩阵
其实协方差矩阵也是:
,可以看出其实
用代替x就成了相关矩阵R,相当于原始样本向量都减去个平均向量,实质上还是一样的,协方差矩阵也是实对称矩阵。
总结下:
1、在人脸识别过程中,对输入的一个测试样本x,求出它与平均脸的偏差
,则
在特征脸空间U的投影,可以表示为系数向量y:
U的维数为M×d,
的维数为M×1,y的维数d×1。
若M为200*200=40000维,取200个主成分,即200个特征向量,则最后投影的系数向量y维数降维200维。
2、根据1中的式子,可以得出:
这里的x就是根据投影系数向量y重构出的人脸图像,丢失了部分图像信息,但不会影响图像质量。