模式识别作业三——kl变换

格式：doc
大小：309.89 KB
文档页数：6

下载文档原格式

/ 6

实验2_KL变换实验

实验二：KL 变换实验学时：4学时实验目的：1. 掌握特征提取的基本方法。

2. 掌握基于KL 变换的特征提取的方法。

3. 培养学生灵活使用KL 变换进行模式识别的能力。

实验内容：给出ORL 人脸数据库，共有400幅人脸图像（40人，每人10幅，大小为92*112象素）。

其中第一个人的图像如下图：选取数据库中的部分样本（每个人的前5张图片）作为训练样本，其余作为未知的测试样本。

从训练样本中得到KL 变换矩阵，然后对训练样本和测试样本都进行变换，用变换后的数据作最近邻识别，距离可以为对应灰度值之差的平方和，统计识别率。

KL 变换方法简介：设图像数据库图像大小为Width ⨯Height ，令d = Width ⨯Height ，则每幅图像可以用按行或者按列堆成一个d 维向量表示。

令111()()N T T t i i t t i S x m x m N N==--=ΦΦ∑，其中1(,,)t N x m x m Φ=-- 。

特征脸方法(KL 变换方法)是从PCA 方法导出的。

PCA 方法就是要寻找正交归一的变换矩阵12(,,,)d L L W u u u R ⨯=∈ ，1T WW =，使得判别准则()()T t J W tr W S W =达到最大，即arg max ()T t WW tr W S W =。

也就是在T y W x =的正交变换后使得总体散度矩阵y T t t S W S W =的迹最大，即各个样本分离得尽量远，将样本的方差尽量的保留下来，和原样本的均方误差尽量小。

可以证明求得12(,,,)L W u u u = 就是对应于矩阵t S 的前L 个最大的特征值的特征向量。

即12(,,,)L W u u u = 的各列向量是下面特征方程的解：t i i i S u u λ=显然，变换后的y T t t S W S W =是一个对角阵，对角线上的元素为相应的特征值，即1()dt i i tr S λ==∑，也就是说每个特征值都代表了相应的特征向量保留总体散度（方差）的能力。

KL变换和主成分分析

在进行主成分分析后，竟以97.4％的精度，用三个新变量就取代了原17个变量。
根据经济学知识，斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3。更有意思的是，这三个变量其实都是可以直接测量的。
主成分分析就是试图在力保数据信息丢失最少的原则下，对这种多变量的数据表进行最佳综合简化，也就是说，对高维变量空间进行降维处理。
jd 1
λ j ：拉格朗日乘数

g(uj )
uTj Ru j

j
(u
T j
u
j
1)
jd 1
jd 1
用函数 g(u j ) 对 u j 求导，并令导数为零，得
(R j I )u j 0 j d 1, ,
——正是矩阵 R 与其特征值和对应特征向量的关系式。
• 如果这些数据形成一个椭圆形状的点阵（这在变量的二维正态的假定下是可能的）.
3.2 PCA: 进一步解释
• 椭圆有一个长轴和一个短轴。在短轴方向上，数据变化很少；在极端的情况，短轴如果退化成一点，那只有在长轴的方向才能够解释这些点的变化了；这样，由二维到一维的降维就自然完成了。
分为：连续K-L变换离散K-L变换
1．K-L展开式设{X}是 n 维随机模式向量 X 的集合，对每一个 X 可以
用确定的完备归一化正交向量系{u j } 中的正交向量展开：

X a juj j 1
d
用有限项估计X时：Xˆ a juj j 1
aj：随机系数；
引起的均方误差： E[( X Xˆ )T ( X Xˆ )]
总样本数目为 N。将 X 变换为 d 维 (d n) 向量的方法：

模式识别基于K-L变换的特征提取

试用K－L变换作一维的数据降维。解：1、求样本总体均值向量
1 ⎡⎛ −5 ⎞ ⎛ −5 ⎞ m = ⎢⎜ ⎟ + ⎜ ⎟ + 10 ⎣⎝ −5 ⎠ ⎝ −4 ⎠
⎛ 4 ⎞⎤ ⎛ 0 ⎞ + ⎜ ⎟⎥ = ⎜ ⎟ ⎝ 5 ⎠⎦ ⎝ 0 ⎠
无需作坐标系平移。 2、求自相关矩阵
1 ⎡⎛ −5 ⎞ R = ⎢ ⎜ ⎟ ( −5 − 5 ) + 10 ⎣⎝ −5 ⎠
二、离散K－L展开式
x 假设 x 为 n 维的随机向量，可以用 n 个正交基向量的加权和来
表示：
x = ∑ α iϕi
i =1
n
α ϕ 式中，i 为加权系数；i 为正交基向量，满足
⎧1 当 i = j ϕ ϕj = ⎨ ⎩0 当 i ≠ j
T i
将 x 用矩阵形式表示为
x = (ϕ1 ,ϕ 2 ,
3、求出 R的本征值λ1 , λ2 , , λn及其对应的本征向量； λ1 ≥ λ2 ≥ ≥ λm ≥ ≥ λn 4、将本征值按从大到小排序，如
ϕ1 ,ϕ2 , ,ϕ n
，
取前 m 个大的本征值所对应的本征向量构成变换矩阵
A = (ϕ1 ,ϕ 2 ,
,ϕm )
；
5、将 n 维的原向量变换成 m 维的新向量
所以
b j = E{α j }
如果在K－L变换前，将模式总体的均值向量作为新坐标系的原点，即在新坐标系中 E[ x] = 0 则有
b j = E[α j ] = E[ϕ T x] = ϕ T E[ x] = 0 j j
此时均方误差变为
ε =
2
j = m +1
∑
n
n
E[α ] =

利用K-L变换法进行人脸识别

（2）原理详解（包括详细步骤）
利用K-L变换法进行人脸识别
K-L变换的重要应用——人脸识别
分类器设计： – 搜集要识别的人的人脸图像，建立人脸图像库； – 利用K-L变换确定人脸基图像； – 用这些基图像对人脸图像库中的有人脸图像进行K-L变换，从而得到每幅图像的参数向量，并将每幅图的参数向量存起来，形成人脸分类器。识别: – 对所输入的待识别人脸图像进行必要的规范化； – 进行K-L变换分析，得到其参数向量； – 将这个参数向量与库中每幅图的参数向量进行比较，找到最相似的参数向量，也就等于找到最相似的人脸，从而认为所输入的人脸图像就是库内该人的一张人脸，完成了识别过程。
特征值按照从大到小进行排序λ1≥λ2≥…≥λn 。
（4）取出前 d 个最大特征值及其对应的正交化、归一化特征向量a1, a2, …, ad 。分别将这 d 个特征向量化为 p 行 q 列矩阵，得到 d 幅图像，称为“特征脸”。由“特征脸” a1, a2, …, ad 张成一个降维的特征子空间。
对应前30个最大特征值的特征向量的
d
O
0.5d
1.5d
d
d
利用K-L变换法进行人脸识别
由于人脸结构的相似性，当把很多人脸图像规一化后，这些图像在这一超高维空间中不是随机或散乱分布的，而是存在某种规律。因此，可以通过K-L变换用一个低维子空间
描述人脸图像，同时又能保存所需要的识别信息。
利用K-L变换法进行人脸识别
第二步：利用K-L变换进行人脸识别 – 设训练样本集为 X {x1, x2 ,, xN } ,包含N 个人脸图像。 N为训练样本的总数，xi 为第i个训练样本图像向量。
图像——“特征脸”
利用K-L变换法进行人脸识别

现代数字信号处理及其应用论文——KL变换的应用

Karhunen-Loeve 变换的应用摘要：本文对Karhunen-Loeve 变换的原理进行了说明，重点分析了K-L 变换的性质，结合K-L 变换的性质，对K-L 变换的具体应用进行了展示。

利用K-L 变换在人脸识别、遥感图像特征提取、地震波噪声抑制、数字图像压缩、语音信号增强中的具体利用，深入总结了K-L 变换在模式识别、噪声抑制和数据压缩领域的重要性。

关键字： Karhunen-Loeve 变换 K-L 变换 K-L 展开1、 Karhunen-Loeve 变换定义1.1Karhunen-Loeve 变换的提出在模式识别和图像处理等现实问题中，需要解决的一个主要的问题就是降维，通常我们选择的特征彼此相关，而在识别这些特征时，数据量大且效率低下。

如果我们能减少特征的数量，即减少特征空间的维数，那么我们将以更少的存储和计算复杂度获得更好的准确性。

于是我们需要一种合理的综合性方法，使得原本相关的特征转化为彼此不相关，并在特征量的个数减少的同时，尽量不损失或者稍损失原特征中所包含的信息。

Karhunen-Loeve 变换也常称为主成分变换(PCA)或霍特林变换，就可以简化大维数的数据集合，而且它的协方差矩阵除对角线以外的元素都是零，消除了数据之间的相关性。

所以可以用于信息压缩、图像处理、模式识别等应用中。

Karhunen-Loeve 变换，是以矢量信号X 的协方差矩阵Ф的归一化正交特征矢量q 所构成的正交矩阵Q ，来对该矢量信号X 做正交变换Y=QX ，则称此变换为K-L 变换（K-LT 或KLT ），K-LT 是Karhuner-Loeve Transform 的简称，有的文献资料也写作KLT 。

可见，要实现KLT ，首先要从信号求出其协方差矩阵Ф，再由Ф求出正交矩阵Q 。

Ф的求法与自相关矩阵求法类似。

1.2Karhunen-Loeve 展开及其性质设零均值平稳随机过程u(n)构成的M 维随机向量为u(n),相应的相关矩阵为R ，则向量u(n)可以表示为R 的归一化特征向量M 21q ,q ,q 的线性组合，即iMi i q c n u ∑==1)(，此式称为u(n)的Karhunen-Loeve 展开式，展开式的系数i c 是由内积 )(c i n u q Hi =M ,1,2,i =定义的随机变量，且有{}0E =i c ，{}⎩⎨⎧≠==l i li c c i li ,0,E *λ。

k变换

K_L变换，SVD变换在图像处理中实际应用讨论一．K_L变换在人脸识别中的实际应用模式识别中一个最基本的问题就是特征抽取, 抽取有效的鉴别特征是解决识别问题的关键。

K-L 变换是特征抽取的最有效的方法之一。

基于K -L 变换的特征抽取有四种最为经典和常用的技术, 其中主分量分析( PCA, 或称以总体散布矩阵为产生矩阵的K-L 变换) 被广泛地应用在人脸等图像识别领域。

主分量分析在处理图像识别问题时, 其弱点也很明显: 首先, 将图像矩阵转化为图像向量后, 造成图像向量的维数一般较高, 比如, 图像的分辨率为100×100, 所得图像向量的维数高达10000, 在如此高维的图像向量上完成PCA 是非常耗时的。

尽管在PCA 中利用奇异值分解定理可加速总体散布矩阵的本征向量的求解速度, 但整个特征抽取过程所耗费的计算量相当可观; 其次, 主分量分析的训练是非监督的，即PCA 无法利用训练样本的类别信息。

另一种经典的K-L 变换方法, 即包含在类平均向量中判别信息的最优压缩技术, 其识别性能优于非监督的主分量分析方法。

受Hong代数特征抽取思想的启发, 本研究提出了一种直接基于图像矩阵的包含在类平均图像中判别信息的最优压缩方法——广义K-L 变换, 它克服了传统主分量分析的弱点。

在ORL 标准人脸库上的试验结果表明, 广义K-L变换方法不仅在识别性能上优于Eigenfaces 方法和Fisherfaces 方法, 且特征抽取的速度提高了近19 倍。

1. 1基本思想定义1: 设X 表示n 维列向量, 将m×n 的图像矩阵A 通过以下线性变换直接投影到X 上。

Y= A X ( 1)得到一个m 维列向量Y, X 为投影轴, Y 为图像A的投影特征向量。

设有C 个已知的模式类别, ni 表示第i 类的训练样本数, N 表示各类的训练样本总数。

第i 类的第j 个训练样本图像为m×n 的矩阵Aj ( i=1, 2, ⋯, C; j = 1, 2, ⋯, ni) 。

模式识别(三)课后上机作业参考解答

“模式识别(三).PDF”课件课后上机选做作业参考解答(武大计算机学院袁志勇, Email: yuanzywhu@) 上机题目：两类问题，已知四个训练样本ω1={(0,0)T,(0,1)T}；ω2={(1,0)T,(1,1)T}使用感知器固定增量法求判别函数。

设w1=(1,1,1)Tρk=1试编写程序上机运行(使用MATLAB、 C/C++、C#、JA V A、DELPHI等语言中任意一种编写均可)，写出判别函数，并给出程序运行的相关运行图表。

这里采用MATLAB编写感知器固定增量算法程序。

一、感知器固定增量法的MATLAB函数编写感知器固定增量法的具体内容请参考“模式识别(三).PDF”课件中的算法描述，可将该算法编写一个可以调用的自定义MATLAB函数：% perceptronclassify.m%% Caculate the optimal W by Perceptron%% W1-3x1 vector, initial weight vector% Pk-scalar, learning rate% W -3x1 vector, optimal weight vector% iters - scalar, the number of iterations%% Created: May 17, 2010function [W iters] = perceptronclassify(W1,Pk)x1 = [0 0 1]';x2 = [0 1 1]';x3 = [1 0 1]';x4 = [1 1 1]';% the training sampleWk = W1;FLAG = 0;% iteration flagesiters = 0;if Wk'*x1 <= 0Wk =Wk + x1;FLAG = 1;endif Wk'*x2 <= 0Wk =Wk + x2;FLAG = 1;endif Wk'*x3 >= 0Wk=Wk-x3;FLAG = 1; endif Wk'*x4 >= 0Wk =Wk -x4; FLAG = 1; enditers = iters + 1; while (FLAG) FLAG = 0; if Wk'*x1 <= 0Wk = Wk + x1; FLAG = 1; endif Wk'*x2 <= 0Wk = Wk + x2; FLAG = 1; endif Wk'*x3 >= 0 Wk = Wk - x3; FLAG = 1; endif Wk'*x4 >= 0 Wk = Wk - x4; FLAG = 1; enditers = iters + 1; endW = Wk;二、程序运行程序输入：初始权向量1W , 固定增量大小k ρ 程序输出：权向量最优解W , 程序迭代次数iters 在MATLAB 7.X 命令行窗口中的运行情况：１、初始化1[111]T W = 初始化W 1窗口界面截图如下：２、初始化1kρ=初始化Pk 窗口界面截图如下：３、在MATLAB 窗口中调用自定义的perceptronclassify 函数由于perceptronclassify.m 下自定义的函数文件，在调用该函数前需要事先[Set path…]设置该函数文件所在的路径，然后才能在命令行窗口中调用。

模式识别课件--特征提取_KL变换

求稳定点：
L 2Ru 2u 0 u
Ru u
稳定点有很多个，但都是R的特征向量。 uT Ru uT u 最小，则u 要使得必须为R最小特征根对应的特征向量。

结
if Ru j j u j then

j d 1
论
uT Ru j取得极值 j
对新样本也作变换，看与哪个y最接近。与实际比较确定是否识别正确，统计识别率。

Matlab相关的函数
读取图像的函数：I=imread(‘D:\a.jpg’); 提供自定义函数读取整个目录的图像： com_ReadDB。求特征向量与特征根：[V,D] = eig(R);

作业

需要利用奇异值分解定理。
1 St N
( xi m)( xi m)T
i 1
N
1 t t T ， t ( x1 m, , xN m) N
根据奇异值分解定理（SVD） d N 维的矩阵 t 存在两个正交，矩阵 U 和 V ，使得 t U V T ，其中 U 和 V 的列向量分别是 t t T （ d d 维）和 t T t （ N N 维）的特征向量，是相应的特征值

把新样本的类别归为距离最近的那个已知样本的类别。
可以拿每个人的前几幅图像作为已知的样本数据，后几幅图像作为未知样本，统计识别率。
用PCA进行数据压缩

PCA (Principle Component Analysis)方法：进行特征降维变换，不能完全地表示原有的对象，
能量总会有损失。希望找到一种能量最为集中的变
第9章特征提取

K-l变换.

因此变换核矩阵为特征向量组成
1 2 L n
正交化后为*，将*T 记作A。因此定义一维K L变换为
F *T f A f
反变换定义为
f *F AT F

图像霍特林变换
思想：将二维图像采用行堆叠或列堆叠转换为一维处理。
Step1：同一幅图象l次传送，形成图象集合
列特征脸的线性加权和表示。此时待识别人脸问题转换为投影系数向量，识别问题转换为分类问题。最简单的分类是最小距离分类等。
K-L 变换的应用－人脸识别
❖谢谢！
✓ 变换Y=ATX与反变换X=AY即为K-L变换的变换公式。
根据K-L变换的原理，A是X空间的协方差矩阵∑x的特征向量矩阵的转置矩阵，即
A = ΦT =
由Y = AX 因此当n=3时,
Φ 11
Φ 21
Φ 12
Φ 22
...
Φ 1n
...
Φ 2n
... ... ... ...
Φ n1
Φ n2
...
Y = AX 式中：X为变换前多光谱空间的像元矢量；
Y为变换后多光谱空间的像元矢量； A为一个n×n的线性变换矩阵。
对于K-L变换中的矩阵A，必须满足以下要求：
✓ A为n×n正交矩阵，A=[φ1,φ2,φ3,…,φn] ✓ 对正交矩阵A来说，取φi为X的协方差矩阵∑x
的特征向量，协方差矩阵除对角线以外的元素都是零
❖ K-L变换即主成分分析就可以简化大维数的数据集合。它还可以用于许多图像的处理应用中，例如：压缩、分类、特征选择等。

K-L变换的原理
❖ 思想
▪ 目的是寻找任意统计分布的数据集合主要分量的子集。
▪ 基向量满足相互正交性，且由它定义的空间最优的考虑了数据的相关性。

模式识别课件--特征提取_KL变换32页PPT

文家。汉族，东晋浔阳柴桑人（今江西九江）。曾做过几年小官，后辞官回家，从此隐居，田园生活是陶渊明诗的主要题材，相关作品有《饮酒》、《归园田居》、《桃花源记》、《五柳先生传》、《归去来兮辞》等。
Thank you
模式识别课件--特征提取_KL变换
6
、
露
凝
无
游
氛
，
天
高
风
景
澈
。
7、翩翩新来燕，双双入我庐，先巢故尚在，相将还旧居。
8
、
吁
嗟
身
后
名
，
于
我
若
浮
烟
。
9、陶渊明（约 365年 —427年），字元亮，（又一说名潜，字渊明）号五柳先生，私谥“靖节”，东晋末期南朝宋初期诗人、文学家、辞赋家、散
1Leabharlann 0、倚南
窗
以
寄
傲
，
审
容
膝
之
易
安
。
6、最大的骄傲于最大的自卑都表示心灵的最软弱无力。——斯宾诺莎 7、自知之明是最难得的知识。——西班牙 8、勇气通往天堂，怯懦通往地狱。——塞内加 9、有时候读书是一种巧妙地避开思考的方法。——赫尔普斯 10、阅读一切好书如同和过去最杰出的人谈话。——笛卡儿

KL变换

模拟退火法 Tabu搜索法遗传算法
单独最优特征组合
计算各特征单独使用时的可分性判据J并加以排队，取前d个作为选择结果不一定是最优结果当可分性判据对各特征具有(广义)可加性，该方法可以选出一组最优的特征来，例：
各类具有正态分布各特征统计独立可分性判据基于Mahalanobis距离
特征选择
j
E y y = E U x x U T = U RU = Λ
T T T
K-L变换的性质变换的性质
特征提取
K-L坐标系把矩阵R对角化，即通过K-L R 变换消除原有向量x的各分量间的相关性，从而有可能去掉那些带有较少信息的分量以达到降低特征维数的目的
λ1 Λ = 0
ε =
j = d +1
∑
∞
u Tj E x x T u
j
=
j= d +1
∑
∞
u Tj R u
j
求解最小均方误差正交基
用Lagrange乘子法：
if R u
j ∞
特征提取
= λ ju
j
th e n ε =
j= d +1
∑
u Tj R u j 取得极值
结论：以相关矩阵R的d个本征向量为 R 基向量来展开x时，其均方误差为： x
顺序后退法Sequential backw. 顺序后退法 selection
特征选择
该方法根据特征子集的分类表现来选择特征搜索特征子集：从全体特征开始，每次剔除一个特征，使得所保留的特征集合有最大的分类识别率依次迭代，直至识别率开始下降为止用“leave-one-out”方法估计平均识别率：用 N-1个样本判断余下一个的类别，N次取平均。

模式识别作业三——kl变换

模式识别作业报告组员：2011302265 孔素瑶2011302268 马征2011302273 周昳慧一、实验要求用FAMALE.TXT 和MALE.TXT 的数据作为本次实验使用的样本集，利用K-L 变换对该样本集进行变换，与过去用Fisher 线性判别方法或其它方法得到的分类面进行比较，从而加深对所学内容的理解和感性认识。

二、具体做法1．不考虑类别信息对整个样本集进行K-L 变换（即PCA ），并将计算出的新特征方向表示在二维平面上，考察投影到特征值最大的方向后男女样本的分布情况并用该主成分进行分类。

2．利用类平均向量提取判别信息，选取最好的投影方向，考察投影后样本的分布情况并用该投影方向进行分类。

3．将上述投影和分类情况与以前做的各种分类情况比较，考察各自的特点和相互关系。

三、实验原理设n 维随机向量T n x x x x ),,(21⋯=，其均值向量][x E u =，相关矩阵][Tx xx E R =，协方差矩阵]))([(Tx u x u x E C --=，x 经正交变换后产生向量T n y y y y ),,(21⋯=。

设有标准正交变换矩阵)),,((21n t t t T T ⋯=，（即I T T T=）Tn T n y y y x t t t x T y ),,(),,(2121⋯=⋯==，x t y Ti i = (1,2,)i n =∑=-===ni i i Tt y y T y T x 11（称为 x 的K-L 展开式）取前m 项为x 的估计值1ˆmi i i xy t ==∑ 1m n ≤<其均方误差为∑∑+=+=∧∧==--=nm i ii nm i iTy y E yE x x x x E m 1'12][][)]()[()(ξ∑∑∑+=+=+====nm i i x inm i inm i ii t R ttx x E t y y E m 1'1''1')(][)(ξ在I T T ='的约束条件下,要使均方误差min )]()[()(1''→=--=∑+=∧∧nm i i x it R tx x x x E m ξ为此设定准则函数∑∑+=+=--=nm i i Ti i nm i i x Ti t t t R t J 11)1(λ由0iJt ∂=∂可得()0x i i R I t λ-= 1,...,i m n =+ 即x i i i R t t λ= 1,...,i m n =+表明: λi 是x R 的特征值，而i t 是相应的特征向量。

模式识别作业K_L变换

模式识别作业
4. 已知一组数据的协方差矩阵为[1 1
2
1
2
1]试问：
(1) 协方差矩阵中各元素的含义是什么？
(2) K-L变换的最佳准则是什么？
(3) 为什么说经K-L变换后消除了各分量之间的相关性？
（1）协方差矩阵的x ij表示i号特征和j号特征之间的协方差的值，其大小表示两者的线性相关性。

（2）最佳准则为对一组数据进行按一组正交基分解，在只取相同数量分量的条件下，以均方误差计算截尾误差最小。

（3）因为经过K-L变换，主分量分解后，协方差矩阵成为对角矩阵，因而各主分量间相关性消除。

5.若有下列两类样本集：
ω1: x1=(0,0,0)T, x2=(1,0,0)T,x3=(1,0,1)T,x4=(1,1,0)T
ω2:x5=(0,0,1)T,x6=(0,1,0)T,x7=(0,1,1)T,x8=(1,1,1)T
要求用K-L变换法，分别把特征空间维数降到d=2和d=1。

试编写满足要求的。

KL变换和主成分分析

例5.3 两个模式类的样本分别为
ω1 ： X1 [2, 2]T ， X 2 [2, 3]T ， X3 [3, 3]T
ω2 ： X 4 [2, 2]T ， X5 [2, 3]T ， X 6 [3, 3]T 利用自相关矩阵R作K-L变换，把原样本集压缩成一维样本集。
进行排队，选择前 d 个较大的特征值。
第三步：计算 d 个特征值对应的特征向量 u j ， j 1,2,, d ，
归一化后构成变换矩阵 U。
U [u1, u2 ,, ud ]
第四步：对{X}中的每个 X 进行 K-L 变换，得变换后向量 X * ： X* UTX
d 维向量 X * 就是代替 n 维向量 X 进行分类的模式向量。
• 如果这些数据形成一个椭圆形状的点阵（这在变量的二维正态的假定下是可能的）.
3.2 PCA: 进一步解释
• 椭圆有一个长轴和一个短轴。在短轴方向上，
4
数据变化很少；在极端的
2
0
情况，短轴如果退化成一
-2
点，那只有在长轴的方向
-4
才能够解释这些点的变化
-4
-2
0
2
4
了；这样，由二维到一维
的降维就自然完成了。
三个新变量就取代了原17个变量。
根据经济学知识，斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3。更有意思的是，这三个变量其实都是可以直接测量的。
主成分分析就是试图在力保数据信息丢失最少的原则下，对这种多变量的数据表进行最佳综合简化，也就是说，对高维变量空间进行降维处理。
(1) 如何作主成分分析? 当分析中所选择的变量具有不同的量纲，

模式识别第三次作业-KL变换

模式识别作业三一、编程要求：编程实现KL变换，并对TM六波段图像进行演算。

KL变换的思想是：从n维特征选取m维特征，删去的n-m维特征不一定就是无用的信息，如何在信息损失最小的情况下选取特征，在理论上就显得更严密些。

通常采用正交变换，得到新的经变换的模式，以保证信息损失最小情况下获得有利于分类的特征。

二、编程思想：将6副图象依次输入获得灰度值存在一个6*size(size为一副图象的像素数)的二维数组中，计算每个波段的灰度均值，然后计算协方差矩阵，得出特征值和特征向量，再重新计算要输出的处理的图象的灰度。

三、核心代码：void CKLchangeView::Oninput() //TM图象数据读入{AfxMessageBox("注意:请一次将6副图象都读入!");//读图象的方法int flag=0;while(flag<6){CFileDialog dlg(TRUE,"bmp",".bmp");if(dlg.DoModal()==IDOK){m_NewFileName[flag]=dlg.GetFileName();for(int j=0;j<5;j++){if(flag==j||m_NewFileName[flag]!=m_NewFileName[j]) continue;else{AfxMessageBox("已打开过的图象!请按方法重新打开!");flag=0;for(int i=0;i<6;i++) m_NewFileName[i]="";return;}}NewFileName=m_NewFileName[flag];flag++;}//判断是否是已经打开的图象，若已经打开，则要重新按方法打开else //不读图象，或是只是要看图象{for(int i=0;i<6;i++) m_NewFileName[i]="";return;}CDC *pDC = GetWindowDC();CFile f(NewFileName,0);m_pDib.Read(&f);//读图象if(m_pDib.m_nColorTableEntries!=256)//判断是否是灰度图象{AfxMessageBox("请打开灰度图象!");return;}CKLchangeDoc* pDoc = GetDocument();pDoc->pDib=&m_pDib;OnDraw(pDC);//调用OnDraw函数绘图sizeImage = m_pDib.GetDimensions();sizeSaveImage = m_pDib.GetDibSaveDim();a=sizeSaveImage.cx * sizeSaveImage.cy;//象素数if(flag==1) tm=CMatrix(6,a);//开第一副图象时为矩阵分配内存//将每幅图象象素灰度值放入矩阵中if(flag==1)for(int i=0;i<a;i++){tm.m_pData[i]=*(m_pDib.m_lpImage+sizeSaveImage.cx*(i/sizeImage.cx)+i%sizeImage.cx );}if(flag==2)for(int i=0;i<a;i++){tm.m_pData[a+i]=*(m_pDib.m_lpImage+sizeSaveImage.cx*(i/sizeImage.cx)+i%sizeImage. cx);}if(flag==3)for(int i=0;i<a;i++){tm.m_pData[2*a+i]=*(m_pDib.m_lpImage+sizeSaveImage.cx*(i/sizeImage.cx)+i%sizeImag e.cx);}if(flag==4)for(int i=0;i<a;i++){tm.m_pData[3*a+i]=*(m_pDib.m_lpImage+sizeSaveImage.cx*(i/sizeImage.cx)+i%sizeImag e.cx);}if(flag==5)for(int i=0;i<a;i++){tm.m_pData[4*a+i]=*(m_pDib.m_lpImage+sizeSaveImage.cx*(i/sizeImage.cx)+i%sizeImag e.cx);}if(flag==6)for(int i=0;i<a;i++){tm.m_pData[5*a+i]=*(m_pDib.m_lpImage+sizeSaveImage.cx*(i/sizeImage.cx)+i%sizeImag e.cx);}}}void CKLchangeView::OnKl() //KL变换计算{int i,j;xfea.Init(6,1);xfeat.Init(1,6);temp=CMatrix(6,6);feature=new double[6];fea.Init(6,6);double tmave[6];//求每幅图象的灰度均值for (i=0;i<6;i++){tmave[i]=0;for(j=0;j<a;j++){tmave[i]+=tm.m_pData[i*a+j];}tmave[i]/=(double)a;}//求方差矩阵Rfor(j=0;j<36;j++){temp.m_pData[j]=0.0;for(i=0;i<a;i++){temp.m_pData[j]+=(tm.m_pData[(j/6)*a+i%6]-tmave[j/6])*(tm.m_pData[(j%6)*a+i%6]-tmave[ j%6]);}temp.m_pData[j]/=(double)a;}temp.JacobiEigenv2(feature, fea, 0.000001);//求特征值和特征向量double t=0.0;double featuretemp[6];//临时变量for(i=0;i<6;i++)featuretemp[i]=feature[i];//给临时数组赋值for(i=0;i<6;i++)//"冒泡法"将特征值排序for(j=0;j<5;j++)if(feature[j]>feature[j+1]){t=feature[j];feature[j]=feature[j+1];feature[j+1]=t;}for(i=0;i<6;i++)//求出特征值排序后对应在特征值数组中的位置for(j=0;j<6;j++)if(feature[i]==featuretemp[j]){index[i]=j;}}void CKLchangeView::OnFirst() //第一主分量{if(NewFileName=="") {AfxMessageBox("请先读入图象数据!");return;} if(fea.m_pData[0]==0) OnKl();result.Init(1,a);for(int i=0;i<a;i++){for(int j=0;j<6;j++)result.m_pData[i]+=fea.m_pData[index[5]+j*6]*tm.m_pData[j*a+i];}Draw();}void CKLchangeView::OnFive() //第五主分量{if(NewFileName=="") {AfxMessageBox("请先读入图象数据!");return;} if(fea.m_pData[0]==0) OnKl();result.Init(1,a);for(int i=0;i<a;i++){for(int j=0;j<6;j++)result.m_pData[i]+=fea.m_pData[index[1]+j*6]*tm.m_pData[j*a+i];}Draw();}void CKLchangeView::OnFour() //第四主分量{if(NewFileName=="") {AfxMessageBox("请先读入图象数据!");return;} if(fea.m_pData[0]==0) OnKl();result.Init(1,a);for(int i=0;i<a;i++){for(int j=0;j<6;j++)result.m_pData[i]+=fea.m_pData[index[2]+j*6]*tm.m_pData[j*a+i];}Draw();}void CKLchangeView::OnSecond() //第二主分量{if(NewFileName=="") {AfxMessageBox("请先读入图象数据!");return;} if(fea.m_pData[0]==0) OnKl();result.Init(1,a);for(int i=0;i<a;i++){for(int j=0;j<6;j++)result.m_pData[i]+=fea.m_pData[index[4]+j*6]*tm.m_pData[j*a+i];}Draw();}void CKLchangeView::OnSix() //第六主分量{if(NewFileName=="") {AfxMessageBox("请先读入图象数据!");return;}if(fea.m_pData[0]==0) OnKl();result.Init(1,a);for(int i=0;i<a;i++){for(int j=0;j<6;j++)result.m_pData[i]+=fea.m_pData[index[0]+j*6]*tm.m_pData[j*a+i];}Draw();}void CKLchangeView::OnThird() //第三主分量{if(NewFileName=="") {AfxMessageBox("请先读入图象数据!");return;}if(fea.m_pData[0]==0) OnKl();result.Init(1,a);for(int i=0;i<a;i++){for(int j=0;j<6;j++)result.m_pData[i]+=fea.m_pData[index[3]+j*6]*tm.m_pData[j*a+i];}Draw();}void CKLchangeView::Draw() //图象输出{int i;for(i=0;i<a;i++)//处理越界的灰度值{if(result.m_pData[i]<0) result.m_pData[i]=0;if(result.m_pData[i]>255) result.m_pData[i]=255;}for (i = 0; i <a; i ++)//重新给图象每个象素赋灰度值{ unsigned char *pData=m_pDib.m_lpImage+sizeSaveImage.cx*(i/sizeImage.cx)+i%sizeImage.cx;*pData=(BYTE)(long)(result.m_pData[i]+0.5);}CDC *pDC = GetWindowDC();CKLchangeDoc* pDoc = GetDocument();pDoc->pDib=&m_pDib;OnDraw(pDC);//将处理后图象绘出}。

3-第三章离散余弦变换KL变换3

6
7
例如：N=4时，有：
⎡H 2 H4 = ⎢ ⎣H 2
⎡1 1 1 1 ⎤ ⎥ H2 ⎤ ⎢ 1 − 1 1 − 1 ⎢ ⎥ ＝ ⎥ －H 2 ⎦ ⎢1 1 − 1 − 1⎥ ⎢ ⎥ ⎣1 − 1 − 1 1 ⎦
8
例如：N=8时，有：
⎡1 ⎢1 ⎢ ⎢1 ⎢ 1 H8 = ⎢ ⎢1 ⎢ ⎢1 ⎢1 ⎢ ⎢ ⎣1 1 −1 1 −1 1 −1 1 −1 1 1 −1 −1 1 1 −1 −1 1 −1 −1 1 1 −1 −1 1 1 1 1 1 −1 −1 −1 −1 1 −1 1 −1 −1 1 −1 1 1 1 −1 −1 −1 −1 1 1 1⎤ −1⎥ ⎥ −1⎥ ⎥ 1⎥ −1⎥ ⎥ 1⎥ 1⎥ ⎥ −1⎥ ⎦
•如何衡量相关性？
• φij 反映了xi和xj之间的相关性，若各分量之间互不相关，则Φ x 只存在对角线，代表各分量的方差。
2
(DHT) 3.8 离散哈达玛变换离散哈达玛变换(DHT) 3.9 K －L变换 K－ 3.10 离散余弦变换（ DCT ）离散余弦变换（DCT DCT）
3
(DHT) 3.8 离散哈达玛变换离散哈达玛变换(DHT)
28
（4）K－L反变换由：得：
Y = A( X − m X )
X = A Y + mX
−1
由于A矩阵的各行都是正交归一化矢量，所以 A−1 = AT ，可得：
X = AT Y + m x
29
K-L 变换的优点四、四、K-L K-L变换的优点 1.完全去除原信号X中的相关性。
2.将Y截短时，均方误差最小，并等于所舍去的特征值之和。 3.若将N个特征按大小顺序排列，即， λ 0 ≥ λ1 ≥ ⋯ ≥ λ N −1 若将 λ m +1 ⋯ λ N −1 舍去后，保留了原信号的最大能量。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

模式识别作业报告
组员：
2011302265 孔素瑶
2011302268 马征
2011302273 周昳慧
一、实验要求
用FAMALE.TXT 和MALE.TXT 的数据作为本次实验使用的样本集，利用K-L 变换对该样本集进行变换，与过去用Fisher 线性判别方法或其它方法得到的分类面进行比较，从而加深对所学内容的理解和感性认识。

二、具体做法
1．不考虑类别信息对整个样本集进行K-L 变换（即PCA ），并将计算出的新特征方向表示在
二维平面上，考察投影到特征值最大的方向后男女样本的分布情况并用该主成分进行分类。

2．利用类平均向量提取判别信息，选取最好的投影方向，考察投影后样本的分布情况并用
该投影方向进行分类。

3．将上述投影和分类情况与以前做的各种分类情况比较，考察各自的特点和相互关系。

三、实验原理
设n 维随机向量T n x x x x ),,(21⋯=，其均值向量][x E u =，相关矩阵][T
x xx E R =，协方差矩阵]))([(T
x u x u x E C --=，x 经正交变换后产生向量T n y y y y ),,(21⋯=。

设有标准正交变换矩阵)),,((21n t t t T T ⋯=，（即I T T T
=）
T
n T n y y y x t t t x T y ),,(),,(2121⋯=⋯==，x t y T
i i = (1,2
,)i n =
∑=-===n
i i i T
t y y T y T x 11
（称为 x 的K-L 展开式）
取前m 项为x 的估计值1
ˆm
i i i x
y t ==∑ 1m n ≤<其均方误差为
∑∑+=+=∧
∧=
=
--=n
m i i
i n
m i i
T
y y E y
E x x x x E m 1
'1
2
][][)]()[()(ξ
∑∑∑+=+=+==
==
n
m i i x i
n
m i i
n
m i i
i t R t
t
x x E t y y E m 1
'1
''
1
'
)(][)(ξ
在I T T ='
的约束条件下,要使均方误差
min )]()[()(1
''
→=
--=∑+=∧
∧n
m i i x i
t R t
x x x x E m ξ
为此设定准则函数∑∑+=+=--
=
n
m i i T
i i n
m i i x T
i t t t R t J 1
1
)1(λ
由
0i
J
t ∂=∂可得()0x i i R I t λ-= 1,...,i m n =+ 即x i i i R t t λ= 1,...,i m n =+
表明: λi 是x R 的特征值，而i t 是相应的特征向量。

利用上式有:
∑∑∑+=+=+==
=
=
n
m i i
n
m i i i T i
n
m i i x T i
t t
t R t
m 1
1
1
)(λ
λξ
用“截断”方式产生x 的估计时，使均方误差最小的正交变换矩阵是其相关矩阵R x 的前m 个特征值对应的特征向量构成的。

四、实验内容
实验中，训练样本集的身高和体重数据构成二维特征向量。

利用K-L 变换，找出合适的投影方向，将原坐标系中的二维向量变为新坐标系中的一维向量，根据变换后的数据进行分类及为实验目的。

(1).不考虑性别信息的特征提取
根据训练样本集数据，计算样本均值)(x E u =和协方差矩阵]))([(T
x u x u x E C --=,式中，
T x x x ),(21=是二维特征列向量。

令产生矩阵=ψ]))([(T
x u x u x E C --=计算ψ的特征值，则最大特征值对应的特征向量即为要求的新坐标系。

将原来的二维坐标系中的数据投影到一维坐标系之后，给定适当的阈值即可实现对样本数据得分类。

(2).利用类均值向量的特征提取
根据训练样本集数据，分别计算两个样本的均值i u 和协方差矩阵i ∑。

在给定先验概率)(i P ω的情况下可以计算出类内离散度矩阵∑=∑
=
2
1
)(i i
i
w P S ω以及类间离散度矩阵
∑=--=2
1
))()((i T i i i b x x x x P S ω，其中i x 和x 分别代表各类均值与总体均值。

w S 是K-L 坐标
系的产生矩阵，变换后表征分类性能的函数
j
w T
j j b T
j j u S u u S u x J =
)(
可见()j J x 是类间离散度与类内离散度在j u 这坐标的分量之比，()j J x 越大，表明在新坐标系中该坐标轴包含较多可分性信息。

为了降低特征空间的维数,可以将各分量按()j J x 大小重新排列，使：
)()()(21D x J x J x J ≥⋯≥≥
并且与前面d 个最大的()j J x 值相对应的特征向量j u ，j=1，……，d 作为特征空间的基向量。

五、程序框图
1.不考虑性别信息
2.利用类均值向量的特征提取
六、实验结果
(1).不考虑性别信息的特征提取
实验中不考虑类别信息，用FAMALE.TXT和MALE.TXT的数据作为本次实验使用的样本集，建立基于K-L变换的分类器，记录错误率，并与Fisher线性分类器的分类结果作比较。

表1
男误判为女女误判为男
K-L104
Fisher84
不考虑性别信息的特征提取中，Fisher线性分类器略胜一筹
(2).利用类均值向量的特征提取
实验中考虑类别信息，设定男女先验概率分别为0.75和0.25，建立基于K-L变换的分类器，记录分类错误率并与Fisher线性分类器的分类错误率进行比较。

表2
男误判为女女误判为男
K-L103
Fisher84
利用类均值向量的特征提取中，分类效果会受到先验概率的影响
七、实验心得
有了前两次的实验经验，这次的实验完成起来要熟络得多。

我们先对之前学过的知识进行了系统的回顾，对KL变换有了更深一步的了解，此外，我们在选取先验概率时，考虑到前面Fisher分类器采用的是0.75对0.25，所以为了减少工作量，我们依旧选取0.75对0.25，整个过程相比于前两次显得较为轻松。

模式识别作业三——kl变换

合集下载

实验2_KL变换实验

KL变换和主成分分析

模式识别基于K-L变换的特征提取

利用K-L变换法进行人脸识别

现代数字信号处理及其应用论文——KL变换的应用

k变换

模式识别(三)课后上机作业参考解答

模式识别课件--特征提取_KL变换

K-l变换.

模式识别课件--特征提取_KL变换32页PPT

KL变换

模式识别作业三——kl变换

模式识别作业K_L变换

KL变换和主成分分析

模式识别第三次作业-KL变换

3-第三章离散余弦变换KL变换3

文档推荐

最新文档

模式识别作业三——kl变换

合集下载

实验2_KL变换实验

KL变换和主成分分析

模式识别 基于K-L变换的特征提取

利用K-L变换法进行人脸识别

现代数字信号处理及其应用论文——KL变换的应用

k变换

模式识别(三)课后上机作业参考解答

模式识别课件--特征提取_KL变换

K-l变换.

模式识别课件--特征提取_KL变换32页PPT

KL变换

模式识别作业三——kl变换

模式识别作业K_L变换

KL变换和主成分分析

模式识别第三次作业-KL变换

3-第三章离散余弦变换KL变换3

文档推荐

最新文档

模式识别基于K-L变换的特征提取