0
p
性质2 主成分的总方差等于原始变量的总方
差, p
p
i
2 i
i 1
i 1
性质3 主成分 Yk 与原始变量 X i 的相关系数
Yk , X i
k i
uki, k, i 1,2,
,
p
为并称其为主成分载
荷。
§5.3 主成分的选取
称
k
k i
为第
i 个主成分的方差贡献率
m
称
m
i
i
i1 p
X1, X 2 , , X p 的线性组合中方差最大者(即
cov Yp ,Yi 0,i p, DYp 最大)。
其中: DYi DUiX UiDX Ui Ui Ui
DX 协方差阵
cov Yi ,Yj cov U iX ,U j X U i covX , X U j U i U j
Y1,Y2 , ,Yp 分别称为原始变量 X 的第 一主成分、第二主成分、…、第 p 主成分。
二、主成分的推导
第一主成分:构造目标函数
1U1, U1 U1 U1U1 1
对 U1 求导
1
U 1
2 U1
2U1
0
得 U1 U1 即 U 为正交阵, 为 Y1 的方差值,
若 的特征根为 1 2 p 0,Y1的最大 方差值为 1,相应的单位化特征向量为 U1 。
u22 X 2
u2p X p
Yp u p1 X1 u p2 X 2 u pp X p
其中
即 Y U X
uk21 uk22 uk2p 1,即UkUk 1, k 1,2, , p
原则:
1、Yi 与 Y j 不相关 i j,i, j 1,2, , p 2、 Y1 是 X1, X 2 , , X p 的线性组合中方差最大者 (即 DY1 最大);Y2 与 Y1不相关的 X1, X 2 , , X p 的线性组合中方差最大者(即 covY1,Y2 0, DY2 最大);…;Y p 与 Y1,Y2 , ,Yp1 都不相关的