第四章 矩阵分解
基于理论研究和计算的需要,往往有必要把矩阵分解为具有某种特性的矩阵之和或积,这就是我们所说的矩阵分解.
本章将介绍一些常用的分解方法,某些在《数值分析》中已涉及的分解,我们这里就不再提起了.
§4.1 矩阵的正交三角分解
60年代后以Givens 与Householden 变换发展起来的矩阵的QR 分解在计算数学中扮演了十分重要的角色,尤其是基于QR 分解所建立的QR 方法,已对数值线性代数理论的近代发展起了关键作用.
定义 1 如果一个上三角矩阵的主对角线元素全为正实数,则称该矩阵为一个正线上三角矩阵.
定理1 (正交三角分解) 设A 为n 阶实满秩矩阵,则必有n 阶正交矩阵Q 及n 阶正线上三角矩阵R ,使得QR A =.
证 设A 按列分块为
()n A ααα ,,21=,
则12,,,n ααα 为欧氏空间n R 的一组基,利用施密特正交化方法可以得到一组正交基
11βα=, ()(),,,2
1122111122ααιαββββαβ+=+-
=
… … … …
n n n n n n n ααιαιαιβ++++=--1,12211 ,
再单位化得一组标准正交基
1111αεb =,
2221122ααεb b += , (1)
… … … …
n nn n n n n n n b b b b ααααε++++=--1,12211 ,
其中i
ii b β1
=
>0,令
???
?
?
?
?
?
?=nn n n b b b b b b B 222
11211,
显然B 为正线上三角矩阵.且有
()()1212,,,,,,n n B εεεααα= .
(2)
再令()12,,,n Q εεε= ,则Q 为正交矩阵.记1-=B R ,则R 仍为正线上三角矩阵.由(2)即得QR A =.定理证毕.
实满秩矩阵的QR 分解是唯一的. 例1 求矩阵
122212121A ??
?= ? ???
的QR 分解.
解 记A 的三个列向量依次为123,,ααα,用施密特正交化方法得
11(1,2,1)T βα==,
212(1,1,1)T ββα=-+=-,
32131711(,0,)3622
T βββα=--+=-.
单位化得
11111121(,,)66666
T
εβα=
==, 2212111111
(,,)333333
T εβαα=
=-+=-, 331235222222(,0,)6322
T εβααα==-
-+=-. 令?????
???
?
?
?--==223
16
103162223161),,(321εεεQ ,则Q 为正交矩阵.且 ()123,,,Q B ααα=其中 11526
63120330
2B ??-
-
? ?
?=-
? ? ? ??
?
,经计算得 176666
30
33200
2R B -?? ? ?
?
== ? ? ? ??
?
,便有QR A =. 对于复满秩矩阵,类似地有UR 分解定理.
定理2 设A 为n 阶复满秩矩阵,则必有n 阶酉矩阵U 及正线上三角矩阵
R ,使得A UR =.
以下讨论列满秩矩阵的正交三角分解.
定理3 设n m A ?为实数域上的列满秩矩阵,则有分解式
A QR =, ???
?
??=01R R ,
其中Q 为m 阶正交矩阵,1R 为n 阶正线上三角矩阵.
证 不妨设m n >,由A 列满秩,必可找到()n m m -?的列满秩矩阵1A ,使()1~
,A A A =为m 阶满秩矩阵,由定理1,必有m 阶正交矩阵Q 及m 阶正线上三角矩阵~
R ,使得
~
~
R Q A =.
记~
R 的前n 列形成的矩阵为10R R ??
= ???
,则1R 为n 阶正线上三角矩阵.且显然有
A QR =.
对于复数域上的列满秩矩阵,亦有类似结果. 定理4 设n m A ?为复数域上的列满秩矩阵,则有
A =UR ,???
?
??=01R R , (3)
其中U 为m 阶酉矩阵,1R 为n 阶正线上三角矩阵.
设m n >,如记11(,,,)m U ξξξ= ,()12,U U U =, ()n U ξξξ,,,211 =, 因为1U 是酉矩阵U 的前n 列构成的,通常称之为部分酉阵,它满足
n H
E U U =11.
从(3)式可见
11A U R = (4)
(3)式与(4)式都可以看作是列满秩矩阵的UR 分解.
§4.2 矩阵的满秩分解
下面介绍矩阵的满秩分解.
定理5 (满秩分解)对任一秩为0)(>r r 的矩阵n m A ?,必存在秩为r 的矩阵
r m B ?及n r C ?,使得
A BC =. (1)
证 A 可经初等变换化为标准形,即有m 阶满秩矩阵1P 及n 阶满秩矩阵
2P ,使得
???
?
?
?=021r
E AP P . 于是 ()1111
1212000r
r r
E E A P P P E P ----????==
? ??
???
,
令 ()1112,00r r E B P C E P --??== ???
,
则B 是11-P 的前r 列,C 是12-P 的前r 行,当然有秩B =秩C r =,并使A BC =,定理证毕.
满秩分解(1)通常不是唯一的.它取决于行列的初等变换矩阵1P 及2P .而矩阵1P ,2P 可以在化A 为标准形的过程中顺便得到,具体做法是:对如下矩阵
0m n A
E E ?? ???
的前m 行、前n 列施行一系列初等变换,化A 为标准形.在这一过程中,等于对m E (及n E )分别施以了与A 的变化相同的行的(及列的)初等变换.最终化为
1200r E P P
????
? ??? ? ???
.
按此办法可得知矩阵A 的秩数r ,并得到行、列的变换矩阵1P 及2P ,进而得到
B 与
C .
例1 求矩阵
????
? ??---=3111317200
21A
的一种满秩分解.
解 在用行、列初等变换化A 为标准形式过程中,顺便求出相应的初等变换矩阵21,P P ,具体变换过程如下
???
????
???
? ??-----???→???????????? ??---=???? ??++100001000010000110131300123130001002
1100001000010000110031110103172001002101(-1)]
[31(-2)][2E E A [32(1)]
[21(2)][2,3]10
00
1
001
00
1
0003132100
1
332100000311000031112
0010200100
0010
00100
100000
100
01++-????
?
?
---- ? ? ?
?
-- ? ?
????→???→-- ? ? ? ?
?
?
? ?
? ??
???
[42(3)][32(3)]10001
000100210000031110200
0100133
00
1
++-??
?
- ? ?
-
?????→- ? ? ?- ? ??
?
. 到此知A 的秩为2,行、列变换矩阵分别为
?????
??--=1130120011P , ??
??
?
?
?
?
?--=10003310010002012P . 求出1P ,2P 的逆矩阵为
???
?
? ??-=-1110120011
1P , ??
??
?
?
? ??-=-10000010313000
2112P . 取11-P 的前两列为B ,取12-P 的前两行为C ,则得A 的一种满秩分解
????
?
?-????
?
??-==31300021111201BC A .
例2 求矩阵
??
??
?
?
?
?
?------=755621042114000265
141A 的满秩分解.
解 对矩阵A 只作初等行变换
??
?
??
??
?
??-→→00000725751
00729710010
700
01 A , 则A 的秩为3,且前三个列向量线性无关,故令
????
???
?
?----=56242100214
1
B , 000
711029007
71525007
71C ??
- ? ?= ? ? ? ??
?
, 容易验证 A B C =.
例3 求矩阵
????
?
??=1113937016241231A
的满秩分解.
解 对A 只作初等行变换
11013033210013300000A ??- ? ?
?
→→ ? ? ? ???
,
则A 的秩为2,且第一、三列向量线性无关,故令
122133B ?? ?= ? ???,110130332100133C ??- ?= ? ? ??
?,
容易验证 A B C =.
由于A 的第二,三列向量也线性无关,故也可取
1110321039961,210019333B C ????- ? ?
== ? ? ? ? ????
?,
亦有 A B C =.
当A 的行数、列数都不大时,采用上例的方法求解A 的满秩分解一般是行之有效的.
§4.3 矩阵的谱分解
一、可对角化矩阵的谱分解
可对角化矩阵A 必可分解为若干个幂等矩阵的、以A 的特征根为系数的线性组合.因为特征根又称谱值,所以这种分解称为谱分解.
定理6 设n 阶可对角化复矩阵A 的全部互异特征根为12,,,,t λλλ 其重数分别为12,,,,t n n n 则存在t 个n 阶幂等矩阵12,,,t A A A 满足(其中
1,,i j t i j
≤≤≠) 1)E A t
i i =∑=1
;(可加性)
2)0i j A A =, j i ≠;(分离性)
3)∑==t
i i i A A 1λ; (1)
4)()i i r A n =.
证 设i λ是A 的i n 重特征根(1,2,,i t = ),则∑==t
i i n n 1,由已知,必有可
逆矩阵
12(,,,)t P P P P =
使得
12
121t n n
t n E E P AP E λλλ-?? ?
?=Λ=
? ? ??
?
. 上面的i P 为i n n ?矩阵,且i P 之各列均为A 相应于特征根i λ的特征向量.现将
1P -分块为
??????
?
??=-t Q Q Q P 211,
其中i Q 为i n n ?矩阵.令
i i i Q P A =,1,2,,,i t =
则有
E PP Q
P A i
t
i i
t i i
===-==∑∑11
1
.
再从11
1212122211
2t t t t t t Q P Q P Q P Q P Q P Q P E P P Q P Q P Q P -?? ? ?
== ? ??? ,可得
i i i n Q P E =, j i P Q j i ≠=,0,
进而有i i i i i i i i A Q P Q P Q P A ===2,0,i j i i j j A A PQ PQ i j ==≠
并且
1
1
1
t
t
i i i i i i i A P P PQ A λλ-===Λ==∑∑,
由i i i A PQ =知,()()i i i A P n ≤=秩秩.又由 1
t i =∑秩()i A ≥秩1
()t i i A =∑=秩1
()t
i i E n n ===∑,
所以只能有秩()i i A n =.
(1)式称为A 的谱分解式,诸i A 称为A 的谱算子. 定理7 在定理6条件下,谱分解式(1)是唯一的,且有
)()
(i i i i A A λ??=
, 1,2,,i t = ,
这里)()(1
j t
i
j j i λλλ?-∏=≠=.
证 先证唯一性.设还有n 阶幂等矩阵12,,,t B B B ,使
0i j B B =()j i ≠,E B t i i =∑=1
,i t
i i B A ∑==1
λ,
则可验证
1
()t
i i j j j A A A A λ==∑,
i i i i A AA A A λ==,
i i i i B AB A B λ==, 1,2
,,i t = 于是 j i j j i j i i B A AB A B A λλ==,即()
0=-j i j i B A λλ.当j i ≠时便有0i j A B =,从而
i i t j j i i t
j j i i B B A B A B A A =???
?
??===∑∑==11.
这就证明了分解的唯一性.
今设
()
()i i i i A G λ??=
,
则当A 的谱分解式为(1)时,对任意的i ,1,2,,j t = ,都有
()()=????????-∏=
≠=j k t i k k i i j i A E A A G λλ?11
()())(111j t j k t i k k i i A AA E A λλλ?-???
?????-∏-≠= =()()()j t j k t i k k i i A E A λλλλ?-???
?
????-∏-≠=111
=
()()()()
j ij j i i j i j k j t
i
k k i i A A A δλ?λ?λλλ?==
-∏=≠=11
. 进而有
i j t
j ij t j j i i A A A G G ===∑∑==1
1
δ,
定理证毕.
定理6是可对角化矩阵针对互异特征根的谱分解.只要在证明过程中对相似因子P 及1P -按如下方法分块(每块为一列或一行)
()??????
?
??==-n n Q Q Q P P P P P 211
21,,,,,
同样令i i i A PQ =(1,2,,i n = ),可得如下结果:
定理8 设n 阶可对角化矩阵A 的全部特征根为n λλλ,,,21 ,则存在n 阶幂等矩阵12,,,n A A A ,满足
1)0i j A A =, j i ≠;
E A
n
i i
=∑=1
)
2;
∑==n
i i i A A 1
)3λ. (2)
定理8中的(2)式也是一种谱分解.(1)式为“异根谱分解”.(2)式为“全根谱分解”.但全根谱分解未必是唯一的. 例1 求可对角化矩阵
460350361A ?? ?=-- ? ?--??
的谱分解式.
解 24
6035
(2)(1)3
6
1
E A λλλλλλ---=
+=+--,故A 的特征值为
11λ=(二重),22λ=-.
当11λ=时,360120360000360000E A λ--????
? ?
-=→ ? ? ? ?????
,解得线性无关的特征向
量
1210ξ-?? ?= ? ???, 2001ξ??
?
= ? ???
.
当22λ=-时,660101330011363000E A λ--???? ? ?
-=→- ? ? ? ?-????,得与12,ξξ线性无关
的特征向量3111ξ-??
?
= ? ???
.
令123(,,)P ξξξ=,112(,)P ξξ=,23()P ξ=.则 1
110121120P ---?? ?=-- ? ???
,令
1110121Q --??= ?--??,()2120Q =,经计算得 111220110121A PQ ??
?
==-- ? ?
--??,222120120120A P Q --??
?
== ? ???
,则得谱分解式
11222201201102120121120A A λλλ--????
? ?
=+=--- ? ? ? ?--????
.
又解 由0E A λ-=,得A 的全部互异特征根11λ=(二重),22λ=-, 令12()2?λλλλ=-=+,21()1?λλλλ=-=-.
计算 1
111220()1(2)110()3121A A A E ??λ??
?
==+=-- ? ?
--??, 2
222120()1()120()3120A A A E ??λ--??
?
==--= ? ?
??
, 可得谱分解式 122A A A =-.
就上例而言,如果想求出A 的全根谱分解式,只需将P 按每列分块,1
P -按每行分块.
123(,,)P P P P =,11
23Q P Q Q -??
?= ? ???
,则
11122201(1,1,0)1
100000A PQ -???? ? ?
==--=-- ? ? ? ?????
,
22200000(1,2,1)0001121A P Q ???? ? ?
==--= ? ? ? ?--????,
33311201(1,2,0)1
201120A PQ ---???? ? ?
=== ? ? ? ?????
, 则有 1232A A A A =+-.
这种分解是不唯一的,因为它和相似因子的不同取法有关.
二、正规矩阵的谱分解
先给出一个重要结论舒尔(Schur)引理.
引理1 对于任一n 阶复矩阵A ,必有n 阶酉矩阵U 及上三角矩阵R ,使得 H U A U R =. (3) 证 设A 的Jordan 标准形为J ,则有可逆矩阵P ,使1A PJP -=.而可逆矩阵P 又可作UR 分解,即有酉矩阵U 及上三角矩阵1R ,使1UR P =,于是
111H A UR JR U -=.记111R R JR -=,则R 仍为上三角矩阵,且使(3)式成立.
在第二章我们定义了正规矩阵即满足H H A A AA =的n 阶复矩阵A 容易验证对角阵、实对称阵、反对称阵、Hermite 阵、反Hermite 阵、正交矩阵、酉
矩阵都是正规矩阵,但是正规矩阵并不仅限于上述矩阵,如1111A -??
= ???
,则
1111T A ??= ?-??,2002T T
A A AA ??== ???
,故A 是正规矩阵.
再看一个复矩阵,设11221i A i -??= ?+??,633336H H i AA A A i -??== ?+??
,故
A 是正规矩阵.
引理2 如果上三角矩阵A 还是正规矩阵,则A 必为对角矩阵.
证 设11121222n n nn a a a a a A a ??
?
?= ?
??? ,则11
12
2212H
n
n
nn a a a A a a a ??
?
?= ? ?
??
. 注意H H AA A A =,有两端第一行第一列元素对应相等,即
11111212111111n n a a a a a a a a +++= ,
得2
2
1210n a a ++= ,所以1210,,0n a a == .
又由第二行第二列元素相等,可知2320,,0n a a == .
在此基础上,可知A 的主对角线以上元素均为0,故可知A 为对角矩阵.
定理9 n 阶复矩阵A 是正规矩阵的充分必要条件是存在酉矩阵U 及对角矩阵Λ,使得
H U U A Λ=,
其中 12(,,,)n diag λλλΛ= ,诸i λ恰为A 的全部特征根.
证 必要性 由Schur 引理,有酉矩阵U 及上三角矩阵Λ,使
H A U
U =Λ (4) 从H H A A AA =可推知
()()H H H H H H U A U U A U U A A U ΛΛ== ()()H H H H H H U A A U U A U U A U ===ΛΛ.
故Λ也为正规矩阵,由引理2知Λ为对角矩阵,设12(,,,)n diag λλλΛ= ,由(4)可知Λ的全对角元恰是A 的全部特征根.
充分性 若酉矩阵U 使H A U U =Λ,且12(,,,)n diag λλλΛ= ,于是
H H ΛΛ=ΛΛ,从而
()()H H H H H H H H H H H H A A U U U U U U U U U U U U AA =ΛΛ=ΛΛ=ΛΛ=ΛΛ=.
证得A 为正规矩阵.
定理9可叙述为复方阵A 酉相似于对角阵的充要条件是A 为正规矩阵. 定理10(正规矩阵的谱分解) 设n 阶复矩阵A 的全部互异特征根为
t λλλ,,,21 ,则A 为正规矩阵的充要条件是存在t 个幂等的H -矩阵
12,,,t A A A ,满足
)10i j A A =, i j ≠;
E A t
i i =∑=1
)2;
∑==t
i i i A A 1
)3λ .
证 设i λ是矩阵A 的i n 重特征根(1,2,,i t = ). 必要性 既然A 是正规矩阵,则存在酉矩阵U ,使得
1H U AU U AU -==Λ,
其中
12
12t n n
t n E E E λλλ?? ? ?Λ=
? ? ??
?
, 设U 分块为
12(,,,)t U U U U = ,
i U 为i n n ?矩阵.便有
??????
? ??==-H t H H H
U U U U U 211.
此时i U ,H i U 正处在定理6证明中i i Q P ,的位置,因此若令
,
1,2,...,H i i i A U U i t ==,
则i A 必是幂等矩阵且使1)、2)、3)式成立,又显然有i H i A A =.必要性得证.
充分性 由i i A A =2,i H i A A =及条件1)、3)可得
∑∑∑====???? ????? ??=t i i i t j j j t i i i H
A A A AA
1
2
11λλλ, 类似可得
i t
i i H
A A A ∑==12
λ,
于是H H A A AA =,即知A 为正规矩阵.
定理10中的幂等H -矩阵又称为正交谱算子,或叫做正交投影算子. 正规矩阵是一类特殊的可对角化矩阵,因此它存在唯一的谱分解,又正交谱算子首先已是谱算子,按谱分解的唯一性,正规矩阵的谱分解亦可按照一般谱分解的方法,只求一般(未必是酉矩阵)的相似因子P 及1P -,按定理6提供的方式求出12,,,t A A A ,这些i A 也必定是H -矩阵,从而成为正交谱算子.与定理10的求法相比,求可逆矩阵P 比求酉矩阵U 简便但却要计算1P -.另外,也可以用定理8提供的方法.
例2 求正规矩阵??
?
?
?
?
?
??=10000100000000i
i A 的谱分解式.
解 求得A 的特征根为123,,1()i i λλλ==-=二重.
求出酉矩阵?????
??
?
?
?
?-
=1000
0100002
121002121U ,使),1,1,(d 1i i iag AU U -=Λ=-. 令 ??
????
?? ??=??? ????
???????
??
=000
0000002121
0021
210,0,21,210021211A ,
??
????
?
? ??--=??? ??-????????
? ??-=000
00000
00212100212
10,0,21,21
0021212A ,
??????
?
?
?=???? ?????????
??=10
0001000000000
010000100100100003A , 则123,,A A A 均为正交谱算子,且123A iA iA A =-+.
又解 求出相似因子???
???
?
??-=10000100001
1001
1P , 算得
?
?
?????
?
??-=-10000100002
121002121
1
P ,
便有1(,,1,1)P AP diag i i -=Λ=-,计算出
??
????
?
?
??=???
???
?????
?
??=000
000000212100212
10,0,21,2100111A ,
211001*********,,0,02
20220000000
00A ??-
?
??
? ?
-??
? ?-=-= ? ? ??? ? ?
???
??
?
,
30
0000
0000010000010000100100100
1A ???? ?
??? ? ?==
? ? ??? ? ?????
, 亦可得谱分解式123A iA iA A =-+.
§4.4 矩阵的奇异值分解
矩阵的奇异值分解是计算矩阵的重要手段,在控制理论、优化问题、广义逆矩阵等方面有直接的应用.
本节将给出复矩阵的奇异值分解.按照这种方法可以把任意复矩阵表示为两个酉矩阵中间夹着一个奇异值矩阵的连乘积.
引理3 对任意复矩阵m n A ?,必有
秩H A A ()=秩H AA ()=秩A .
证 只证秩H A A ()=秩A ,为此考虑两个线性方程组
0Ax =, (1)
0H A Ax =, (2)
矩阵分析
第四章 矩阵分解
§4.1: 矩阵的满秩分解 §4.2: 矩阵的正交三角分解 §4.3: 矩阵的奇异值分解 §4.4: 矩阵的极分解 §4.5: 矩阵的谱分解
矩阵分解前言
矩阵分解定义: 将一个已知矩阵表示为另一些较为简单或 较为熟悉的矩阵的积(或和)的过程称为矩阵分解. 例:(1)对任意n阶正规矩阵A,存在酉阵U∈Un×n使 A=Udiag(λ1,…,λn)U*, 其中λ1,…,λn为A的所有特征值的任一排列. (2)对任意n阶正定矩阵A,存在可逆阵Q∈Cnn×n使A=Q*Q,或存 在唯一正定阵B使A=BB. 矩阵分解意义:有利于研究已知的矩阵. 例如,利用正定阵A的平方根B为正定阵可证: 对任意Hermite阵H,AH或HA都有实特征值.
1
( AH~(A1/2)-1AHA1/2=A1/2HA1/2∈Hn×n )
2
初等变换与初等矩阵(p73)
三类初等变换: (行(列)变换←→左(右)乘) (1)将矩阵A的两行互换等价于用第一类初等矩阵P(i,j)左 乘A; (2)将矩阵A的第i行乘以k≠0等价于用第二类初等矩阵 P(i(k))=diag(1,…,1,k,1,…,1)左乘A. (3)将矩阵A的第j行乘以k≠0后再加到第i行等价于左乘第 三类初等矩阵P(i,j(k)).
P (i , j ) =
?1 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 1 0 1 1 1 0 1 1
初等变换与初等矩阵举例
?1 ?? 1 4 7 ? ? 1 4 7 ? ? 0 1 ?? 2 5 8 ? = ? 3 6 9 ? ; ? ?? ? ? ? ? 1 0 ?? 3 6 9 ? ? 2 5 8 ? ? ?? ? ? ? ?1 4 7??1 ? ? 1 7 4? ? 2 5 8?? 0 1? = ? 2 8 5? ? ?? ? ? ? ? 3 6 9?? 1 0? ? 3 9 6? ? ?? ? ? ?
?1 ??1 4 7? ? 1 4 7 ? ? ?? ? ? ? 0.2 ? ? 2 5 8 ? = ? 0.4 1 1.6 ? ; ? ? 1?? 3 6 9 ? ? 3 6 9 ? ? ?? ? ? ?
?1 4 7??1 ? ? 1 4 7 / 9? ? ?? ? ? ? ? 2 5 8?? 1 ? = ? 2 5 8/9? ? 3 6 9?? 1/ 9 ? ? 3 6 1 ? ? ?? ? ? ?
---- i ---- j
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 1?
P (i , j ( k )) =
?1 ? ? ? ? ? ? ? ? ? ?
1
k 1
? ? ? ? ---? ? ? ---? ? ? 1?
i j
3
?1 ?? 1 2 3? ? 1 2 3 ? ? ?? ? ? ? ? ?4 1 ? ? 4 5 6 ? = ? 0 ?3 ?6 ? ; ? 1?? 7 8 9? ? 7 8 9 ? ? ?? ? ? ?
?3 ? ? 1 2 0 ? ? 1 2 3??1 ? ?? ? ? ? ? 4 5 6?? 1 ? = ? 4 5 ?6 ? ?7 8 9?? 1 ? ? 7 8 ?12 ? ? ?? ? ? ?
4
初等变换与初等矩阵的性质
3类初等矩阵都是可逆的(行列式不为0). 将A依次作初等矩阵P1,…,Pr对应的行(列)初等变换等价 于左(右)乘A以可逆矩阵Pr…P1(P1…Pr). 可适当选第一类初等矩阵的乘积P使PA(AP)的行(列)是A 的行(列)的任意排列; 可适当选第三类初等矩阵 P(i,j(k))中的k使P(i,j(k))A的(i,j)元变为0; 可适当选第二类初等矩阵P(i(k))中的k使P(i(k))A的非 零(i,i)元变为1. 存在初等矩阵的乘积P和Q,使PAQ= ,其中r=rankA.
初等变换与初等矩阵的性质续
命题:设A∈Crm×n前r列线性无关,则用初等行变换可把A变为
? Er ? ? 0 ?1 ? ? D? ? = ? ? 0 ? ? ? ? ? ? 1 1 * * * * *? ? *? *? ? *? ? ? ? ?
一般地,?A∈Crm×n都存在m,n阶可逆阵P和Q使PAQ=
5
证:因前r列线性无关,故用第一类初等矩阵左乘可使A的 (1,1)元≠0. 再用第二类初等矩阵左乘可使a11=1; 最后用若干第三类初等矩阵左乘可使A的第一列=e1. 因前2列线性无关,故新的第2列与e1线性无关且≠0, 故用第一类行变换可使(2,2)元≠0,…可使A的第2列=e2. ….可使A的第r列=er.此时空白处必为0元.
安徽大学 章权兵
1
现代控制理论讲义
第四章 矩阵范数和奇异值分解 4.1 引言 在这一讲中,我们将引入矩阵范数的概念。之后会介绍矩阵的奇异值分解或者叫SVD。SVD 揭示了矩阵的2范数,它的值意义更大:它使一大类矩阵扰动问题得以解决,同时也为后面稳定鲁棒性的概念打下基础;它还解决了所谓的完全最小二乘问题,该问题是我们前面讲的最小二乘问题的推广;还帮我们澄清在矩阵求逆计算中碰到的态性的概念。在下一讲中,我们会花更大的篇幅来叙说SVD的应用。 例 4.1 为了提高大家对矩阵范数研究和应用的兴趣,我们首先从一个例子开始,该例子提出了与矩阵求逆有关的矩阵态性问题。我们所感兴趣的问题是矩阵求逆对矩阵扰动的敏感程度。 考虑求下列矩阵的逆 马上就可以求得 现在我们假设对一个受到扰动的矩阵求逆 求逆后,结果就成了 在这里表示A中的扰动,表示中的扰动。显然中一项的变化 会导致中的变化。如果我们解,其中,得到 ,加入扰动后,解得。 在这个结果中,我们仍然可以清楚的看到开始数据仅有的变化,却导致解产生 的变化。 以上例子中我们看到的要比在标量情况下差的多。如果是标量,那么
,所以的倒数中小数部分的变化和的变化在同一量级上。 因此,在上例中的现象完全是在矩阵的时候才出现的。看上去好像和是近似奇异的事实有关——因为它的列几乎不独立,且它的行列式值要比它的最大元素小很多,等等。随后(见下一讲),我们会找到衡量奇异程度的合理方法,同时还要说明在求逆情况下,这种方法和灵敏度的关系如何。 在理解这种灵敏度和扰动的细节关系之前,我们首先要找到度量向量和矩阵量级的方法。在第一讲中我们已经引入了向量范数的概念,所以我们现在来看一下矩阵范数的定义。 4.2 矩阵范数 一个维复数矩阵可以看成(有限维)赋范向量空间中的一个算子: 其中,这里的范数指的是标准欧氏范数。定义的归纳2-范数如下: 术语“归纳”是指在向量和的范数的基础上,使得以上矩阵范数的定义有意义。该定 义中,归纳范数表示矩阵在中单位圆上向量扩大的倍数,也就是说,它表示矩阵的增益。 除了用2-范数来度量向量和,我们还可以用范数,感兴趣的是的情 况。它的定义是: 需要考虑的一个很重要的问题是,在第一讲向量范数定义的情况下,归纳范数是否是真正的范数呢?下面,我们来回顾定义范数的三个条件: 现在我们证明是上的范数——利用前面的定义: 1.对任意都有,所以。进一步有,因为 是在单位圆上的最大值。 2.对任意的,由得。 3.三角不等式仍然成立,因为:
第四章 习题答案 1。用Gauss 消去法解方程组 1231231 2323463525433032 x x x x x x x x x ++=?? ++=??++=? 解:方程组写成矩阵形式为12323463525433032x x x ?????? ? ? ? = ? ? ? ? ? ????? ?? 对其进行Gauss 消去得12323441 4726002x x x ?? ???? ? ? ? ?-= ? ? ? ? ? ?????-?? 得方程组12312323 32346 131 44 822 24 x x x x x x x x x ++=?=-???? -=-?=????=?-=-?? 2。用Gauss 列主元素消去法解方程组 1233264107075156x x x -?????? ? ? ?-= ? ? ? ? ? ?-???? ?? 解:因为第一列中10最大,因此把10作为列主元素 1233264107075156x x x -?????? ? ? ?-= ? ? ? ? ? ?-??????12r r ????→1231070732645156x x x -?????? ? ? ?-= ? ? ? ? ? ?-???? ?? 21 3113 10122 31070716106101055052 2r r r r x x x +-? ??? ? ?-?? ? ? ? ? ????→-= ? ? ? ? ? ??? ? ?????23 r r ????→123107075505221 61061010x x x ? ??? ? ?-?? ? ? ? ? ?= ? ? ? ? ? ? ?? ? ?-????
第一节 正规矩阵 【Schur 三角化定理】设n n A ?∈ ,则存在酉矩阵U ,使*U AU B =,其中B 为一个上三角矩阵. 【酉矩阵】n 阶复方阵U 的n 个列向量是U 空间的一个标准正交基. 1H H H n U U UU E U U -==?= 性质:设有矩阵A ,B ,则 (1)若A 是酉矩阵,则1A -也是酉矩阵; (2)若A ,B 是酉矩阵,则AB 及BA 也是酉矩阵; (3)若A 是酉矩阵,则|det()|1A =; (4)A 是酉矩阵?A 的n 个列向量是两两正交的单位向量. 【定理4.1.1】矩阵A 可以酉对角化?**AA A A =. *U AU T =是上三角矩阵,*********()()AA UTU UTU UTU UT U UTT U === *********()()A A UTU UTU UT U UTU UT TU ===,故****A A AA T T TT =?= A 可以酉对角化,则?酉矩阵U 使*U AU D = ***************()()()()AA U DU U DU U DUU D U U DD U U D DU U DU U DU A A ====== 【定义4.1.1】设n n A ?∈ ,若**AA A A =,则称A 是正规矩阵. 【引理4.1.1】设A 为正规矩阵,若A 又为三角矩阵,则A 为对角矩阵. 【定理4.1.2】设n n A ?∈ ,则A 为正规矩阵?A 有n 个两两正交的单位特征向量. 【推论4.1.1】正规矩阵属于不同特征值的特征向量是两两正交的. 【定理4.1.3】设()i j n n A a ?=是复矩阵,1λ,2λ,……,n λ为A 的n 个特征值,则 (1)(Schur 不等式) 221 ,1||||n n i i j i i j a λ==≤∑∑ (2)A 为正规矩阵?2 21 ,1 |||| n n i i j i i j a λ===∑∑ (3)* 2,,1 tr()||n i j i j AA a == ∑ 【推论】设A 为正规矩阵且幂零,则0A =. 【定义4.1.2】设a 与b 是实数,且0b ≠,则称二阶实矩阵 a b b a ?? ?-??