第四章正规矩阵与矩阵的分解
- 格式:doc
- 大小:327.50 KB
- 文档页数:3
矩阵分解矩阵分解矩阵分解是将矩阵拆解为数个矩阵的乘积,可分为三⾓分解、满秩分解、QR分解、Jordan分解和SVD(奇异值)分解等,常见的有三种.矩阵的三⾓分解、正交三⾓分解、满秩分解将矩阵分解为形式⽐较简单或性质⽐较熟悉的⼀些矩阵的乘积,这些分解式能够明显地反映出原矩阵的许多数值特征,如矩阵的秩、⾏列式、特征值及奇异值等. 另⼀⽅⾯, 构造分解式的⽅法和过程也能够为某些数值计算⽅法的建⽴提供了理论依据. 接下来就讨论⼀下矩阵的三⾓分解.1 矩阵的三⾓分解1.1 矩阵的三⾓分解基本概念与定理定义1.1[]5设m n∈和上三⾓矩L C?A C?∈,如果存在下三⾓矩阵m n阵n m∈, 使得A=LU, 则称A可作三⾓分解或LU分解.U C?定义1.2设A为对称正定矩阵, D为⾏列式不为零的任意对⾓矩阵,则T=成⽴:A A=, U为⼀个单位上三⾓矩阵, 且有A LDU1) 如果L是单位下三⾓矩阵, D是对⾓矩阵, U是单位上三⾓矩阵, 则称分解D=为LD U分解.A L U2) 如果L=LD是下三⾓矩阵, ⽽U是单位上三⾓矩阵, 则称三⾓分解A LUCrout分解;= 为克劳特()3) 如果U DU是单位下三⾓矩阵, U 为上三⾓矩阵, 则称三⾓=分解A LUDoolittle分解;= 为杜利特()U --=== , 称为不带平⽅根的乔累斯基()Cholesky 分解;5) 如果12L D L = , 12D U U= , 则1122A LD U LD D U LU=== , 由于T UL = , 则T A LL= , 称为带平⽅根的乔累斯基()Cholesky 分解. 定理 1.1 n阶⾮奇异矩阵A可作三⾓分解的充要条件是k 0A ≠()1,2,,1k n =- ,这⾥A k为A 的k 阶顺序主⼦阵, 以下同.证明必要性. 设⾮奇异矩阵A 有三⾓分解A L U=, 将其写成分块形式k12k122122212222A L 0U =A A 0U kA U L L这⾥A k ,k L 和k U 分别为A, L和U 的k 阶顺序主⼦阵. ⾸先由0⽽L 0k ≠,U 0k ≠; 因此A =L U0kkk ≠()1,2,,1k n =-.充分性. 对阶数n 作数学归纳法. 当n=1时, 1A =(11a )=(1)(11a ),结论成⽴. 设对n k =结论成⽴, 即k =k k A L U , 其中k L 和k U 分别是下三⾓矩阵和上三⾓矩阵. 若k 0A ≠,则由kA =L k k U 易知L k 和k U 可逆. 现证当1n k =+时结论也成⽴, 事实上-1k k k k1TT 1T 1-1k+1,1k 1,1k k k A c 0c A =10c kkk T kk k k k k L U L r a r U a r U L +--+++??= ? ?-.由归纳法原理知A 可作三⾓分解.定理 1.1 给出了⾮奇异矩阵可作三⾓分解的充要条件, 由于不满⾜定理1.1的条件, 所以它不能作三⾓分解. 但110000110011211011202A ?????????? ?===.上例表明对于奇异矩阵,它还能作三⾓分解未必要满⾜定理1.1的条件.⾸先指出,⼀个⽅阵的三⾓分解不是唯⼀的, 从上⾯定义来看,杜利特分解与克劳特分解就是两种不同的三⾓分解,其实,⽅阵的三⾓分解有⽆穷多, 这是因为如果D 是⾏列式不为零的任意对⾓矩阵, 有1()()A LU C D D U LU-== ,其中,LU 也分别是下、上三⾓矩阵, 从⽽A LU = 也使A 的⼀个三⾓分解. 因D 的任意性, 所以三⾓分解不唯⼀. 这就是A 的分解式不唯⼀性问题, 需规范化三⾓分解.定理 1.2 (LD U 基本定理)设A 为n 阶⽅阵,则A 可以唯⼀地分解为A =LD U(1.1)的充分必要条件是A 的前1n -个顺序主⼦式k 0A ≠()1,2,,1k n =- .其中L,U分别是单位下、上三⾓矩阵, D是对⾓矩阵D=diag ()12,,,n d d d ,1k k k A d A -=()1,2,,kn = , 01A =.证明充分性. 若k 0A ≠()1,2,,1k n =- , 则由定理1.1, 即实现⼀个杜利特分解A LU= , 其中L 为单位下三⾓矩阵, U 为上三⾓矩阵,记1112122==()()()()()()1111112122222n n n nn a a a a a a ??=()n A , 因为()u 0i ii ii a ≡≠()1,2,,1i n =- .下⾯分两种情况讨论:1) 若A ⾮奇异,由式(1)有n ?=()()() 121122n nn a a a =A ≠, 所以()n nn nna u =≠,这时令()()()()121122diag n nn D a a a = , 则() ()()1121122111,,,n nn D diag a a a -??= ?.LD D U LDU -=== (1.2)是A 的⼀个LD U 分解.2)若A 奇异,则()u 0i iiii a ≡=,此时令()()()12111221,1(,,,,0)n n n D diag a a a ---= ,()()()()121n-111221,1,,,n n n D diag a a a ---= , α=()1n1u,,,Tn u n - ,则10n T UU α-??≡ =1111110=DU 0001n n n n T T U D U D α------,因此不论哪种情况, 只要k0A ≠()1,2,,1k n =- , 总存在⼀个LD U分解式(1.1),1a kk k kk k A d A -==()1,2,,1kn =- ,01A =.均⾮奇异.若还存在另⼀个LD U 分解111A L D U =, 这⾥1L ,1D , 1U 也⾮奇异,于是有111L D U L D U =(1.3)上式两端左乘以11L -以及右乘以1U -和1D -, 得111111L L D U U D---=, (1.4)但式(1.4)左端是单位下三⾓矩阵, 右端是单位上三⾓矩阵, 所以都应该是单位阵, 因此1LL I-=,1111D U UDI--=,即1L L =,111--=. 由后⼀个等式类似地可得11U UI-=,11D D I-=,即有1U U=,1D D=.2) 若A 奇异, 则式(1.3)可写成分块形式1111100001000110001T T T T T L D U L D U ααββ= ? ? ? ? ? ???????????, 其中1L, 1L 是1n -阶单位下三⾓阵; U , 1U 是1n -阶上三⾓阵; D,1D 是1n -阶对⾓阵; α, 1α,β, 1β是1n -维列向量. 由此得出111111=D U D DUD ααββαββα???? ? ???, 其中1L, 1D , 1U 和L ,D, U均⾮奇异, 类似于前⾯的推理, 可得1L =L ,1D =D , 1U =U ,1=αα,T T1=ββ.必要性. 假定A 有⼀个唯⼀的LD U 分解, 写成分块的形式便是1111A 00=0101n n n n T T nn n x D L U ya d αβ----,(1.5)其中1n L -,1D n -, 1n U -, 1n A -分别是L,A的1n -阶顺序主⼦矩阵;x , y, α,β为1n -维列向量. 由式(1.5)有下⾯的矩阵⽅程:1111n n n n A L D U ----=, (1.6)11TTn n yD U β--=,(1.7)11n n x L D α--=, (1.8)1Tnn n na D d βα-=+. (1.9)否则, 若10n A -=, 则由式(1.6)有111110n n n n n A L D U D -----===.于是有1110n n n L D D ---==, 即11n n L D --奇异. 那么对于⾮其次线性⽅程组(1.8)有⽆穷多⾮零解, 不妨设有α', 使11n n L D x α--'=, ⽽α'=α.同理, 因11n n D U --奇异, ()1111TTT n n n n L D U D ----=也奇异,故有ββ'≠, 使11TTn n U D yβ--=, 或11TTn n D U yn nn n d a D βα-'''=-, 则有1111000101n n n n T T nn nA x D L U y a d αβ----'= ? ? ? ?'',这与A 的LD U 分解的唯⼀性⽭盾, 因此10n A -≠.考察1n -阶顺序主⼦矩阵1n A -由式(1.6)写成分块形式, 同样有2222n n n n A L D U ----=. 由于10n D -≠, 所以20n D -≠, 可得222220n n n n n A L D U D -----==≠, 从⽽20n A -≠. 依此类推可得0k A ≠()1,2,,1k n =- .综上所述, 定理证明完毕.推论 1[]3 设A 是n 阶⽅阵, 则A 可惟⼀进⾏杜利特分解的充分必要条件是A 的前1n -个顺序主⼦式11110k k k kka a A a a =≠,1,2,,1k n =- , 其中L 为单位上三⾓矩阵, 即有11121212223132121111n nnn n n n n u u u l u u l l A u l l l -=并且若A 为⾮奇异矩阵, 则充要条件可换为: A的各阶顺序主⼦式全不为零, 即:0k A ≠,1,2,,k n = .推论 2[]3 n 阶⽅阵A 可惟⼀地进⾏克劳特分解111212122212111n nn n nnl u u ll u A LUl l l==的充要条件为11110k k k kka a A a a =≠, 1,2,,1k n =- .若A 为奇异矩阵, 则0nn l =, 若A 为⾮奇异矩阵, 则充要条件也可换为0k A ≠, 1,2,,k n = .定理 1.3[]3 设A 为对称正定矩阵, 则A 可惟⼀地分解为T A LDL =, 其中L 为下三⾓矩阵, D 为对⾓矩阵, 且对⾓元素是L 对⾓线元素的倒数. 即2212n n nnl l l L l l l ?? ?=, 1122111nn l l D l ?? ? ? ? ?=. 其中11/j ijij ik jk kkk l a l l l -==-∑,1,2,,ni = , 1,2,,j i = .。
矩阵分解法
矩阵分解法是一种被广泛应用于矩阵和数据分析领域的数学方法,它能够对复杂的数据集进行简单而有效的分解,为更深入的分析提供基础。
本文将详细介绍矩阵分解法的基本原理及各种应用,以及它能够解决的相关问题。
矩阵分解法的基本概念是使用矩阵的特定分解技术,将一个大的复杂的矩阵分解成若干较小的更简单的矩阵,这些矩阵之间可能存在一定的关系。
最常用的矩阵分解方法是奇异值分解(Singular Value Decomposition,SVD),它能够有效地将一个矩阵分解成三个矩阵,这三个矩阵可以用来描述矩阵的行、列和特征。
其中,最重要的矩阵是特征值矩阵,它能够描述矩阵中特征之间的关系,这些特征信息可以作为进一步分析的依据。
同时,这些特征也能够影响到矩阵的值,从而有助于解决机器学习和数据挖掘中的关系推断问题,从而获得新的结论。
此外,矩阵分解还可以用于对数据进行统计和预测,这是因为矩阵分解能够提取出高维数据中隐藏的模式,从而将复杂的数据集简化为易于理解的表示形式。
因此,矩阵分解法在实际的数据分析中有着重要的应用,如文本分类、推荐系统和图像识别等。
另外,矩阵分解法还能够帮助数据科学家们解决压缩和特征选择的问题。
首先,矩阵分解能够帮助我们压缩数据集,从而节省存储空间;其次,这种方法也可以帮助我们提取出有用的特征,从而达到减少计算负担的目的。
(尾)总之,矩阵分解法是一种极其重要的数学方法,它可以帮助我们对复杂的数据集进行分解,提取有用信息,从而为进一步分析提供基础,同时还可以用于压缩和特征选择等目的。
因此,矩阵分解法可以说是数据科学领域的一个重要的数学工具,值得进一步关注和研究。
正定矩阵必存在LU分解正定矩阵是定义在线性代数中的一种重要的矩阵类型,它具有一些非常有用的性质。
其中之一是,正定矩阵必定存在LU分解。
在本篇文章中,我们将深入研究正定矩阵和它的LU分解。
一、正定矩阵的定义与性质1.1 定义在线性代数中,正定矩阵是指一个对称矩阵 A,满足对于任意非零向量 x ,都有 x^T A x>0。
此处,x^T 代表 x 的转置。
正定矩阵的定义可表述为:如果 A 是一个 n 阶矩阵,当且仅当对于任意非零向量 x,都有 x^T A x>0,则 A 是正定矩阵。
正定矩阵的一个显著特点是,它的所有特征值都是正数。
这个特性可以通过谱分解得到。
1.2 性质正定矩阵具有一些重要的性质。
这里列举其中的三个:性质1:正定矩阵的所有特征值都是正数。
性质2:正定矩阵的所有主子矩阵都是正定矩阵。
性质3:正定矩阵是可逆矩阵。
且它的逆矩阵也是正定矩阵。
二、LU分解LU分解是一种矩阵分解方法,将一个矩阵分解成一个下三角矩阵L 和一个上三角矩阵 U 的乘积,即 A=LU。
其中,L 是“下三角”,它的对角线上元素都是 1;U 是“上三角”矩阵,它的对角线元素不为零。
下三角矩阵的定义是,在主对角线上和右上角的元素都是零的矩阵。
同理,上三角矩阵也是在主对角线下和左下角的元素都是零的矩阵。
下面,我们来介绍一种求解正定矩阵的LU分解的方法。
3.1 Cholesky分解Cholesky分解是一种求解正定矩阵的LU分解的方法。
其基本思路是,将正定矩阵 A 分解成 L 和它的转置矩阵 L^T 的乘积,即 A=LL^T。
具体实现步骤如下:步骤1:将正定矩阵A 分解成 L L^T 的形式。
其中,L 是一个下三角矩阵。
L的第一行第一列为第一行第一列元素的平方根。
步骤2:求出 L 的逆矩阵 L^-1。
步骤3:将 L^-1 与 L^T 相乘,得到 A 的逆矩阵,即 A^-1。
因为A是正定矩阵,所以它的逆矩阵也是正定矩阵。
第一章 线性空间与线性映射 习题一 (43-45)1、(1)对于V y x ∈∀,,x y x y x y x y y x y x y x y x +=⎪⎪⎭⎫⎝⎛+++=⎪⎪⎭⎫ ⎝⎛+++=+112211112211;(2)对于V z y x ∈∀,,,⎪⎪⎭⎫ ⎝⎛+++++++=⎪⎪⎭⎫⎝⎛+++++++=⎪⎪⎭⎫ ⎝⎛+⎪⎪⎭⎫ ⎝⎛+++=++))()(1111112221111112112211121112211z y z x y x z y x z y x y x z z y x y x z y x z z y x y x y x z y x ,⎪⎪⎭⎫ ⎝⎛+++++++=⎪⎪⎭⎫⎝⎛+++++++=⎪⎪⎭⎫ ⎝⎛++++⎪⎪⎭⎫ ⎝⎛=++))()(1111112221111111122211111221121z y z x y x z y x z y x z y x z y z y x z y x z y z y z y x x z y x ,即)()(z y x z y x ++=++。
(3)对于⎪⎪⎭⎫⎝⎛=00θ和V x ∈∀,显然x x x x x x x =⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫⎝⎛+++=+21121000θ; (4)对于V x ∈∀,令⎪⎪⎭⎫⎝⎛--=2211x x x y , 则θ=⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫ ⎝⎛--+-=⎪⎪⎭⎫ ⎝⎛--+⎪⎪⎭⎫ ⎝⎛=+0021221211221121x x x x x x x x x x x y x ,即x y -=。
(5)对于R ∈∀μλ,和V x ∈∀,有x x x x x x x x x x x x x x x x x x x x x x x )()()]()[(21)()()2(21)()()]1()1([21)1(21)1(2121212212122212121221121212121μλμλμλμλμλμλμλμλμλμλμλλμμμλλμλμλμμμμλλλλμλ+=⎪⎪⎭⎫ ⎝⎛+=⎪⎪⎪⎭⎫⎝⎛+-++++=⎪⎪⎪⎭⎫ ⎝⎛--+++++=⎪⎪⎪⎭⎫ ⎝⎛+-+-+++=⎪⎪⎪⎭⎫⎝⎛-++⎪⎪⎪⎭⎫ ⎝⎛-+=+(6)对于R ∈∀λ和V y x ∈∀,,有⎪⎪⎪⎭⎫⎝⎛+-++++=⎪⎪⎭⎫ ⎝⎛+++=+211112211112211))(1(21)()()(y x y x y x y x y x y x y x y x λλλλλλ, ⎪⎪⎪⎭⎫ ⎝⎛+-++++=⎪⎪⎪⎭⎫ ⎝⎛-+-++-++++=⎪⎪⎪⎭⎫ ⎝⎛+-++-++=⎪⎪⎪⎭⎫⎝⎛-++⎪⎪⎪⎭⎫ ⎝⎛-+=+211112211112212211122111122122121121212121))(1(21)()()1(21)1(21)()1(21)1(21)1(21)1(21y x y x y x y x y x y y x y x y x y x y x y y x x y x y y y x x x y x λλλλλλλλλλλλλλλλλλλλλλλλλλλλλλλλλλ,即y x y x λλλ+=+)(。
矩阵分解⼤全矩阵分解是指根据⼀定的原理⽤某种算法将⼀个矩阵分解成若⼲个矩阵的乘积。
常见的矩阵分解有可逆⽅阵的三⾓(LU)分解、满秩⽅阵的正交三⾓(QR)分解、对称正定矩阵的Cholesky分解,以及任意⽅阵的Schur分解、Hessenberg分解、EVD分解、任意矩阵SVD分解、GMD分解等。
(1) 可逆⽅阵的LU分解矩阵的LU分解就是将⼀个矩阵表⽰为⼀个交换下三⾓矩阵和⼀个上三⾓矩阵的乘积形式。
线性代数中已经证明,只要⽅阵A是⾮奇异的(即可逆的),LU分解总是可以进⾏的。
当L为单位下三⾓矩阵⽽U为上三⾓矩阵时,此三⾓分解称为杜利特(Doolittle)分解。
当L为下三⾓矩阵⽽U为单位上三⾓矩阵时,此三⾓分解称为克劳特(Crout)分解。
显然,如果存在,矩阵的三⾓分解不是唯⼀的。
(PS:⽅阵A可唯⼀地分解为A=LDU(其中L,U分别为单位下,上三⾓矩阵,D为对⾓矩阵)的充分必要条件为A的前n-1个顺序主⼦式都不为0。
特别:对n阶对称正定矩阵,存在⼀个⾮奇异下三⾓矩阵L,使得A=LL'成⽴。
)MATLAB提供的lu函数⽤于对矩阵进⾏LU分解,其调⽤格式为:[L,U]=lu(X):产⽣⼀个上三⾓阵U和⼀个变换形式的下三⾓阵L(⾏交换),使之满⾜X=LU。
注意,这⾥的矩阵X必须是⽅阵。
[L,U,P]=lu(X):产⽣⼀个上三⾓阵U和⼀个下三⾓阵L以及⼀个置换矩阵P,使之满⾜PX=LU。
当然矩阵X同样必须是⽅阵。
(2) 满秩⽅阵的QR分解对矩阵X进⾏QR分解,就是把X分解为⼀个正交矩阵Q和⼀个上三⾓矩阵R的乘积形式。
QR分解只能对⽅阵进⾏。
MATLAB的函数qr可⽤于对矩阵进⾏QR分解,其调⽤格式为:[Q,R]=qr(X):产⽣⼀个⼀个正交矩阵Q和⼀个上三⾓矩阵R,使之满⾜X=QR。
[Q,R,E]=qr(X):产⽣⼀个⼀个正交矩阵Q、⼀个上三⾓矩阵R以及⼀个置换矩阵E,使之满⾜XE=QR。
(3) 对称正定矩阵的Cholesky分解如果矩阵X是对称正定的,则Cholesky分解将矩阵X分解成⼀个下三⾓矩阵和上三⾓矩阵的乘积。
高等代数北大版第四章矩阵知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN第四章 矩阵( * * * )一、复习指导:矩阵这一章节可以说是一个基础章节,它不仅很重要,而且还是其他章节的基础,学好矩阵十分重要,我们要对逆矩阵,转置矩阵,对称矩阵等等的概念都要弄清楚,除此之外,还要知道矩阵的运算性质,矩阵的秩。
在考试中,很有可能会出与矩阵这一章节有关的证明题,例如证明相互关联的矩阵的秩,矩阵的逆之间的关系,还有可能有与求矩阵的逆有关的题目。
总的来说,这一个章节是一个关键的章节,高等代数这本书里面的知识都是融会贯通的,学好了矩阵能够为后面的章节夯实基础。
二、考点精讲:(一) 基本概念及其运算1.基本概念矩阵—形如⎪⎪⎪⎪⎪⎭⎫ ⎝⎛mn m m n n a a a a a aa a a212222111211称为m 行n 列的矩阵,记为n m ij a A ⨯=)(,行数与列数相等的矩阵称为方阵,元素全为零的矩阵称为零矩阵。
(1)若矩阵中所有元素都为零,该矩阵称为零矩阵,记为O 。
(2)对n m ij a A ⨯=)(,若n m =,称A 为n 阶方阵。
(3)称⎪⎪⎪⎭⎫ ⎝⎛=11 E 为单位矩阵。
(4)对称矩阵—设n n ij a A ⨯=)(,若),,2,1,(n j i a a ji ij ==,称A 为对称矩阵。
(5)转置矩阵—设⎪⎪⎪⎪⎪⎭⎫⎝⎛=mn m m n n a a a a a a a a a A 212222111211,记⎪⎪⎪⎪⎪⎭⎫⎝⎛=mn n n m m Ta a a a a a a a a A212221212111,称T A 为矩阵A 的转置矩阵。
(6)同型矩阵及矩阵相等—若两个矩阵行数与列数相同,称两个矩阵为同型矩阵,若两个矩阵为同型矩阵,且对应元素相同,称两个矩阵相等。
(7)伴随矩阵—设n n ij a A ⨯=)(为n 矩阵,将矩阵A 中的第i 行和j 列去掉,余下的元素按照原来的元素排列次序构成的1-n 阶行列式,称为元素ij a 的余子式,记为ij M ,同时称ij j i ij M A +-=)1(为元素ij a 的代数余子式,这样矩阵中的每一个元素都有自己的代数余子式,记⎪⎪⎪⎪⎪⎭⎫⎝⎛=*nn n n n n A A A A A A A A A A 212221212111,称为矩阵A 的伴随矩阵。
矩阵分解与特征值分解矩阵分解和特征值分解是线性代数中重要的概念和技术,在许多领域中都有广泛的应用。
本文将介绍矩阵分解和特征值分解的概念,讨论它们的性质和应用,并探讨它们之间的联系。
一、矩阵分解矩阵分解是将一个复杂的矩阵表示为多个简单矩阵的乘积形式的过程。
常见的矩阵分解方法包括LU分解、QR分解、Cholesky分解等。
这些分解方法可以大大简化矩阵运算的复杂性,提高算法的效率。
1. LU分解LU分解是将一个矩阵表示为下三角矩阵和上三角矩阵的乘积形式。
通过LU分解,可以将线性方程组的求解问题转化为两个简单的方程组的求解问题,从而简化计算过程。
2. QR分解QR分解是将一个矩阵表示为正交矩阵和上三角矩阵的乘积形式。
QR分解广泛应用于最小二乘问题和特征值计算中,有助于提高计算的稳定性和精度。
3. Cholesky分解Cholesky分解是将一个对称正定矩阵表示为一个下三角矩阵和其转置矩阵的乘积形式。
Cholesky分解常用于解决线性方程组的求解问题,具有较高的计算效率和稳定性。
二、特征值分解特征值分解是将一个矩阵表示为可逆矩阵和对角矩阵的乘积形式。
特征值分解在许多领域中都有广泛的应用,如物理学、工程学、计算机科学等。
特征值分解可以帮助我们理解矩阵的性质和行为。
对于一个n阶方阵A,特征值分解可以表示为A = PDP^-1,其中P是由A的特征向量组成的矩阵,D是由A的特征值组成的对角矩阵。
特征值表示了矩阵变换中的比例关系,特征向量表示了矩阵中不变方向。
通过特征值分解,我们可以了解矩阵的稳定性、收敛性以及系统的振动模式等信息。
三、矩阵分解与特征值分解的联系矩阵分解和特征值分解在一定程度上是相互关联的。
特征值分解可以被看作是一种矩阵分解的特殊形式,即将一个矩阵分解为其特征向量矩阵和对角矩阵的乘积。
一些矩阵分解方法可以被用于求解特征值和特征向量,例如QR分解和带平移的QR分解可以用于计算特征值和特征向量。
而特征值分解对于一些方阵具有特殊的性质,可以为矩阵分解提供一种基础和方法。
第一节 正规矩阵
【Schur三角化定理】设nnA,则存在酉矩阵U,使*UAUB,其中B为一
个上三角矩阵.
【酉矩阵】n阶复方阵U的n个列向量是U空间的一个标准正交基.
1HHHnUUUUEUU
性质:设有矩阵A,B,则
(1)若A是酉矩阵,则1A也是酉矩阵;
(2)若A,B是酉矩阵,则AB及BA也是酉矩阵;
(3)若A是酉矩阵,则|det()|1A;
(4)A是酉矩阵A的n个列向量是两两正交的单位向量.
【定理】矩阵A可以酉对角化**AAAA.
*
UAUT
是上三角矩阵,*********()()AAUTUUTUUTUUTUUTTU
*********
()()AAUTUUTUUTUUTUUTTU
,故****AAAATTTT
A
可以酉对角化,则酉矩阵U使*UAUD
*********
******
()()()()AAUDUUDUUDUUDUUDDUUDDUUDUUDUAA
【定义】设nnA,若**AAAA,则称A是正规矩阵.
【引理】设A为正规矩阵,若A又为三角矩阵,则A为对角矩阵.
【定理】设nnA,则A为正规矩阵A有n个两两正交的单位特征向量.
【推论】正规矩阵属于不同特征值的特征向量是两两正交的.
【定理】设()ijnnAa是复矩阵,1,2,……,n为A的n个特征值,则
(1)(Schur不等式)221,1||||nniijiija
(2)A为正规矩阵
22
1,1||||nniijiija
(3)*2,,1tr()||nijijAAa
【推论】设A为正规矩阵且幂零,则0A.
【定义】设a与b是实数,且0b,则称二阶实矩阵
ab
ba
为一个Schur型.
【定理】(实正规矩阵)设A是n阶实矩阵,则A是正规矩阵存在正交矩阵
Q
使得
12Ts
QAQAAA
其中每个iA或者是一阶实矩阵,或者是一个Schur型.
【推论】设A是n阶实矩阵.
(1)A是对称矩阵存在正交矩阵Q,使得TQAQ是对角矩阵;
(2)A是反对称矩阵存在正交矩阵Q,使得
120Ts
QAQAAA
其中每个00iiibAb,从而反对称矩阵的非零特征值为纯虚数;
(3)A是正交矩阵存在正交矩阵Q,使得
12()Tsts
QAQIIAAA
其中每个iA是二阶Givens旋转矩阵,从而正交矩阵的特征值的模均为1.
设B是n阶复矩阵.
(4)B是Hermite矩阵存在正交矩阵U,使得TUBU是实对角矩阵;
(5)B是反Hermite矩阵存在正交矩阵U,使得TUBU是纯虚数对角矩阵(即
实部为0);
(6)B是酉矩阵存在酉矩阵U,使得TUBU是对角元素的模均为1的对角矩
阵,从而酉矩阵的特征值的模均为1;
(7)Hermite矩阵A正定A的所有顺序主子式均大于0;
【引理】Hermite阵或实对称矩阵A在某一个k维子空间上正定A至少有k个
特征值(包括重数)大于零.
第二节 正规矩阵的谱分解
设A是正规矩阵,则由定理知,存在酉矩阵U使得*12(,,,)nUAUdiag.因
而*12(,,,)nAUdiagU.令12(,,,)nU,则
1
2
*
1
*
2
12****111222(,,,)n
n
n
nnn
A
()
由于12,,,n为A的特征值,12,,,n为A对应的两两正交的单位特征向
量,故式()称为正规矩阵A的谱分解或特征(值)分解。
若把式()中系数相同的放在一起(0特征值对应的项去掉),然后把系数提出
来,则公式()就变成
1122ss
APPP
,
其中12,,,s为A的互不相同的非零特征值,由于
***
(),1,iiiiin
**
()()0,1,ijijijn
*2*
(),1,iiiiin
所以
*2
,,0,1.iiiiijPPPPPPijs
由幂等矩阵与投影变换
的对应关系可知,iP是某正交投影变换(在某基下)的矩阵,故常称为正交投
影矩阵。
精心搜集整理,只为你的需要