第四章矩阵因子分解
- 格式:ppt
- 大小:982.50 KB
- 文档页数:15
正矩阵因子分解法
正矩阵因子分解法,也称为Cholesky分解,是一种用于解决线性方程组的方法。
它的基本思想是将对称正定矩阵分解成两个因子,一个是下三角矩阵,另一个是它的转置。
下面我们来解释一下这个分解法的具体步骤。
1. 对称正定矩阵A的分解
Cholesky分解是从对称正定矩阵A开始的。
我们将A分解成下三角矩阵L和它的转置L^T的乘积,即A=LL^T。
在这个式子中,L是下三角矩阵,L^T是L的转置矩阵。
2. 判断矩阵是否对称正定
在进行Cholesky分解之前,需要先判断矩阵是否对称正定。
如果矩阵不是对称正定的,则Cholesky分解法不适用于该矩阵。
3. 下三角矩阵L的求解
对于下三角矩阵L的求解,我们可以采用以下的迭代公式:L(i, j) = (A(i, j) - Σ(k=1)^{j-1}L(i, k)L(j, k))/L(j, j),其中i≥j,L(i, i)=sqrt(A(i, i) - Σ(k=1)^{i-1}L(i, k)^2)。
4. 解方程组
在进行了三步之后,我们就可以使用得到的L来解方程组Ax=b,即先解Ly=b,然后解L^Tx=y。
这样我们就得到了方程组的解。
Cholesky分解法的优点是计算速度快,特别是对于大规模稠密矩阵的解法。
此外,它还可以用于其他数学问题,比如说最小二乘问题,高斯随机场等。
但该方法缺点在于,如果矩阵不是对称正定的,则该方法不适用。
同济大学研究生课程教学大纲课程名称所在院(系、所)适用专业填表日期同济大学研究生院培养处制课程编号:(请用4号字填写)课程名称:(请用黑体4号字填写)英文名称:(请用4号字填写)开课单位:(请用宋体5号字填写)开课学期:(请用宋体5号字填写)课内学时:(请用宋体5号字填写)教学方式:(请用宋体5号字填写)适用专业:(请用宋体5号字填写)考核方式:(请用宋体5号字填写)预修课程:(请用宋体5号字填写)一、教学目标与要求(请用宋体5号字填写)二、课程内容与学时分配(请用宋体5号字填写)三、实验及实践性环节(注:此项没有的不填)(请用宋体5号字填写)四、教材(序号,编著者姓名,教材名称,出版社,版次,出版日期)(请用宋体5号字填写)主要参考书(序号,编著者姓名,教材名称,出版社,版次,出版日期)(请用宋体5号字填写)大纲撰写负责人:(请用宋体5号字填写)授课教师:(请用宋体5号字填写)课程编号:000109课程名称:矩阵论英文名称:The Theory of Matrices开课单位:081(理学院数学系)开课学期:1课内学时:60 教学方式:讲授适用专业:工科各专业考核方式:考试预修课程:线性代数、高等数学一、教学目标与要求本课程较全面、系统地介绍矩阵的基本理论、方法和某些应用,重点是线性空间及其映射、变换,以及矩阵运算等。
难点是理解线性空间、线性映射、线性变换的不变子空间、λ矩阵在相抵下的标准形和矩阵算子范数等抽象概念以及计算线性映射在基下的矩阵、-的各种因子分解等。
通过本课程中基本概念和基本定理的阐述和论证,培养研究生的抽象思维与逻辑推理能力,提高研究生的数学素养。
在重视数学论证的同时,强调数学概念的物理、力学等实际背景,培养研究生应用数学知识解决实际工程技术问题的能力。
通过本课程的学习,要求研究生掌握矩阵的基本理论和方法,为学习后续课程、开展科学研究打好基础。
二、课程内容与学时分配第一章线性空间与内积空间(8学时)1.1 预备知识:集合·映射与数域 1.2 线性空间1.3 基与坐标 1.4 线性子空间1.5 线性空间的同构 1.6 内积空间第二章线性映射与线性变换(8学时)2.1 线性映射及其矩阵表示 2.2 线性映射的值域与核2.3 线性变换 2.4 特征值与特征向量2.5 矩阵的相似对角形 2.6 线性变换的不变子空间2.7 酉(正交)变换与酉(正交)矩阵第三章λ-矩阵与矩阵的Jordan标准形(8学时)3.1 一元多项式 3.2 λ-矩阵及其在相抵下的标准形3.3 λ-矩阵的行列式因子和初等因子 3.4 矩阵相似的条件3.5矩阵的Jordan标准形3.6 Cayley-Hamilton定理与最小多项式第四章矩阵的因子分解(8学时)4.1 初等矩阵 4.2 满秩分解4.3 三角分解 4.4 QR分解4.5 Schur定理与正规矩阵 4.6 奇异值分解第五章 Hermite 矩阵与正定矩阵(6学时)5.1 Hermite 矩阵与Hermite 二次型 5.2 Hermite 正定(非负定)矩阵5.3 矩阵不等式 5.4 Hermite 矩阵的特征值* 第六章 范数与极限(10学时)6.1 向量范数 6.2 矩阵范数6.3 矩阵序列与矩阵级数 6.4 矩阵扰动分析第七章 矩阵函数与矩阵值函数(4学时)7.1 矩阵函数 7.2 矩阵值函数7.3 矩阵值函数在微分方程组中的应用 7.4 特征对的灵敏度分析* 第八章 广义逆矩阵(6学时)8.1 广义逆矩阵的概念 8.2 广义逆矩阵A -与线性方程组的解8.3 极小范数广义逆A m -与相容方程组的极小范数解8.4 最小二乘广义逆A i -与矛盾方程组的最小二乘解8.5 广义逆矩阵A +与线性方程组的极小最小二乘解第九章 Kronecker 积与线性矩阵方程(2学时)9.1 矩阵的Kronecker 积 9.2 矩阵的拉直与线性矩阵方程9.3 矩阵方程AXB C =与矩阵最佳逼近问题* 9.4 矩阵方程AX B =的Hermite 解与矩阵最佳逼近问题* 9.5 矩阵方程AX XB C +=和X AXB C-=* 第十章 非负矩阵* 10.1 非负矩阵与正矩阵 10.2 素矩阵与不可约矩阵10.3 随机矩阵 10.4 M —矩阵注:带“*”者为机动的内容。
正定矩阵因子分解法正定矩阵因子分解法是一种非常有效的矩阵分解技术,是矩阵分析和数据处理中的重要工具。
在数学、物理、工程、计算机科学等许多学科中都有广泛的应用。
本文将从概念、原理、应用等方面介绍正定矩阵因子分解法。
一、概念正定矩阵是指对于任意非零的列向量x,都有x’Ax>0的矩阵A。
其中x’表示x的转置,意义是x的行向量,x是一列向量。
正定矩阵因子分解法是把一个正定矩阵分解成两个较小的正定矩阵相乘的过程。
具体来讲,若A是一个n×n正定矩阵,则可以将它写成A=LL’的形式,其中L是一个n×r矩阵,r≤n,L’是L的转置,即r×n矩阵。
此时L被称为A的正定矩阵因子分解。
二、原理A的正定矩阵因子分解需要用到Cholesky分解。
Cholesky分解是对称正定矩阵的一种特殊分解形式,于1914年由法国数学家Cholesky提出,具体来说就是将对称正定矩阵A分解为A=LL’的形式,其中L是一个下三角矩阵,而L’为其转置。
这种分解形式在计算过程中比一般LU分解有更快的速度和更小的误差。
Cholesky分解的一个显著特点是只用考虑一个三角矩阵,而不需要LU 分解中的两个矩阵。
因此,它的实现比LU分解要容易,速度也更快。
此外,Cholesky分解也很适合数值计算,因为它能够避免数值精度的问题。
三、应用正定矩阵因子分解法在科学计算中有广泛的应用,例如统计学、信号处理、金融工程等领域。
在人工智能领域中,它被广泛应用于深度学习、矩阵分解等问题中。
举个例子,正定矩阵因子分解法在PCA(主成分分析)中起到关键作用。
PCA是一种线性映射,通过将向量投影到代表数据不同方面的主轴上来降低数据维度,从而得到一个更小的数据集。
在这个过程中,用到了数据的协方差矩阵,而协方差矩阵必须是正定的,因此需要用到正定矩阵分解。
四、总结正定矩阵因子分解法是一种重要的矩阵分解技术,它能够将一个大的正定矩阵分解成两个较小的正定矩阵相乘的形式。
正定矩阵因子分解法
正定矩阵因子分解法是将一个正定矩阵表示为若干个因子的乘积的方法,其中每个因
子也是正定矩阵。
正定矩阵因子分解法可以用于解决许多问题,例如:
1. 矩阵求逆
2. 矩阵特征值分解
4. 线性方程组求解
等等。
在正定矩阵因子分解法中,其中一个很重要的步骤是矩阵的对称平方根分解。
对称平
方根分解是将一个正定矩阵表示为一个下三角矩阵和它的转置矩阵的乘积的方法。
这个下
三角矩阵就是原矩阵的对称平方根。
当一个正定矩阵被成功地分解成若干个因子的乘积时,我们可以使用这些因子来求解
各种问题。
例如,我们可以使用这些因子来快速求解一个线性方程组,这个线性方程组的系数矩
阵是正定的。
具体来说,我们可以首先将系数矩阵写成对称平方根的形式,然后将方程组
转化为一个新的方程组,其中系数矩阵是一个对称三角矩阵。
最后,我们可以使用回代法
来求解这个新的方程组,从而得到原方程组的解。
除了线性方程组的求解,正定矩阵因子分解法还可以用于求解矩阵特征值和特征向量,以及计算矩阵和向量的广义逆。
总之,正定矩阵因子分解法是一个非常重要和有用的技术,在许多领域中都得到了广
泛的应用。
矩阵分解,也称为矩阵因子分解或矩阵分解,是矩阵理论中的一种重要技术。
以下是矩阵分解的发展历程:
1. 早期阶段:矩阵分解的思想在早期的线性代数教材中就已经出现,但当时并没有引起广泛的关注。
2. 1901年:法国数学家Édouard Goursat开展了关于矩阵分解的研究,他提出了Goursat定理,该定理描述了任意一个可逆矩阵如何可以被分解为一些初等矩阵的乘积。
3. 1909年:挪威数学家Harald Bohr和英国数学家F. Murnaghan 分别独立地提出了矩阵的谱分解,也就是将一个矩阵分解为一个对称正定矩阵和一个上三角矩阵的乘积。
4. 1928年:英国数学家Hugh Everett提出了Everett定理,该定理给出了任意一个矩阵如何可以被分解为一些行阶梯形矩阵的乘积。
5. 1932年:德国数学家Eberhard M气象学家和物理学家合作,将矩阵分解应用到气象学中,用来模拟和研究大气环流。
6. 1960年代:随着计算机科学和数值分析的兴起,矩阵分解开始广泛应用于各个领域,如线性方程组的求解、最优化问题、控制论、信号处理等。
7. 1980年代:随着稀疏矩阵技术和并行计算的快速发展,矩阵分解的算法和实现也在不断改进和优化,以适应大规模和高性能计算的需求。
8. 2000年代至今:随着机器学习和数据科学的发展,矩阵分解被广泛应用于数据分析和处理中,如推荐系统、社交网络分析、自然语言处理等。
总之,矩阵分解是一个古老而又充满活力的研究领域。
随着科学技术的发展,矩阵分解的应用范围越来越广泛,其理论和方法也在不断地发展和完善。
矩阵因式分解公式是将一个矩阵分解成几个矩阵的乘积的公式。
常见的矩阵因式分解公式包括以下几种:
1. 特征值分解:对于一个$n\times n$的方阵$A$,可以将其分解为特征值和特征向量的乘积,即$A=PDP^{-1}$,其中$P$是特征向量组成的矩阵,$D$是对角矩阵,其对角线上的元素是$A$的特征值。
2. 奇异值分解:对于一个$m\times n$的矩阵$A$(其中$m\geq n$),可以将其分解为奇异值和奇异向量的乘积,即$A=UΣV^T$,其中$U$是$m\times m$的酉矩阵,$Σ$是$m\times n$的对角矩阵,其对角线上的元素是$A$的奇异值,$V$是$n\times n$的酉矩阵。
3. Cholesky 分解:对于一个正定对称矩阵$A$,可以将其分解为下三角矩阵$L$的平方,即$A=L^TL$。
4. QR 分解:对于一个$m\times n$的矩阵$A$(其中$m\geq n$),可以将其分解为一个正交矩阵$Q$和一个上三角矩阵$R$的乘积,即$A=QR$。
以上是常见的矩阵因式分解公式,不同的分解公式适用于不同的矩阵类型和问题。
矩阵因式分解(LU分解)与列昂惕夫投入产出模型矩阵的因式分解是把一个矩阵A表示为两个或更多个矩阵的乘积,是将复杂的数据进行分解,其中有多种方法,例如:LU分解,秩分解,QR分解,奇异值分解,谱分解等。
这里主要介绍对LU分解的认识。
根据参考的书籍,这里的LU分解只限于一系列具有相同系数矩阵的线性方程:Ax=b1, Ax=b2, … , Ax=b p (1)当A为可逆矩阵时,可计算A-1,然后计算A-1 b1,A-1 b2,等等。
但是,真正在社会实践的运用中,又是如何计算并使用的呢?实际而言,(1)中的第一个方程是由行变换解出的,并同时得出矩阵A的LU分解。
设A为m×n阶矩阵,则A m×n可进行化简为阶梯形,此时不必行对换,那么A可写成形式A=LU,L是m×m下三角矩阵,主对角线元素全是1,U是A的一个等价的m×n阶梯形矩阵。
如下:这样的一个分解称为LU分解,矩阵L是可逆的,我们称L为单位下三角矩阵。
由上,我们可知,当A=LU时,方程Ax=b可写成L(Ux)=b,把Ux写成y,可以有解下面一对方程来求解x:Ly=bUx=y首先解Ly=b然后解Ux=y求得x,如下,每个方程都比较容易解,因和都是三角矩阵。
下面,举出一道例题;例:求下列矩阵的LU分解:因为A有4行,故L为4×4矩阵,L的计算方式为第一列是A的第一列除以它的第一行主元元素,L如下:比较A与L的第一列。
把A的第一列的后3个元素变换为零同时也为L的后三列变换,下面是A变为阶梯形U:将上述A到U的行变化结果放入L中:故得到所求出的L和U满足LU=A,利用LU分解,我们可以进行线性方程组的计算,简化这种计算。
后我又参考了网络上的最新信息,得到即使矩阵不可逆,LU仍然可能存在。
实际上,如果一个秩为k的矩阵的前k个顺序主子式不为零,那么它就可以进行LU分解,但反之则不然。
目前,在任意域上一个方块矩阵可进行LU分解的充要条件已经被发现,这些充要条件可以用某些特定子矩阵的秩表示。
矩阵分析第四章 矩阵分解§4.1: 矩阵的满秩分解 §4.2: 矩阵的正交三角分解 §4.3: 矩阵的奇异值分解 §4.4: 矩阵的极分解 §4.5: 矩阵的谱分解矩阵分解前言矩阵分解定义: 将一个已知矩阵表示为另一些较为简单或 较为熟悉的矩阵的积(或和)的过程称为矩阵分解. 例:(1)对任意n阶正规矩阵A,存在酉阵U∈Un×n使 A=Udiag(λ1,…,λn)U*, 其中λ1,…,λn为A的所有特征值的任一排列. (2)对任意n阶正定矩阵A,存在可逆阵Q∈Cnn×n使A=Q*Q,或存 在唯一正定阵B使A=BB. 矩阵分解意义:有利于研究已知的矩阵. 例如,利用正定阵A的平方根B为正定阵可证: 对任意Hermite阵H,AH或HA都有实特征值.1( AH∼(A1/2)-1AHA1/2=A1/2HA1/2∈Hn×n )2初等变换与初等矩阵(p73)三类初等变换: (行(列)变换←→左(右)乘) (1)将矩阵A的两行互换等价于用第一类初等矩阵P(i,j)左 乘A; (2)将矩阵A的第i行乘以k≠0等价于用第二类初等矩阵 P(i(k))=diag(1,…,1,k,1,…,1)左乘A. (3)将矩阵A的第j行乘以k≠0后再加到第i行等价于左乘第 三类初等矩阵P(i,j(k)).P (i , j ) =⎛1 ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ 1 0 1 1 1 0 1 1初等变换与初等矩阵举例⎛1 ⎞⎛ 1 4 7 ⎞ ⎛ 1 4 7 ⎞ ⎜ 0 1 ⎟⎜ 2 5 8 ⎟ = ⎜ 3 6 9 ⎟ ; ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ 1 0 ⎟⎜ 3 6 9 ⎟ ⎜ 2 5 8 ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠ ⎛1 4 7⎞⎛1 ⎞ ⎛ 1 7 4⎞ ⎜ 2 5 8⎟⎜ 0 1⎟ = ⎜ 2 8 5⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ 3 6 9⎟⎜ 1 0⎟ ⎜ 3 9 6⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠⎛1 ⎞⎛1 4 7⎞ ⎛ 1 4 7 ⎞ ⎜ ⎟⎜ ⎟ ⎜ ⎟ 0.2 ⎟ ⎜ 2 5 8 ⎟ = ⎜ 0.4 1 1.6 ⎟ ; ⎜ ⎜ 1⎟⎜ 3 6 9 ⎟ ⎜ 3 6 9 ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠⎛1 4 7⎞⎛1 ⎞ ⎛ 1 4 7 / 9⎞ ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ 2 5 8⎟⎜ 1 ⎟ = ⎜ 2 5 8/9⎟ ⎜ 3 6 9⎟⎜ 1/ 9 ⎟ ⎜ 3 6 1 ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠---- i ---- j⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ 1⎠P (i , j ( k )) =⎛1 ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝1k 1⎞ ⎟ ⎟ ⎟ ---⎟ ⎟ ⎟ ---⎟ ⎟ ⎟ 1⎠i j3⎛1 ⎞⎛ 1 2 3⎞ ⎛ 1 2 3 ⎞ ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ −4 1 ⎟ ⎜ 4 5 6 ⎟ = ⎜ 0 −3 −6 ⎟ ; ⎜ 1⎟⎜ 7 8 9⎟ ⎜ 7 8 9 ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠−3 ⎞ ⎛ 1 2 0 ⎞ ⎛ 1 2 3⎞⎛1 ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ 4 5 6⎟⎜ 1 ⎟ = ⎜ 4 5 −6 ⎟ ⎜7 8 9⎟⎜ 1 ⎟ ⎜ 7 8 −12 ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠4初等变换与初等矩阵的性质3类初等矩阵都是可逆的(行列式不为0). 将A依次作初等矩阵P1,…,Pr对应的行(列)初等变换等价 于左(右)乘A以可逆矩阵Pr…P1(P1…Pr). 可适当选第一类初等矩阵的乘积P使PA(AP)的行(列)是A 的行(列)的任意排列; 可适当选第三类初等矩阵 P(i,j(k))中的k使P(i,j(k))A的(i,j)元变为0; 可适当选第二类初等矩阵P(i(k))中的k使P(i(k))A的非 零(i,i)元变为1. 存在初等矩阵的乘积P和Q,使PAQ= ,其中r=rankA.初等变换与初等矩阵的性质续命题:设A∈Crm×n前r列线性无关,则用初等行变换可把A变为⎛ Er ⎜ ⎝ 0 ⎛1 ⎜ ⎜ D⎞ ⎜ = ⎜ ⎟ 0 ⎠ ⎜ ⎜ ⎜ ⎜ ⎝ 1 1 * * * * *⎞ ⎟ *⎟ *⎟ ⎟ *⎟ ⎟ ⎟ ⎟ ⎠一般地,∀A∈Crm×n都存在m,n阶可逆阵P和Q使PAQ=5证:因前r列线性无关,故用第一类初等矩阵左乘可使A的 (1,1)元≠0. 再用第二类初等矩阵左乘可使a11=1; 最后用若干第三类初等矩阵左乘可使A的第一列=e1. 因前2列线性无关,故新的第2列与e1线性无关且≠0, 故用第一类行变换可使(2,2)元≠0,…可使A的第2列=e2. ….可使A的第r列=er.此时空白处必为0元.安徽大学 章权兵1矩阵分析§4.1: 矩阵的满秩分解⎛ 1 ⎜ A = ⎜ −2 ⎜ 0 ⎝ 0 0 0 0⎞ ⎛1 ⎟ ⎜ 1 ⎟ , 没 有 P ∈ C 33 × 3 使 P A = ⎜ ⎟ ⎜ 0⎠ ⎝0 0 0 0⎞⎛1 ⎟⎜ 1⎟⎜0 0⎟⎜0 ⎠⎝ 0 0 1 0⎞ ⎛ 1 ⎟ ⎜ 1 ⎟ = ⎜ −2 0⎟ ⎜ 0 ⎠ ⎝ 0 1 0 0⎞ ⎟ 0⎟ 0⎟ ⎠1⎞ ⎟ ⎟. 0⎟ ⎠定义:对任意矩阵A∈Crm×n,A=BC 称为A的一个满秩分 解,如果B∈Crm×r,C∈Crr×n. 例:⎛1 ⎜ ⎜1 ⎜0 ⎝ 1 2 1 2 3 1 3 ⎞ ⎛1 ⎟ ⎜ 2 ⎟ = ⎜1 − 1⎟ ⎜ 0 ⎠ ⎝ 1⎞ ⎟⎛ 1 2 ⎟⎜ ⎜0 1 ⎟⎝ ⎠ ⎛1 4 ⎞ ⎜ ⎟ = ⎜1 ⎟ 1 1 − 1⎠ ⎜ ⎝0 0 1 2⎞ ⎟⎛ 1 3 ⎟⎜ ⎜0 1 ⎟⎝ ⎠ −1 0 1 1 5 ⎞ ⎟ − 1⎟ ⎠⎛ 1 ⎜ A P ( 2, 3) = ⎜ − 2 ⎜ 0 ⎝⎛ 1 0 0 ⎞ ⎛ 1 0 0 ⎞ ⎛ 1 0.5 0 ⎞ ⎜ ⎟⎜ ⎟ ⎜ ⎟ PAQ = P (2,1(0.5)) AP (2, 3) = ⎜ 0.5 1 0 ⎟ ⎜ −2 1 0 ⎟ = ⎜ 0 1 0 ⎟ ⎜ 0 0 1⎟⎜ 0 0 0⎟ ⎜ 0 0 0⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠m=3,n=4,r=2. 注:可能存在不仅是常数差别的两个实质不同的满 秩分解.矩阵满秩分解的存在定理定理4.1.1:任意矩阵A∈Crm×n,都有满秩分解: A=BC,B∈Crm×r,C∈Crr×n. 证:由初等矩阵性质知: 存在可逆阵P∈Cmm×m和Q∈Cnn×n,使 PAQ= 从而 A⎛ Er ⎜ ⎜ 0 ⎝ 0 ⎞ ⎛ Er ⎟=⎜ 0⎟ ⎜ 0 ⎠ ⎝ ⎛ Er ⎞ -1 ⎜ ⎟ ( E r =P ⎝ 0 ⎠ ⎞ ⎟ ⎟ (E r ⎠ 0)存在定理中矩阵B,C的决定对于A的前r列线性无关的情形:⎛E PA = ⎜ r ⎝ 0 D ⎞ ⎛ Er ⎞ = (Er 0 ⎟ ⎜ 0 ⎟ ⎠ ⎝ ⎠ D)⎛E A = P −1 ⎜ r ⎝ 0D⎞ Er ⎞ −1 ⎛ ⎟= P ⎜ ⎟ (Er 0 ⎠ ⎝ 0 ⎠D ) = BC其中0)⎛E ⎞ B = P −1 ⎜ r ⎟ ; C = ( Er ⎝0⎠D)Q-10)= BC,⎛ 其中B=P-1 ⎜Er ⎞ ⎜ 0 ⎟ ,C= ⎟ ⎝ ⎠(ErQ-1满足所要求的条件.C是PA的前r行(即所有非0行)组成的矩阵, B和C的秩显然都是r.10矩阵B的进一步决定对于A的前r列线性无关的情形: 要求PA的前r列化为(Er,0)T,故有 B=P-1(Er,0)T ⇒ PB=(Er,0)T=PA1, 其中,A1为A前r列组成的子矩阵,由此推出B=A1. (参看P.183-184定理的证明及例4.1.1,例4.1.2) 对下例,A的第1,3两列也线性无关. 令A1为A第1,3两列组成的子矩阵,并将A的第1,3 两列化为(E2,0)T,C为所得矩阵的前2行. 则不难看出也有 A=BC和B=A1.求矩阵满秩分解的初等变换方法再以A= ⎜ 1 ⎜⎛1 1 2 3 ⎞ ⎟ 2 3 2 ⎟ 为例作说明如下: ⎜ 0 1 1 −1⎟ ⎝ ⎠①用初等行变换把A前两列变为(E2 0)T⎛1 1 2 3 ⎞ ⎛1 1 2 3 ⎞ ⎛1 0 1 4 ⎞ ⎛1 1⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎛1 0 1 4 ⎞ ⎜ 1 2 3 2 ⎟ → ⎜ 0 1 1 −1 ⎟ → ⎜ 0 1 1 −1⎟ = ⎜ 1 2 ⎟ ⎜ 0 1 1 −1⎟ ⎠ ⎜ 0 1 1 −1 ⎟ ⎜ 0 1 1 −1 ⎟ ⎜ 0 0 0 0 ⎟ ⎜ 0 1 ⎟ ⎝ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ a1 a2 ②用初等行变换把A的1,3两列变为(E2 0)T ⎛1 1 2 3 ⎞ ⎛1 1 2 ⎜ ⎟ ⎜ ⎜1 2 3 2 ⎟ → ⎜0 1 1 ⎜ 0 1 1 −1 ⎟ ⎜ 0 1 1 ⎝ ⎠ ⎝ 3 ⎞ ⎛ 1 −1 0 5 ⎞ ⎛ 1 2 ⎞ ⎟ ⎜ ⎟ ⎜ ⎟ ⎛ 1 −1 0 5 ⎞ −1 ⎟ → ⎜ 0 1 1 − 1 ⎟ = ⎜ 1 3 ⎟ ⎜ ⎟ 0 1 1 −1 ⎠ −1 ⎟ ⎜ 0 0 0 0 ⎟ ⎜ 0 1 ⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠a1 a3安徽大学 章权兵2矩阵分析关于矩阵满秩分解的注矩阵满秩分解不唯一;但同一矩阵的两个满秩分 解的因式矩阵之间存在密切关系(见定理4.1.2). A∈Crm×n ⇒ r=rank A ≤ min{m,n} A的秩等于它的行秩,列秩或行列式秩. A的行(列)秩是它的行(列)最大线性无关组的行 (列)数;A的行列式秩是其非0子式的最大阶数. A=BC ⇒ rank A≤rank B 且 rank A≤rank C rank A=rank A*13引理4.3.1引理4.3.1:对任意矩阵A∈Crm×n有 rank(AA*)=rank(A*A)=rank A*=rank A=r. 证:因方程组Ax=0的解空间维数等于n-rank A, (*) 故为了证明 rank(A*A)=rank A 只须证明下列两个方程组有相同的解空间即可 Ax=0 ⑴ ⑵ A*Ax=0 显然,x满足⑴ ⇒ x满足⑵. x满足⑵ ⇒ x*A*Ax=0,即(Ax,Ax)=0 ⇒ Ax=0,即x满足⑴. 注:利用A的任意性以A*代A由(*)得 rank A=rank A*=rank((A*)*A*)=rank(AA*)同一矩阵两个满秩分解间的关系定理4.1.2:若A=BC=B1C1均为A∈Crm×n 的满秩分解, 则存在θ∈Crr×r,使得B=B1θ,C=θ-1C1. 证:若A=BC=B1C1,则BCC*=B1C1C*. 由p.190引理4.3.1知:rank(CC*)=rank C=r, 从而 CC*∈Crr×r为可逆矩阵,且满足B=B1C1C*(CC*)-1. 由上式推出r≥rank(C1C*)≥rank B=r,即rank(C1C*)=r. 进而 θ=C1C*(CC*)-1∈Crr×r,满足B=B1θ. 同理可证 C=(B*B)-1B*B1C1=θ′C1,θ′∈Crr×r. 因此,BC=B1C1 ⇒ B1θθ′C1=B1C1 ⇒ B1*B1θθ′C1C1* = B1*B1C1C1* 引理4.3.1 ⇒ θθ′=E ⇒ θ′=θ-1定理4.1.2的补充命题:设A=B1C1为A∈Crm×n的满秩分解, 则A=BC是A的满秩分解,当且仅当 ∃θ∈Crr×r, B=B1θ,C=θ-1C1. 证: 必要性由定理4.1.2给出. 充分性. 若存在θ使(*)成立,则B,C给出A的满秩分解: BC=B1C1=A. (*)§4.2: 矩阵的正交三角分解满秩矩阵的分解 行(列)满秩矩阵的分解 一般矩阵的分解满秩矩阵的正交三角分解定理4.2.1:∀A∈Cnn×n都可唯一地分解为A=UR(或A=LU),其中 U∈Un×n,R(L)为正线上(或下)三角矩阵. 证:(存在性)令A=(α1, … ,αn),则α1, … ,αn线性无关, 用Schmidt方法从α1, … ,αn得标准正交组ν1,…,νn满足⎧ ⎪ ⎪ ⎨ ⎪ ⎪α ⎩α 1 = C 11ν 11αn2= C 21ν1+ C 22 ν22∀i,Cii=‖βi‖>0n= C n 1ν+ Cn2ν+ ... + C nn νC 21 C 22于是其中,U=(ν1,…,νn)为酉矩阵,R为正线上三角矩阵.⎛ C 11 ⎜ A= (α 1 ,..., α n ) = (ν 1 ,..., ν n ) ⎜ ⎜ ⎜ ⎜ ⎝C n1 ⎞ ⎟ C n2 ⎟ ⎟ ⎟ C nn ⎟ ⎠=UR,安徽大学 章权兵3矩阵分析β1=α1 , β2=α2-((α2,β1)/(β1,β1))β1 , β3=α3-((α3,β1)/(β1,β1))β1-((α3,β2)/(β2,β2))β2 , . . . νi=(1/‖βi‖)βi, βi=‖βi‖νi, i=1,2,… α1=β1=‖β1‖ν1; C11=‖β1‖>0 α2=((α2,β1)/(β1,β1))β1+β2=C21ν1+‖β2‖ν2;C22=‖β2‖>0正交三角分解唯一性证明定理4.2.1:∀A∈Cnn×n都可唯一地分解为A=UR(或A=LU), 其中U∈Un×n,R(L)为正线上三角矩阵. (唯一性) 设还有U′∈Un×n和正线上三角矩阵R′使A=U′R′. 则有 UR=U′R′ ⇒ U′*U = R′R-1 = W 矩阵 W=U′*U∈Un×n,且W=R′R-1 仍然是正线上三角矩阵. (正线上三角阵的逆和积仍是正线上三角阵) 于是,由p.162的引理3.9.1知 W=E. 即 (U′)*U=R′R-1=E. 由此式立即推出:U=U′E=U′ & R′=ER=R. 得证唯一性.α3=C31ν1+C32ν2+‖β3‖ν3; . . .C33=‖β3‖>0正交三角分解下三角情形的证明定理4.2.1:∀A∈Cnn×n都可唯一地分解为A=LU,其中 U∈Un×n,L为正线下三角矩阵. 证: ∀A∈Cnn×n ⇒ AT∈Cnn×n. 存在唯一的U′∈Un×n和正线上三角矩阵R,使AT=U′R. 于是A=(AT)T=(U′R)T=RTU′T=LU, 其中,U=U′T∈Un×n,L=RT为正线下三角矩阵.列(行)满秩矩阵的正交三角分解定理4.2.2:∀A∈Crm×r(Crr×n)都可唯一地分解为A=UR (A=LU), 其中U∈Urm×r(Urr×n),R(L)为r阶正上线(下)三角矩阵. (定理4.2.1为m=n=r时的特例) 证:(存在性)令A=(α1, … ,αr),则α1, … ,αr线性无关, 用Schmidt方法求得标正组ν1,…,νr满足⎧ ⎪ ⎪ ⎨ ⎪ ⎪α ⎩αr2α 1 = C 1 1ν 1 = C 2 1ν 1 + C 2 2ν22∀i,Cii>0.r= C r 1ν 1 + C r 2ν+ . . . + C r rν因此A=UR,其中U=(ν1,…,νr)∈Urm×r, R=⎛ C 11 ⎜ ⎜ ⎜ ⎜ ⎝C 21 C 22C r1 ⎞ ⎟ Cr2 ⎟ ⎟ ⎟ C rr ⎠定理4.2.2唯一性证明定理4.2.2: ∀A∈Crm×r都可唯一地分解为A=UR,其中 U∈Urm×r,R为r阶正线上三角矩阵. (唯一性) 设还有U′∈Urm×r和正线上三角矩阵R′∈Cr×r 使A=U′R′. 则有 R*R=A*A=(R′)*R′, 于是由定理3.9.1⑹,A*A是正定Hermite矩阵. 故A*A可唯一地表示为乘积R*R,其中R为正线上三角阵. 因此必有R=R′. 进而,由UR=U′R′给出U=U′,得证唯一性.一般矩阵的正交三角分解定理4.2.3:∀A∈Crm×n可分解为A=U1R1L2U2,其中U1∈Urm×r, U2∈Urr×n,R1和L2分别为r阶正线上三角和下三角矩阵. 证:由矩阵的满秩分解知: 存在列满秩矩阵B和行满秩矩阵C使A=BC. 存在U1∈Urm×r和r阶正上线上三角矩阵R1使得B=U1R1. 存在r阶正线下三角矩阵L2和U2∈Urr×n使得C=L2U2. 从而A=U1R1L2U2满足条件.安徽大学 章权兵4矩阵分析用UR(LU)分解方法解方程组例4.2.1:用UR(LU)方法解方程组 Ax=b (*) − 2 ⎞ 1 ⎛ 1 ⎞ 其中 ⎛ − 3 ⎜ ⎟ ⎜ ⎟⎜ 1 A = ⎜ 1 ⎜ ⎜ 2 ⎝ 1 1 − 1 − 1 0 1 ⎟ ⎜ 0 ⎟, b = ⎜ 2 ⎟ ⎜ ⎟ ⎜ 1 ⎠ ⎝ ⎟ ⎟. ⎟ ⎟ ⎠§4.3: 矩阵的奇异值分解引理4.3.1:对任意矩阵A∈Crm×n有 rank(AA*)=rank(A*A)=rank A*=rank A=r. 引理4.3.2: ∀A∈Cm×n,AA*∈Cm×m 与 A*A∈Cn×n 均为 半正定Hermite矩阵. 证:由(A*A)*=A*A 和 ∀x∈Cn,x*A*Ax=(Ax,Ax)≥0 得证:A*A∈Cn×n 为半正定Hermite矩阵. 同理可证: AA*∈Cm×m 为半正定Hermite矩阵.解:令A=(α1,α2,α3),易见α1,α2,α3线性无关, 用Schmidt方法得标准正交组ν1,ν2,ν3如教本所示. 则A=UR,R为正线上三角矩阵,U=(ν1,ν2,ν3)∈U34×3 于是 R=U*A,代入(*)式得 URx=b ⇒ Rx=U*b ⇒ x=R-1U*b 最后求得 x=(-5/2,-1/2,3)T.AA*∈Cm×m与A*A∈Cn×n的特征值定理4.3.1: ∀A∈Cm×n, AA*∈Cm×m与A*A∈Cn×n的非零特 征值(正特征值)全同. 证法1:不难验证下列矩阵等式:⎛ AA* 0 ⎞⎛ Em A ⎞ ⎛ AA* ⎜ * ⎟⎜ ⎟=⎜ ⎜ A 0 ⎟⎜ En ⎟ ⎜ A* ⎠ ⎝ ⎝ ⎠⎝⎜ 因S= ⎜ ⎝ ⎛ Em定理4.3.1的另一证法证法2:设λ≠0是AA*的非零特征值: AA*x=λx, λ≠0,x≠0 则 A*x≠0, A*A(A*x)=λ(A*x) 所以λ也是A*A的非零特征值. 同理可证: A*A的任一非零特征值也是AA*的非零特征值.AA* A⎞ ⎛ Em A ⎞⎛ 0 ⎟=⎜ ⎟⎜ En ⎟⎜ A* A* A ⎟ ⎜ ⎠⎝ ⎠ ⎝0 ⎞ ⎟ A* A⎟ ⎠0 ⎞ −1 0 ⎞ ⎛ AA * 0 ⎞ A⎞ ⎛ 0 ⎛ 0 ⎟ = S⎜ * ⎜ ⎜ ⎟S ~ ⎜ * ⎜ ⎟ ⎟ * ⎟ * ⎟ En ⎟ 可逆,故 ⎜ A* 0 ⎟ ⎝ A A A⎠ ⎝ A A A⎠ ⎠ ⎠ ⎝ *)=0与det(λE-A*A)=0有相同非零解, 从而det(λE-AA得证AA*与A*A有相同的非零特征值.奇异值的概念定义4.3.1:∀A∈Crm×n,AA*∈Cm×m或A*A∈Cn×n 的正特征 值的算术平方根称为A的正奇异值(简称奇异值, 共有r个记为 α1,…,αr). 例:求A= ⎜ − 1 ⎜⎜ 0 ⎝ ⎛ 1 0⎞ ⎟ 1⎟∈ C 0⎟ ⎠3× 2 2正规矩阵的奇异值定理4.3.2:正规矩阵的奇异值是其非零特征值的模. 证:设A为正规矩阵,则有U∈Un×n使 A=Udiag(λ1, … ,λn)U* A*=Udiag(λ 1 ,..., λ n )U* 从而 AA*=Udiag(|λ1|2, … ,|λn|2)U* 得证A的正奇异值是A的非零特征值的模.的奇异值.解: A*A=⎜ −1 ⎜⎝⎛2−1⎞ ⎟ 1⎟ ⎠,det(λE-A)=λ2-3λ+1的两个根:(3±√5)/2 均为正, A的奇异值为:α1=((3+√5)/2)1/2;α2=((3-√5)/2)1/2. 例4.3.1:见P.191.安徽大学 章权兵5矩阵分析矩阵的酉等价关系定义:设A,B∈Cm×n,若有S∈Cmm×m,T∈Cnn×n 使B=SAT,则称B 与A等价;若有U∈Um×m,V∈Un×n使B=UAV,则称B与A酉等价. 不难证明Cm×n中的等价或酉等价关系R是等价关系. ∀A∈Cm×n,ARA:A=EmAEn (ARB⇒BRA): A=UBV⇒B=U*AV*,U*∈Um×m,V*∈Un×n (ARB & BRC⇒ARC):A=UBV & B=U′CV′⇒A=UU′CV′V 注1: A与B酉等价当且仅当它们有相同的奇异值. 注2: ∀A∈Cm×n的酉等价类中有一个最简单形状的矩阵 (见定理4.3.3). ( A∈Crm×n等价于diag(Er,0)=PAQ )奇异值分解定理1定理4.3.3:令α1,…,αr为A∈Crm×n的全部正奇异值; ∆=diag(α1,…,αr),则有U∈Um×m,V∈Un×n使 U*AV= ⎜ 0 ⎜⎛ ∆ 0⎞ ⎟ =D∈C m×n r 0⎟ ⎝ ⎠(*)U满足U*AA*U是对角矩阵,V满足V*A*AV是对角矩阵. ( A=UDV*称为A的奇异值分解式) 证: 因AA*为m阶半正定矩阵,故有U∈Um×m使⎛ ∆2 0⎞ ⎟ 0⎟ ⎝ ⎠ 分块U=(U1,U2),则U1∈Urm×r,U2∈Um-rm×(m-r)U*AA*U=diag(α12,…,αr2,0,…0)= ⎜ 0 ⎜对角阵 次酉阵奇异值分解定理1续⎛ ∆2 ⎜ ⎝ 0 ⎛ U1* ⎞ ⎛ U1* AA *U1 U1* AA *U 2 ⎞ 0 ⎞ ⎛ U1* ⎞ ⎟ ⎟ = ⎜ * ⎟ AA *(U1 , U 2 ) = ⎜ * ⎟ ( AA *U1 , AA *U 2 ) = ⎜ * * U2 ⎠ 0 ⎠ ⎝U 2 ⎠ ⎝ ⎝ U 2 AA *U1 U 2 AA *U 2 ⎠奇异值分解定理1续令 V1=(v1,…,vr),则v1,…,vr为标准正交组. 将此标正组扩大为Cn的标正基:v1,…,vr,vr+1,…,vn, 令V=(v1,…,vn)=(V1,V2)∈Un×n,其中V2=(vr+1,…,vn). 易见 0=V1*V2=∆-1U1*AV2 ⇒ U1*AV2=0 综合以上得⎛ U * AV U 1* AV2 ⎞ ⎛U * ⎞ ⎟ U * AV = ⎜ 1* ⎟ A(V1 , V2 ) = ⎜ 1* 1 ⎜ U AV U * AV ⎟ ⎜U ⎟ 2 2⎠ ⎝ 2 1 ⎝ 2⎠ ⎛ U * AA * U 1∆−1 =⎜ 1 ⎜ 0 ⎝ 0 ⎞ ⎛ ∆2 ∆−1 ⎟=⎜ 0⎟ ⎜ 0 ⎠ ⎝ 0⎞ ⎛ ∆ 0⎞ ⎟=⎜ ⎟ 0⎟ ⎜ 0 0⎟ ⎠ ⎠ ⎝比较(1,1)块得 ∆2=U1*AA*U1 比较(2,2)块得 0=U2*AA*U2=(U2*A)(U2*A)* ⇒ U2*A=0. ( ∀M∈Cm×n,MM*=0 ⇒ 0=tr(MM*)=Σ2 i,j|mij|⇒ ∀i,j,mij=0 ⇒ M=0 ) 令 V1=A*U1∆-1∈Cn×r 则 V1*V1=∆-1U1*AA*U1∆-1=∆-1∆2∆-1=E ⇒ V1∈Urn×r奇异值分解定理2定理4.3.4:令α1,…,αr为A∈Crm×n的全部正奇异值; ∆=diag(α1,…,αr),则有U1∈Urm×r,V1∈Urn×r 使 A=U1ΔV1 . 证:由定理4.3.3直接推出⎛∆ A = U ⎜ ⎜ 0 ⎝ 0 0 ⎞ ⎟V ⎟ ⎠*关于奇异值分解定理的注(1)定理4.3.3的证明同时给出了因子矩阵U,V的求法. (U(V)是使AA*(A*A)酉相似对角化的变换矩阵) (2)矩阵U,V的列分别是AA*,A*A的对应特征向量. 证: 只证U(类似可证V). U*AA*U=diag(λ1,…,λm),λi为AA*的特征值. 令 U=(u1,…,um), 则 (AA*u1,…,AA*um)=AA*(u1,…,um) =(u1,…,um)diag(λ1,…,λm) =(λ1u1,…,λmum) ⇒ ∀i,AA*ui=λiui A*A=VD*U*UDV*=Vdiag(λ1,…,λm)V* ⇒ ∀i,A*Avi=λivi= (U 1 , U2⎛∆ )⎜ ⎜ 0 ⎝0 0⎞ ⎛ V 1* ⎟⎜ * ⎟⎜ V ⎠⎝ 2⎞ ⎟ ⎟ ⎠⎛V * ⎞ = (U 1∆ , 0 )⎜ 1* ⎟ = U 1∆ V1* ⎜V ⎟ ⎝ 2⎠安徽大学 章权兵6矩阵分析奇异值分解例1例4.3.1: 求 A=⎛1 ⎜ ⎜0 ⎜0 ⎝ 2⎞ ⎟ 0⎟ 0⎟ ⎠奇异值分解例2例:求 A= 解: AA* =⎛1 ⎜ ⎜2 ⎝ 0 0 0⎞ ⎟ 0⎟ ⎠的奇异值分解式.的奇异值分解式.解: AA*=diag(5,0,0),σ(AA*)={5,0,0},Δ=(√5). U1∈U13×1是AA*对应于5的单位特征向量x=(1,0,0)T,U=E3. V1=A*U1∆-1= ⎜ ⎜⎛1 ⎝2 0 0 ⎛1⎞ 0 ⎞⎜ ⎟ ⎟⎜ 0 ⎟ ⎟ 0 ⎠⎜ ⎟ ⎝0⎠⎛1 ⎜ ⎜2 ⎝2⎞ * ⎟ 4 ⎟ ,σ(AA )={5,0},r=1,Δ=(√5). ⎠U1∈U12×1是AA*对应于5的单位特征向量x=(1/√5,2/√5)T V1=A*U1∆-1 = ⎜ 0⎜0 ⎝ ⎛1 ⎜ 2⎞ ⎟⎛ 0 ⎟⎜ ⎜ 0 ⎟⎝ ⎠1 5 2 5( )=1 51 5⎛1⎞ ⎜ ⎟ ⎜ 2⎟ ⎝ ⎠, V=1 5⎛1 ⎜ ⎜2 ⎝− 2⎞ ⎟ 1 ⎟ ⎠⎞ ⎟ ⎟ ⎠( )=1 51 5⎛1 ⎜ ⎜0 ⎜0 ⎝2⎞ ⎛1⎞ ⎟⎛ 1 ⎞ ⎜ ⎟ 0 ⎟⎜ ⎟ = ⎜ 0 ⎟ ⎜2⎟ 0 ⎟⎝ ⎠ ⎜ 0 ⎟ ⎠ ⎝ ⎠所以A的奇异值分解式是 A=UDV*= ⎜ 0 ⎜⎝0 ⎛1 ⎜ 0 1 0 0⎞⎛ 5 ⎜ 0⎟⎜ 0 ⎟ 1⎟⎜ 0 ⎠⎝ 0⎞ ⎟⎛ 0⎟⎜ 0⎟⎝ ⎠1 5 −2 5 1 2 5⎛1⎞ ⎞ ⎜ ⎟ ⎟ = ⎜0⎟ 5 ⎠ ⎜0⎟ ⎝ ⎠( 5 )(1 52 5)=U1∆ V 1*所以A的奇异值分解式是 ⎛ 15 * = ⎜ A = U1ΔV1 ⎜ 2 ⎝ 5⎞ ⎟( ⎟ ⎠5 ) (1, 0 , 0 )§4.4: 矩阵的极分解定义:令A∈Cn×n,A=HU或A=UH称为A的极分解式,如果 U∈Un×n,H∈Cn×n 是半正定Hermite矩阵. 特例: n=1时,由复数的指数表示式 a=ρeiθ 有 A=(a)=(ρ)(eiθ)=HU, H=(ρ)是半正定Hermite矩阵,U=(eiθ)是酉矩阵. 下面的定理证明: 矩阵的极分解式存在并且是唯一的.满秩方阵的极分解定理4.4.1: ∀A∈Cnn×n,存在U∈Un×n 和n阶正定Hermite矩阵 H1,H2 使 A=H1U (H12=AA*,即H1=√(AA*))或 A=UH2;并且这 样的分解式是唯一的. 证: 由定理3.9.1和定理3.9.4, 正定Hermite矩阵A*A存在唯一正定矩阵H2=(A*A)1/2. 令U=AH2-1, 则 U*U=(AH2-1)*AH2-1 =H2-1A*AH2-1=H2-1H22H2-1=E, 从而U∈Un×n使A=UH2;因H2可逆且唯一,故U也唯一. ( 另一半的证明: A=UH2=UH2U*U=H1U, H1=UH2U*为正定Hermite矩阵. AA*=H1UU*H1=H12 & H1为正定Hermite阵 ⇒ H1唯一. )非满秩方阵的极分解定理4.4.2: ∀A∈Crn×n,存在U∈Un×n和唯一n阶秩r半正定 Hermite矩阵H1,H2使A=H1U (H12=AA*,即H1=√(AA*)) 或 A=UH2 (即H2=√(A*A)). 证:存在性 由奇异值分解定理有U1,V∈Un×n使A=U1DV*, D=diag(α1,…,αr,0,…,0). 令H1=U1DU1*,H2=VDV*,U=U1V*,则H1,H2,U满足要求 A=U1DU1*U1V*=H1U; A=U1V*VDV*=UH2. 唯一性 若A=H1U,则AA*=H12 ⇒H1=(AA*)1/2唯一. 注:也可用上述方法证明定理4.4.1. 思考:定理4.4.2中U是否唯一? 不一定唯一! 没有U=AH2-1矩阵极分解的一个经典应用定理4.4.3: ∀A∈Cn×n 为正规矩阵当且仅当存在 U,U′∈Un×n和(同一个)n阶半正定Hermite矩阵H使 A=HU=U′H. 证:必要性 设A*A=AA*.由定理4.4.2,存在U∈Un×n和n 阶半正定Hermite矩阵H1,H′使A=H1U=UH′. 因此 H1=(AA*)1/2=(A*A)1/2 =H′. (AA*=H1UU*H1=(H1)2,A*A=H′U*UH′=(H′)2) 充分性 设A=HU=U′H. 则 AA*=HU(HU)*=H2 , A*A=(U′H)*U′H=H2 =AA*安徽大学 章权兵7。
第四章 矩阵的分解将矩阵分解为具有某种特性的因子之积,从以我们所熟悉的Gauss 消去法为依据而导出的LU 分解,到上个世纪60、70年代以Givens 和Householder 变换发展起来的QR 分解,在矩阵理论的研究与应用中都具有十分重要的意义。
这些特殊的分解式一方面反映了原矩阵的某些数值特征,另一方面,分解的方法与过程也为某些数值计算方法和理论分析提供了有效的工具。
§4.1n 阶矩阵的三角分解和LU 分解在线性代数中我们已经学过应用Gauss 消去法求解n 元线性方程组b Ax =, 其中:()nn ija A ⨯=,()Tn x x x x ,,,21 =,()Tn b b b b ,,,21 =。
Gauss 消去法的基本思路是将系数矩阵化为上三角形矩阵,或将增广矩阵化为上阶梯形矩阵,而后回代求解。
现在应用所谓选主元素法来实施Gauss 消去法的消去过程,至于回代过程我们不做讨论。
设()A A =0,记A 的k 阶顺序主子式为k ∆()n k ,,2,1 =。
如果()00111≠=∆a ,令()()011011a a c i i = ()n i ,,3,2 =,构造Frobenius 矩阵:⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=11121211 n n c c c L ,⎪⎪⎪⎪⎪⎭⎫⎝⎛---=-111212111 n n c c c L则()()()()()()()()()1002020220101201101100A a a a a a a a AL nn n n n =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=- (4.1.1) 因此,在()0A的第一列中除主元素()011a 外,其余元素均被化为零。
式(4.1.1)即为()()110A L A =,由于倍加变换不改变矩阵行列式的值,所以由()1A 得到A 的二阶顺序主子式为()()1220112a a =∆。
如果()()01220112≠=∆a a ,则必有()0122≠a 。