第二十讲 矩阵的对角化
- 格式:pdf
- 大小:1.32 MB
- 文档页数:41
对角化原理
对角化原理是线性代数中的一个重要概念,它涉及到将一个矩阵转换为对角矩阵的过程。
通过对角化,我们能够将一个复杂的矩阵问题简化,从而更容易地解决相关问题。
对角化原理的基本思想是将一个矩阵相似于一个对角矩阵。
对角矩阵是一个除了主对角线上的元素外,其他元素都为零的矩阵。
通过对角化,我们可以将一个复杂的矩阵分解为一组简单的特征向量和对应的特征值。
为了将对角化原理应用于实际问题,我们需要找到一个可逆矩阵P,使得P^(-1)AP是一个对角矩阵。
这个过程称为矩阵的对角化。
如果存在这样的可逆矩阵P,那么称矩阵A是可对角化的。
矩阵可对角化的条件是其所有特征值都是非零的,且每个特征值对应一个线性无关的特征向量。
如果这些条件满足,则存在一个可逆矩阵P,使得P^(-1)AP是对角矩阵。
对角化原理的应用非常广泛,包括数值分析、信号处理、图像处理、控制系统等领域。
例如,在信号处理中,对角化可以用于将信号分解为一组正交的基函数,从而更好地理解和分析信号的特性。
在控制系统理论中,对角化可以用于分析系统的稳定性和性能。
总之,对角化原理是一种重要的数学工具,它可以简化复杂矩阵问题,并将其分解为一组简单的特征向量和特征值。
通过将对角化原理应用于实际问题,我们可以更好地理解和分析相关问题的特性,从而为实际应用提供更好的解决方案。
引言在高等代数中,我们为了方便线性方程组的运算引入了矩阵的概念. 在线性方程组的讨论中我们看到,线性方程组的系数矩阵和增广矩阵反应出线性方程组的一些重要性质,并且解方程组的过程也表现为变换这些矩阵的过程.除线性方程组之外,在二次型中我们用矩阵研究二次型的性质,引入了矩阵合同、正定、负定、半正定、半负定等概念及其判别方法.在线性空间中用矩阵研究线性变换的性质,引入矩阵相似的概念,这是一种等价关系,利用它我们把矩阵分类,其中与对角矩阵相似的矩阵引起的我们的注意,由此我们对线性变换归类,利用简单的矩阵研究复杂的,方便我们看待问题,进而又引入对角型矩阵、λ矩阵及若尔当标准型.基本概念定义定义1 常以n m P ⨯表示数域P 上n m ⨯矩阵的全体,用E 表示单位矩阵.定义2 n 阶方阵A 与B 是相似的,如果我们可以找到一个n 阶非奇异的方阵矩阵T n n P ⨯∈,使得AT T B 1−=或者BT T A 1−=.根据定义我们容易知道相似为矩阵间的一个等价关系:①反身性:AE E A 1−=; ②对称性:若A 相似于B ,则B 相似于A ; ③传递性:如果A 相似于B ,B 相似于C ,那么A 相似于C . 定义3 n 阶方阵A 与B 是合同的,如果我们可以找到一个n 阶非奇异方阵T n n P ⨯∈,使得B =T T AT 或者BT T A T =.根据定义我们容易知道合同也为矩阵间的一个等价联系:①反身性:A =AE E T ;②对称性:由AT T B T =即有11)(−−=BT T A T ;③传递性:由111AT T A T=和2122T A T A T =有)()(21212T T A T T A T =.定义4 式为⎪⎪⎪⎪⎪⎭⎫⎝⎛⋯⋯⋯m b b b 000000021的m 阶方阵叫对角矩阵,这里i b 是数(),2,1m i ⋯⋯=. 定义5 方阵A n n P ⨯∈,若BT T A 1−=,T 非奇异,B 是对角阵,则称A 可相似对角化. 定义6 方阵A n n P ⨯∈,若BT T A T =,T 非奇异,B 是对角阵,则称A 可合同对角化.定义7 矩阵的初等变换:⑴互换矩阵的第i 行(列)于j 行(列); ⑵用非零数c P ∈乘以矩阵第i 行(列);⑶把矩阵第j 行的t 倍加到第i 行.定义 8 由单位矩阵经过一次初等行(列)变换所得的矩阵称为初等矩阵. 共有三种初等矩阵:①单位矩阵经过初等变换⑴得),(j i P 且),(),(1j i P j i P =−;②单位矩阵经过初等变换⑵得))((t i P 且)/1(())((1t i P t i P =−;③单位矩阵经过初等变换⑶得))(,(t j i P 且))(,())(,(1t j i P t j i P −=− 定义9 设方阵n n P B ⨯∈,若E B =2,就称B 为对合矩阵。
矩阵的正交对角化是线性代数中一个重要的概念和方法。
正交对角化是指将一个实对称矩阵或复Hermite矩阵通过相似变换,化为对角矩阵的过程。
在这个过程中,新的矩阵具有一些特殊的性质,其中对角元素是原矩阵的特征值,而非对角元素为零。
要进行矩阵的正交对角化,首先需要满足两个条件:矩阵的特征值存在且为实数,且矩阵的特征值对应的特征向量构成一组正交向量组。
对于实对称矩阵和复Hermite矩阵而言,这两个条件是成立的。
以实对称矩阵为例,假设有一个实对称矩阵A,其特征值为λ1, λ2, ...,λn,对应的特征向量为v1, v2, ..., vn。
由于实对称矩阵的特征值都为实数,所以可以得出特征向量是线性无关的,并且可以正交化得到一组标准正交基{u1, u2, ..., un}。
接下来,将标准正交基{u1, u2, ..., un}作为列向量组成一个矩阵U,其中每一列就是一个单位特征向量。
由于特征向量是一个实数域上的向量,对于任意的特征向量ui和uj,都有其内积成立:ui·uj = δij。
然后,构造一个对角矩阵Λ,其对角线上的元素为矩阵A的特征值。
即Λ = diag(λ1, λ2, ..., λn)。
由于特征向量构成一组标准正交基,可以得到一个正交矩阵U,使得U^T·U = U·U^T = I,其中I为单位矩阵。
最后,可以得到正交对角矩阵D,使得D = U^T·A·U,其中D是一个对角矩阵,对角线上的元素即为A的特征值。
这个过程就是矩阵的正交对角化。
矩阵的正交对角化具有很多重要的意义。
首先,对角化可以将一个复杂的矩阵转化为一个很简单的矩阵,对于计算特征值和特征向量等操作提供了便利。
其次,正交对角化可以保留矩阵的一些重要性质,如行列式的性质、迹的性质、矩阵的幂等性等。
再次,正交对角化也为解决线性方程组和常微分方程等问题提供了基础。
需要注意的是,并非所有的矩阵都能进行正交对角化。
矩阵对角化的方法
矩阵对角化是将一个方阵通过相似变换,转化为对角矩阵的过程。
常用的矩阵对角化方法有以下几种:
1. 特征值分解:对于一个可对角化的矩阵,可以通过求解其特征值和特征向量来进行对角化。
首先求解矩阵的特征值,然后求解每个特征值对应的特征向量,并将这些特征向量排列成一个矩阵,将原矩阵相似变换到对角矩阵。
2. 正交对角化:对于实对称矩阵,可以通过正交对角化的方法进行对角化。
首先通过特征值分解求解出特征值和对应的特征向量,然后将特征向量单位化得到正交矩阵,再进行相似变换得到对角矩阵。
3. Jordan标准形:对于不可对角化的矩阵,可以通过Jordan标准形对其进行对角化。
首先求解矩阵的特征值和对应的特征向量,然后通过Jordan标准形的分块结构将矩阵进行相似变换得到对角矩阵。
需要注意的是,并不是所有矩阵都可以对角化。
只有满足一定条件的矩阵才可以进行对角化。
矩阵对角化的步骤引言矩阵对角化是线性代数中一个重要的概念,它可以将一个矩阵变换为对角矩阵,从而简化一些运算和求解问题的过程。
本文将通过介绍矩阵对角化的基本概念、性质和步骤来深入探讨该主题。
什么是矩阵对角化矩阵对角化是指通过相似变换将一个矩阵变换为对角矩阵的过程。
对角矩阵是一种特殊的方阵,它的非主对角线上的元素全都是0,而主对角线上的元素可以是任意的数。
对角矩阵在一些问题的求解过程中具有简化运算的作用。
矩阵对角化的条件要将一个矩阵对角化,需要满足以下条件: 1. 矩阵必须是方阵,即行数和列数相等。
2. 矩阵必须有n个线性无关的特征向量,其中n是矩阵的维度。
矩阵对角化的步骤对于一个满足对角化条件的矩阵,下面是进行矩阵对角化的步骤:步骤1:求矩阵的特征值首先,我们需要求出矩阵的特征值。
矩阵的特征值是一个标量,它满足方程Ax=λx,其中A是矩阵,λ是特征值,而x是对应于特征值λ的特征向量。
步骤2:求特征值对应的特征向量在求得矩阵的特征值之后,我们需要求解特征值对应的特征向量。
通过解方程(A−λI)x=0,其中A是矩阵,λ是特征值,I是单位矩阵,x是特征向量,可以得到特征向量。
步骤3:构成特征向量矩阵将步骤2中求得的特征向量按列构成一个矩阵P,这个矩阵称为特征向量矩阵。
步骤4:构成特征值矩阵将步骤1中求得的特征值按对角线排列成一个对角矩阵Λ,其它位置上的元素为0。
步骤5:对角化通过相似变换,即A=PΛP−1,将矩阵A变换为对角矩阵Λ。
这个过程中,矩阵P是特征向量矩阵,Λ是特征值矩阵。
矩阵对角化的意义和应用矩阵对角化在数学和工程中有着广泛的应用。
其主要意义在于简化问题的求解过程和分析矩阵的性质。
以下是矩阵对角化的一些具体应用:1.矩阵求幂一步计算: 对角化可以将矩阵的幂指数形式A n化简为PΛn P−1的形式,其中Λn是对角矩阵每个元素分别进行幂运算,大大简化了计算的复杂度。
2.线性差分方程的求解: 微分方程可以用矩阵表示,对角化可以将不易求解的高阶微分方程转化为一组一阶方程,从而简化求解过程。
摘要矩阵的对角化指的是矩阵与对角矩阵相似,而形式最简单的对角矩阵在矩阵理论中占有重要地位,因此研究矩阵的对角化问题是很有实用价值的.矩阵是否可以对角化,是矩阵的一条很重要的性质。
对相似可对角化的充分必要条件的理解,一直是线性代数学习中的一个困难问题。
目前对于矩阵可对角化的条件,矩阵对角化的方法和矩阵对角化的运用都有了较为全面和深入的研究。
在归纳总结前人的基础之上,先给出了与对角化相关的概念,其次讨论了矩阵对角化的几个等价条件,最后总结了一些有关矩阵对角化的应用。
关键词:方阵;特征值;特征向量;对角化AbstractMatrix diagonalization refers similarity matrix and a diagonal matrix, The simplest form of a diagonal matrix plays an important role in matrix theory, Therefore Matrix diagonalization problem is very practical value.Whether matrix diagonalization matrix is a very important property. To be similar to the necessary and sufficient condition for understanding keratosis, has been one of linear algebra learning difficulties. At present more comprehensive and in-depth study of the matrix can be diagonalized conditions, matrix methods and the use of matrix diagonalization diagonalization of everything. In summarizing the basis of their predecessors, with the first given diagonalization related concepts, followed by discussion of the matrix diagonalization of several equivalent conditions and, finally, the application of some of the matrix diagonalization.Keywords: square; characteristic value; eigenvectors; diagonalization目录引言 (1)一矩阵可对角化的概念 (2)1.1 特征值、特征向量的概念 (2)1.2 矩阵可对角化的概念 (2)二矩阵可对角化的几个等价条件 (4)2.1 矩阵可对角化的充分必要条件及其证明 (4)2.2 可对角化矩阵的相似对角阵的求法及步骤 (8)三矩阵可对角化的应用 (9)3.1具体矩阵对角化的求解过程 (9)3.2矩阵对角化的应用 (13)3.2.1在反求矩阵方面的应用. (13)3.2.2 求方阵的高次幂 (14)3.2.3 求行列式的值 (15)3.2.4求一些具有线性递推关系组的数列的通项和极限 (16)3.2.5 在二次曲面上的一些应用 (17)结论 (19)致谢............................................... 错误!未定义书签。
矩阵对角化一、矩阵的对角化涉及到四个方面的问题: (1) 可对角化的判定;(2) 相似矩阵的性质与应用; (3) 一般矩阵的对角化及应用;(4) 实对称矩阵的正交对角化及应用。
二、与方阵的对角化的相关的命题:思路:①n 阶方阵A 可对角化⇔A 有n 个线性无关的特征向量;②对n 阶方阵A 的任一特征值i λ(设i k 为重根),有()i i n r E A k λ--=例:已知2253111a A b ⎛⎫⎪= ⎪ ⎪--⎝⎭有特征值问A 能否对角化?说明理由。
解:由于1±是A 特征值,将其代入特征值方程,求其行列式有 A =71)01a a E--+=⇒=-( 2(3)03E A b b --=-+=⇒=-故212533111A -⎛⎫ ⎪=- ⎪ ⎪--⎝⎭3333111(1)2(3)(1)2i iii i aλλλ===⇒+-+=+-+-⇒=-∑∑那么A 有3个不痛的特征值,故A 可以对角化。
例:设A 为3阶矩阵,123,,ααα是线性无关的三维列向量,且满足1123+A αααα=+,223A =2+ααα,323A =2+3ααα。
(I )求矩阵B ,使得()()123123,,,,A B αααααα=; (II )求巨神A 的特征值;(III )求可逆矩阵P 使得1P AP -为对角矩阵。
解:(I )由题设条件,有:()()()1231231232323,,,,,2,23A A A A ααααααααααααα==++++()123100,,122113ααα⎛⎫⎪= ⎪ ⎪⎝⎭可知100122113B ⎛⎫ ⎪= ⎪ ⎪⎝⎭(II )因为123,,ααα是线性无关的三维列向量,可知矩阵()123,,C ααα=可逆,且由AC CB =,有1C AC B -=,即矩阵A 与B 相似,由此可得矩阵A 与B 有相同的特征值。
由()()2100122140113E B λλλλλλ--=---=--=---得矩阵B 的特征值,也即矩阵A 的特征值为121λλ==,34λ=(III )对应于121l l ==解齐次线性方程组()0E B x -=,得基础解系:()()121,1,0,2,0,1T Tx x =-=-对应于34l =解齐次线性方程组()40E B x -=,得基础解系:()30,1,1Tx =令矩阵()123120,,101011Q ξξξ--⎛⎫ ⎪== ⎪ ⎪⎝⎭,则 1100010004Q BQ -⎛⎫⎪= ⎪ ⎪⎝⎭()()1111Q BQ Q C ACQ CQ AC CQ ----==记矩阵()()123121323120,,101,2,011P CQ ααα--⎛⎫⎪===-∂+∂-∂+∂∂+∂ ⎪ ⎪⎝⎭则有11p AP Q BQ --=为对角矩阵,故P即为所求的可逆矩阵。
矩阵的对角化学生姓名:马莉莹 指导老师:朱广俊数学科学学院,2008级,数学与应用数学(师范)我们知道属于特征值i λ的特征向量i X 满足()0i i A I X λ-=,1,2,,,i n = 即它们满足如下条件:,1,2,,.i i i AX X i n λ== 其中 (4-9) 若将矩阵A 的特征向量i X 作为列向量所组成的n 阶方阵记为X ,则等式(4-9)可以表示为AX X =Λ (4-10) 其中Λ是一个对角矩阵,且主对角线上的元素为A 特征值;即,12000000n λλλ⎛⎫ ⎪ ⎪Λ= ⎪ ⎪⎝⎭(4-11) 已经证明了属于不同特征值的特征向量是线性无关的(定理4-1).所以,当i λ互不相同时,矩阵X 是非奇异的.当在等式 (4-10)两边同时乘以1X -,可得到1X AX -=Λ (4-12) 因此,通过特征向量所组成的矩阵和它的逆,我们能将特征值互异的矩阵A 变成一个主对角线上的元素为其特征值的对角矩阵.等式(4-12)所表示的变换称为矩阵A 的对角变换.如果矩阵A 的特征值不是互异的,那么A 未必可对角化.例如,矩阵3103A ⎛⎫= ⎪⎝⎭不能如(4-12)那样对角化.对于等式(4-12)中的矩阵A ,称为与对角矩阵相似.一般地,对任意两个同阶方阵A 和B ,如果存在一个非奇异的矩阵C ,使得1C AC B -=,则称方阵A 和B 是相似的,称由A 到B 的变换为相似变换.特别地,若矩阵B 是一个对角矩阵,且主对角线上的元素均是A 的特征值,则称矩阵B 是矩阵A 的标准形.除了主对角线上的元素的顺序外,该标准形是唯一的.在等式(4-12)中,我们称由矩阵A 的特征向量i X 构成的矩阵X 为矩阵A 的模态矩阵.矩阵的特征向量乘以任意非零常数后仍是该矩阵的特征向量.因此,矩阵A 的模态矩阵并非是唯一的.例1 试判断矩阵6221A ⎛⎫= ⎪-⎝⎭和8631B ⎛⎫= ⎪--⎝⎭是否是相似的. 解:若A 和B 相似,则存在一个2阶的可逆矩阵C 使得1C AC B -=;即AC CB =.令0.a b C ad bc c d ⎛⎫=-≠ ⎪⎝⎭且则 6286=-2131a b a b c d c d ⎛⎫⎛⎫⎛⎫⎛⎫ ⎪⎪ ⎪⎪--⎝⎭⎝⎭⎝⎭⎝⎭6262836.22836a c a d a b a b a c b d c d c d ++--⎛⎫⎛⎫= ⎪ ⎪-+-+--⎝⎭⎝⎭利用矩阵相等可得下面的齐次线性方程组2320273067202620a b c a c d a b d b c d --=⎧⎪+-=⎪⎨--=⎪⎪+-=⎩37,26,2,2a t s b t s c s d t =-=-==,其中s t 和是任意实数,为该齐次线性方程组的解.因此,存在一个可逆矩阵372622t s t s C s t --⎛⎫= ⎪⎝⎭,其中s t 和是任意实数. 由0C ≠可得22618120t st s -+≠()()6120,t s t s --≠ 2.t s t s ≠≠且因此矩阵A 和B 是相似的.令0, 1.s t == 则1113233,,02102C C -⎛⎫- ⎪⎛⎫== ⎪ ⎪ ⎪⎝⎭ ⎪⎝⎭且有11162328633.210231102C AC B -⎛⎫- ⎪⎛⎫⎛⎫⎛⎫=== ⎪ ⎪⎪ ⎪--- ⎪⎝⎭⎝⎭⎝⎭ ⎪⎝⎭故A 与B 相似.例2 证明相似矩阵具有相同的行列式和相同的特征值.解:设A 和B 是相似矩阵,则存在一个与A 和B 同阶的可逆矩阵C ,使得1C AC B -=.由性质矩阵乘积的行列式等于行列式之积,可得111B C A C C C AC C A I A A---=====则()()111A I C A I CC AC C IC B I λλλλ----=-=-=-即A 和B 有相同的特征多项式,由此易知:矩阵A 和B 有相同的特征方程和特征值.值得注意的是:例2的逆命题不成立.例如矩阵10120101A B ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭和有相同的特征值12==1λλ且A B =,但对于任意2阶可逆矩阵1C C AC I -=有,但.I B ≠,所以矩阵A 和B 不是相似的.例3 证明对所有自然数n 有n n i i i A X X λ=.解: 可用数学归纳法来证明该等式:由(4-9) 知 i i i AX X λ= i i i AX X λ=假设对任意正整数k 有k k i i i A X X λ=.由(4-9)得11k k k k i i i i i i i A X A X AX X λλλ++===即对所有自然数n 有n n i i i A X X λ= (4-13)若A 是具有n 个不同实特征值的n 阶实对称矩阵,则与n 个不同实特征值对应的特征向量是相互正交的(定理4-5).若将每一个特征向量通过适当的乘法进行正规化,则由其作为列向量组成的矩阵是一个正交矩阵.我们称用正交模态矩阵作用的变换为正交变换;即矩阵A 的正交变换为变换T C AC ,其中C 是一个正交矩阵.若一个n 阶实对称矩阵有多个特征值,则我们总能得到n 个彼此正交的单位向量.我们也能得到与其它特征向量正交的r 个线性无关的特征向量是一个r 重特征值对应的特征向量.此外,可取这些特征向量两两正交.我们假定实对称矩阵的这些性质均是成立的,而它的有关证明则将留在更有深度的线性代数文本中去讨论.定理4-6 每一个实对称矩阵均可通过正交变换化为标准型.定理4-6有时也称为主轴定理.我们将在本章的后段部分讨论该定理在解析几何中的应用.例4 设3113A ⎛⎫= ⎪⎝⎭.试求将矩阵A 变换为标准形的正交矩阵.解:A 的特征方程是2680λλ-+=;由此可得A 的特征值12λ=,24λ=.与特征值12λ=对应的特征向量为11.22T-⎛⎫ ⎪⎝⎭ 与特征值24λ=对应的特征向量为11.22T ⎛⎫ ⎪⎝⎭因此将矩阵A 变换为标准形的正交矩阵为 1122;1122⎛⎫⎪ ⎪- ⎪ ⎪⎝⎭即 111131202222111311042222-⎛⎫⎛⎫ ⎪ ⎪⎛⎫⎛⎫ ⎪ ⎪= ⎪ ⎪- ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭⎝⎭。
第五章矩阵的对角化及二次型说明与要求:在矩阵分析和一些经济问题的计算中往往可归结为如下的数学问题:对于n⨯n矩阵A,求数λ和非零的n维向量α,使关系式Aα=λα成立.这样的数称为A的特征值,α称为特征向量.本章介绍矩阵的特征值及特征向量的概念、计算方法以及它们的一些基本性质,并讨论一些与它们有关的矩阵问题.本章的中心问题是研究矩阵的相似对角化,而在研究过程中,矩阵的特征值和特征向量是一个有力的工具,而且这些概念本身也是很重要的.我们要深刻理解矩阵的特征值和特征向量的概念、熟练掌握求特征值和特征向量的方法.对于抽象给出的矩阵要会用定义求解(实际是求特征值的取值范围);对于具体数字给出的矩阵,一般先从特征方程|λA-E|=0求出特征值,再解齐次线性方程组(λA-E)X=0,基础解系就是λ所对应的线性无关的特征向量.相似对角化是重点,要掌握相似矩阵的概念和矩阵对角化的条件,注意一般矩阵与实对称矩阵在对角化方面的联系与区别.既要能求出矩阵A的相似对角矩阵Λ(当A可对角化时),又要会用特征值、特征向量、相似、可对角化等确定A的参数.会利用对角化求A m.知道非负矩阵的定义及有关性质.二次型指的是数域P上的n元二次齐次多项式,它的研究起源于解析几何中化二次曲面的方程为标准形式的问题.二次型不但在几何中出现,而且在数学的其它分支以及物理、力学中也常常会碰到.在这一章里,我们用学过的矩阵知识来讨论二次型的一些最基本的性质.二次型与实对称矩阵之间有一一对应的关系.一方面,二次型的问题可以用矩阵的理论与方法来研究;另一方面,实对称矩阵的问题也可转化成二次型的思想方法来解决.本章的另一中心问题是化二次型为标准形和二次型的正定性.学习时,应在掌握二次型的矩阵表示的基础上,熟练掌握化标准形的方法(配方法、初等变换法和正交变换法).以及二次型正定的充要条件和正定性的判定.用正交变换法化二次型为标准形与实对称矩阵正交相似对角形是同一个问题,而以两种形式出现.若用正交变换化二次型X T AX为标准形Y TΛY,则A与对角矩阵Λ既相似又合同,Λ由A的特征值所组成.若用配方法化X T AX为标准形Y TΛY,则A与对角矩阵Λ仅仅是合同.此时对角矩阵Λ的元素不唯一.。
矩阵对角化的步骤矩阵对角化是线性代数中一项重要的技术,它可以将一个复杂的矩阵转化为一个更简单的对角矩阵。
在实际应用中,对角化可以帮助我们简化数学计算、解决方程组和求解特征值等问题。
下面将介绍矩阵对角化的步骤。
一、什么是矩阵对角化?在线性代数中,一个n×n的方阵A称为可对角化矩阵,当且仅当它可以表示成PDP−1的形式,其中P是可逆方阵,D是对角矩阵。
也就是说,通过一系列变换可以将原始矩阵转换为一个对角矩阵。
二、为什么要进行矩阵对角化?1. 简化计算通过对角化可以将原始矩阵转换为一个更加简单的形式,使得计算更加容易。
例如,在求解线性方程组时,如果系数矩阵可对角化,则可以直接求出其逆和行列式等参数。
2. 求解特征值通过对角化可以求出一个矩阵的特征值和特征向量。
这些参数在许多应用中都非常重要,例如图像处理、信号处理和物理建模等领域。
三、矩阵对角化的步骤1. 求出矩阵的特征值和特征向量对于一个n×n的矩阵A,首先需要求出它的n个特征值λ1,λ2,…,λn 和对应的特征向量v1,v2,…,vn。
这一步可以通过求解矩阵A−λI的零空间来实现,其中I是单位矩阵。
具体地,我们需要求解线性方程组(A−λI)x=0,并找到所有非零解x。
这些非零解构成了矩阵A的特征向量。
2. 构造特征向量矩阵P将所有求得的特征向量按列排成一个矩阵P=[v1v2⋯vn],称为特征向量矩阵。
注意到如果某个特征值有多个线性无关的特征向量,那么它们都可以被加入到P中。
3. 求出对角化矩阵D将所有求得的特征值按对角线排列构成一个对角矩阵D=diag(λ1,λ2,…,λn)。
4. 求出逆变换矩阵P−1由于P是由线性无关的特征向量构成的矩阵,因此它是可逆的。
我们可以通过高斯-约旦消元法或矩阵求逆公式等方法求出P的逆矩阵P−1。
5. 检验对角化结果将对角化矩阵D和逆变换矩阵P−1代入PDP−1,即可得到原始矩阵A的对角化形式。
为了检验结果是否正确,可以计算PDP−1与原始矩阵A之间的误差。
20.1 矩阵可对角化的条件
设矩阵有个线性无关的特征向量令
则是一个对角矩阵其对角元素是
的特征值:
20.1 矩阵可对角化的条件事实上,
于是
因可逆,故
20.1 矩阵可对角化的条件
若存在可逆矩阵使为对角矩阵,则称矩阵是可对角
化的(diagonalized).
由上面的分析知,反之也成立. 故有
定理:矩阵可对角化的充要条件是有个线性无关
的特征向量.
20.1 矩阵可对角化的条件
例:的特征值为
故只有个线性无关的特征向量,因此不能对角化.
20.1 矩阵可对角化的条件
定理:设是的互异特征值,是相应特征向量. 则线性无关.
证明:设
两边左乘得
再左乘得
不断左乘直到得
故有
20.1 矩阵可对角化的条件
左边第二个矩阵的行列式行列式
因此该矩阵可逆,故
由于特征向量均为非零向量,故
所以线性无关.
20.1 矩阵可对角化的条件
推论:具有个两两互异特征值的矩阵可以对角化.
但若矩阵有相同特征值,其也可能对角化.
例:有重特征值任何可逆矩阵都使
是对角阵. 这反映了所有非零向量都是单位矩阵的特征向量.
20.2 特征值的代数重数和几何重数
定义:设其中
称为特征值的代数重数(algebraic
multiplicity),记作称为特征值
的几何重数(geometric multiplicity),记作
例:
20.2 特征值的代数重数和几何重数
例:
例:
20.2 特征值的代数重数和几何重数
一般地,
命题:
引理1:相似矩阵具有相同的特征多项式.
事实上,设可逆,则我们有
20.2 特征值的代数重数和几何重数
引理2:任意复方阵相似于上三角阵,且其对角元为矩阵的特征值. 证明:对方阵的阶数用数学归纳法.
时结论成立. 假设对阶复方阵结论成立.
对任意阶复方阵设其有特征值及相应特征向量
则可将其扩充得的一组基有
记则有
20.2 特征值的代数重数和几何重数
对阶复方阵由归纳假设, 存在可逆阵使得
为上三角阵.
令
为上三角阵.
则结论第一部分得证.
由引理1知
上三角阵的对角元为的特征值.
20.2 特征值的代数重数和几何重数
命题的证明:
由引理2,相似于上三角阵则和有相同特征值,且对任
意特征值
因此,不妨设是上三角阵,即
于是
故
20.2 特征值的代数重数和几何重数
定理:复方阵可对角化对任意特征值
事实上,
若则
故有个线性无关的特征向量.
从而可对角化.
20.2 特征值的代数重数和几何重数
例:判断是否可对角化,若可以求使
为对角阵.
解:
于是
又
因此,可对角化.
20.2 特征值的代数重数和几何重数对
的基础解系为
对
的基础解系为
20.2 特征值的代数重数和几何重数
令
则
20.2 特征值的代数重数和几何重数
注:可以看到,使对角化的矩阵不是唯一的. 一个特征向量乘
以非零常数后仍是属于同一特征值的特征向量,所以若用任意非
零常数乘以的各列,则得一个新的使对角化的矩阵. 而对于重特征值则有更大自由度. 上例中由的任意线性组合得到的
两个线性无关的向量都可充当的前两列.
20.2 特征值的代数重数和几何重数
例:设其中为矩阵.
的秩为
的秩为
故可对角化.
20.3 矩阵可对角化的应用
若矩阵可对角化,则可快速计算
例:设求
解:的特征值
可对角化.
20.3 矩阵可对角化的应用
对
的基础解系为
对
的基础解系为
20.3 矩阵可对角化的应用
令 则
故
20.3 矩阵可对角化的应用
例(Markov过程):
每年海淀区以外人口的迁入海淀区,而海淀区人口的迁出. 这给出一个差分方程:
设最初外部人口为内部人口为则一年以后
外部人口
内部人口
即
20.3 矩阵可对角化的应用
这个虚构的人口迁移过程有两个特点:(1)人口总数保持不变;(2)海淀区外部和内部的人口数不是负的. 我们称之为Markov(马尔科夫)过程.
由性质(1),矩阵每一列元素之和为由性质(2),矩阵元素非负. 同样等也非负.
20.3 矩阵可对角化的应用
记
取则
20.3 矩阵可对角化的应用
于是我们可求和年之后的人口分布:
20.3 矩阵可对角化的应用
可以看出,经过很多年之后,会变得非常小,从而这个解达到一个极限状态:
此时,总人口仍为与初始状态相同. 但在此极限状态下,
总人口的在外部,在内部, 并且这个数据无论初始分布
怎样总成立.
20.3 矩阵可对角化的应用
注意到
即这个稳定状态是Markov矩阵关于的特征向量.
20.3 矩阵可对角化的应用
例(Fibonacci数列):
数列满足规律
这是一个差分方程.
怎样由出发,求出Fibonacci数列的通项公式呢?
20.3 矩阵可对角化的应用
令则
即
于是只需求
20.3 矩阵可对角化的应用
故
20.3 矩阵可对角化的应用
初始值给出
于是
Fibonacci数是这个乘积的第二个分量
20.3 矩阵可对角化的应用
我们希望研究由差分方程描述的离散动力系统的长期行为,即时解的性质.
设可对角化,即存在可逆矩阵其中
使为对角阵.
则
其中即
可以看出,的增长由因子支配. 因此系统的稳定性依赖于的特征值.
20.3 矩阵可对角化的应用
对由一个差分方程定义的离散动力系统,当的所
有特征值时,它是稳定的(stable),且;当所有
时,它是中性稳定的(neutrally stable),且有界;而当
至少有一个特征值时,它是不稳定的(unstable),且是
无界的.
Markov过程是中性稳定的,Fibonacci数列是不稳定的.
20.3 矩阵可对角化的应用
例:考虑差分方程其中
的特征值为其对角元和故该系统是稳定的.
由任何一个初始向量出发,的解必定最终趋向于
如:
20.3 矩阵可对角化的应用
可以看到从开始,
而的实际作用是,若把分解成的两个特征向量
的和:
则把属于的特征向量化为零,而把属于
的特征向量乘以
20.4 同时对角化
问题:给定两个阶矩阵是否存在可逆矩阵使得
同时为对角阵,也即同时对角
化?
命题:若有相同特征向量矩阵使得
为对角阵,则
事实上,
20.4 同时对角化
重要的是,“逆”命题也成立. 我们不加证明地给出:
定理:若均可对角化,且则可同时对角化.
注意到,若则
故和是的属于同一特征值的特征向量. 看简单的情况.
假设的特征值两两互异,则其所有特征子空间都是一维的. 于是
必是的倍数,也即是的特征向量. 从而有公共特
征向量矩阵,可同时对角化.
20.4 同时对角化
定理:对阶复矩阵若矩阵的特征值两两互异,则
可同时对角化.
20.4 同时对角化
小结:
1. 矩阵可对角化,指存在可逆矩阵使为对角阵.
2. 矩阵可对角化有个线性无关的特征向量.
3. 若复矩阵有个互异特征值,则可对角化.
4. 复矩阵可对角化任意特征值的几何重数等于代数重数.
5. 设可对角化, 即存在可逆阵使则
6. 差分方程的解为
其中。