特征值与特征向量计算第六章
- 格式:ppt
- 大小:1.03 MB
- 文档页数:53
第六章 特征值和特征向量应用例子方阵的特征值和特征向量是两个应用十分广泛的概念,利用特征值和特征向量可以把变换AX X →表示成简单而易于想象的形式,利用特征值和特征向量可以求解工程技术中控制论的系统稳定问题、空间曲面和空间曲线的化简问题、微分方程组及差分方程组的求解等问题. 事实上,特征值和特征向量的应用是十分广泛的,远不止这些. 本章主要介绍特征值和特征向量在动力系统、人口流动、污染、遗传及微分方程组求解等方面的应用.例1 动力系统发展趋势设0.950.030.050.97A ⎡⎤=⎢⎥⎣⎦,分析由100.6(0,1,2,),0.4k k k +⎡⎤===⎢⎥⎣⎦ x Ax x 所确定的动力系统的长期发展趋势.解 第1步求A 的特征值,并找出每个特征空间的基. A 的特征方程是0.950.030(0.95)(0.97)(0.03)(0.05)0.050.97λλλλ-==----2 1.920.92λλ=-+由二次方程的求根公式得11λ=,20.92λ=.容易验证对应11λ=和20.92λ=的特征向量分别是135⎡⎤=⎢⎥⎣⎦v 和211⎡⎤=⎢⎥-⎣⎦v 的非零倍数.下一步把给定的0x 表示为1v 和2v 的线性组合,显然12{,}v v 是2R 的基,因此存在系数1c 和2c ,使得101122122[]c c c c ⎡⎤=+=⎢⎥⎣⎦x v v v v (1)事实上1111202310.60[]510.40c c --⎡⎤⎡⎤⎡⎤==⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎣⎦v v x 110.600.1251530.400.2258--⎡⎤⎡⎤⎡⎤==⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦(2) 因为,式(1)的1v 和2v 是A 的特征向量,故1122,(0.92)A A ==v v v v ,容易算出每个k x :101122A c A c A ==+x x v v 1122(0.92)c c =+v v 211122(0.92)A c A c A ==+x x v v 21122(0.92)c c =+v v 继续下去,有1122(0.92)(0,1,2,)k k c c k =+= x v v把式(2)的1c 和2c 代入上式,得310.1250.225(0.92)(0,1,2,)51kk k ⎡⎤⎡⎤=+=⎢⎥⎢⎥-⎣⎦⎣⎦x当k →∞时,10.375(0.92)0,0.125.0.625kk ⎡⎤→→=⎢⎥⎣⎦x v例2 幂方法求矩阵的特征值和特征向量求方阵A 的特征向量要先解一元n 次方程||0λ-=I A 以求出特征根. 解一元n 次方程一般是很困难的,这就给求特征向量带来困难.幂方法求矩阵的特征向量的方法:从任何一个非零向量0X 出发(例如取0(1,,1))'= X ,不断地用A 左乘,得到0(1,2,)n n n == X A X ,并且用与n X 方向相同的某个n Y 代替(例如,将n X 除以它的各分量绝对值之和得到n Y ,则n Y 的各分量绝对值之和为1.)当n 无限增大时,如果nY 趋于一个极限位置 Y,则 Y 就是A 的特征向量(所属特征值通常是A 的所有特征值中绝对值最大的.)例如:10.50.40.3210.70.6,2.5 1.42 1.30.30.40.51⎛⎫ ⎪⎪= ⎪ ⎪ ⎪⎝⎭A 从0(1,1,1,1)'=X 开始,将10=X AX 除以各分量之和得到121,=Y X AY 除以各分量之和得到2Y . 一般地,如果已经得到k Y ,将k AY 除以各分量之和得到1k +Y . 这样就得到一系列的列向量1,,,n Y Y ,直到某个1||m m +-Y Y 小到可以忽略不计的程度,可以近似地认为1m m +=Y Y ,m m λ=AY Y ,则m Y 是特征向量,所属的特征值λ等于m AY 各分量之和. 这个过程很容易用计算机实现. 具体计算出各k Y 如下(为节省篇幅写成行向量形式):(0.138365,0.27044,0.45283,0.138365),(0.131698,0.251377,0.480387,0.136538),(0.130463,0.248149,0.483933,0.137455),(0.130229,0.247579,0.484386,0.137806), (0.130184,0.247475,0.484443,0.137899),(0.130175,0.247456,0.484449,0.13792),(0.130173,0.247452,0.48445,0.137924),(0.130173,0.247451,0.48445,0.137925), (0.130173,0.247451,0.48445,0.137926),(0.130173,0.247451,0.48445,0.137926), 其中9Y 与10Y 已经看不出差别,可以认为是特征向量. 99λ=AY Y ,其中3.75697λ=是9AY 的各分量和,就是9Y 所属于的特征值.这个方法求出的是绝对值最大的特征值的特征向量.在科学计算中,这个方法叫做幂方法. 什么样的方阵可以用这个方法来求特征向量,是值得探讨的理论问题. 不过,只要计算机做出来的结果收敛,n Y 与1n +Y 的差别趋于零,就求出了一个特征向量.例3 人口流动模型假设一个大城市的总人口是固定的,人口的分布因居民在市区和郊区之间迁徒而变化,每年有6%的市区居民搬到效区去住,而有2%的效区居民搬到市区居住,假如开始时有30%的居民住在市区,70%的居民住在效区,问10年后市区和效区的居民人口比例是多少?50年后又如何?这个问题可以用矩阵乘法来描述,把人口变量用市区和效区两个分量表示,即k k c k s x x ⎛⎫= ⎪⎝⎭x ,其中k c x 为市区人口所占比例,k s x 为效区人口所占比例,k 表示年份的次序,0k =时的初始状态的人口变量为0000.3.0.7c s x x ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭x一年后,市区人口为100(10.06)0.02c c s x x x =-+,效区人口1000.06(10.02)s c s x x x =+-,用矩阵表示为11100.940.020.30.2960.0.060.980.70.7040c s x x ⎛⎫⎛⎫⎛⎫⎛⎫==== ⎪ ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭x Ax 从初始时间到k 年,此关系保持不变,因此上述算式可扩展为2120.k k k k --==== x Ax A x A x 可算出11030500.29600.27170.25410.2508,,,.0.70400.72830.74590.7492⎛⎫⎛⎫⎛⎫⎛⎫==== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭x x x x事实上,无限增加时间k ,市区和效区人口之比将趋向于一组常数0.25/0.75. 为了弄清为什么这个过程趋于一个稳态值,用MA TLAB 程序先求出A 特征值12=0.9200=1.0000λλ,,特征向量分别为10.70710.7071ξ-⎡⎤=⎢⎥⎣⎦和20.31620.9487ξ-⎡⎤=⎢⎥-⎣⎦. 令1211,13-⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭u u ,它们分别与两个特征向量12,ξξ成比例并构成整数,由于110.940.0210.920.920.060.9810.92--⎛⎫⎛⎫⎛⎫===⎪⎪ ⎪⎝⎭⎝⎭⎝⎭Au u , 220.940.02110.060.9833⎛⎫⎛⎫⎛⎫===⎪⎪ ⎪⎝⎭⎝⎭⎝⎭Au u ,由于1u 和2u 是属于不同特征值的特征向量,所以它们线性无关,因此是二维向量空间的基.初始向量0x 可以写成基向量1u 和2u 的线性组合0210.3110.250.050.250.05.0.731-⎛⎫⎛⎫⎛⎫==-=- ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭x u u因此0210.250.05(0.92).k k k ==-x A x u u式中的第二项会随着k 的增大趋于零,如果只取小数点后两位,则只要27k >,这第二项就可以忽略不计而得到27020.25|0.25.0.75k k k >⎛⎫=== ⎪⎝⎭x A x u。
第六章 矩阵的相似变换本章主要讨论方阵的特征值和特征向量、方阵的相似变换和对角化等问题.第一节 方阵的特征值和特征向量一、特征值与特征向量定义1 设A 是n 阶方阵,如果存在数λ和n 维非零向量X 使关系式λ=AX X (6.1)成立,则称数λ为方阵A 的特征值;非零列向量X 称为A 对应于特征值λ的特征向量.将式(6.1)改写成()λ−=A E X 0, (6.2) 将(6.2)看成关于X 的齐次线性方程组,它有非零解当且仅当其系数行列式满足 0λ−=A E , (6.3)即1112121222120λλλ−−=−n nn n nn a a a a a a a a a , (6.4)这是以λ为未知数的一元n 次方程,称为A 的特征方程,其左端λ−A E 是λ的n 次多项式,记作()λf ,称为A 的特征多项式,特征方程的根就是A 的特征值.根据代数基本定理,在复数范围内,n 阶方阵A 有n 个特征值(重根按重数计算),记作12,,,λλλ n .求出特征值λi 后,将λi 代入齐次线性方程组(6.2)中,求解方程组()λ−=i A E X 0 (6.5) 的所有非零解向量,就是属于λi 的特征向量。
对不同的特征值逐个计算,可求得属于各特征值的全部特征向量.若非零向量X 是方阵A 的特征向量,则由(6.1)式可知,对任意实数0k ≠,有()()k k λ=A X X ,(6.6) 这表明k X 也是方阵A 的特征向量,因此属于同一特征值的特征向量有无穷多个;反之,不同特征值对应的特征向量必不相同,即一个特征向量只能属于一个特征值(证明留给读者作为练习).由齐次线性方程组解的性质容易证得如下定理.定理1 设λ是方阵A 的特征值,12,,,s p p p 是属于λ的特征向量,则12,,,s p p p 的任意非零线性组合仍是属于λ的特征向量.例1 求141130002−−=A 的特征值和特征向量. 解 A 的特征多项式2141()130(2)(1)002λλλλλλλ−−−=−=−=−−−f A E ,所以A 的特征值为12λ=,231λλ==. 对于12λ=,解齐次方程组(2)−=A E X 0.由3411012110011000000−−−=→−A E ,得基础解系 1111−=p ,所以111(0)≠k k p 是对应于12λ=的全部特征向量.对于231λλ==,解齐次方程组()−=A E X 0.由 241120120001001000−−−=→A E ,得基础解系 2210−=p ,所以222(0)≠k k p 是对应于231λλ==的全部特征向量. 例2 求204121103−−=A 的特征值和特征向量.解 A 的特征多项式2204()121(1)(2)13λλλλλλλ−−−=−=−=−+−−f A E ,所以A 的特征值为11λ=−,232λλ==. 对于11λ=−,解齐次方程组()+=A E X 0.由104104131011104000−−+=→−A E ,得基础解系 1411−=p ,所以111(0)≠k k p 是对应于11λ=−的全部特征向量.对于232λλ==,解齐次方程组(2)−=A E X 0.由 4041012101000101000−−−=→A E ,得基础解系 2010=p ,3101− = p ,所以2233+k k p p (2k ,3k 不同时为0)是对应于232λλ==的全部特征向量.二、特征值和特征向量的性质定理2* 设12,,,λλλ n 是n 阶方阵()=ij a A 的n 个特征值,则有(1)11n n i ii i i a λ==∑∑; (2)1ni i λ==∏A .其中1niii a=∑是A 的主对角元之和,称为方阵A 的迹,记作tr()A .证明 见附录六例3 设7414744y x −= −−A 的特征值为123λλ==,312λ=,求,x y 的值. 解 由定理2可得123123tr()7718331212108x x y λλλλλλ=++=++=+− A A 解之得4,1x y ==−.定理3 设λ是方阵A 的特征值,p 是A 的属于λ的任一特征向量,则有: (1)k R ∀∈,k λ是k A 的特征值,p 是k A 的属于k λ的特征向量;(2)对任意非负整数k ,k λ是k A 的特征值,p 是k A 的属于k λ的特征向量; (3)若()ϕA 是A 的m (m 为任意非负整数)次多项式,即01()m m a a a ϕ=+++A E A A ,则()ϕλ是()ϕA 的特征值,p 是()ϕA 的属于()ϕλ的特征向量;(4)若A 可逆,则0λ≠,且1λ是1−A 的特征值,p 是1−A 的属于1λ的特征向量;(5)若A 可逆,则λA是*A 的特征值,p 是*A 的属于λA的特征向量;(6)λ也是T A 的特征值.证明 (1)由λ=Ap p ,有k k λ=Ap p 成立。
特征值与特征向量计算
特征值与特征向量是线性代数中重要的概念,它们在矩阵运算、物理学、工程学等领域都有广泛的应用。
特征值与特征向量的计算能够帮助我们理解线性系统的性质,从而更好地分析和解决问题。
特征值可以理解为矩阵在某个方向上的伸缩因子,而特征向量则表示在该方向上的运动方向。
可以将特征值与特征向量类比为一个人在不同方向上的运动,特征值相当于移动的速度,而特征向量则是移动的方向。
举个例子来说,假设有一个二维平面上的矩阵A,它可以表示一个变换。
如果我们找到了矩阵A的特征值和特征向量,那么就可以知道在哪个方向上变换的速度最快,以及在哪个方向上变换的方向是怎样的。
特征值与特征向量的计算方法有多种,最常见的是通过求解矩阵的特征方程来得到。
特征方程是一个关于特征值的方程,解方程可以得到特征值的值。
然后,将每个特征值代入到矩阵方程(A-λI)x=0中,可以求得对应的特征向量。
特征值与特征向量的计算不仅可以帮助我们理解线性系统的性质,还可以在实际问题中发挥重要作用。
比如,在物理学中,特征值与特征向量可以用来描述振动系统的固有频率和振动模态;在工程学中,特征值与特征向量可以用来分析结构的稳定性和响应特性。
特征值与特征向量的计算是一种重要的数学工具,它能够帮助我们理解线性系统的性质,并在实际问题中发挥重要作用。
通过计算特征值与特征向量,我们能够更好地分析和解决问题,为科学研究和工程实践提供有力支持。
第六章 特征值我们接着第四章进行讨论. 我们已经知道,对于n 维线性空间V 的一个线性变换A 来说,如果V 可以分解为一些不变子空间的直和,则可以通过选择适当的基12,,,n εεε,使得A 在这组基下的矩阵为准对角阵. 当然,这种分解是越细越好. 即各不变子空间的维数是越小越好. 最为理想的是能将V 分解为n 个一维不变子空间的直和, 这样可通过选择适当的基,A 在这组基下的矩阵为对角阵:12n a a a ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭此时,线性变换A 的许多性质便能一目了然. 例如,若12,,,r a a a 均不为零,但1,,r n a a +全为零,则A 的秩为r ,12Im (,,,)r L =A εεε,而1Ker (,,)r n L +=A εε.但能否这样分解,完全取决于所给的线性变换. 本章将对此展开讨论.§6.1 特征值和特征向量1. 特征值与特征向量概念定义 6.1.1 设A 是数域P 上n 维线性空间V 的一个线性变换. 如果对于数域P 中一个数0λ,在V 中存在一个非零向量ξ,使得0()λ=A ξξ, (1.1) 则称0λ是线性变换A 的一个特征值,向量ξ称为A 的属于特征值0λ的特征向量.说明 从几何上来看,在经过线性变换后,特征向量的方向保持在同一条直线上,若00λ>,保持方向不变;若00λ<,保持方向相反;若00λ=,特征向量就变为了零向量.现在设A 在某组基下的矩阵是A ,向量ξ在这组基下可以表示为一个列向量α,此时(1.1)式等价于0λ=A αα.从而等价于0()n λ-=0E A α.定义6.1.2 设A 是数域P 上的n 阶方阵,如果存在0P λ∈及n 维非零列向量α,使得0λ=A αα,则称0λ是矩阵A 的一个特征值, α称为A 的属于特征值0λ的特征向量.关于特征值与特征向量,我们有下面三个命题:命题6.1.3 如果ξ是A 的属于特征值0λ的特征向量. 则对P 的任意数0k ≠,k ξ都是属于特征值0λ的特征向量.证明 由于0()λ=A ξξ,≠0ξ,所以对0k ≠有k ≠0ξ,且00()()()()k k k k λλ===A A ξξξξ.故k ξ是属于特征值0λ的特征向量. 证毕 命题6.1.4 一个特征向量只能属于一个特征值. 证明 设≠0ξ是A 的一个特征向量,且0()λ=A ξξ, 0()λ'=A ξξ, 则00λλ'=ξξ. 而≠0ξ,所以00λλ'=. 证毕. 命题6.1.5 向量≠0ξ生成的子空间()L ξ对A 不变⇔ξ是A 的一个特征向量. 证明 若()L ξ对A 不变,则()()L ∈A ξξ. 所以存在0P λ∈,使得0()λ=A ξξ. 即ξ是A 的一个特征向量.反过来,若ξ是A 的一个特征向量. 则≠0ξ,且有0()λ=A ξξ,则由命题6.1.3,对于()L ξ的任意向量k ξ有00()()()()k k k L λλ==∈A ξξξξ,即()L ξ对A 不变,从而是关于A 的一维不变子空间. 证毕.2. 特征值与特征向量的求法读者自然会问:如何判断一个向量是不是特征向量呢?如果是,又如何求相应的特征值呢?下面对有限维线性空间来进行讨论.设A 是数域P 上n 维线性空间V 的一个线性变换,12,,,n εεε是V 的一组基,A 在这组基下的矩阵是A . ξ是A 的属于特征值0λ的一个特征向量,即0()λ=A ξξ,≠0ξ,0P λ∈.设ξ在基12,,,n εεε下的坐标为12(,,,)n k k k ,则11221212()(,,,)(,,,)n n n n k k kkk k ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭A A A ξεεεεεε,11220012120(,,,)(,,,)n n n n k k k k k k λλλ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭ξεεεεεε. 所以11220n n k k k k k k λ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭A , 即12000()0n n k k k λ⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪-= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭E A . 这就表明:12(,,,)T n k k k 是系数矩阵为0n λ-E A 的齐次线性方程组0()n λ-=0E A x的一个非零解. 因此,系数矩阵的行列式等于零,即00n λ-=E A .这也说明了特征值0λ是关于λ的n 次多项式()n f λλ=-E A 的一个根.反过来,坐标为0()n λ-=0E A x 的非零解的向量便是A 的属于特征值0λ的特征向量.我们引入下面的定义. 定义6.1.6 设111212122212n n n n nn a a a a a a a a a ⎛⎫ ⎪ ⎪= ⎪⎪⎝⎭A λ是一个符号或文字,则称矩阵111212122212n n n n nn a a a a a a a a a λλλλ---⎛⎫⎪---⎪-= ⎪⎪---⎝⎭E A 为A 的特征矩阵. 称()f λλ=-E A为A 的特征行列式或特征多项式.于是上面的分析可以归纳为下面的定理.定理6.1.7 设A 是数域P 上的n 维线性空间V 的一个线性变换,A 在V 的基12,,,n εεε下的矩阵是A . 若ξ是A 的属于特征值0λ的一个特征向量,即0()λ=A ξξ,≠0ξ,0P λ∈,则A 的特征值0λ是特征多项式()f λλ=-E A 的根,而属于0λ的特征向量ξ的坐标就是齐次线性方程组0()λ-=0E A x 的非零解. 反之,如果0λ是多项式()f λλ=-E A 的根,且0P λ∈,则0λ是线性变换A 的一个特征值. 而以0()λ-=0E A x 的非零解为坐标的向量便是A 的属于特征值0λ的特征向量.把上面的分析逆推回去即得定理的后一部分的证明.例6.1.8 设A 是数域P 上3维线性空间V 的一个线性变换,123,,εεε是V 的一组基,A 在这组基下的矩阵是122212221⎛⎫ ⎪= ⎪ ⎪⎝⎭A ,求A 的特征值及相应的特征向量.(分析)先求出特征值,即求出()f λλ=-E A 的根0λ; 再将0λ代入到0()λ-=0E A x 中,求0()λ-=0E A x 的非零解,这非零解便是属于0λ的特征向量的坐标.解 1)先求特征值. 由于2122()212(1)(5)221f λλλλλλλ---=-=---=+----E A ,所以11λ=-(二重根),25λ=. 由于任何数域都包含有理数域,所以12,P λλ∈,从而1,5-都是A 的特征值.2)求属于特征值11λ=-的特征向量. 解方程组1()λ-=0E A x ,即112311231213(1)220,2(1)20,22(1)0.x x x x x x x x x λλλ---=⎧⎪-+--=⎨⎪--+-=⎩得到1231231232220,2220,2220.x x x x x x x x x ---=⎧⎪---=⎨⎪---=⎩容易求得它的基础解系是100,111⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭. 所以113=-ξεε,223=ξε-ε是属于特征值11λ=-的特征向量. 因而属于特征值11λ=-的全部特征向量为1122k k +ξξ. 其中12,k k P ∈,且不全为零.同样的,可以求得3123=++ξεεε是属于特征值25λ=的特征向量. 因而属于特征值25λ=的全部特征向量为3k ξ. 其中k P ∈,且不为零.例6.1.9 在n 维线性空间中数乘变换k A 在任一组基下的矩阵都是k E ,它的特征多项式是()n k k λλ-=-E E . 所以k A 的特征值只有k . 由数乘变换k A 的定义可知,每个非零向量都是属于k 的特征向量.例6.1.10设A 是实数域R 上3维线性空间V 的一个线性变换,123,,εεε是V 的一组基,A 在这组基下的矩阵是332112310⎛⎫⎪=- ⎪ ⎪--⎝⎭A ,求A 的特征值及相应的特征向量. 解 1)先求特征值. 由于2332()112(4)(4)31f λλλλλλλ---=-=--=+-E A ,所以特征多项式的根为2i ±,4. 但2i ±不属于实数域R ,故不是特征值,所以只有4是A 的特征值.2)求属于特征值14λ=的特征向量. 解方程组1()λ-=0E A x ,即112311231213(3)320,(1)20,30.x x x x x x x x x λλλ---=⎧⎪-+-+=⎨⎪++=⎩ 得到123123123220,320,340.x x x x x x x x x --=⎧⎪-++=⎨⎪++=⎩ 容易求得它的基础解系是11,1⎛⎫ ⎪ ⎪ ⎪-⎝⎭.所以123=+-ξεεε,是属于特征值14λ=的特征向量. 因而属于特征值14λ=的全部特征向量为k ξ. 其中k P ∈,且不为零.我们再来介绍特征向量的一个重要性质. 定理6.1.11 属于不同特征值的特征向量线性无关.证明 设A 是数域P 上n 维线性空间V 的一个线性变换,12,,,m λλλ是A 的m个互异的特征值,如果i ≠0ξ是属于(1,2,,)i i m λ=的特征向量,即()(,,1,2,,)i i ii i P i m λλ=≠∈=0A ξξξ.我们需要证明12,,,m ξξξ在P 上线性无关. 对m 用数学归纳法.当1m =时,因为1≠0ξ,所以1ξ线性无关,定理成立. 假设定理对1(1)m m ->成立,现在考虑m 的情形. 设112211m m m m k k k k --++++=0ξξξξ. (1.1)(1.1)式两边同乘以m λ有 112211m m m m m m m m k k k k λλλλ--++++=0ξξξξ. (1.2) 再对(1.1)的两边同时作用线性变换A ,则有 111222111m m m m m m k k k k λλλλ---++++=0ξξξξ. (1.3)所以(1.2)-(1.3)有111222111()()()m m m m m m k k k λλλλλλ----+-++-=0ξξξ. 由归纳假设121,,,m -ξξξ线性无关,而12,,,m λλλ互异,所以1210m k k k -====.因而,再由(1.1)式有m m k =0ξ,而m ≠0ξ,故0m k =. 所以12,,,m ξξξ线性无关. 证毕.§6.2 特征多项式在上节里,我们介绍了特征多项式概念,本节我们要进一步讨论它. 设111212122212n n n n nn a a a a a a a a a ⎛⎫⎪ ⎪= ⎪⎪⎝⎭A 则A 的特征多项式为111212122212()n nn n nna a a a a a f a a a λλλλλ------=-=---E A11122()(1)n n n nn a a a λλ-=-+++++-A .因此我们有下面的结论.命题6.2.1 n 阶方阵A 的特征多项式是一个首项为1的n 次多项式.定义6.2.2 n 阶方阵A 的特征多项式()f λ在复数域内的根,称为A 的特征根.设A 的特征根为12,,,n λλλ,则由Vieta 定理我们又有下面的结论.命题6.2.3 设n 阶方阵()ij n na ⨯=A 的特征根为12,,,n λλλ,则1)112212Tr()nn n a a a λλλ=+++=+++A ;2)12n λλλ=A .注意,命题6.2.3中的1)并不意味着一定有111222,,,nn n a a a λλλ===.我们知道同一个线性变换在不同基下的矩阵是相似的,那么相似的矩阵是否有相同的特征值呢?下面的定理作出了肯定的回答. 定理6.2.4 相似阵有相同的特征多项式. 证明 设方阵,A B 相似,即存在满秩方阵P 使得1-=B PAP .所以,111λλλ----=-=-E B E PAP PP PAP11()λλλ--=-=-=-P E A P P E A P E A .证毕.说明 1)相似的方阵既然有相同的特征多项式,当然也就有相同的特征根. 因而结合命题6.2.3,相似的矩阵就有相同的行列式.2)定理6.2.4的逆不成立,即有相同特征多项式的矩阵却未必相似.如1011,0101⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭E A .有相同的特征根,但并不相似. 因为和E 相似的矩阵只有它自身.3)由于一个线性变换A 在不同基下的矩阵是相似的,则由定理6.2.4,A 在任何基下的矩阵的特征多项式都是相同的. 于是我们给出下面的定义.定义6.2.5 设A 有限维线性空间V 的一个线性变换,A 在V 的任意一组基下的矩阵的特征多项式就称为线性变换A 的特征多项式,而其在复数域内的根称为A 的特征根.说明 如果A 是数域P 上的有限维线性空间V 的一个线性变换,那么A 的特征值必是A 的特征根. 但A 的特征根未必是A 的特征值,只有属于P 的特征根才是A 的特征值. 对于矩阵的特征值与特征根的情形是相似的(如本章第一节例6.1.10).最后,我们指出特征多项式的一个重要性质. 定理6.2.6(Hamilton-Caylay 定理)设()ij n na ⨯=A 是数域P 上的一个n 阶方阵,()f λλ=-E A 是A 的特征多项式,则11122()()(1)n n n nn f a a a -=-+++++-=0A A A A E .证明 设()()λλ*=-B E A 是λ-E A 的伴随矩阵. 由伴随矩阵的性质,有()()()f λλλλ-=-=B E A E A E E .由于伴随矩阵()λB 中的元素都是λ-E A 的各个元素的代数余子式,因而也都是次数不超过1n -的多项式. 于是由矩阵的运算性质,可以把()λB 写成:120121()n n n n λλλλ----=++++B B B B B ,其中0121,,,,n n --B B B B 都是n n ⨯数字矩阵.设111()n n n n f a a a λλλλ--=-+++,则111()n n n n f a a a λλλλ--=-+++E E E E E . (2.1)又()()()120121()n n n n λλλλλλ-----=++++-B E A B B B B E A()()()1201021121n n n n n n B λλλλ-----=+-+-++--B B A B B A B B A B A . (2.2)将(2.1)与(2.2)进行比较得01012121211,,,,.n n n n n a a a a ----=⎧⎪-=⎪⎪-=⎪⎨⎪⎪-=⎪-=⎪⎩B E B B A E B B A E B B A E B A E (2.3)用1,,,,n n -A A A E 依次从右边乘(2.3)的第一式,第二式,,第n 式,第1n +式,得0111101121222122212111,,,,.n n n n n n n n n n n n n n n n n a a a a a a a ------------⎧==⎪-==⎪⎪-==⎪⎨⎪⎪-==⎪⎪-=⎩B A EA A B A B A EA A B A B A EA A B A B A EA A B A E (2.4)把(2.4)的1n +个式子左边与右边分别相加,左边就变为了零,而右边即为()f A . 所以()f =0A . 证毕.设A 是数域P 上的n 维线性空间V 的一个线性变换,由于P 上的线性变换的集合()M V 与n n P ⨯同构,又当A 在某组基下的矩阵为A 时,mA 的矩阵为m A ,从而由Hamilton-Caylay 定理有下面的推论.推论6.2.7 设A 是数域P 上的n 维线性空间V 的一个线性变换,()f λ是A 的特征多项式,则()f =A 0. 其中0是零变换.例6.2.8 设,A B 是两个n 阶方阵,则AB 与BA 有相同的特征多项式,从而有相同的特征根. 证明 由于,λλλλ--⎛⎫⎛⎫⎛⎫= ⎪⎪⎪⎝⎭⎝⎭⎝⎭00E A E A E AB E B E B E 上式两边取行列式,并利用Laplace 定理有nn λλλλ=-EA E AB BE.又,λλλλ⎛⎫⎛⎫⎛⎫= ⎪⎪ ⎪--⎝⎭⎝⎭⎝⎭00EE A E A B E BE E AB 同理有nn λλλλ=-EA E BA BE.因而有n n λλλλ-=-E AB E BA .故λλ-=-E AB E BA .§6.3 对角化对于某个线性空间一个线性变换,我们关心的是:能否找到一组基,使得这个线性变换在这组基下的矩阵具有特别简单的形状?对角矩阵可以认为是最为简单的一种矩阵. 而同一线性变换在不同基下的矩阵是相似的. 那么我们的问题就是:是否所有线性变换的矩阵都相似于对角阵呢?如果不然,哪些线性变换的矩阵可以相似于对角阵呢?在这一节里,我们主要讨论这个问题.1. 方阵的对角化定义6.3.1 如果数域P 上的方阵A 与P 上的一个对角矩阵相似,则称方阵A 在P 上可以对角化. 如果数域P 上的有限维线性空间V 的线性变换A 的矩阵在P 上可以对角化,则称线性变换A 可以对角化.说明 从上面的定义可以看出,如果线性变换A 可对角化,那么通过选择适当的基,A 在这组基下的矩阵是对角阵.定理6.3.2 设A 是n 维线性空间V 的一个线性变换,那么A 可以对角化的充分必要条件是A 有n 个线性无关的特征向量. 证明 设A 在基12,,,n εεε下的矩阵是A ,即1212(,,,)(,,,)n n =A A εεεεεε.如果A 可以对角化,即存在可逆阵P 使得121n λλλ-⎛⎫⎪⎪= ⎪ ⎪⎝⎭P AP , 则1212(,,,)(,,,)n n =P αααεεε也是V 的一组基,且11212(,,,)(,,,)n n -=P AP A αααααα1212(,,,)n n λλλ⎛⎫⎪⎪= ⎪ ⎪⎝⎭ααα, 则有 (),1,2,,i i i i n λ==A αα.这说明12,,,n ααα是A 特征向量,而它们显然是线性无关的.反过来,如果12,,,n ααα是A 的n 个线性无关的特征向量. 则它同时可以认为就是V 的一组基,而A 在12,,,n ααα下的矩阵是对角阵,即A 可以对角化. 证毕.说明 定理6.3.2可以用矩阵的语言叙述:如果A 是n 阶方阵,则A 相似于对角阵的充分必要条件是A 有n 个线性无关的特征向量(这样的矩阵A 称为可对角化矩阵).推论6.3.3设A 是数域P 上的n 维线性空间V 的一个线性变换. 如果A 的特征多项式在P 中有n 个单根,则A 在P 上可以对角化.证明 由于A 的特征多项式在P 上有n 个单根,即A 在P 上有n 个互异的特征值,而属于不同的特征值的特征向量都是线性无关的,所以A 有n 个线性无关的特征向量,从而由定理6.3.2知,A 在P 上可以对角化.推论6.3.4 设A 是复数域上的n 维线性空间V 的一个线性变换. 如果A 的特征多项式没有重根,则A 可以对角化.说明 上面的两个推论可以用矩阵语言来叙述. 即1)如果复数域上的矩阵A 有n 个单根,则A 在P 上可以对角化.2)如果复数域上的矩阵A 的特征多项式没有重根,则A 在P 上可以对角化.2. 特征子空间下面我们进一步讨论对角化定义6.3.5设A 是数域P 上的n 维线性空间V 的一个线性变换,0λ是A 的一个特征值,则称{}00,()V V λλ=∈=A αααα为A 的属于特征值0λ的特征子空间.因为0()λ=A αα等价于0()()λ-=0E A α,则00Ker()V λλ=-E A . 所以0V λ的确是V 的子空间. 又因为00()()λλ-=-A E A E A A ,则再由第四章§4.4的例4.4.6,我们有下面的命题.命题6.3.6 特征子空间0V λ是A 的不变子空间.现在我们讨论特征值0λ的重数与特征子空间0V λ的维数之间的关系. 定理6.3.7设A 是数域P 上的n 维线性空间V 的一个线性变换,0λ是A 的一个特征值,0V λ是属于A 的特征子空间,则00dim V λλ≤的重数.证明 设0dim V m λ=,且12,,,m ααα是0V λ的一组基,现在将它扩充为V 的一组基:121,,,,,,m m n +ααααα.因为0V λ是属于A 的特征子空间,则0V λ是V 的不变子空间. 因而可设101202011,112,12,11122(),(),(),(),().m m m m m n m n n n n nn n a a a a a a λλλ++++====+++=+++A A A A A αααααααααααααα于是A 在基121,,,,,,m m n +ααααα下的矩阵为01,110,1m n n m nn a a a a λλλ++⎛⎫⎪ ⎪ ⎪ ⎪=⎪ ⎪ ⎪ ⎪ ⎪⎝⎭A . 于是有0()()m g λλλλ-=-E A ,其中()g λ为A 中右下角小块的特征多项式. 故0λ在特征多项式()f λλ=-E A中的重数m ≥,亦即00dim V λλ≤的重数.证毕.定理6.3.8 如果12,,,k λλλ是线性变换A 的不同的特征值,而1,,i i ir αα是属于特征值(1,2,,)i i k λ=的线性无关的特征向量,那么向量组11111,,,,,,k r k kr αααα线性无关.(分析)根据线性无关的定义进行证明. 证明 设1111111111k k r r k k kr kr l l l l ++++++=0αααα令11,1,2,,i i i i i i ir ir l l V i k λ=++∈=ααα. 则上式即为12k +++=0ααα.所以i α只可能是0,或者是属于i λ的特征向量. 如果12,,,k ααα不全为0,我们不妨设12,,,()s s k ≤ααα都不是0,即它们分别是属于12,,,s λλλ的特征向量,而其余的都是0,则有12s +++=0ααα.这说明12,,,s ααα线性相关,而属于不同特征值的特征向量线性无关,从而引出矛盾. 所以12,,,k ααα全为0,亦即11,1,2,,i i i i i ir ir l l i k =++==0ααα.又1,,i i ir αα线性无关,所以10,1,2,,i i ir l l i k ====.故向量组11111,,,,,,k r k kr αααα线性无关. 证毕.定理6.3.9设A 是数域P 上的n 维线性空间V 的一个线性变换. 则A 可以对角化的充分必要条件是,A 的特征根都是特征值,而且对每个特征值i λ都有dim i i V λλ=的重数.证明 充分性. 设A 的特征根都是特征值,也就是说A 的特征根都在P 中. 令12,,,k λλλ是A 的全部互异的特征根,重数依次为12,,,k r r r . 则12k r r r n +++=.又dim ,(1,,)i i V r i k λ==,则可设1,,i i ir αα是i V λ的一组基. 所以由定理3.8,这n 个特征向量11111,,,,,,k r k kr αααα线性无关. 于是由定理6.3.2,A 可以对角化.必要性. 设A 可以对角化,即A 在某组基下的矩阵是对角阵,则A 有n 个线性无关的特征向量. 这些特征向量经过适当的排列为:11111,,,,,,t s t ts εεεε.其中1,,i i is εε是同一个特征值(1,,)i i t λ=的特征向量.显然,11111,,,,,,t s t ts εεεε也是V 的一组基. 那么A 在这组基下的矩阵为 111ttt s s λλλλ⎛⎫⎫ ⎪⎪⎬ ⎪⎪ ⎪⎭⎪ ⎪ ⎪⎫ ⎪⎪ ⎪⎬ ⎪⎪ ⎪⎭⎝⎭, 则A 的特征多项式为1212()()()()t s s s t f λλλλλλλ=---,由于1t s s n ++=,这说明A 的特征根都是特征值. 而(1,,)i i t λ=互异,则i λ的重数为i s . 又由于11111,,,,,,t s t ts εεεε是V 的一组基,线性无关,所以dim i i V s λ≥.而由定理6.3.7,dim i i V s λ≤. 故dim i i V λλ=的重数.证毕 .说明 1)用矩阵语言来叙述:设A 是数域P 上的n 阶方阵. 则A 可以对角化的充分必要条件是,A 的特征根都是特征值,而且对每个特征值i λ都有dim i i V λλ=的重数.2)这个定理给出了一个线性变换A 可对角化的充分必要条件.对于可对角化矩阵A ,现在我们来详细讨论如何求出P ,使得1-P AP 为对角阵.由于A 可对角化,则可设A 的特征值为12,,,n λλλ. 因为P 是可逆阵,不妨设12(,,,)n =P ααα是对P 按列进行分块. 由于121n λλλ-⎛⎫⎪⎪= ⎪ ⎪⎝⎭P AP , 所以12n λλλ⎛⎫⎪⎪= ⎪ ⎪⎝⎭AP P . 因此121122(,,,)(,,,)n n n λλλ=A A A αααααα.即有,i i i λ=A αα所以,可以认为i α就是属于特征值i λ的特征向量. 因此P 的n 个列向量就是A 的n 个线性无关的特征向量. 这表明只要我们求出A 的n 个线性无关特征向量,将它们放在一起组成的矩阵就是所要求的P .说明 因为特征向量不唯一,所以P 不唯一. 另外第i 个列向量对应于第i 个特征值.例6.3.10 判断矩阵100252241⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭A是否相似于对角阵,如果是,求出可逆矩阵P ,使得1-P AP 为对角阵. (分析)首先需要求出特征值,并根据相应的特征向量来判断A 是否相似于对角阵. 解 由于23100252(1)(3)241λλλλλλ--=--=--+E A .所以A 特征根1(二重)及3(一重),并且都是特征值. 将1λ=代入()3λ-=0E A x 有1231232420,2420.x x x x x x -+=⎧⎨-+=⎩ 容易求得该齐次线性方程组的基础解系为12211,001-⎛⎫⎛⎫ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭εε.将3λ=代入()3λ-=0E A x 后,容易求出这个方程组的基础解系为301.1⎛⎫⎪= ⎪ ⎪⎝⎭ε这说明A 有3个线性无关的特征向量,则它可以对角化. 因而根据上面的讨论有1210100101,010011003--⎛⎫⎛⎫ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭P P AP .推论6.3.11 设A 是数域P 上的n 阶方阵. 则A 在P 上可对角化的充分必要条件是A 的特征根都在P 中,并且对每个特征根i λ都有()i i R n r λ-=-E A ,其中i r 是特征根i λ的重数.证明 对于A 的每个特征根i λ,齐次线性方程组()i λ-=0E A x的解空间的维数为()i n R λ--E A . 而该齐次线性方程组的解空间实际上就是相应于i λ的特征子空间i V λ,所以dim ()i i V n R λλ=--E A .又由定理6.3.9,A 可对角化的充分必要条件是,每个特征根i P λ∈,且dim i i V λλ=的重数i r =.故()i i R n r λ-=-E A . 证毕.例6.3.12 判断下面方阵能否对角化:452221111-⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭A .解 容易求得1是A 的三重特征根;又容易看出(1)033R ⋅-≠=-E A .故A 在任何数域上都不能对角化. 习题A1. 求下列矩阵的特征值与特征向量:1)110143202⎛⎫ ⎪ ⎪ ⎪⎝⎭; 2)010100001⎛⎫ ⎪⎪ ⎪⎝⎭; 3)1100230000230014-⎛⎫⎪⎪⎪ ⎪⎝⎭. 2. 已知()()1212,,,,,,,n n a a a b b b ==αβ是两个非零向量且'=0αβ,求矩阵'=αβA 的全部特征值.3. 设A 使线性空间V 上的线性变换,V 有一个直和分解:12m V V V V =⊕⊕⊕,其中每个i V 是A 的不变子空间. 设A 限制在i V 上的特征多项式为()i f λ,求证:A 的特征多项式12()()()()m f f f f λλλλ=.4. 证明:n 阶矩阵A 以任一非零n 列向量为特征向量的充分必要条件是c =A E ,其中c 是常数.5. 设15310ac b c a -⎛⎫ ⎪= ⎪ ⎪--⎝⎭A .如果1=-A ,*A 有一个特征值0λ且属于0λ的一个特征向量为()1,1,1T--. 求0,,,a b c λ的值.6.判断下列矩阵是否相似于对角阵,如果是,求出可逆矩阵P ,使得1-P AP 为对角阵.1)212533102-⎛⎫⎪=- ⎪ ⎪--⎝⎭A ;2)142340313--⎛⎫ ⎪=- ⎪ ⎪-⎝⎭A .7. 矩阵A 是3阶方阵,其特征值为1,1,3,对应的特征向量依次为()()()2,1,0,1,0,1,0,1,1T T T -,求出矩阵A .8. 设3221423kk -⎛⎫ ⎪=-- ⎪ ⎪-⎝⎭A 当k 为何值时,存在可逆矩阵P ,使得1-P AP 为对角阵. 求出P 和对角阵.9. 设12,λλ是A 的两个不同的特征值,12,ξξ分别是12,λλ的特征值,则12+ξξ必不是A 的特征向量.10. 设V 使复数域上的n 维线性空间,A 与B 是V 的两个线性变换,且=A B B A .证明:1)如果0λ是A 的一个特征值,那么0V λ是B 的不变子空间.2)A 与B 至少有一个公共的特征向量.习题B1. 设T =B AA ,其中12(,,,)T n a a a =A ,且(1,2,,)i a i n =为非零实数.1)证明:k l =B B ,并求出数l ,这里k 是正整数;2)求可逆阵C ,使得1-C BC 为对角阵,并写出该对角阵.2. 设A 是m n ⨯矩阵,B 是n m ⨯矩阵,且m n ≥. 求证:m n m n λλλ--=-E AB E BA .3. 设A 是数域P 上n 维线性空间V 的线性变换且可逆. 证明:1)A 的特征值不为零;2)如果0λ是A 的特征值,则10λ-是1-A 的特征值.4. 设A 是数域P 上n 维线性空间V 的线性变换,证明:A 的行列式为零的充分必要条件是A 的一个特征值为零.5. 设A 是一个n 阶下三角阵,证明:1)如果当i j ≠时,ii jj a a ≠,,1,2,,i j n =,那么A 相似于一个对角阵. 2)如果1122nn a a a ===,而至少有一个00000,()i j a i j ≠>,那么A 不相似于对角阵.6. 证明:对任一n 阶复方阵A ,存在可逆矩阵P ,使得1-P AP 为上三角矩阵.。