第2节 矩阵可对角化的条件、实对称矩阵的对角化
- 格式:ppt
- 大小:349.50 KB
- 文档页数:17
矩阵可以对角化的充分必要条件矩阵的对角化是线性代数中一个重要的概念,它在许多领域中都有广泛的应用。
在矩阵的对角化中,有一个非常重要的定理,即矩阵可对角化的充分必要条件。
本文将从理论和实际应用两个方面,详细介绍矩阵可对角化的充分必要条件。
一、理论介绍我们来介绍矩阵的对角化。
对于一个n阶方阵A,如果存在一个可逆矩阵P,使得P^{-1}AP为对角矩阵D,即P^{-1}AP=D,那么我们称矩阵A可对角化,且D为A的一个对角化矩阵。
接下来,我们来介绍矩阵可对角化的充分必要条件。
对于一个n阶方阵A,A可对角化的充分必要条件是存在n个线性无关的特征向量。
为了更好地理解这个条件,我们来解释一下特征向量和特征值。
对于一个n阶方阵A和一个非零向量v,如果满足Av=λv,其中λ为一个常数,那么我们称v为A的一个特征向量,λ为对应的特征值。
特征向量和特征值的概念在线性代数中非常重要,它们可以描述矩阵的性质和变换。
而矩阵可对角化的充分必要条件即存在n个线性无关的特征向量,也就是说,对于一个可对角化的矩阵A,存在n 个不同的特征值和对应的特征向量。
二、实际应用矩阵的对角化在实际应用中有着广泛的应用。
以下我们将介绍两个常见的实际应用场景。
1. 线性变换在线性代数中,矩阵可以表示线性变换。
对于一个可对角化的矩阵A,它可以通过对角化得到一个对角矩阵D。
这样,原来的线性变换就变成了对角矩阵的线性变换。
对角矩阵的线性变换非常简单,只需要对每个坐标轴进行伸缩即可。
这种对角矩阵的线性变换在计算机图形学中有着广泛的应用,可以实现图像的缩放、旋转和平移等操作。
2. 特征值问题矩阵的特征值和特征向量在特征值问题中有着重要的应用。
特征值问题是求解形如Ax=λx的问题,其中A为一个已知矩阵,x为未知向量,λ为未知常数。
矩阵可对角化的充分必要条件即存在n个线性无关的特征向量。
对于特征值问题,我们可以通过对矩阵A进行对角化,得到特征值和特征向量。
特征值问题在物理学、工程学和计算机科学等领域中有着广泛的应用。
矩阵可对角化的充要条件矩阵可对角化的充要条件矩阵是线性代数中的重要概念,它是由一组数排成的矩形阵列。
在线性代数中,对于一个给定的方阵,我们希望能够找到一个相似矩阵,使得这个方阵可以被对角化。
那么什么样的矩阵可以被对角化呢?下面我们将从多个方面来探讨这个问题。
一、基本概念1. 矩阵相似如果存在一个可逆矩阵P,使得A = PBP^-1,则称A和B相似。
其中B是一个任意的方阵。
2. 特征值与特征向量设A是n阶方阵,如果存在一个非零向量x使得Ax = λx,则称λ是A的特征值,x是A对应于λ的特征向量。
3. 对角矩阵如果一个n×n方阵只有主对角线上有非零元素,则称其为对角矩阵。
常用符号为D。
二、必要条件如果一个n×n方阵可以被对角化,则其必须满足以下条件:1. 线性无关所有特征向量必须线性无关。
2. 完备所有特征向量必须完备。
3. 重根如果有重根的特征值,则其对应的特征向量必须线性无关。
三、充分条件如果一个n×n方阵满足以下条件,则其可以被对角化:1. 存在n个线性无关的特征向量如果一个n×n方阵A有n个线性无关的特征向量,那么可以将它们组成一个矩阵P,使得A = PDP^-1,其中D是由A的特征值构成的对角矩阵。
2. 所有特征向量都是完备的如果所有特征向量都是完备的,则可以将它们组成一个矩阵P,使得A = PDP^-1,其中D是由A的特征值构成的对角矩阵。
3. 每个特征值都有足够数量的线性无关的特征向量如果每个特征值都有足够数量(等于其重数)的线性无关的特征向量,则可以将它们组成一个矩阵P,使得A = PDP^-1,其中D是由A的特征值构成的对角矩阵。
四、结论综上所述,当一个n×n方阵满足以上充分条件之一时,则该方阵可被对角化。
而当一个n×n方阵不满足以上必要条件之一时,则该方阵不可被对角化。
因此,在实际问题中,我们可以通过计算矩阵的特征值和特征向量来判断其是否能被对角化,并进一步求出对角矩阵。
实对称阵可对⾓化的⼏种证明及其推⼴实对称阵是⼀类常见的矩阵, 它与实⼆次型和实内积空间上的⾃伴随算⼦有着密切的联系. 任⼀实对称阵 A 均正交相似于对⾓阵, 即存在正交阵 P , 使得P ′AP =diag{λ1,λ2,⋯,λn }.实对称阵的这条重要性质, 通常在内积空间的框架中加以证明 (参考复旦⾼代教材第 9.5 节). 事实上, 这⼀性质既可以在引⼊矩阵可对⾓化的定义和判定准则后直接加以证明, 也可以利⽤ Jordan 标准型理论加以证明. 下⾯我们将给出实对称阵可对⾓化的⼏种证明, 为此先来证明三个简单的引理.引理 1 实对称阵的特征值都是实数.证明 设 A 为 n 阶实对称阵, λ0∈C 是 A 的任⼀特征值, α=(a 1,a 2,⋯,a n )′∈C n 是对应的特征向量, 即 A α=λ0α. 上式两边同时左乘 ¯α′, 则有 ¯α′A α=λ0¯α′α. 注意到 α 是⾮零向量, 故 ¯α′α=n∑i =1|a i |2>0. 注意到 A 为实对称阵, 故 ¯(¯α′A α)′=¯α′A α, 即 ¯α′A α 是⼀个实数, 从⽽λ0=¯α′A α¯α′α也是实数. ◻引理 2 设 A 为 n 阶实对称阵, 则 r (A )=r (A 2)=r (A 3)=⋯.证明 由⾼代⽩⽪书的例 3.72 可知 r (A )=r (A ′A )=r (A 2), 从⽽ r (A )=r (A 2m) (m ≥1). 再由矩阵相乘秩相等或变⼩的性质以及夹逼法可知 r (A )=r (A k )(k ≥1). ◻引理 3 设 A 为 n 阶实对称阵, 则 Ker A ∩Im A =0 并且 Ker A =Ker A 2=Ker A 3=⋯.证明 由引理 2 以及线性映射的维数公式即得. ◻定理 1 实对称阵可实对⾓化.证法 1 (有完全的特征向量系) 由引理 1 可设 A 的全体实特征值为 λ1,λ2,⋯,λn , 我们对特征值 λ1 来证明其代数重数等于其⼏何重数. 不失⼀般性, 可设 λ1=⋯=λm , 但 λj ≠λ1(m <j ≤n ), 即 λ1 的代数重数为 m . 由复旦⾼代教材的定理 6.1.2 及其后的注可知, 存在⾮异实矩阵 P , 使得 P −1AP =B C 0D, 其中 B 是主对⾓元为 λ1 的 m 阶上三⾓阵, D 是主对⾓元分别为 λm +1,⋯,λn 的上三⾓阵, 于是P −1(A−λ1I n )P =B −λ1I mC 0D −λ1I n −m.注意到 B −λ1I m 是主对⾓元全为零的上三⾓阵, 这是⼀个幂零阵, 故 (B −λ1I m )m =0, 从⽽P −1(A−λ1I n )m P=B −λ1I mC 0D −λ1I n −mm=0∗0(D −λ1I n −m )m.注意到 (D −λ1I n −m )m 是⼀个主对⾓元全不为零的上三⾓阵, 从⽽是⾮异阵, 于是 r ((A −λ1I n )m )=n −m . 注意到 A −λ1I n 为实对称阵, 再由引理2 可知, λ1 的⼏何重数为n −r (A −λ1I n )=n −r ((A −λ1I n )m )=n −(n −m )=m ,即⼏何重数等于代数重数.证法 2 (全空间等于特征⼦空间的直和) 任取 A 的实特征值 λ0, 由引理 3 可知Ker(A −λ0I n )=Ker(A −λ0I n )2=⋯,再由⾼代⽩⽪书的例 7.13 的证法 1 完全相同的讨论即得结论. 另外, 由 Ker(A −λ0I n )=Ker(A −λ0I n )n 可知, λ0 的⼏何重数 dimKer(A −λ0I n )等于其代数重数 dimKer(A −λ0I n )n , 即 A 有完全的特征向量系, 这⼀⽅法⽐证法 1 更加简洁.证法 3 (极⼩多项式⽆重根) 任取 A 的实特征值 λ0, 由引理 3 可知Ker(A −λ0I n )=Ker(A −λ0I n )2=⋯,()()()()再由⾼代⽩⽪书的例 7.13 的证法 2 完全相同的讨论即得结论.证法 4 (Jordan 标准型之⼀) 任取A的实特征值λ0, 由引理 3 可知Ker(A−λ0I n)∩Im(A−λ0I n)=0,再由⾼代⽩⽪书的例 7.13 的证法 3 完全相同的讨论即得结论.证法 5 (Jordan 标准型之⼆) 任取A的实特征值λ0, 由引理 2 可知r(A−λ0I n)=r((A−λ0)2), 再由⾼代⽩⽪书的例 7.14 的证法 2 完全相同的讨论即得结论.证法 6 (Jordan 标准型之三) 设P为⾮异实矩阵, 使得P−1AP=J=diag{J r1(λ1),⋯,J rk(λk)}.⽤反证法, 若A不可对⾓化, 则不妨设r1>1. 设P′P=(b ij), 则b12=b21并且b11是P的第⼀列元素的平⽅和, 由P的⾮异性可知b11>0. 注意到P′AP=P′PJ为对称阵, 但P′PJ的第 (1,2) 元为b11+λ1b12, 第 (2,1) 元为λ1b21, 这两者不相等, ⽭盾.证法 7 (内积空间理论) 参考复旦⾼代教材的定理 9.5.2 和推论 9.5.2. ◻事实上, 我们也可以这样来看. 由上⾯的讨论可知, 对任⼀n阶实对称阵A, 全空间 R n等于A的所有特征⼦空间的直和. 容易证明: 在 R n的标准内积下, A的属于不同特征值的特征向量必正交, 属于同⼀特征值的特征向量可以利⽤ Gram-Schmidt 正交化⽅法化成两两正交的单位特征向量. 因此我们可以找到A的n个两两正交的单位特征向量, 将这些向量拼成矩阵P, 则P是⼀个n阶正交阵, 使得P′AP=diag{λ1,λ2,⋯,λn}.这就是A的正交相似标准型, 它对于深⼊探讨实对称阵的正定性和半正定性有着重要的作⽤.注 1 本题是 15 级⾼代 II 每周⼀题第 10 题第 1 ⼩问以及 16 级⾼代 II 每周⼀题第 6 题. 给出上述证法的复旦数学学院学⽣为: 章俊鑫 (证法 1),何陶然 (类似证法 1), 徐钰伦 (证法 2), 杨锦⽂ (证法 2), 杨钊杰 (证法 2), 蒋亦凡 (证法 3), 胡晓波 (证法 5), 杨彦婷 (证法 5), 沈伊南 (类似证法 6).下⾯将实对称阵可对⾓化的⼏种证法进⾏适当地推⼴, 从⽽不利⽤⾣相似标准型理论也可以直接证明: 实反对称阵, Hermite 阵, 斜 Hermite 阵,正交阵, ⾣阵, 以及更⼀般的复正规阵均可复对⾓化. 这是 15 级⾼代 II 每周⼀题第 10 题第 2 ⼩问以及 17 级⾼代 II 每周⼀题第 7 题第 2 ⼩问.我们先给出前三个引理的推⼴.引理 4 Hermite 阵的特征值都是实数. 特别地, 斜 Hermite 阵 (实反对称阵) 的特征值都是 0 或纯虚数.证明 Hermite 阵情形的证明完全类似于实对称阵情形的证明 (参考引理 1). 设A为斜 Hermite 阵, 则 i A为 Hermite 阵, 从⽽ i A的特征值都是实数, 于是A的特征值都是 0 或纯虚数. 实反对称阵是⼀种特殊的斜 Hermite 阵, 故结论也成⽴. ◻引理 5 设A为n阶复正规阵, 则r(A)=r(A2)=r(A3)=⋯.证明由⾼代⽩⽪书的例 3.72 对应的复版本可知: 对任意的m×n阶复矩阵A, 有r(A)=r(¯A ′A)=r(A¯A′).特别地, 若A是 Hermite 阵, 则r(A)=r(A2), 再仿照引理 2 的证明即得结论. 若A是复正规阵, 即A ¯A′=¯A′A, 注意到A¯A′是 Hermite 阵, 故有r(A2)=r(A2¯A2′)=r(AA¯A′¯A′)=r(A¯A′A¯A′)=r((A¯A′)2)=r(A¯A′)=r(A),再仿照引理 2 的证明即得结论. ◻引理 6 设A为n阶复正规阵, 则 Ker A∩Im A=0 并且 Ker A=Ker A2=Ker A3=⋯.证明由引理 5 以及线性映射的维数公式即得. ◻定理 2 复正规阵可对⾓化. 特别地, 实反对称阵, Hermite 阵, 斜 Hermite 阵, 正交阵, ⾣阵均可复对⾓化.证明定理 1 的证法 1--证法 5 可完全平⾏地改写⽤于证明定理 2; 定理 1 的证法 6 适当地修改之后可以证明: 实反对称阵, Hermite 阵,斜 Hermite 阵均可复对⾓化; 我们把具体的证明过程留给感兴趣的读者⾃⾏完成. 证法 7 可参考复旦⾼代教材的定理 9.6.2 和定理 9.6.3. ◻注 2 本⽂中的相关思想可推⼴为⼀般的可对⾓化判定准则, 具体的内容请参考教学博⽂ [3].参考⽂献[1] ⾼代教材: 姚慕⽣, 吴泉⽔, 谢启鸿编著, ⾼等代数学 (第三版), 复旦⼤学出版社, 2014.[2] ⾼代⽩⽪书: 姚慕⽣, 谢启鸿编著, 学习⽅法指导书: ⾼等代数 (第三版), 复旦⼤学出版社, 2015.Processing math: 100%。
矩阵对角化公式矩阵对角化是线性代数中的重要概念,它提供了一种将一个矩阵表示为对角矩阵的方法,使得矩阵的运算更加简化。
在本文中,我们将介绍矩阵对角化的基本概念、判定条件以及计算方法。
1. 矩阵对角化的基本概念一个n×n矩阵A可对角化,意味着存在一个可逆矩阵P和一个对角矩阵D,使得A=PDP^{-1}。
其中,D是由A的特征值组成的对角矩阵。
2. 判定矩阵可对角化的条件一个n×n矩阵A可对角化的条件是:- 矩阵A有n个线性无关的特征向量;- 矩阵A的每个特征值都有对应的正交归一化特征向量。
3. 计算矩阵的特征值和特征向量要计算一个矩阵A的特征值和特征向量,可以遵循以下步骤:- 计算矩阵A的特征多项式det(A-λI),其中λ是一个未知数,I是单位矩阵;- 解特征多项式的根,即特征值λ;- 将特征值代入方程A-λI的解空间中,求解特征向量。
4. 矩阵对角化的计算过程对于可对角化的矩阵A,可以按以下步骤进行对角化:- 对矩阵A进行特征值分解,得到特征矩阵V和对角矩阵D;- 计算可逆矩阵P,使得A=V^{-1}DVP;- 可以通过相似变换将矩阵A对角化,P表示变换矩阵。
5. 对角化与矩阵的性质对角矩阵的特点是非常简单的,可以很容易地计算幂、指数和逆矩阵等运算。
因此,对角化使得矩阵的运算更加简化。
6. 矩阵对角化的应用矩阵对角化在许多领域都有广泛应用,包括物理、工程和数据分析等。
例如,在量子力学中,矩阵对角化可以把含有多个粒子态的哈密顿矩阵表示成一组分立的单粒子能级。
总结:矩阵对角化是线性代数中一个重要的概念,它提供了将一个矩阵表示为对角矩阵的方法。
这篇文章介绍了矩阵对角化的基本概念、判定条件及计算方法,还讨论了对角化的计算过程、矩阵的性质以及应用领域。
对角化简化了矩阵的运算,并且在许多领域有广泛的应用。
第二节矩阵可对角化的条件定义1 如果矩阵能与对角矩阵相似,则称可对角化。
例1设,则有:,即。
从而可对角化。
定理1 阶矩阵可对角化的充分必要条件是有个线性无关的特征向量。
证明:必要性如果可对角化,则存在可逆矩阵,使得将按列分块得,从而有因此有,所以是的属于特征值的特征向量,又由可逆,知线性无关,故有个线性无关的特征向量。
充分性设是的个线性无关的特征向量,它们对应的特征值依次为,则有。
令,则是一个可逆矩阵且有:因此有,即,也就是矩阵可对角化。
注若,则,对按列分块得,于是有,即,从而。
可见,对角矩阵的元素就是矩阵的特征值,可逆矩阵就是由的线性无关的特征向量所构成的,并且特征向量的顺序依赖于对角矩阵。
定理2 矩阵的属于不同特征值的特征向量是线性无关的。
证明:设是的个互不相同的特征值,是的属于特征值的特征向量,现对作数学归纳法证明线性无关。
当时,由于特征向量不为零,因此定理成立。
假设的个互不相同的特征值对应的个特征向量是线性无关的。
设是的个互不相同的特征值,是的属于特征值的特征向量。
又设(1)成立。
则有,又将(1)式两边同乘得:从而有,由归纳假设得,再由两两互不相同可得,将其代入(1)式得,因此有,从而线性无关。
推论1 若阶矩阵有个互不相同的特征值,则可对角化,且。
定理3 设是阶矩阵的个互异特征值,对应于的线性无关的特征向量为,则由所有这些特征向量(共个)构成的向量组是线性无关的。
证明:设,记,,则有,且或是的属于特征值的特征向量。
若存在某个,,则由属于不同特征值的特征向量线性无关知,矛盾。
因此有,,又由已知得,,因此向量组线性无关。
定理4设是阶矩阵的一个重特征值,对应于的特征向量线性无关的最大个数为,则,即齐次线性方程组的基础解系所含向量个数不超过特征值的重数。
证明:用反证法。
由于是的属于特征值的特征向量当且仅当是齐次线性方程组的非零解,因此对应于的特征向量线性无关的最大个数与齐次线性方程组的基础解系所含向量个数相等。
矩阵可对角化条件
1、阶矩阵可对角化的充分必要条件是有个线性无关的特征向量。
若阶矩阵定理2矩阵的属于不同特征值的特征向量是线性无关的。
2、若阶矩阵有个互不相同的特征值,则可对角化。
3、阶矩阵可对角化的充分必要条件是:每个特征值对应的特征向量线性无关的最大个数等于该特征值的重数(即的每个特征值对应的齐次线性方程组的基础解系所含向量个数等于该特征值的重数,也即的每个特征子空间的维数等于该特征值的重数)。
矩阵可对角化的充要条件引言矩阵对角化是矩阵理论中的一个重要概念,它能够让我们更好地理解矩阵的性质和运算。
在实际应用中,对角化可以简化计算和分析过程,因此对于一个矩阵是否可对角化的问题,是值得我们深入研究和探讨的。
本文将探讨矩阵可对角化的充要条件,通过理论推导和实例分析,将会全面、详细、完整地讲解矩阵可对角化的各种情况及其判定条件。
I. 列举与分析矩阵的特殊情况为了更好地理解什么样的情况下一个矩阵可对角化,我们先来列举一些特殊的矩阵情况,并分析它们是否可对角化。
1. 对角矩阵对角矩阵是指主对角线以外的元素都为零的矩阵。
例如:[ A =]对于任意的对角矩阵,由于它的非零元素只存在于主对角线上,所以它必然是一个可对角化的矩阵。
2. 对称矩阵对称矩阵是指矩阵的转置等于其本身的矩阵。
例如:[ B =]对于任意的对称矩阵,它必然是一个可对角化的矩阵。
这是因为对于对称矩阵,其特征值都是实数,且对应不同特征值的特征向量是相互正交的,因此可以通过特征向量的线性组合来表示整个矩阵。
3. 可逆矩阵可逆矩阵是指存在逆矩阵的矩阵。
例如:[ C =]对于任意的可逆矩阵,它必然是一个可对角化的矩阵。
这是因为可逆矩阵的特征值都是非零的,且可逆矩阵可以表示为一个对角矩阵和一个正交矩阵的乘积,而正交矩阵的转置等于其逆矩阵,因此可逆矩阵可以通过正交矩阵的逆变换为对角矩阵。
II. 可对角化的充分条件在上一节中,我们列举了一些特殊的矩阵情况,并发现它们对应的矩阵都是可对角化的。
接下来,我们将推导出可对角化的充分条件,并用定理的形式表述出来。
定理1对于一个n阶矩阵A,如果它有n个线性无关的特征向量,那么A是可对角化的。
证明:假设A有n个线性无关的特征向量,分别为v1, v2, …, vn,相应的特征值分别为λ1, λ2, …, λn。
根据特征值与特征向量的定义,我们可以得到以下等式:Av1 = λ1v1Av2 = λ2v2…Avn = λnv现在,我们将这n个特征向量构成一个矩阵V,即:V = [v1, v2, …, vn]同时,将这n个特征值构成一个对角矩阵Λ,即:Λ = []根据上述等式,我们可以得到:AV = [Av1, Av2, …, Avn] = [λ1v1, λ2v2, …, λnvn] = VΛ由于V是一个可逆矩阵(因为v1, v2, …, vn是线性无关的),所以可以将上述等式两边都左乘V的逆矩阵V^-1,得到:AVV^-1 = VΛV^-1即:A = VΛV^-1因此,我们证明了如果一个n阶矩阵A有n个线性无关的特征向量,那么A是可对角化的。
第四章矩阵的对角化对于一个矩阵,如何寻找一个适当的变换,在将其变为简单矩阵的同时,保留原矩阵的一些重要特征,这是矩阵论中一个非常重要的问题.在这一问题的研究中,矩阵的特征值和特征向量的概念起着非常重要的作用.拉普拉斯在19世纪初提出了矩阵的特征值的概念.1854年,若尔当研究了矩阵化为标准形的问题.1885年,埃尔米特证明了一些特殊矩阵的特征根的性质,后人称之为埃尔米特矩阵的特征根性质,凯莱1858年发表了一篇论文《矩阵论的研究报告》,文中研究了方阵的特征方程和特征值的一些基本结果,克莱布什等证明了对称矩阵的特征根性质.在这一问题的研究史上,值得重点介绍的是下面两位数学家:第一位是柯西,他首先给出了特征方程的术语,并证明了阶数超过3的矩阵有特征值及任意阶实对称矩阵都有实特征值;给出了相似矩阵的概念,并证明了相似矩阵有相同的特征值.第二位是弗罗贝尼乌斯,正是他引入了矩阵的相似变换、合同矩阵、正交矩阵等重要概念,并讨论了正交矩阵和合同矩阵的一些重要性质.矩阵的特征值、特征向量和仿真的对角化理论与方法是矩阵理论的重要组成部分,它不仅在数学的各个分支有重要作用,而且在其他学科如工程技术、数量经济分析等领域有着广泛的应用.本章主要讨论方阵的特征值与特征向量理论及方阵在相似意义下的对角化问题,并应用这些理论和方法解决一些实际问题.§4.1 矩阵的特征值和特征向量一、特征值和特征向量的概念在工程实践及经济管理等许多领域中,经常会遇到矩阵的特征值和特征向量的问题.例 4.1.1 经济发展与环境污染是当今世界亟待解决的两个突出问题.为了研究某地区经济发展与环境污染之间的关系,可建立如下数学模型:设,分别为某地区目前的环境污染水平与经济发展水平,,分别为该地区若干年后的环境污染水平与经济发展水平,且有如下关系,令,,,则上述关系的矩阵形式为:若该地区目前的环境污染水平与经济发展水平,则若干年后的环境污染水平与经济发展水平为,即这里,4就是矩阵的一个特征值,是矩阵的对应于4的一个特征向量.定义 4.1.1 设为阶矩阵,若存在数和维非零列向量,使得;则称为矩阵的特征值,是矩阵一个特征值,称为的属于(或对应于)特征值的特征向量.由特征值、特征向量的定义可得(1)若为的属于的特征向量,则对于非实数,也是的属于的特征向量. (2)若,为的属于的特征向量,则当时,也是的属于的特征向量.(3)若,为的互异特征值,,分别为的属于,的特征向量,则.证若,则,即,故.由于,所以,矛盾.因此.例 4. 1. 2 求阶方阵的一个特征值与所对应的特征向量.解取维向量,,,则,故是的一个特征值,是属于特征值的一个特征向量.将(4.1.1)写成下面形式.根据定义,特征向量就是齐次线性方程组. (4.1.2)的非零解.由于(4.1.2)有非零解的充要条件是其系数行列式等于零,故知阶矩阵的特征值满足方程.为叙述方便,引入下面的概念.定义4. 1. 2 .,称为矩阵的特征多项式,称为的特殊矩阵,称为的特征方程.二、特征值与特征向量的计算求阶矩阵的特征值和特征向量,可按如下步骤进行:(1)计算的特征多项式,求出特征方程的全部根,,,. 对每个特征值,,,,求解齐次线性方程组.设它的一个基础解系为,,,,则的属于的全部特征向量为其中,,,为不全为零的任意常数.限于本教材适用范围,我们将不讨论的复特征值和特征向量.例 4.1.3 求矩阵的特征值与特征向量解矩阵的特征多项式=由,得的特征值为,,.对于,解齐次线性方程组,即解方程组,得基础解系,,,所以对应于,的全部特征向量为().对于,解齐次线性方程组,即解方程组得基础解系,,,所以对应于的全部特征向量为()..对于,解齐次线性方程组,即解方程组,得基础解系,,,所以对应于的全部特征向量为()..例4.1.4 求矩阵的特征值与特征向量解矩阵的特征多项式为=,由,得的特征值为,.对于,解齐次线性方程组,即解方程组,得基础解系,,,,,,所以对应于的全部特征向量为(,不全为零).对于,解齐次线性方程组,即解方程组,得基础解系,,,所以对应于的全部特征向量为().例4.1.5 求矩阵的特征值与特征向量解矩阵的特征多项式为=,由,得的特征值为,.对于,解齐次线性方程组,即解方程组,得基础解系,,,所以对应于的全部特征向量为(). 对于,解齐次线性方程组,即解方程组,得基础解系,,,所以对应于的全部特征向量为(). 三、特征值与特征向量的性质定理4.1.1 阶矩阵与有相同的特征值.证由,知与有相同的特征多项式,故有相同的特征值.定理4.1.2 设,,,,为方阵的个特征值,则有(1)(2)证(1)根据多项式因式分解与方程根的关系,有(4.1.3)令,得,即(2)比较(4.1.3)式两端的系数,右端为,而左端含的项来自的主对角线元乘积项,其含的系数为,因此.我们将阶矩阵的主对角线元之和称为矩阵的迹,记为(),即( )= ∑=n k 1推论4.1.1 阶矩阵 可逆的充分条件是它的任一特征值不等于零.定理4.1.3 若 为 的特征值, 是对应的特征向量,则(1) 为 的特征值( 为常数);(2) 为 的特征值( 为正整数);(3) 若 为 的多项式,则 为 的特征值;(4) 若 可逆,则 为 的特征值, 为 的特征值.证 由题意,对于 ,有 .(1) 因为 ,故 为 的特征值.(2) 由 ,得 ,假设 , 于是 ,由数学归纳法知结论成立.(3) 设 ,由(2)可得(4) 由于 可逆,故 ,从而 ,故, ,即 为 的特征值, 为 的特征值.下面给出方阵 的特征向量的性质定理4.1.4 设 , , , 为 阶矩阵 的 个互异特征值, , , , 分别是 的属于 , , , 的特征向量,则 , , , 线性无关.证 设有常数 , , , ,使得(4.1.4) 上式两边左乘 ,并注意到 , , , ,有.按这种方法再依次用 , , 左乘(4.1.4),并应用定理4.1.3(2)的结论,得,,,上式的矩阵形式为,,,(,,,),上式左端第二个矩阵的行列式是范德蒙德行列式,因为,,,互不相同,所以该行列式的值不为零,从而该矩阵可逆.用该矩阵的逆右乘上述等式两边,得,,,(,,,)于是,,,,由于特征向量,,,非零,因此只有,,,上式才能成立,故,,,为线性无关.定理4.1.5设,,,为阶矩阵的个互异特征值,,,,分别是的属于,,,的线性无关的特征向量,则向量组,,,,,,,,,,,线性无关.证明略.关于对应同一个特征值的特征向量间的关系,有定理4.1.6 设是阶矩阵的重特征值,则对应于的线性无关特征向量个数不超过个.显然,依据定理4.1.6,当特征值为单根时,对应的线性无关特征向量个数只能是一个.根据上述定理,对于阶矩阵的每一个不同的特征值,求出齐次线性方程组的基础解系,就得到的属于的线性无关的特征向量.然后,把它们合成一起所得的向量组仍然线性无关.阶矩阵的线性无关特征向量个数不大于.例4.1.6设三阶矩阵的特征值为,,求(1)的特征值.(2)的特征值.(3)的特征值及.解(1)由于,因此可逆,由定理4.1.3知,的特征值为,,.(2)由定理4.1.3知,的特征值为6,6,4.(3)因为,所以).设,由定理4.1.3知,的特征值为,1,2,3.由此得的特征值为,,,.例4.1.7 设为正交矩阵,若,则有特征值证,则.另一方面,由于及,则因此,即为的特征值.§4.2 相似矩阵在矩阵的运算中,对角矩阵的运算最方便.我们自然要问,一个阶矩阵是否可化为对角矩阵,且保持矩阵的一些重要性质不变.本节将讨论这个问题.一、相似矩阵定义4.2.1 设,为阶矩阵,如果存在阶可逆矩阵,使得,则称矩阵和相似,也称是的相似矩阵,记作.可逆矩阵称为相似变换矩阵. 例 4.2.1 设,,,不难验证可逆,且.由于,因此.两个相似矩阵是等价矩阵,相似是方阵之间的一种关系,这种关系具有如下性质:(1)反身性:;(2)对称性:若,则;(3)传递性:若,,则;此外,相似矩阵之间有许多共同的性质定理4.2.1 若阶矩阵与相似,则(1);(2);(3),有相同的特征值;(4).证由于,故存在阶可逆矩阵,使得,从而(1);(2);(3)由于,即,有相同的特征多项式,于是,有相同的特征值.(4)由(3)即得.推论4.2.1 若阶矩阵与对角矩阵=相似,则,,,是的个特征值.例4.2.2 若,求,.解对角矩阵的特征值为,,,由于,因此的特征值也为,,,再根据相似矩阵有相同的迹,可得,,解此方程组得,.两个相似的矩阵还具有下面的性质(1)若,则,(为正整数);(2)若,为多项式,则;(3)若,且,均可逆,则;证只证,故存在阶矩阵,使得,从而个即.二、矩阵的对角化定义 4.2.2 若阶矩阵与对角矩阵相似,则称可对角化.相似矩阵有许多共同性质.在我们熟悉的矩阵中,形式最简单的一类是对角矩阵,若矩阵相似于对角矩阵,就可以借助对角矩阵来研究,如何求相应的可逆矩阵?下面我们就来讨论这个问题.定理4.2.3 阶矩阵相似于对角矩阵(可对角化)的充要条件是有个线性无关的特征向量.证必要性.设存在可逆矩阵,使得==.设,,,,由=,得=,或,,,,,,.即,,,,,,因此,,,,,由于可逆,因此,从而,,,都是非零向量,故,,,分别是的属于特征值,,,的特征向量,再由可逆知,,,线性无关.充分性.设,,,分别是的属于特征值,,,的个线性无关的特征向量,则有,,,取,,,,因为,,,线性无关,所以可逆,于是有=.,即==因此矩阵相似于对角矩阵.因为特征向量不是唯一的,所以矩阵不具有唯一性.推论4.2.2若阶矩阵有个互异的特征值,则必可对角化.推论4.2.3阶矩阵可对角化的充分必有条件是的每个重特征值都有个线性无关的特征向量.即.由上述结论可知,例4.1.3和例4.1.4给出的矩阵可对角化,而例4.1.5给出的矩阵不能对角化.根据上述结论,可以归纳出将矩阵对角化的具体计算步骤:(1)求出阶矩阵的全部互异特征值,,,,它们的重数依次为,,,;(2)求的特征向量.对每个特征值求方程组的基础解系,即为的对应的线性无关的特征向量,设为,,,,,,;(3)判定是否可对角化.若对每一个特征值都有,,,,则可对角化,否则不可对角化;(4)当可对角化时,令,,,,,,,,,,,,)个个个且可逆,且有=例4.2.3判断下列矩阵能否对角化,若能,求出可逆矩阵,使得为对角矩阵.(1);(2)解(1)矩阵的特征多项式为=由,得的特征值为,,.由推论4.2.2知,矩阵可对角化.下面求可逆矩阵.对于,解齐次线性方程组,即解方程组,得基础解系,,,即为即为的属于特征值的一个特征向量.对于,解齐次线性方程组,即解方程组得基础解系,,,即为的属于特征值的一个特征向量.对于,解齐次线性方程组,即解方程组,得基础解系,,,即为的属于特征值的一个特征向量.取,,,则有==(2)矩阵的特征多项式为=由,得的特征值为,.当,即为的二重特征值时,.故,依据推论4.2.3知,矩阵可对角化,且对应的线性无关的特征向量为,,,,,.对于,解齐次线性方程组,得的属于特征值的一个特征向量,,.取取,,,则有==对于可对角化的矩阵,我们可应用来求方程的幂,例如,对上例的矩阵,我们有.例4.2.4 设,求为何值时,(1)可对角化,并求相似变换矩阵;(2)为可逆矩阵.解(1)矩阵的特征多项式为=,故的特征值为,.对于,解齐次线性方程组,得的属于特征值的特征向量为,,,,,.对于,解齐次线性方程组,得的属于特征值的特征向量为,,.依据推论4.2.3知,无论为何值,矩阵均可对角化.令,,,则有==.()的特征值分别为,,,故当且时,为可逆矩阵.§4.3 实对称矩阵的对角化我们已经知道,不是每个矩阵都能对角化.但本节讨论的实对称矩阵一定可以对角化,而且还能正交相似于对角矩阵,本节将讨论实对称矩阵的对角化.一、实对称矩阵的特征值与特征向量的性质实对称矩阵的特征值和特征向量具有一些特殊的性质,这些性质可以保证实对称矩阵一定可以对角化.定理4.3.1 实对称矩阵的特征值都是实数.证设为实对称矩阵的特征值,为对应的特征向量,即,.用表示的共轭复数,用表示的共轭复向量.则,于是有,及,以上两式相减得,以为所以.因而,即为实数.由于实对称矩阵的特征值为实数,那么为实矩阵,则齐次线性方程组的解可取为实向量,亦即实对称矩阵的特征向量为实向量.定理4.3.2实对称矩阵不同的特征值对应的特征向量正交,证设,为实对称矩阵的两个不同的特征值,,分别为它们对应的特征向量,则,,,,从而,因是对称矩阵,又有,于是,因,故,即与正交.定理4.3.3 设为阶实对称矩阵,为的重特征根,则,从而特征值恰好对应个线性无关的特征向量.证明略.二、实对称矩阵的对角化由定理4.3.2和定理4.3.3可得定理4.3.4 设为阶实对称矩阵,则存在正交矩阵,使得=其中,,,为的全部特征值.(1)求出阶实对称矩阵的全部互异特征值,,,,它们的重数依次为,,,;(2)求实对称矩阵的特征向量.对每个特征值求方程组的基础解系,即为的对应的线性无关的特征向量,设为,,,;(3)用施密特正交化方法,将特征向量,,,,,,正交,,,单位化,得到一个标准正交向量组,,,,,,;(4)令,,,,,,,,,,,(,,,,,,,,,,,,)个个个且为正交矩阵,且有=例4.3.1 设实对称矩阵,求正交矩阵,使得=为对角矩阵.解矩阵的特征多项式为=,因此,矩阵的特征值为,,.对于,解齐次线性方程组,得基础解系,,;对于,解齐次线性方程组,得基础解系,,;对于,解齐次线性方程组,得基础解系,,.将,,单位化,可得,,,,,,,,令,,,且为正交矩阵,且有=例4.3.2 设实对称矩阵,求正交矩阵,使得=为对角矩阵.解矩阵的特征多项式为=,因此,矩阵的特征值为,.对于,解齐次线性方程组,得基础解系,,,,,;先将向量,正交化,令,,,,再单位化,得,,对于,解齐次线性方程组,得基础解系,,,将其单位化,得.令,,,且为正交矩阵,且有=.例 4.3.3 设三阶实对称矩阵的特征值为,,且属于的特征矩阵为,,,求矩阵.解设的属于特征值的特征向量为,,,则与正交,即,解此齐次线性方程组,得基础解系,,,,,,易见,,正交.将,,单位化,可得,,令,,,则为正交矩阵,且有=,从而=.习题四 (A )一、填空题1. 为 阶矩阵, 有非零解,则 必有一个特征值__________.2.若 阶可逆方阵 的每行元之和 ,则 的一个特征值为__________.3.设 为三阶可逆矩阵,其逆矩阵的特征值为,,,则行列式 __________.4.设 是非奇异矩阵的一个特征值,则矩阵有一个特征值为__________.5.若 为四阶实对称矩阵, ,且2是 的三重特征值,则 的相似对角矩阵为__________.6. 设 为 阶矩阵, 有 个互异特征值 , , , ,则有 __________ , , , .7. 设 是三阶实对称矩阵, 的特征值是 , ,则有 __________. 8.若四阶矩阵 与 相似,矩阵 的特征值为,,,,则9.已知矩阵只有一个线性无关的特征向量,则10.设 , ,,矩阵 , 为自然数,则行列式 11.已知三阶实对称矩阵 的一个特征值为 ,对应的特征向量 , ,,且 的主对角线上的元全为零,则 二、单选题1.设三阶矩阵,则 的特征值是()(A )1,0,1 (B )1,1,2 (C )-1,1,2 (D )1,-1,12.若可对角化的 阶矩阵 只有一个特征值为零,则 =() (A ) (B ) (C )1 (D )03.设 , , , 是矩阵 对应于特征值 的特征向量,当线性组合∑=ni 1满足()时,∑=ni 1也是矩阵 对应于特征值 的特征向量.(A)其中不全为零(B)其中全不为零(C)是非零向量(D)是任一向量4.当满足下列()条件时,矩阵与相似.(A)(B)(C)与有相同的特征多项式.(D)阶矩阵与有相同的特征值且个特征值不相同.5.已知二阶实对称矩阵的特征向量为,且,则必为的特征向量的是()(A)(B),(C),,(D),,不同时为零6.设是阶非零矩阵,,下列命题不正确的是().(A)的特征值只有零(B)必不能对角化(C)必可逆(D)只有一个线性无关的特征向量7.设,是矩阵的两个不同的特征值,对应的特征向量分别为,,则,线性无关的充要条件是()(A)(B)(C)(D)8.若,且,,则以下结论错误的是().(A)(B)(C)为不可逆矩阵(D)必有特征值9.设,有特征值,(二重),且有三个线性无关的特征向量,则.(A)4(B)(C)(D)10.设,为阶矩阵,且与相似,则()(A)(B)与均相似于同一个对角矩阵.(C)与有相同的特征值与特征向量(D)对任意常数,与相似.三、综合题1.求下列矩阵的特征值与特征向量:(1);(2);(3);(4).2.判断下列矩阵与是否相似:(1),;(2),;(3),;(4),.3.求下列矩阵的次幂:(1);(2).4.求正交矩阵,使得为对角矩阵.(1);(2).5.设是阶方阵的一个特征值,且的伴随矩阵为,试证:的非零列向量是的属于的特征向量.6.考察栖息地在同一地区的兔子和狐狸的生态模型,对两种动物的数量的相互依存的关系可用以下模型描述:,,,,,其中,分别表示第年时兔子和狐狸的数量,而,分别表示基年时兔子和狐狸的数量,记,,,,(1)写出该模型的矩阵形式;(2)如果,求.(3)求7.设,相似,求:(1),的值;(2)求正交矩阵,使得.8.设向量,,,,,,,,且,记,求的所有特征值及特征向量.9.设,为三维单位列向量,且,令,证明与相似.10.设三阶实对称矩阵的特征值是1,2,3,矩阵的属于特征值1,2,3的特征向量分别是,,,,,.(1)求的属于特征值3的特征向量;(2)求矩阵.11.设,若为的一个特征值,求;(2)求.12.若存在正交矩阵,使矩阵,同时相似于对角矩阵,则必有.13.设为三阶实对称矩阵,且满足条件,的秩.求的全部特征值.14.设,求实对称矩阵,使.15.设矩阵,求.16.已知三阶矩阵与相似,,是的两个特征值,,计算,其中是的伴随矩阵.(B)1.设矩阵与相似,与相似,试证:与相似.2.已知与对角矩阵相似,求.3.设是阶实幂等矩阵(即),且,.(1)设,,试证.(2)试证:;(3)求4.设,为阶矩阵,,证明(1)是与的相同特征值;(2)与的基础解系线性相关.5.设是阶矩阵,且任一非零维向量都是的特征向量,试证:(即为数量矩阵)6.已知三阶非零矩阵,满足,,,证明:(1)0和1必是与的特征值;(2)若是关于的特征向量,的个特征值两两互异,若的特征向量总是的特征向量,证明.8.设,均为阶非零矩阵,且满足,,证明:(1)是,的特征值.(2)若,,分别是,对应于的特征向量,则,线性无关.答案:一、填空题1.02.3.-64.5..6.7.8.14 7639.10.11.二、单选题1-5 CBCDB6-10 DDADD三、综合题1.(1),,的属于的特征向量,;的属于的特征向量,.(2),;的属于的特征向量为,,不全为零;的属于的特征向量为,(3),;的属于的特征向量为,,不全为零;的属于的特征向量为,.(4)(三重);的属于的特征向量为,,不全为零;2.(1)不相似;(2)相似;(3)相似.3.(1);(2)当为偶数时,;当为奇数时,.。