第四章方阵的特征值理论
- 格式:doc
- 大小:816.50 KB
- 文档页数:10
数值分析--第四章--特征值特征向量计算(乘幂法)
摘要:n阶⽅阵A满⾜AX=λx,λ为矩阵A的特征值,x为特征值对应的特征向量。
⼀.乘幂法(求模最⼤特征值及对应特征向量)
设矩阵A有n个相性⽆关的特征向量x1,x2,x3,.....xn,相应的特征值λ1,λ2,λ3,.....λn(由⼤到⼩排列)。
迭代法引⼊:上⼀章学了迭代法求解线性⽅程组Ax=b的解,给定任⼀的初始值v0,不断迭代可以得到Ax=b的解。
同理,给定任⼀⾮零的n维向量v0,不断迭代可以 得到矩阵A的特征向量,
对于初始向量v0可以由A的n个线性⽆关的特征向量表⽰:
带⼊迭代⽅程中:
当迭代次数k趋近于⽆穷⼤时,可得到最⼤特征值λ1对应的特征向量a1x1(与x1线性相关)
同理,当迭代次数趋近于⽆穷⼤时,可得到绝对值最⼤的特征值,λ1
其中,m表⽰向量中的绝对值最⼤的那个元素值
如何利⽤迭代法求解按模最⼤特征值和特征向量
说明:
1.初始值:我们给定初始值x0=[1,1,1]^T,取特征值1
2.第⼀次迭代:
对应的近似特征值取:
3.第⼆次迭代:
⼆.改进乘幂法
这个规范化处理的⽬的:防⽌数据溢出或是数据消失
从上⾯可以看出,改进乘幂法即是每次迭代出的特征向量都进⾏⼀次规范化处理 。
第4章矩阵的特征值矩阵的特征值是线性代数中非常重要的概念,它在许多领域都有广泛的应用。
本文将介绍矩阵的特征值的定义、性质和计算方法,并探讨其在科学与工程中的应用。
1.特征值的定义和性质给定一个n阶方阵A,非零向量X称为矩阵A的特征向量,如果满足AX=λX,其中λ是一个常数,称为矩阵A的特征值。
根据这个定义,我们可以得到特征值的一些性质:(1)特征值可以是实数或复数。
当矩阵A是实矩阵时,特征值可以是实数或者是成对出现的复共轭数对。
例如,对于一个2阶实矩阵,它可以有两个实特征值,也可以是一个实特征值和一个复特征值对。
(2)特征值和特征向量的数量相等。
对于一个n阶矩阵A,它有n个特征值和n个对应的特征向量。
(3)特征值和矩阵的迹、行列式有关。
矩阵的迹是指所有主对角元素之和,行列式是指矩阵的特征值之积。
特别地,对于一个2阶方阵A,它的特征值满足特征值之和等于迹(A)、特征值之积等于行列式(A)。
2.特征值的计算方法(1)特征值分解:特征值分解是将一个可对角化的矩阵A分解为A=QΛQ^(-1),其中Q是一个正交矩阵,Λ是一个对角矩阵,对角线上的元素就是矩阵A的特征值。
通过特征值分解,我们可以得到矩阵A的特征值和特征向量。
(2)QR算法:QR算法是一种迭代方法,用于逼近一个矩阵A的特征值和特征向量。
首先,将矩阵A分解为QR,其中Q是一个正交矩阵,R是一个上三角矩阵。
然后,迭代计算QR,直到收敛为止。
最后,对于得到的上三角矩阵R,它的对角线上的元素就是矩阵A的特征值。
3.特征值在科学与工程中的应用特征值在科学与工程中有广泛的应用,这里介绍两个典型的例子。
(1)特征值在量子力学中的应用:量子力学是研究微观粒子行为的物理学理论。
量子力学中的波函数可以表示为特征值和特征向量的线性组合。
特征值表示了粒子的能量,特征向量表示了粒子的状态。
通过解特征值问题,我们可以得到粒子的能量和对应的状态。
(2)特征值在图像处理中的应用:图像处理是一种对数字图像进行分析和处理的技术。
§3 方阵的特征值与特征向量一、特征值与特征向量的定义设A 为n 阶方阵,p 是某个n 维非零列向量. 一般来说,n 维列向量Ap 未必与p 线性相关,也就是说向量Ap 未必正好是向量p 的倍数. 如果对于取定的n 阶方阵A ,存在某个n 维非零列向量p ,使得Ap 正好是p 的倍数,即存在某个数λ使得λAp =p ,这样的向量就是A 的相应的特征向量.下面正式给出方阵的特征值和特征向量的定义.定义3.1 设()ij n na ⨯=A 为n 阶实方阵. 若存在某个数λ和某个n 维非零列向量p 使λAp =p ,则称λ是A 的一个特征值,称p 是A 的属于特征值λ的一个特征向量. 为了求出A 特征值和特征向量,我们把λAp =p 改写成()λ-=nEA p 0. 再把λ看成待定参数,那么p 就是齐次线性方程组()λ-=nEA x 0的任意一个非零解. 显然,它有非零解当且仅当它的系数行列式为零:0λ-=n E A .定义3.2 带参数λ的n 阶方阵λ-n E A 称为A 的特征方阵,它的行列式λ-n E A 称为A 的特征多项式. 称0λ-=n E A 为A 的特征方程. 根据行列式的定义可知有以下等式111212122212n nn n n na a a a a a a a a λλλλ-------=---n EA()()()1122n na a a λλλ=---+, (1)在省略的各项中不含λ的方次高于2n -的项, 所以n 阶方阵A 的特征多项式一定是λ的n 次多项式. A 的特征方程的n 个根(复根,包括实根或虚根, r 重根按r 个计算)就是A 的n 个特征值. 在复数范围内, n 阶方阵一定有n 个特征值.综上所述, 对于给定的n 阶实方阵()i j a =A , 求它的特征值就是求它的特征多项式(1)的n 个根. 对于任意取定的一个特征值0λ,A 的属于这个特征值0λ的特征向量,就是对应的齐次线性方程组0()λ-=n E A x 0的所有的非零解. 注意: 虽然零向量也是0()λ-=n E A x 0的解,但0不是A 的特征向量!二、关于特征值和特征向量的若干结论定理3.1 n 阶方阵A 和它的转置矩阵TA 必有相同的特征值. 证 由矩阵转置的定义得到矩阵等式()TT λλ-=-n n E A E A . 再由行列式性质1知道()TT λλλ-=-=-n n n E A E A E A .这说明A 和TA 必有相同的特征多项式,因而必有相同的特征值. 证毕 定理3.2 设12,,,n λλλ的n 阶方阵()i j a =A 的全体特征值,则必有()111,nn ni i iii i i atr λλ======∑∑∏A A .这里,()tr A 为()i j a =A 中的n 个对角元之和,称为A 的迹(trace ).A 为A 的行列式. 证 在关于变量λ的恒等式()()()()112111nn nnn n i ii i λλλλλλλλλλλ-==⎛⎫-=---=-++- ⎪⎝⎭∑∏n E A中取0λ=即得 ()()111nnnii λ=-=-=-∏A A ,所以必有1nii λ==∏A .再据行列式定义可得()()()1122n na a a λλλλ-=---+n E A {()!1n -个不含nλ和1n λ-的项}11n nn i i i a λλ-=⎛⎫=-++ ⎪⎝⎭∑{()!1n -个不含n λ和1n λ-的项}比较λ-n E A 的上述两个等式两边的1n λ-项的系数, 即得11nni i ii i aλ===∑∑. 证毕定理3.3 设A 为n 阶方阵.()1110mm m m f x a x a xa x a --=++++为m 次多项式.()1110m m m m f a a a a --=++++n A A A A E为对应的A 的方阵多项式. 如果λ=Ap p ,则必有()()f f λ=A p p . 这说明()f λ必是()f A 的特征值. 特别, 当()f =A O 时,必有()0f λ=,即A 的特征值必是对应的m 次多项式()f x 的根.证 先用归纳法证明,对于任何自然数k , 都有kkλ=A p p . 当1k =时,显然有λ=Ap p . 假设kkλ=A p p 成立, 则必有()()11k k k k k λλλ++====A p A A p A p Ap p 。
因此, 对于任何自然数k , 都有kkλ=A p p .于是,必有()()1110m m m m f a a a a --=++++n A p A A A E p()()()()1110m m m m a a a a --=++++n A p A p Ap E p=()()1110m m m m a a a a f λλλλ--++++=p p .当()f =A O 时,必有()()ff λ==p A p 0. 因为≠p 0, 所以()0f λ=, 证毕注1: 求方阵多项式的特征值, 只要求出A 的一个特征值λ, 那么()f λ一定是()f A 的特征值.注2: 利用2()f x x =, 若λ是A 的特征值, 则2λ是2A 的特征值.例1任意取定A 的一个特征值0λ. 如果12p p 和都是A 的属于特征值0λ的特征向量,则对任何使12k k +≠12p p 0的实数12k k 和, 12k k =+12p p p 必是A 的属于特征值0λ的特征向量.证 由所设条件知()()12120120k k k k k k λλ=+=+=+=121212Ap A p p Ap Ap p p p . 证毕任意取定A 的一个特征值0λ. 因为0λ是0λ-=n E A 的根,()0λ-=n E A x 0必有无穷多个解, 所以, A 的属于任意特征值0λ的特征向量一定有无穷多个. 那么自然要问: 属于取定特征值的线性无关的特征向量的最大个数是多少?为此, 考虑由特征值0λ确定的齐次线性方程组()0λ-=nEA x 0的解空间{}00V λλ==p Ap p .它的任意一个基, 也就是齐次线性方程组()0λ-=nEA x 0的任意一个基础解系{}12s ξ,ξ,,ξ,就是A 的属于这个特征值0λ的最大个数的线性无关的特征向量组. 其中的基向量个数为()0s n λ=--n r E A .所以这个最大个数就是齐次线性方程组()0λ-=nEA x 0的自由未知量个数. 而A 的属于这个特征值0λ的特征向量全体就是1si i k =∑iξ,这里12,,,s k k k 是任意的不全为零的实数.例2 设1224⎛⎫=⎪⎝⎭A ,求出A 的所有的特征值和特征向量. 解 A 的特征方阵为1224λλλ--⎛⎫-= ⎪--⎝⎭n E A . A 的特征方程为()125024λλλλλ---==-=--n E A .它的两个根:120,5λλ==,就是A 的两个特征值. 用来求特征向量的齐次线性方程组为 12120240x x λλ⎛⎫--⎛⎫⎛⎫= ⎪⎪ ⎪--⎝⎭⎝⎭⎝⎭. 即()()1212120240x x x x λλ--=⎧⎪⎨-+-=⎪⎩. 属于10λ=的特征向量满足线性方程组:121220240x x x x --=⎧⎨--=⎩ .可取解 21-⎛⎫= ⎪⎝⎭1p .属于25λ=的特征向量满足线性方程组:121242020x x x x -=⎧⎨-+=⎩ . 可取解 12⎛⎫= ⎪⎝⎭2p .这就是A 的两个线性无关的特征向量. 容易验证 112202024101λ--⎛⎫⎛⎫⎛⎫⎛⎫====⎪⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭11A p p ,22121515242102λ⎛⎫⎛⎫⎛⎫⎛⎫==== ⎪⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭2A p p .属于10λ=的特征向量全体为11,k k 1p 为任意非零常数. 属于25λ=的特征向量全体为22,k k 2p 为任意非零常数.例3 当20-=n E A 时,根据特征值的定义知道,2就是A 的特征值. 当0=n E +A 时,因为 ()10n--=-=n n E A E +A ,所以,1-就是A 的特征值.例4 设A 为n 阶方阵,但不是单位矩阵. 如果()()n +-=n n r A +E r A E ,问1-是不是A 的特征值?解 因为≠n A E ,所以必有(),1-≠-≥n n A E O r A E . 再根据 ()()n +-=n n r A +E r A E知道必有()n <n r A +E ,即0=n A +E . 所以,1-一定是A 的特征值.命题1 实方阵的特征值未必是实数,特征向量也未必是实向量. 例5 求0110⎛⎫=⎪-⎝⎭A 的特征值 解 容易求出特征方程21101λλλλ--==+=2E A 的两个根:12,i i λλ==-,这里,i =是纯虚数.此例说明,虽然A 是实方阵,但是它的特征值都不是实的. 求出对应的向量会发现,特征向量也不是实向量.命题2 三角矩阵的特征值就是它的全体对角元.例如,设A 是上三角矩阵12000n a a a **⎛⎫⎪* ⎪= ⎪ ⎪ ⎪⎝⎭A , 则()12100ni i na a a a λλλλλ=--*-*--*-==--∏n E A .它的n 个根就是A 的n 个对角元.命题3 一个向量p 不可能是属于同一个方阵A 的不同特征值的特征向量. 事实上,如果 ,λμ==A p p A p p ,则()λμ-=p 0. 因为≠p 0, 所以必有λμ=.注意: A 和TA 未必有相同的特征向量. 即当λ=Ap p 时未必有Tλ=A p p . 例如,取111,,1010λ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭A p , 则有1111101111,1010011010⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=⨯=≠⨯⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭. 100011111⎛⎫⎛⎫⎛⎫=⨯ ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭.这说明A 和TA 的属于同一个特征值的特征向量可以是不相同的.例6 设1203⎛⎫= ⎪⎝⎭A , 求223=-+2B A A E 的所有的特征值.解 因为上三角矩阵A 的特征值就是它的对角元13和,而由223=-+2B A A E 知道,对应的多项式为()223f x x x =-+,所以B 的特征值就是()()12,36f f ==.例7 求出以下特殊的n 阶方阵A 的所有可能的特征值(m 是某个正整数):(1)m=A O (2)2=n A E解 设λ=Ap p ,则,m mλ=≠A p p p 0.(1) 由 mmλ==⨯=p A p O 00 和≠p 0 知道0λ=. (2) 由λ⨯=22n p =A p =E p p 和≠p 0 知道21,1λλ==±.注: 上述二个特殊的方阵分别称为幂零矩阵与对合矩阵. 因此, 幂零矩阵的特征值必为0.对合矩阵的特征值必为1±.三、关于求特征值和特征向量的一般方法下面我们通过实例介绍求方阵的特征值和特征向量的一般方法.例8 求出624232426⎛⎫ ⎪= ⎪ ⎪⎝⎭A 的特征值和线性无关的特征向量.解 先求出A 的特征多项式624224232032426226λλλλλλλλ-------=---=--------3E A224032410λλλ---=---- ()()()231024λλλ----⨯⎡⎤⎣⎦=()()()()2221322211.λλλλλ=--+=--.因此A 的特征值为1232,11λλλ===.用来求特征向量的齐次线性方程组为()123624232426x x x λλλλ⎛⎫---⎛⎫ ⎪⎪-=--- ⎪ ⎪ ⎪ ⎪---⎝⎭⎝⎭3E A x =0.属于122λλ==的特征向量123x x x ⎛⎫ ⎪= ⎪ ⎪⎝⎭p 满足:12312312342402204240x x x x x x x x x ⎧---=⎪---=⎨⎪---=⎩,即()2132x x x =-+. 据此可求出两个线性无关的特征向量 102,201⎛⎫⎛⎫⎪ ⎪=-=- ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭12p p .属于311λ=的特征向量123x x x ⎛⎫ ⎪= ⎪ ⎪⎝⎭p 满足:123123123524028204250x x x x x x x x x ⎧--=⎪-+-=⎨⎪--+=⎩.在前两个方程中消去3x ,可得12129180,2x x x x -==. 在后两个方程中消去1x ,可得23321890,2x x x x -==.于是可求出特征向量 212⎛⎫⎪= ⎪ ⎪⎝⎭3p .属于122λλ==的特征向量全体为{}121212|,,k k k k R k k +∈12p p 且不全为零. 属于311λ=的特征向量全体为{}30|k k k R ≠∈p 且.例9 设n 阶方阵()i j a =A 的每一行中元素之和同为a ,证明a 必是A 的特征值,并求出A 的属于这个a 的特征向量p .证 取111⎛⎫ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭p . 显然有 111211212111n i i i n n n n n a a aa a a a a a a ⎛⎫⎛⎫ ⎪ ⎪⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪⎝⎭Ap p .因此a 是矩阵A 的一个特征值, 而p 是A 的属于特征值a 的特征向量. 证毕四.矩阵的对角化定义3.3 设A 是一个n 阶方阵,若存在n 阶可逆矩阵,使得112(,,,)n diag λλλ-==P AP Λ则称A 相似于对角矩阵, 也称A 可以相似对角化, 简称A 可对角化.定理 3.4 设12,,,m λλλ是方阵A 的m 个特征值, 12,,,m p p p 依次是与之对应的特征向量. 如果12,,,n λλλ各不相等, 则12,,,m p p p 线性无关.证 设有常数12,,,m x x x 使1122m m x x x +++=p p p 0, 则1122()m m x x x +++=A p p p 0,即 111222m m m x x x λλλ+++=p p p 0依此类推, 得 111222(1,2,,1).k km m m m x x x k m λλλ+++==-p p p 0把以上各式写成矩阵形式, 得1112221122111(,,,)(,,,).1m m m m m m m x x x λλλλλλ---⎛⎫⎪⎪= ⎪⎪ ⎪⎝⎭p p p 000上式等号式端第二个矩阵的行列式是范德蒙行列式, 当12,,,m λλλ互不相等时, 该行列式不等于零, 从而该矩阵可逆, 于是有1122(,,,)(,,,)(1,2,,).m m j j x x x x j m =⇒==p p p 000p 0但j ≠p 0, 故120m x x x ====, 所以向量组12,,,m p p p 线性无关.定理3.4 若n 阶方阵A 与B 相似, 则A 与B 的特征多项式相同, 从而其特征值相等.证 因A 与B 相似, 即有可逆矩阵P , 使1-=P AP B , 故111()()λλλλ----=-=-=-E B P E P P AP P E A P E A .推论: 若n 阶方阵A 与对角阵12n λλλ⎛⎫⎪⎪= ⎪ ⎪⎝⎭Λ相似, 则12,,,m λλλ就是A的全部特征值.定理3.5 n 阶方阵A 相似于对角矩阵⇔A 有n 个线性无关的特征向量.证 必要性:设12n λλλ-⎛⎫⎪⎪== ⎪ ⎪ ⎪⎝⎭1P AP Λ ,则有AP =P Λ. 令(),,,12n P =p p p 是P 的按列分块的列向量表示法,则由P 是可逆矩阵知道列向量组{}12n p,p ,,p 为线性无关向量组. 因为()(),,,,,,12n 12nA P =A p p p =A p A p Ap ()()1212,,,,,,n n λλλλλλ⎛⎫⎪⎪= ⎪ ⎪ ⎪⎝⎭12n 12n P Λ=p p p p p p所以, 由AP =P Λ知道必有分块矩阵等式 (),,,12nA p A p A p ()12,,,n λλλ=12n p p p由此可得列向量等式,1,2,,j j n λ==j j Ap p .这就证明了P 的n 个列向量就是A 的n 个线性无关的特征向量. 充分性:设A 有n 个线性无关的特征向量{}12n p ,p ,,p ,且,1,2,,j j n λ==j j Ap p ,则(),,,12n P =p p p 是n 阶可逆矩阵,而且满足()()2122,,,,,,n n n λλλ==11AP A p p p p p p()122,,,n n λλλ⎛⎫ ⎪⎪== ⎪ ⎪ ⎪⎝⎭1p p p P Λ. 即-1P AP =Λ为对角矩阵. 证毕推论: 如果n 阶方阵A 的n 个特征值各不相等, 则A 与对角阵相似.例10 设2125312a b -⎛⎫ ⎪= ⎪ ⎪--⎝⎭A 的一个特征向量为121⎛⎫⎪= ⎪ ⎪-⎝⎭p . (1) 求参数,a b 的值及A 的特征向量p 对应的特征值;(2) A 是否与对角阵相似?解 (1) 设A 的与特征向量p 相对应的特征值为λ, 可得方程组(),λ-=E A p 0 即212105310,1210a b λλλ--⎛⎫⎛⎫⎛⎫ ⎪⎪ ⎪---= ⎪⎪ ⎪ ⎪⎪ ⎪-+-⎝⎭⎝⎭⎝⎭亦即 1020,10a b λλλ+=⎧⎪--=⎨⎪---=⎩解得 1,3,0.a b λ=-=-=(2) 由3212533(1)012λλλλλ---=-+-=+=+E A , 知A 三重特征值123 1.λλλ===-由于312101101101523523022011101312011000--⎛⎫⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪--=--→--→→ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭⎝⎭⎝⎭E A可知, ()2,321r n r --=-=-=E A , 因而三阶方阵A 的与1λ=-对应的线性无关的特征向量组仅有一个向量, 故A 不可以对角化.。