3矩阵特征值与特征向量的计算
- 格式:doc
- 大小:349.50 KB
- 文档页数:17
毕业论文(设计)题目:矩阵特征值和特征向量的求法与应用毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。
尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。
对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。
作者签名:日期:指导教师签名:日期:使用授权说明本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。
作者签名:日期:学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。
除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。
对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
本人完全意识到本声明的法律后果由本人承担。
作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
涉密论文按学校规定处理。
作者签名:日期:年月日导师签名:日期:年月日注意事项1.设计(论文)的内容包括:1)封面(按教务处制定的标准封面格式制作)2)原创性声明3)中文摘要(300字左右)、关键词4)外文摘要、关键词5)目次页(附件不统一编入)6)论文主体部分:引言(或绪论)、正文、结论7)参考文献8)致谢9)附录(对论文支持必要时)2.论文字数要求:理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。
3矩阵的特征值和特征向量矩阵的特征值和特征向量是矩阵理论中的重要概念之一,它们在许多应用中具有重要的意义。
本文将详细介绍矩阵的特征值和特征向量,并说明它们的性质和应用。
一、矩阵的特征值和特征向量定义对于一个n×n的矩阵A,如果存在一个非零向量x使得Ax=kx,其中k是一个常数,那么k称为矩阵A的特征值,x称为矩阵A的特征向量。
我们可以用以下的形式表示矩阵的特征方程:det(A-λI)=0其中,det(A-λI)是矩阵A-λI的行列式,λ是一个常数,I是单位矩阵。
根据特征方程,我们可以求解出矩阵A的特征值λ。
然后,将每个特征值代入特征方程,可以求解出对应的特征向量x。
二、特征值和特征向量的性质1.特征值的性质:-一个矩阵的特征值可以是实数,也可以是复数。
-一个n×n的矩阵最多有n个不同的特征值。
- 特征值与矩阵的行列式有关,它们的乘积等于矩阵的行列式:det(A)=λ1*λ2*…*λn。
2.特征向量的性质:- 特征向量具有标量倍数的自由度,即如果x是矩阵A的特征向量,则kx也是矩阵A的特征向量,其中k是任意非零标量。
-特征向量可以用于表示矩阵的一组基,这意味着可以用特征向量表示矩阵的任意向量。
三、特征值和特征向量的计算对于一个给定的n×n矩阵A,我们可以通过以下步骤计算其特征值和特征向量:1. 解特征方程det(A-λI)=0,求得特征值λ1, λ2, ..., λn。
2. 将每个特征值代入特征方程,解出对应的特征向量x1, x2, ..., xn。
对于一些矩阵,特征值和特征向量可以通过简单的计算得到。
例如,对于对角矩阵,其特征值就是其主对角线上的元素,而对应的特征向量可以是单位向量。
对于一些特殊的矩阵,如上三角矩阵和下三角矩阵,其特征值也可以很容易地得到。
四、特征值和特征向量的应用1.线性系统的稳定性分析特征值和特征向量在控制论中经常用于分析线性系统的稳定性。
对于一个线性系统,通过求解其特征值,可以判断系统是否稳定。
特征值和特征向量计算的数值方法在数学和计算机科学领域中,特征值和特征向量是非常重要的概念。
特征值和特征向量的计算有许多不同的数值方法,本文将介绍其中一些常见的数值方法,并分析它们的优劣和适用范围。
一、特征值和特征向量的定义在矩阵理论中,给定一个n×n的矩阵A,如果存在一个非零向量v和一个标量λ,使得Av=λv,那么称v为矩阵A的特征向量,λ为矩阵A的特征值。
特征值和特征向量的计算可以帮助我们理解矩阵的性质以及解决一些实际问题。
二、幂法幂法是计算特征值和特征向量的常用数值方法之一。
幂法的基本思想是通过多次迭代,逐渐逼近矩阵的特征值和特征向量。
具体操作如下:1. 初始化一个非零向量b0;2. 进行迭代计算:bi+1 = A * bi / ||A * bi||;3. 取出近似特征向量的最后一列:v = bn;4. 进行迭代计算特征值:λ = (Av)T * v / (vT * v)。
幂法的主要优点是简单易懂,且只需要进行矩阵向量乘法和内积计算。
然而,幂法仅能求取具有最大特征值的特征向量,而且对于存在多个特征值相等的情况并不适用。
三、反幂法反幂法是幂法的一种改进方法,用于求取矩阵A的最小特征值和对应的特征向量。
反幂法的基本步骤如下:1. 初始化一个非零向量b0;2. 进行迭代计算:bi+1 = (A - μI)^-1 * bi / ||(A - μI)^-1 * bi||;3. 取出近似特征向量的最后一列:v = bn;4. 进行迭代计算特征值:λ = (Av)T * v / (vT * v)。
反幂法的改进之处在于引入了矩阵的逆运算,通过使用矩阵A减去一个合适的常数μ乘以单位矩阵来实现。
反幂法适用于矩阵A的特征值接近于μ的情况。
四、QR方法QR方法也是一种常用的特征值计算方法,它适用于求解所有特征值以及对应的特征向量。
QR方法的基本思想是将一个矩阵分解为正交矩阵Q和上三角矩阵R的乘积,然后迭代地将矩阵A转化为更接近上三角形的形式。
第3章 矩阵特征值与特征向量的计算一些工程技术问题需要用数值方法求得矩阵的全部或部分特征值及相关的特征向量。
3.1 特征值的估计较粗估计ρ(A ) ≤ ||A ||欲将复平面上的特征值一个个用圆盘围起来。
3.1.1 盖氏图定义3.1-1 设A = [a ij ]n ⨯n ,称由不等式∑≠=≤-nij j ijii aa z 1所确定的复区域为A 的第i 个盖氏图,记为G i ,i = 1,2,…,n 。
>≤-=<∑≠=}:{1nij j ij ii i a a z z G定理3.1-1 若λ为A 的特征值,则 ni iG1=∈λ证明:设Ax = λx (x ≠ 0),若k 使得∞≤≤==xx x i ni k 1max因为k nj j kjx x aλ=∑=1⇒∑≠=-nkj j kjk kk x ax a )(λ⇒∑∑∑≠=≠=≠≤≤=-nkj j kj nkj j kj kjnk j kj kj kk a x x a x x a a 11λ⇒ ni ik GG 1=⊂∈λ例1 估计方阵⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡----=41.03.02.05.013.012.01.035.03.02.01.01A 特征值的范围 解:G 1 = {z :|z – 1|≤ 0.6};G 2 = {z :|z – 3|≤ 0.8}; G 3 = {z :|z + 1|≤ 1.8};G 4 = {z :|z + 4|≤ 0.6}。
注:定理称A 的n 个特征值全落在n 个盖氏圆上,但未说明每个圆盘内都有一个特征值。
3.1.2 盖氏圆的连通部分称相交盖氏圆之并构成的连通部分为连通部分。
孤立的盖氏圆本身也为一个连通部分。
定理3.1-2 若由A 的k 个盖氏圆组成的连通部分,含且仅含A 的k 个特征值。
证明: 令D = diag(a 11,a 12,…,a nn ),M = A – D ,记)10(000)(212211122211≤≤⎪⎪⎪⎪⎪⎭⎫⎝⎛+⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=+=εεεεn n n n nn a a a a a a a a a M D A则显然有A (1) = A ,A (0) = D ,易知A (ε)的特征多项式的系数是ε的多项式,从而A (ε)的特征值λ1(ε),λ2(ε),…,λn (ε)为ε的连续函数。
A (ε)的盖氏圆为:)10(,}||||:{)(11≤≤⊂=≤-=∑∑≠=≠=εεεεi nij j ij nij j ijii i G a aa z z G因为A (0) = D 的n 个特征值a 11,a 12,…,a nn ,恰为A 的盖氏圆圆心,当ε由0增大到1时,λi (ε)画出一条以λi (0) = a ii 为始点,λi (1) = λi 为终点的连续曲线,且始终不会越过G i ;不失一般性,设A 开头的k 个圆盘是连通的,其并集为S ,它与后n – k 个圆盘严格分离,显然,A (ε)的前k 个盖氏圆盘与后n – k 个圆盘严格分离。
当ε = 0时,A (0) = D 的前k 个特征值刚好落在前k 个圆盘G 1,…,G k 中,而另n – k 个特征值则在区域S 之外,ε从0变到1时,ki iG 1)(=ε与 nk i iG 1)(+=ε始终分离(严格)。
连续曲线始终在S 中,所以S 中有且仅有A 的k 个特征值。
注:1) 每个孤立圆中恰有一个特征值。
2) 例1中G 2,G 4为仅由一个盖氏圆构成的连通部分,故它们各有一个特征值,而G 1,G 3构成的连通部分应含有两个特征值。
3) 因为例1中A 为实方阵,所以若λ为A 的特征值,则λ也是A 的特征值,所以G 2,G 4中各有一个实特征值。
3.1.3 盖氏圆与相似变换由于特征值是相似不变量,所以代数上常用相似变换将矩阵化简以得到特征向量,这里也可用相似变换将盖氏圆的半径变小,以得到更好的估计。
原理:取对角阵作相似变换阵:P = diag(b 1,b 2,…,b n )其中b i > 0,i = 1,2,…,n 则),,,(diag )1,,1,1(21211n nb b b A b b b diag AP P B ==-与A 有相同特征值. 而B 的第i 个盖氏圆为:}:{1∑≠=≤-nij j ij ijii b b a a z z ,⎪⎪⎪⎪⎪⎭⎫⎝⎛⎪⎪⎪⎪⎪⎭⎫⎝⎛⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=n nn n n n n n b b b a a a a a a a a a b b b B2121222211121121111⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=nnnn n n nn n a b b a bb a b ba a bb a b b a b b a a221122422212111121211 适当选取b 1,b 2,…,b n 就有可能使B 的某些盖氏圆的半径比A 的相应盖氏圆的半径小。
1) 欲缩小G i ,可取b i 最大。
2) 欲缩小除G i 外的圆,可取b i 最小。
例2,估计⎪⎪⎪⎭⎫ ⎝⎛=4.002.001.013.08.001.012.001.09.0A 的特征值范围。
解:A 的三个盖氏圆分别为:G 1 = {z :| z – 0.9|≤ 0.13};G 2 = {z :| z – 0.8|≤ 0.14}; G 3 = {z :| z – 0.4|≤ 0.03} λ3 ∈ G 3,较好。
为了更好地估计另外两个特征值可取b 3最小:取b 1 = b 2 = 1,b 3 = 0.1即⎪⎪⎪⎭⎫ ⎝⎛=1.011P ,则⎪⎪⎪⎭⎫ ⎝⎛==-4.02.010.0013.08.001.0012.001.09.01AP P B 所以G 1' = {z :| z – 0.9|≤ 0.022};G 2' = {z :| z – 0.8|≤ 0.023};G 3' = {z :| z – 0.4|≤ 0.3}三个盖氏圆分离,故有λ1 ∈ G 1',λ2 ∈ G 2',λ3 ∈ G 3。
3.2 幂法与反幂法幂法是求方阵的最大特征值及对应特征向量的一种迭代法。
3.2.1 幂法设A n 有n 个线性相关的特征向量v 1,v 2,…,v n ,对应的特征值λ1,λ2,…,λn ,满足 |λ1| > |λ2| ≥ …≥ |λn | (3.2.1)1. 基本思想因为{v 1,v 2,…,v n }为C n的一组基,所以任给x (0)≠ 0,∑==ni i i v a x 1)0( —— 线性表示所以有])([)(21111111)0(∑∑∑∑====+====ni i i k i kni k k i i ni ik i n i i i kk v a v a v a v A a v a A xA λλλλ (3.2-2)若a 1 ≠ 0,则因11<λλi知,当k 充分大时 A (k )x (0) ≈ λ1k a 1v 1 = cv 1 属λ1的特征向量 另一方面,记max(x ) = x i ,其中|x i | = ||x ||∞,则当k 充分大时,111111*********)0(1)0()max()max()max()max()max()max(λλλλλ==≈---v a v a v a v a x A x A k kk kk k若a 1 = 0,则因舍入误差的影响,会有某次迭代向量在v 1方向上的分量不为0,迭代下去可求得λ1及对应特征向量的近似值。
2. 规范化在实际计算中,若|λ1| > 1则|λ1k a 1| →∞,若|λ1| < 1则| λ1k a 1| → 0都将停机。
须采用“规范化”的方法⎪⎩⎪⎨⎧==+)()1()()()()max(k k k k k Ay xx x y , k = 0,1,2,… (3.2-4) 定理3.2-1 任给初始向量0)0(≠x有,⎪⎩⎪⎨⎧==∞→∞→特征值特征向量1)(11)()max(lim )max(lim λk k k k x v v y (3.2-5)证明:⎭⎬⎫⎩⎨⎧++======∑∑==-------ni i k i i k ni i ki i kk k k k k k k k k k k v a v a v a v a x A x A x x A x x AAy Ay x x y2111121111)22.3()0()0()1()1()1()1()1()1()()()(])([max ])([)max())max(max()max()max()max(λλλλλλ )max()max(])([max ])([11111121112111v v v a v a v a v a v a v a k ni i k i i ni i ki i =→⎭⎬⎫⎩⎨⎧++=∞→==∑∑λλλλ而1111111)1()()max()max()max()max())max(max()max()max(λλ===→=∞→-v v v Av v v AAy x k k k注:若A 的特征值不满足条件(3.2.1),幂法收敛性的分析较复杂,但若λ1 = λ2 = … = λ r 且|λ1| > |λ r +1| ≥ …≥ |λn |则定理结论仍成立。
此时不同初始向量的迭代向量序列一般趋向于λ1的不同特征向量。
3. 算法求maxa(x )的流程,设数组x (n )数向量x 的n 个分量幂法流程:例1,用幂法求⎪⎪⎪⎭⎫ ⎝⎛=361641593642A 的最大模特征值及对应特征向量见P312function y = maxa(x) k=1;n=length(x); for i=2:nif (abs(x(i))>abs(x(k)),k=i; end; end; y=x(k);A=[2,4,6;3,9,15;4,16,36]; x0=[1;1;1]; y=x0/maxa(x0) x1=A*ywhile(abs(maxa(x1)-maxa(x0)))>0.001 x0=x1;y=x0/maxa(x0) x1=A*y end; ymaxa(x1)3.2.2 加速方法幂法的迭代公式:⎪⎩⎪⎨⎧==+)()1()()()()max(k k k k k Ay xx x y当k →∞时)max(11)(v v yk →,max(x (k )) → λ1,其中|λ1| > |λ2| ≥ …≥ |λn |注:幂法的收敛速度取决于比值|λ2| / |λ1|,考虑收敛加速1. 特征值的Aitken 加速法(1) 思想:由定理3.2.1的证明知∑∑∑∑=-==-=--++=+⎭⎬⎫⎩⎨⎧+==ni i k i i ni i ki i ni i k i i ni i k i i k k v a v a v a v a v a v a v a v a A Ay x 21111211112111121111)1()(])(max[])(max[])(max[])([max )max()max(λλλλλλλλλ⇒)k (0)(])(max[])1()()1(max[)(])(max[])1()(max[)(])(max[])(max[])(max[)max(1121211112112212112121111211211212111121111211111)(充分大时当→≈+-+-=+-=++-+=--=-=--=-=--=-=-=∑∑∑∑∑∑∑M v a v a v a v a v a v a v a v a v a v a v a v a v a x k ni i k i i ni i i k i i i k ni i k i i ni i ik i i k ni i k i i ni i k i i ni i k i i k λλλλλλλλλλλλλλλλλλλλλλλλλλλλλλλ(3.2.6))()max()max()max()max(121)(1)1(1)1(1)2(λλλλλλ≈--≈--⇒+++k k k k x x x x解之得)1(1)()1()2(2)1()2()2()()1()2(2)1()()2(1)max()max(2)max()]max()[max()max()max()max(2)max()][max()max()max(+∆+++++++++=+---=+---≈k k k k k k k k k k k k k x x x x x x x x x x x x λλ (3.2.7)使用λ1(k +2)作为λ1的近似值的算法称为Aitken 加速法。