第9章 矩阵特征值问题的数值方法
- 格式:pps
- 大小:486.00 KB
- 文档页数:49
矩阵特征值问题求解矩阵在数学和工程领域有着广泛的应用,而研究矩阵的特征值是其中一个重要的问题。
矩阵的特征值对于矩阵的性质和行为具有重要的影响,因此求解矩阵的特征值是一项非常重要的任务。
什么是特征值和特征向量在矩阵理论中,矩阵A的特征值(eigenvalue)是一个数λ,满足方程$A\\mathbf{v} = \\lambda\\mathbf{v}$的向量$\\mathbf{v}$存在且不为零。
其中,$\\mathbf{v}$被称为对应于特征值$\\lambda$的特征向量(eigenvector)。
特征值和特征向量的求解是矩阵理论和线性代数中的重要问题之一。
特征值问题的求解方法1. 特征值分解我们可以通过特征值分解的方法求解矩阵的特征值。
给定一个方阵A,我们可以将其表示为$A=Q\\Lambda Q^{-1}$的形式,其中Q是由A的特征向量所组成的矩阵,Λ是由A的特征值所组成的对角矩阵。
2. 特征多项式特征值问题的另一种求解方法是通过矩阵的特征多项式。
特征多项式是关于矩阵A的一个多项式,它的根就是矩阵A的特征值。
通过求解特征多项式的根,我们可以得到矩阵的特征值。
3. 幂法幂法是一种常用的求解特征值问题的迭代方法。
通过不断的迭代计算$A\\mathbf{v}^{(k)}$,其中$\\mathbf{v}^{(k)}$是第k次迭代得到的特征向量,我们可以逐渐逼近矩阵的特征值和特征向量。
应用和意义矩阵的特征值问题求解在计算机图形学、信号处理、物理学等领域都有着重要的应用和意义。
通过求解矩阵的特征值,我们可以分析矩阵的性质、系统的稳定性以及模式识别等问题,为我们深入理解和应用矩阵提供了重要的工具和方法。
综上所述,矩阵的特征值问题求解是一个具有重要意义和广泛应用的问题,通过不同的方法和技术,我们可以有效地求解矩阵的特征值和特征向量,为我们更好地理解和利用矩阵提供了重要的支持。
第章矩阵特征值的计算矩阵特征值是矩阵理论中的一个重要概念,它在很多领域中都有广泛的应用,如物理、化学、工程等。
本文将从特征值的定义、计算方法和应用举例等方面进行阐述。
一、特征值的定义对于一个n阶方阵A,如果存在一个非零向量x,使得Ax=kx,其中k 是一个常数,那么k称为A的特征值,x称为A的对应于特征值k的特征向量。
从定义可以看出,矩阵A的特征值和特征向量是成对出现的,特征向量可以是一个实数或是一个向量,特征值可以是实数或是复数。
二、特征值的计算方法1.直接计算法此方法适合于较小的矩阵。
给定一个n阶矩阵A,首先构造特征方程det(A-λI)=0,其中I是n阶单位矩阵,λ是未知数,然后求解特征方程得到特征值,将特征值代入(A-λI)x=0求解对应的特征向量。
2.幂法幂法是一种迭代方法,适用于大型矩阵。
假设特征值的绝对值最大,那么从非零向量b开始迭代过程,令x0=b,求解x1=A*x0,然后再将x1作为初始值,求解x2=A*x1,以此类推,直到收敛为止。
最后,取最终得到的向量xn,其模即为特征值的近似值。
3.QR方法QR方法是一种迭代方法,可以用于寻找特征值和特征向量。
首先将矩阵A分解为QR,其中Q是正交矩阵,R是上三角矩阵,然后对R进行迭代,重复进行QR分解,直到收敛。
最后,得到的上三角矩阵的对角元素即为特征值的近似值,在QR分解的过程中,特征向量也可以得到。
三、特征值的应用举例1.物理学中的量子力学量子力学中的哈密顿算符可以表示为一个矩阵,物理量的测量值就是对应的特征值。
例如,电子的自旋可以有上自旋和下自旋两种状态,上自旋对应的特征值为1,下自旋对应的特征值为-12.工程中的振动问题在工程中,矩阵特征值可以用来求解振动问题。
例如,振动系统的自由度决定了特征向量的个数,而特征值则表示了振动的频率。
通过计算矩阵的特征值和特征向量,可以预测系统的振动频率和振型。
3.网络分析中的中心性度量在网络分析中,矩阵特征值可以用来计算节点的中心性度量。
求矩阵特征值的方法矩阵特征值是矩阵理论中的一个重要概念,它在许多领域中都有着广泛的应用,如物理学、工程学、计算机科学等。
求矩阵特征值的方法有多种,下面将介绍其中的三种常用方法。
一、特征多项式法特征多项式法是求矩阵特征值的一种常用方法。
它的基本思想是将矩阵A与一个未知数λ相乘,得到一个新的矩阵B=A-λI,其中I为单位矩阵。
然后求解矩阵B的行列式,得到一个关于λ的多项式,称为特征多项式。
矩阵A的特征值就是使特征多项式等于零的λ值。
具体步骤如下:1. 构造矩阵B=A-λI。
2. 求解矩阵B的行列式det(B)。
3. 解特征多项式det(B)=0,得到矩阵A的特征值λ。
二、幂法幂法是求矩阵特征值的一种迭代方法。
它的基本思想是从一个任意的非零向量开始,不断地将其乘以矩阵A,直到向量的方向趋于特征向量的方向,同时向量的模长趋于特征值的绝对值。
具体步骤如下:1. 选择一个任意的非零向量x0。
2. 迭代计算xn+1=Axn/||Axn||,其中||Axn||为Axn的模长。
3. 当xn+1与xn的差值小于某个预设的精度时,停止迭代,此时xn 的模长即为矩阵A的最大特征值,xn/||xn||即为对应的特征向量。
三、QR分解法QR分解法是求矩阵特征值的一种数值方法。
它的基本思想是将矩阵A 分解为QR,其中Q为正交矩阵,R为上三角矩阵。
然后对R进行迭代,得到一个对角矩阵,对角线上的元素即为矩阵A的特征值。
具体步骤如下:1. 对矩阵A进行QR分解,得到A=QR。
2. 对R进行迭代,得到一个对角矩阵D,对角线上的元素即为矩阵A的特征值。
以上三种方法都有其优缺点,具体选择哪种方法取决于实际应用场景和计算需求。
在实际应用中,还可以结合多种方法进行求解,以提高计算精度和效率。
矩阵特征值的数值解法矩阵的特征值是在矩阵与其特征向量之间的关系中的数值解。
特征值在各个领域中都有广泛应用,包括物理、工程、金融等。
在解决实际问题时,我们经常需要计算矩阵的特征值,因此研究如何求解矩阵特征值的数值方法是非常重要的。
1. 幂迭代法(Power Iteration)幂迭代法是求解矩阵特征值的一种简单而常用的数值方法。
它的基本思想是通过不断迭代矩阵与向量的乘积,使得向量趋近于该矩阵的一个特征向量。
具体步骤如下:(1)初始化一个非零的初始向量x。
(2)进行迭代计算,即$x^{(k+1)}=Ax^{(k)}/,Ax^{(k)},$。
(3)当向量x的相对误差小于一些预设的精度要求时,停止迭代,此时的x即为矩阵A的一个特征向量。
(4)将x带入特征值的定义式$\frac{Ax}{x}$,计算出特征值。
幂迭代法的优点是简单易实现,计算速度较快,缺点是只能求解特征值模最大的特征向量,而且对于存在特征值模相近的情况,容易收敛到错误的特征值上。
2. QR迭代法(QR Iteration)QR迭代法是一种较为稳定的求解矩阵特征值的数值方法。
它的基本思想是通过不断进行QR分解,使得矩阵的特征值逐渐收敛。
具体步骤如下:(1)将矩阵A进行QR分解,得到正交矩阵Q和上三角矩阵R,令$A_1=RQ$。
(2)将$A_1$再次进行QR分解,得到新的矩阵$A_2=R_1Q_1$。
(3)重复步骤(2),直到得到收敛的矩阵$A_k$,此时$A_k$的对角线上的元素即为矩阵A的特征值。
QR迭代法的优点是对于特征值模相近的情况仍然能够收敛到正确的特征值上。
缺点是每次QR分解都需要消耗大量的计算量,迭代次数较多时计算速度较慢。
3. Jacobi迭代法(Jacobi's Method)Jacobi迭代法是一种通过对称矩阵的对角线元素进行迭代操作,逐步将非对角元素变为零的求解特征值的方法。
具体步骤如下:(1)初始化一个对称矩阵A。
求矩阵特征值的方法矩阵特征值是线性代数中一个非常重要的概念,对于矩阵的特征值和特征向量的求解是解线性代数问题和应用的关键之一。
下面将从基本概念、性质、求解方法等方面全面介绍矩阵特征值的方法。
一、基本概念矩阵特征值是指对于一个n阶矩阵A,存在常数λ,使得线性方程组(A-λI)x = 0有非零解x存在。
其中,I是n阶单位矩阵。
λ称为矩阵A的特征值,而满足(A-λI)x = 0的非零向量x称为A的对应于特征值λ的特征向量。
二、性质1. 矩阵A和其转置矩阵A^T具有相同的特征值,但对应的特征向量不同。
2. 矩阵的特征值是与矩阵的倍数无关的。
3. n阶矩阵A的特征值个数不超过n个,包括相同特征值重数。
即重特征值可以有多个线性无关的特征向量。
4. 矩阵的特征向量是线性无关的。
三、求解方法1. 特征值的定义法根据特征值的定义,我们将(A-λI)x = 0进行变换,得到(A-λI)x = 0,即(A-λI)x = 0。
利用行列式的性质求解此方程,得到特征值λ的值,再带入方程组中求解特征向量。
2. 特征值的代数重数和几何重数特征值λ是使(A-λI)x = 0有非零解的λ值,λ称为矩阵的代数重数。
而对应特征值λ的解向量x称为矩阵的特征多项式的零空间,零空间的维数称为矩阵的几何重数。
通常,代数重数大于等于几何重数。
3. 矩阵的特征向量特征向量是矩阵A与特征值λ的关联,通过求解(A-λI)x = 0可以得到特征向量。
特征向量是在特征值确定的情况下,通过解方程组取出的非零向量。
4. 特征值和特征向量的计算法常用的计算特征值和特征向量的方法有幂法、反幂法、QR方法、稀疏特征问题求解方法等。
(1)幂法幂法是求解矩阵最大特征值和特征向量的一种迭代方法。
首先初始化一个非零向量b0,然后进行迭代计算,直到满足迭代终止条件。
迭代过程为:b(k+1) = A*b(k),其中b(k)表示第k次迭代后的向量。
最后得到的向量b即为矩阵A的最大特征值对应的特征向量。
矩阵特征值求法的十种求法(非常经典)以下是矩阵特征值求法的十种经典求法:1. 幂法(Power Method)幂法(Power Method)幂法是求解特征值的常用方法之一。
它基于一个重要的数学原理:对于一个非零向量$x$,当它连续乘以矩阵$A$的$k$次幂后,$Ax$的方向将趋于特征向量相应的特征值。
这种方法通常需要进行归一化,以防止向量过度增长。
2. 反幂法(Inverse Power Method)反幂法(Inverse Power Method)反幂法是幂法的一种变体。
它通过计算矩阵$A$的逆来求解最小的特征值。
使用反幂法时,我们需要对矩阵$A$进行LU分解,以便更高效地求解线性方程组。
3. QR方法QR方法QR方法是一种迭代方法,可以通过将矩阵$A$分解为$QR$形式来逐步逼近特征值。
这种方法是通过多次应用正交变换来实现的,直到收敛为止。
QR方法不仅可以求解特征值,还可以求解特征向量。
4. Jacobi方法Jacobi方法Jacobi方法是一种迭代方法,通过施加正交相似变换将矩阵逐步变为对角矩阵。
在每个迭代步骤中,Jacobi方法通过旋转矩阵的特定元素来逼近特征值。
这种方法适用于对称矩阵。
5. Givens旋转法Givens旋转法Givens旋转法是一种用于特征值求解的直接方法。
它通过施加Givens旋转矩阵将矩阵逐步变为对角矩阵。
这种方法是通过旋转矩阵的特定元素来实现的。
6. Householder变换法Householder变换法Householder变换法是一种用于特征值求解的直接方法。
它通过施加Householder变换将矩阵逐步变为Hessenberg形式,然后再进一步将其变为上三角形式。
这种方法是通过对矩阵的列向量进行反射来实现的。
7. Lanczos方法Lanczos方法Lanczos方法是一种迭代方法,用于对称矩阵的特征值求解。
该方法创建一个Krylov子空间,并使用正交投影找到最接近特征值的Krylov子空间中的特征值。
矩阵特征问题的计算方法首先,我们来定义特征值和特征向量。
对于一个n阶方阵A,如果存在一个非零向量X,使得下式成立:AX=λX其中,λ是一个实数常数,称为特征值;X是一个非零向量,称为特征向量。
也可以将上面的等式写成(A-λI)X=0,其中I是n阶单位矩阵。
接下来,我们介绍一些常用的计算特征值和特征向量的方法。
一、特征方程法特征方程法是最常用的求解特征值和特征向量的方法。
对于n阶方阵A,我们可以将特征方程写成:A-λI,=0其中,A-λI,表示A-λI的行列式。
解特征方程即可得到n个特征值λ1,λ2,...,λn。
对于每个特征值λi,我们可以代入(A-λiI)X=0,求解出对应的特征向量Xi。
二、幂法幂法是一种迭代计算特征值和特征向量的方法。
它的基本思想是,假设一个向量X0,然后通过迭代的方式不断计算Xk+1=AXk,直到收敛为止。
此时,Xk就是所求的特征向量,而特征值可以通过计算向量Xk与Xk+1的比值得到。
三、雅可比迭代法雅可比迭代法是一种用于计算对称矩阵特征值和特征向量的方法。
它的基本思想是,通过矩阵的相似变换将对称矩阵转化为对角矩阵。
雅可比迭代法的具体步骤如下:1.初始化一个对称矩阵A,令Q为单位矩阵。
2.找到A的非对角元素中绝对值最大的元素(a,b)。
3.计算旋转矩阵R,使得AR=RD,其中D为对角矩阵,D的对角线元素与A的特征值相等。
4.更新矩阵A=R^TAR,更新矩阵Q=Q×R,重复步骤2和3,直到达到收敛条件。
四、QR分解法QR分解法是一种计算特征值和特征向量的常用方法。
它的基本思想是,将矩阵A分解为QR,其中Q是正交矩阵,R是上三角矩阵。
然后,通过对R进行迭代得到对角矩阵D,D的对角线元素与A的特征值相等。
具体步骤如下:1.初始化一个矩阵A。
2.对A进行QR分解,得到矩阵Q和R。
3.计算新矩阵A=RQ,重复步骤2和3,直到达到收敛条件。
特征值和特征向量在实际应用中具有重要的意义。
矩阵特征值问题的计算方法特征值问题:A V=λV¾直接计算:A的阶数较小,且特征值分离得较好 特征值:det(λI-A)=0,特征向量:(λI-A)V=0¾迭代法:幂法与反幂法¾变换法:雅可比方法与QR方法内容:一、 特征值的估计及其误差问题二、 幂法与反幂法三、 雅可比方法四、 QR方法一、 特征值的估计及其误差问题 (一)特征值的估计结论 1.1:n 阶矩阵()ij n n A a ×=的任何一个特征值必属于复平面上的n 个圆盘:1,||||,1,2,ni ii ij j j i D z z a a i n =≠⎧⎫⎪⎪=−≤=⎨⎬⎪⎪⎩⎭∑"(10.1) 的并集。
结论1.2:若(10.1)中的m个圆盘形成一个连通区域D,且D与其余的n-m个圆盘不相连,则D中恰有A的m个特征值。
(二)特征值的误差问题结论1.3:对于n 阶矩阵()ij n n A a ×=,若存在n 阶非奇异矩阵H ,使得11(,,)n H AH diag λλ−=Λ=", (10.2)则11min ||||||||||||||i p p p i nH H A λλ−≤≤−≤∆ (10.3)其中λ是A A +∆的一个特征值,而(1,,)i i n λ="是A 的特征值,1,2,p =∞。
结论1.4:若n 阶矩阵A 是实对称的,则1min ||||||i p i nA λλ≤≤−≤∆。
(10.4)注:(10.4)表明,当A 是实对称时,由矩阵的微小误差所引起的特征值摄动也是微小的。
但是对于非对称矩阵而言,特别是对条件数很大的矩阵,情况未必如此。
二、 幂法与反幂法(一) 幂法:求实矩阵按模最大的特征值与特征向量假设n 阶实矩阵A 具有n 个线性无关的特征向量,1,iV i n =",则对于任意的0nX R ∈,有 01ni ii X a V ==∑,从而有01111112((/))n nk k k i i i i ii i nk k i i i i A X a A V a V a V a V λλλλ======+∑∑∑.若A 的特征值分布如下:123||||||||n λλλλ>≥≥≥",则有01111()k kk A X a V λλ→∞⎯⎯⎯→为对应的特征向量须注意的是,若1||1λ<,则10kλ→,出现“下溢”,若1||1λ>,则1kλ→∞,出现“上溢”,为避免这些现象的发生,须对0kA X 进行规范化。
矩阵特征值问题的数值方法矩阵特征值设A 是n 阶矩阵,x 是非零列向量. 如果有数λ 存在,满足那么,称x 是矩阵A 关于特征值λ的特征向量. 很显然一般地有主特征值的乘幂迭代法设n 阶矩阵A 的n 个特征值按模从大到小排序为:n 其对应的n 个线性无关的特征向量分别为:设是任意一个非零的n 维向量,则:假设,构造一个向量序列:则:或者:当时:如果是矩阵A 的关于特征值的一个特征向量,特征值个特征那么对于任意一个给定的,也是特征值的特征向量。
所以,是对主特征值对应的特征向量的近似。
如果则会变得很大或者如果,则会变得很大,或者如果,则会变得非常小,在实际计算中,为避免这种情况的出现需对做归一化处理况的出现,需对做归一化处理:由:左乘得:所以主特征值的近似值所以主特征值的近似值:残余误差向量定义为:当迭代次数充分大时,残余误差将充分小。
逆乘幂法:类似地,也可以求模最小特征值和对应的特征向量特征向量。
上述问题的主特征值问题就是矩阵A 的模最小特征值问题。
结果,逆乘幂法的迭代公式为:在实际应用中,无需计算逆矩阵,但需求解线性系统实对称矩阵的基本定理:对实对称矩阵A ,一定存在一个正交相似变换使得为对角矩阵且其对角矩阵P ,使得:为对角矩阵,且其对角的特征值元素为矩阵A 的特征值。
相似变换:相似变换保持矩阵特征值(但不是特征向量)不变不变。
(证明略)正交相似变换:中。
正交相似变换的例子—坐标旋转:叫旋转矩阵。
容易验证:。
适当选择旋转角,可消去xy 项—得到对角阵D 。
矩阵特征值问题的数值方法实对称矩阵的基本定理再看下面的例子:令:O 平面的坐标旋转变换适当同样地有:。
则是在x-O-z 平面的坐标旋转变换。
适当x z —D 。
选择旋转角可消去z 项得到对角阵实对称矩阵的Jacobi 方法:全部特征值和特征向量根据实对称矩阵的基本定理,求得矩阵A 的全部特征值的关键是找到正交相似变换矩阵P 使部特征值的关键,是找到正交相似变换矩阵P ,使得为对角阵。
求矩阵特征值的方法介绍在线性代数中,矩阵特征值是一个重要的概念。
特征值可以帮助我们了解矩阵的性质和特点。
求解矩阵特征值的方法有很多种,每种方法都有其适用的场景和优缺点。
本文将介绍几种常用的方法,包括幂法、QR方法、雅可比方法和特征值问题的迭代解法。
幂法幂法是一种用于估计矩阵最大特征值和对应特征向量的迭代算法。
该方法的基本思想是通过不断迭代矩阵与向量的乘积,使得向量逐渐趋近于特征向量。
具体步骤如下:1.随机选择一个向量b作为初始向量。
2.计算矩阵A与向量b的乘积,得到向量c。
3.对向量c进行归一化处理,得到向量b。
4.重复步骤2和步骤3,直到向量b的变化趋于稳定。
5.向量b的模即为矩阵A的最大特征值的估计值,向量b即为对应的特征向量的估计值。
幂法的收敛速度取决于矩阵A的特征值分布。
如果矩阵A的最大特征值与其他特征值之间的差距较大,那么幂法往往能够快速收敛。
QR方法QR方法是一种迭代算法,用于计算实对称矩阵的特征值。
该方法的基本思想是通过不断迭代矩阵的QR分解,使得矩阵逐渐趋近于上三角矩阵,从而得到特征值的估计值。
具体步骤如下:1.对矩阵A进行QR分解,得到正交矩阵Q和上三角矩阵R。
2.计算矩阵R与矩阵Q的乘积,得到新的矩阵A。
3.重复步骤1和步骤2,直到矩阵A的变化趋于稳定。
4.矩阵A的对角线元素即为矩阵A的特征值的估计值。
QR方法的收敛速度较快,并且对于任意实对称矩阵都适用。
但是,QR方法只能计算实对称矩阵的特征值,对于一般的矩阵则不适用。
雅可比方法雅可比方法是一种用于计算实对称矩阵的特征值和特征向量的迭代算法。
该方法的基本思想是通过不断迭代交换矩阵的非对角线元素,使得矩阵逐渐趋近于对角矩阵,从而得到特征值和特征向量的估计值。
具体步骤如下:1.初始化一个单位矩阵J,将其作为迭代的初始矩阵。
2.在矩阵J中找到非对角线元素的绝对值最大的位置,记为(i, j)。
3.构造一个旋转矩阵P,使得P^T * J * P的(i, j)位置元素为0。
线性方程组与矩阵特征值求解的数值方法线性方程组与矩阵特征值求解是线性代数中的两个重要问题。
线性方程组解决了形如Ax=b的方程组,其中A为一个m×n的矩阵,b为一个m 维的向量,求解x使得该方程组成立。
矩阵特征值求解是求解形如Ax=λx的特征值和特征向量问题,其中A为一个n×n的矩阵,λ为特征值,x为特征向量。
这两个问题在实际应用中有广泛的应用,如计算机图形学、仿真和优化等领域。
本文将介绍线性方程组和矩阵特征值求解的数值方法。
一、线性方程组的求解方法1.1直接法直接法是指通过一系列的代数运算和变换直接求解线性方程组的解。
经典的直接法有高斯消元法、LU分解法和Cholesky分解法等。
这些方法的时间复杂度通常为O(n^3)。
直接法的优点是解的精度高,稳定性好,适用于小规模的问题。
1.2迭代法迭代法是指通过迭代计算逼近线性方程组的解。
迭代法的基本思想是将原方程组转化为递推的形式,并选择一个初始解,通过递推计算得到趋于或精确的解。
常用的迭代法有Jacobi迭代法、Gauss-Seidel迭代法和SOR迭代法等。
这些方法的时间复杂度通常为O(n^2)。
迭代法的优点是适用于大规模问题,但收敛速度慢,精度较差。
二、矩阵特征值求解方法2.1幂法幂法是求解特征值最大的特征值与对应特征向量的方法。
假设有一个n×n的矩阵A,选择一个初始向量x(0),通过迭代计算x(k)=Ax(k-1)/,Ax(k-1),其中,·,表示向量的范数,直到收敛为止。
最后得到的x为特征向量,特征值为λ=(Ax·x)/(x·x)。
幂法的收敛速度较慢,但适用于特征值分布差异较大的情况。
2.2反幂法反幂法是求解特征值最小的特征值与对应特征向量的方法。
和幂法类似,反幂法选择一个初始向量x(0),通过迭代计算x(k)=(A-λI)^-1x(k-1)/,(A-λI)^-1x(k-1),其中I为单位矩阵,λ为近似的特征值,直到收敛为止。
9 矩阵特征值计算在实际的工程计算中,经常会遇到求n 阶方阵 A 的特征值(Eigenvalue)与特征向量(Eigenvector)的问题。
对于一个方阵A,如果数值λ使方程组Ax=λx即(A-λI n )x=0 有非零解向量(Solution Vector)x,则称λ为方阵A的特征值,而非零向量x为特征值λ所对应的特征向量,其中I n 为n阶单位矩阵。
由于根据定义直接求矩阵特征值的过程比较复杂,因此在实际计算中,往往采取一些数值方法。
本章主要介绍求一般方阵绝对值最大的特征值的乘幂(Power)法、求对称方阵特征值的雅可比法和单侧旋转(One-side Rotation)法以及求一般矩阵全部特征值的QR 方法及一些相关的并行算法。
1.1 求解矩阵最大特征值的乘幂法1.1.1 乘幂法及其串行算法在许多实际问题中,只需要计算绝对值最大的特征值,而并不需要求矩阵的全部特征值。
乘幂法是一种求矩阵绝对值最大的特征值的方法。
记实方阵A的n个特征值为λi i=(1,2, …,n),且满足:│λ1 │≥│λ2 │≥│λ3 │≥…≥│λn │特征值λi 对应的特征向量为x i 。
乘幂法的做法是:①取n维非零向量v0 作为初始向量;②对于k=1,2, …,做如下迭代:直至 uk +1 ∞- u k u k =Av k -1 v k = u k /║u k ║∞ < ε为止,这时v k +1 就是A 的绝对值最大的特征值λ1 所对应的特征向∞量x 1 。
若v k -1 与v k 的各个分量同号且成比例,则λ1 =║u k ║∞ ;若v k -1 与v k 的各个分量异号且成比 例,则λ1 = -║u k ║∞ 。
若各取一次乘法和加法运算时间、一次除法运算时间、一次比较运算时 间为一个单位时间,则因为一轮计算要做一次矩阵向量相乘、一次求最大元操作和一次规格 化操作,所以下述乘幂法串行算法 21.1 的一轮计算时间为n 2+2n =O(n 2 )。
第九章矩阵特征值与特征向量计算方法教学目的 1. 掌握求矩阵特征值与特征向量的幂法及反幂法;2. 掌握求矩阵特征值的QR方法。
教学重点及难点重点是求矩阵特征值与特征向量的幂法及反幂法求矩阵特征值的QR方法;难点是求矩阵特征值的带原点位移的QR方法。
教学时数12学时教学过程§2 幂法及反幂法2.1幂法在一些工程、物理力学部标题中,需要我们求矩阵的按模最大的特征值(称为A的主特征值)和对应的特征向量。
幂法是一种计算矩阵的主特征值的一种迭代法,它最大优点是方法简单,适合于计算大型稀疏矩阵的主特征值。
设,其特征值为,对应特征向量为即且线性无关。
设特征值满足:(即为强占优)(2.1)幂法的基本思想,是任取一个非零初始向量,由矩阵的乘幂构造一向量序列(2.2称为迭代向量。
下面来分折。
由设为中一个基本,于是,有展开式(且设)且有(2.3由假设(2.1)式,则即且收敛速度由比值确定。
且有(2.4)这说明,当充分大时,有,或越来越接近特征向量。
下面考虑主特征值的计算。
用表示的第个分量,考虑相邻迭代向量的分量的比值。
从而是(2.5说明相邻迭代向量分量的比值收敛到主特征,且收敛速度由比值来度量,越小收敛越快,但越小收敛越快,但,而接近于1时,收敛可能很慢。
定理7 (1)设n个线性无关的特征向量:(2)设特征值满足(3)幂法:)则(1);(2)如果主特征值为实的重根,即有又设A有个线性无关的特征向量,其中对于任意初始向量则由幂法有且有(设不全为零)由此,当充分大时,接近于与对应的特征向量的某个线性组合。
应用幂法计算的主特征值及对应的特征向量时,如果),迭代向量的各个不等于零的分量将随而趋于无究(或趋于零),这样电算时就可能溢出。
为此,就南非要将迭代向量加以规范化。
设有非零向量其中表示向量绝对值最大的元素,即如果有草药则其中为所有绝对值最大的分量中最小指标。
显然有下面性性质:设,则在定理7条件下幂法可改进为:任取初始向量。
第9章矩阵特征值问题的数值方法9.1 特征值与特征向量9.2 Hermite矩阵特征值问题9.3 Jacobi方法9.4 对分法9.5 乘幂法9.6 反幂法9.7 QR方法引言工程实践中有多种振动问题,如桥梁或建筑物的振动,机械机件、飞机机翼的振动,工程实践中有多种振动问题,如桥梁或建筑物的振动,机械机件、飞机机翼的振动,及一些稳定性分析和相关分析可转化为求矩阵特征值与特征向量的问题。
London, England: Millennium ('Wobbly') Bridge (1998-2002, Norman Foster and Partners and Arup Associates)I decide that I have to write something today, otherwise I would not know how to speak English here.•This is a very quick story about a bridge.•London launched three major construction projects to celebrate the arrival of the Millennium. After all, Greenwich (pronounced green-ich) is supposed to be (supposed to be?!) where the prime meridian lies, and the place where the Millennium officially starts in the world. The three projects are the Millennium Dome in North Greenwich, so far the largest single roofed structure in the world, London Eye right across Westminster, which becomes so far the largest observation wheel in the world, and the Millennium Bridge that links Southeast London with St. Paul’s Cathedral, which is currently…well...not swinging any more, it is said.•The bridge was designed by Imperial College, a college of my former university. On the very first day that the bridge was open to public, there were simply so many people going there to walk from the south bank to St. Paul’s that the weight completely exceeded the architect’s expectation.•The slender steel truss bridge began to vibrate with a million people on there. The opening ceremony ended up in anembarrassing vertigo.•Millennium left Londoners a happy adage about swinging bridge, meaning fancy technology that looks good but functions in a funny fashion.•Am I using too many F’s here? Or is it simply because my tongue starts to swing in the same direction when I am writing about this wobbly bridge?•Next time you visit London, I strongly recommend this place.After all, with a little swing, this is a shortcut to dash into St.Paul’s directly from the southeast!xxG =T1e x=TG: Google Matrix,“the world’s largest matrix computation”.4,300,000,000x: PageRank(网页级别)vector“The $25,000,000,000 Eigenvector”搜索引擎9.1 特征值与特征向量设A是n阶矩阵,x是非零列向量. 如果有数λ存在,满足,(1)那么,称x是矩阵A关于特征值λ的特征向量.如果把(1)式右端写为,那么(1)式又可写为:Ix λ()0I A x λ-=||0I A λ-=即1110()||...n n n f I A a a a λλλλλ--=-=++++记它是关于参数λ的n 次多项式,称为矩阵A 的特征多项式,其中a 0=(-1)n |A |.(2)显然,当λ是A 的一个特征值时,它必然是的根. 反之,如果λ是的根,那么齐次方程组(2)有非零解向量x ,使(1)式成立. 从而,λ是A 的一个特征值.A 的特征值也称为A 的特征根.()0f λ=()0f λ=矩阵特征值和特征向量有如下主要性质:定理9.1.1 n阶矩阵A是降秩矩阵的充分必要条件是A有零特征值.定理9.1.2 设矩阵A与矩阵B相似,那么它们有相同的特征值.定理9.1.3 n阶矩阵A与A T有相同的特征值.定理9.1.4 设λi≠λj是n阶矩阵A的两个互异特征值,x、y分别是其相应的右特征向量和左特征向量,那么,x T y=0 .9.2 Hermite矩阵特征值问题设A为n阶矩阵,其共轭转置矩阵记为A H. 如果A=A H,那么,A称为Hermite矩阵.9.2.1 Hermite 矩阵的有关性质设是Hermite 矩阵A 的n 个特征值.有以下性质:•全是实数.12,,...,n λλλ12,,...,nλλλ•有相应的n 个线性无关的特征向量,它们可以化为一组标准酉交的特征向量组,即12,,...,n λλλ12,,...,n u u u Hi j u u ijδ=•是酉空间中的一组标准酉交基.12,,...,n u u u•记U=( ),它是一个酉阵,即U H U=UU H =I ,那么即A 与以为对角元的对角阵相似.12,,...,n u u u 1Hn U AU D λλ⎛⎫⎪==⎪ ⎪⎝⎭O12,,...,n λλλ•A 为正定矩阵的充分必要条件是全为正数.12,,...,nλλλ定理9.2.1 设是Hermite 矩阵A 的n 个特征值,那么证:12,,...,n λλλ21max ii nAλ≤≤=21niFi Aλ==∑2222()()(())HA A A A A ρρρ===由21max ii nAλ≤≤=因此2221()()nHiFi Atr A A tr A λ====∑又由21niFi Aλ==∑得设x 是一个非零向量,A 是Hermite 矩阵,称为矩阵A 关于向量x 的Rayleigh 商,记为R(x).H H x Ax x x 定理9.2.2 如果A 的n 个特征值为其相应的标准酉交的特征向量为那么有12...n λλλ≥≥≥12,,...,n u u u 1()nR x λλ≥≥定理9.2.3 设A 是Hermite 矩阵,那么10min ()min ()k n k k k x C x x C x R x R x λλ-+∈≠∈≠==%%且且或9.2.2 极值定理定理9.2.4(极值定理) 设Hermite 矩阵的n 个特征值为,其相应的标准酉交特征向量为. 用C k 表示酉空间C n 中任意的k 维子空间,那么12...n λλλ≥≥≥12,,...,n u u u 1100max min ()minmax ()k kn k n k k x C x C k C x C x R x R x λλ-+-+∈≠∈≠==且且或9.2.3 Hermite矩阵特征值问题的性态矩阵特征值问题与求解线性方程组问题一样,都存在当矩阵A的原始数据有小变化(小扰动)时,引起特征值问题的变化有大有小的问题,如果引起的变化小,称该特征值问题是良态的. 反之,称为病态的.矩阵特征值问题的性态是很复杂的,通常分别就单个特征值或整体特征值给出条件数进行分析. 对于Hermite矩阵,由于其特征值问题的特殊性质,其特征值都是良态的.下面先证明Hermite矩阵特征值的扰动定理.定理9.2.5 设矩阵A ,E ,A+E 都是n 阶Hermite 矩阵,其特征值分别为那么,证设矩阵A 关于特征值λ1,λ2,…,λn 的标准酉交特征向量为u 1,u 2,…,u n ,是由u i ,u i+1,…,u n 生成的n-i+1维子空间.对中任意非零向量x,由极值定理,有12n λλλ≥≥≥L 12n εεε≥≥≥L 12nμμμ≥≥≥L 1i n i i λεμλε+≤≤+1n i C -+%1n i C -+%111000()max max max n i n i n i Hi Hx C x H HH H x C x x C x x A E x x xx Ax x Exx x x xμ-+-+-+∈≠∈≠∈≠+≤=+%%%且且且由定理9.2.3,又由定理9.2.2,对任意x≠0,有从而有另一方面, A=(A+E)-E. 记为矩阵-E 的特征值,那么,重复上面的过程,可得从而有10max n i Hi H x C x x Ax x xλ-+∈≠=%且110max n i Hn Hx C x x Exx xεε-+∈≠≥≥%且1i i μλε≤+12nδδδ≥≥≥L 1i n i δε-+=-1i i λμδ≤+i i nμλε≥+定理9.2.5通常又称为Hermite 矩阵特征值的扰动定理定理9.2.6 设矩阵A 和A′=A+E 都是n 阶Hermite 矩阵,其特征值分别为和,那么12n λλλ≥≥≥L 12n λλλ'''≥≥≥L 222i i E E λμλ-≤≤+这个定理表明,扰动矩阵E 使A 的特征值的变化不会超过‖E‖2.一般‖E‖2小,因此,Hermite 矩阵特征值是良态的.9.3 Jacobi方法•理论上,实对称矩阵A正交相似于以A的特征值为对角元的对角阵. 问题是如何构造这样的正交矩阵呢? Jacobi方法就是通过构造特殊的正交矩阵序列,通过相似变换使A的非对角线元素逐次零化来实现对角化的.9.3.1 平面旋转矩阵与相似约化先看一个简单的例子.设是二阶实对称矩阵,即a 21=a 12,其特征值为λ1,λ2. 令使得记容易验证B T =B, 且11122122a a A a a ⎛⎫=⎪⎝⎭cos sin sin cos R θθθθ⎛⎫-=⎪⎝⎭11TR AR λλ⎛⎫= ⎪⎝⎭11122122Tb b B R AR b b ⎛⎫== ⎪⎝⎭22111112222212212211122222111222cos 2sin cos sin ()sin cos (cos sin )sin 2sin cos cos b a a a b b a a a b a a a θθθθθθθθθθθθ=++==-+-=-+解之得:当时当时可选取1122a a ≠12112221arctan2a a a θ=-1122a a =4πθ=为使R T AR 为对角阵,要求b 12=b 21=0一般的n 阶平面旋转矩阵21arctan2pq pp qqa a a θ=-4πθ≤9.3.2 经典的Jacobi方法设A是实对称矩阵,记A1=A.Jacobi方法的基本思想是用迭代格式A k+1=Q T k A k Q k , k=1,2,…构造一个相似矩阵序列,使{Ak }收敛于一个对角阵. 其中Qk 为平面旋转矩阵,其旋转角θk 由使Ak的绝对值最大元a(k)pq=a(k)qp=0 或按列依次使A的非对角元零化来确定.定理9.3.1 设A 是n 阶实对称矩阵,那么由Jacobi 方法产生的相似矩阵序列{A k }的非对角元收敛于0. 也就是说,{A k }收敛于以A 的特征值为对角元的对角阵.记其中E k 是A k 除主对角元外的矩阵.由平面旋转矩阵的性质中,对于,有因此,()()k k iikA diag a E =+1Tk pq k pq A R A R +=,i p q≠(1)2(1)2()2()2()()()()k k k k ip iq ip iq a a a a +++=+22()212()k k kpqFFE E a +=-又由假设,因此,这样,便有从而,当22()()()()1,,1max(1)nk k k k pqijpqpqi j n i ji j i jaaan n a≤≤≠=≠==-∑且且且22()(1)k k pqF E n n a ≤-222112222(1)(1)kk kF FFE E E n nn n+≤-≤---1,0k Fk E +→∞→9.3.3 实用的Jacobi 方法•循环Jacobi 方法必须一次又一次扫描,才能使{A k }收敛于对角阵,计算量很大. 在实际计算中,往往用一些特殊方法来控制扫描次数,减少计算量. 下面介绍一种应用最为广泛的特殊循环Jacobi 方法——阈Jacobi 方法. 阈Jacobi 方法首先确定一个阈值δ,在对非对角元零化的一次扫描中,只对其中绝对值超过阈值的非对角元进行零化. 当所有非对角元素的绝对值都不超过阈值后,将阈值减少,再重复下一轮扫描,直至阈值充分小为止.减少阈值的方法通常是先固定一个正整数M≥n ,扫描一次后,让. 而阈值的下界是根据实际问题的精度要求选定的.Mδδ→9.3.4 用Jacobi 方法计算特征向量•假定经过k 次迭代得到A k+1=R T k …R T 1AR 1…R k ,(15) 这时A k+1是满足精度要求的一个近似的对角阵. 如果记Q k =R 1R 2…R k =Q k-1R k ,(16)那么,Q k 是一个正交矩阵,且(15)式又可表示为A k+1=Q T k AQ k .当A k+1的非对角元素充分小,Q k 的第j 列q j 可以看成是近似特征值a (k+1)jj 相应的特征向量了.在实际计算中,可以按(16)式在迭代过程中形成Q k ,把Q k 看成是Q k-1右乘一个平面旋转矩阵得到. 不妨记Q 0=I ,Q k 的元素按下式计算:()(1)(1)()(1)(1)()(1)cos sin ,sin cos ,,,,1,2,k k k ip ipk ipk k k k iq ipk iqk k k ijijq q q q qqqqj p q i nθθθθ-----=+=-+=≠=L9.4 对分法理论上,一个实对称矩阵正交相似于一个以其特征值为对角元的对角阵. 但是,经典的结果告诉我们,一个大于4次的多项式方程不可能用有限次四则运算求根. 因此,我们不可能期望只用有限次相似变换将一个实对称矩阵约化为一个对角阵.下面先介绍将一个实对称矩阵相似约化为实对称三对角矩阵的方法,再讨论求其特征值的对分法.9.4.1 相似约化为实对称三对角矩阵将一个实对称矩阵正交相似约化为一个实对称三对角矩阵的算法,可归纳如下:记A (1)=A,对k=1,2,…,n -2①按(4)式、(5)式和(8)式计算;②按(9)~(12)式,计算A (k+1). ,k k k u σβ'和()1,()2,()(4)k k k k k k k k k nk a a u a σ++⎛⎫- ⎪ ⎪'= ⎪ ⎪ ⎪⎝⎭M ()()21,1(()(5)n k k k k k ik i k sign a a σ+=+=-∑()1,()(8)k k k k k k a βσσ+=-1()1(1)(),(9),(10)1,(11)2(),(12)k k k k T k k kk k k k k k k T T k k k k g A u u g y g u A A u y y u βεβε--+===-=-+9.4.2 Sturm 序列的性质•设实对称三对角矩阵为其中βi ≠0 (i=1,2,…,n-1)其特征矩阵为T-λI. 记T-λI 的第i 阶主子式为111221n n a T a a ββββ-⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭OO O 111211()i i i i a a p a λββλλββλ----=-O OO•这是关于λ的i 次多项式,当i=n 时,p n (λ)=|T-λI |是矩阵T 的特征多项式.令p 0(λ)≡1,则有p 1(λ)=α1-λ,p i (λ)=(αi -λ)p i-1(λ)-β2i-1p i-2(λ),i=2,3,…,n.(15)•多项式序列{p i (λ)}(i=0,1,…,n)称为Sturm 序列111211()i i i i a a p a λββλλββλ----=-O OO定理9.4.1{p i (λ)}(i=1,2,…,n)的根都是实根.证由(14)式,p i (λ)是i 阶实对称矩阵的特征多项式,因此,{p i (λ)}(i=1,2,…,n)的根全是实根. 定理9.4.2定理9.4.2 设α是p i (λ)的一个根,那么①p i-1(α)p i+1(α)≠0,即相邻的两个多项式无公共根;②p i-1(α)p i+1(α)<0,即p i-1(α)与p i+1( α)反号.lim ()0,i p λλ→-∞>lim ()0,lim ()0,i i p p λλλλ→+∞→+∞<>当i 为奇数当i 为偶数定理9.4.4 p i (λ)的根都是单根,并且将p i+1(λ)的根严格隔离.9.4.3 同号数和它的应用•定义1 设p 0(λ)≡1,{p i (λ)}(i=1,2,…,n) 是一个Sturm 序列,称相邻的两个数中符号一致的数目为同号数,记为a i (λ). 若某个p i (λ)=0,规定与p i-1(λ)反号.•定理9.4.5 设两个实数x<y ,那么,形如(13)式的实对称三对角矩阵T 的特征多项式在区间(x,y ]上根的数目为a(x)-a(y).9.4.4 求Hermite矩阵特征值的对分法•对分法的计算可归纳为以下4个部分①确定(13)式的矩阵T的全部特征值的分布区间.②在区间[a,b]中,用区间对分的方法找出只含T的一个特征值的子区间.③在只含一个特征值的子区间上的对分法.④同号数的计算.9.5 乘幂法•设A 是n 阶矩阵,其n 个特征值按模从大到小排序为又假设关于λ1,λ2,…,λn 的特征向量v 1,v 2,…,v n 线性无关. 123n λλλλ>≥≥≥L 201112211[()()]k k k k n n A x a v a v v λλλλλ=+++L 乘幂法是适用于求一般矩阵按模最大特征值及相应特征向量的算法.x k →λk 1a 1v 1 (k→∞).因此,x k 可看成是关于特征值λ1的近似特征向量.迭代格式为1,0,1,k k k k k x z x x Az k ∞+===L按模最大特征值λ1及其相应的特征向量v 1的乘幂法的计算公式:111,0,1,kk k k kT k k k T k k x z x x Az z Az k z z λ∞++====L9.5.2 收缩方法•设矩阵A 的n 个特征值按模从大到小排序为,其相应的n 个线性无关特征向量为v 1,v 2,…,v n . 在计算A 的最大特征值λ1及相应特征向量v 1后,可以通过收缩方法,继续用乘幂法计算λ2及其相应的特征向量v 2.123nλλλλ>>≥≥L•定义n 阶矩阵•把去掉A 1的第1行和第1列的n-1阶矩阵记为2121112221122211111111211211000n n Tn n n n nn n n a v a a v a a v a A A v a v a a v a a v a α⎛⎫⎪---⎪=-= ⎪⎪---⎝⎭L L M M M L222112232113221132311233311333112112311311n n n n n n n n nn n n a v a a v a a v a a v a a v a a v a B a v a a v a a v a ---⎛⎫⎪--- ⎪= ⎪⎪---⎝⎭L LM MM L•那么,B 有与A 1除λ1外的相同的n-1个特征值|λ2|>|λ3|≥…≥|λn |,可以用乘幂法计算λ2及其相应的特征向量. 在计算λ1和v 1后,按(15)式形成n-1阶矩阵B 的计算过程称为收缩方法.9.6 反幂法•反幂法可以求一个非奇异矩阵A 的逆矩阵A-1的按模最小的特征值及相应的特征向量,又可以求A 的一个近似特征值相应的特征向量.•9.6.1 求按模最小特征值及相应特征向量的反幂法,又称为反迭代法.1(1)1,0,1,kk k k kTk k k T k kx z x LUx z z xk z zξ∞+++====L9.6.2 求近似特征值的特征向量的反幂法•先对矩阵进行LU 分解,记那么,(7)下面介绍一种选取特殊的初始向量x 0的反幂法——半迭代法.l I A λ-%l I A LUλ-=%1,0,1,kk k kkk k x z x Ly zUx y k ∞+====L•假设,选取初始向量x 0满足‖x 0‖∞=1,这时z 0=x 0.对照(7)式中的第二个式子.可把z 0看成满足Le=z 0.(8)这里,e=(1,1,…,1)T ,而z 0的各个分量的取值多少是无关重要的.这样,在第一个迭代步的计算中,只需求解(7)式中的上三角方程组Ux 1=e. “半迭代法”的命名也由此而得.l I A λ-%9.7 QR 方法定理9.7.1设A 是n 阶矩阵,其n 个特征值为.那么存在一个酉矩阵U ,使U HAU 是以为对角元的上三角矩阵.12,,,n λλλL 12,,,n λλλL 9.7.1 两个基本定理定理9.7.2设A 是n 阶实矩阵,那么,存在一个正交矩阵Q ,使Q TAQ 为一个准上三角矩阵,它的对角元是A 的一个特征值,对角元上的二阶块矩阵的两个特征值是A 的一对共轭复特征值.9.7.2 相似约化为上Hessenberg矩阵对一般n阶矩阵,QR算法的每一个迭代步需要O(n3)次乘法运算.如果矩阵阶数稍大,这个算法几乎没有实际的应用价值.通常采用的方法是先将矩阵相似约化为上Hessenberg形式的矩阵,在此基础上应用QR 迭代.这时,一个QR迭代步的乘法运算次数只需O(n2)次.所谓上Hessenberg 矩阵是指一个n 阶矩阵A ,如果当i>j+1时,a ij =0,称A 为上Hessenberg 矩阵.例如:一个5阶的上Hessenberg 矩阵具有如下的形式:**********0****00***000**A ⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭下面介绍QR 方法时,都假设矩阵A 是一个上Hessenberg 矩阵.。