第八章 矩阵的特征值与特征向量的数值解法
某些工程计算涉及到矩阵的特征值与特征向量的求解。如果从原始矩阵出发,先求出特征多项式,再求特征多项式的根,在理论上是无可非议的。但一般不用这种方法,因为了这种算法往往不稳定.常用的方法是迭代法或变换法。本章介绍求解特征值与特征向量的一些方法。
§1 乘幂法
乘幂法是通过求矩阵的特征向量来求特征值的一种迭代法,它适用于求矩阵的按模最大的特征值及对应的特征向量。
定理8·1 设矩阵An ×n 有n 个线性无关的特征向量X i(i=1,2,…,n),其对应的特征值λi (i =1,2,…,n)满足
|λ1|>|λ2|≧…≧|λn |
则对任何n维非零初始向量Z 0,构造Zk = AZ k-1
11()lim
()k j k k j
Z Z λ→∞
-=
(8·1)
其中(Zk )j表示向量Z k 的第j个分量。 证明 : 只就λi是实数的情况证明如下。
因为A 有n 个线性无关的特征向量X i ,(i = 1,2,…,n)用X i(i = 1,2,…,n)线性表示,即Z 0=α1X 1 + α2X2 +用A 构造向量序列{Z k }其中 ? 21021010,
,k k k Z AZ Z AZ A Z Z AZ A Z -=====, (8.2)
由矩阵特征值定义知AXi =λi X i (i=1,2, …,n),故
?
0112211122211121k k k k k n n
k k k n n n
k
n
k
i i i i Z A Z A X A X A X X X X X X ααααλαλαλλλααλ===++
+=+++????
??=+
??????
?
∑
(8.3)
同理有
1
1
11
1121k n
k i k i i i Z X X λλααλ---=?
?
????=+ ?????
?
?
∑ (8.4)
将(8.3)与(8.4)所得Zk 及Z k-1的第j 个分量相除,设α1≠0,并且注意到 |λi |<|λ1|(i=1,2,…,n )得
11()lim
()k j k k j
Z Z λ→∞
-= 证毕
定理8·1的证明过程实际上是给出了矩阵的按模最大特征值的计算方法: 1) 先任取一非零向量Z 0,一般可取Z 0=(1,1,1)T ; 2) 按(8.2)式计算Z k =AZk-1(k=1,2,…); 3) 当K足够大时,即可求出
11()()k j k j
Z Z λ-=,为了减少λ1对于所选的第j 个分
量的依赖性,还可用各个分量比的平均值来代替,即
1
11()()
n
k j
j
k j
Z Z n
λ=-=∑
关于对应于λ1的特征向量的计算:
由(8.1)知,当k 充分大时,Zk =λ1Z k-1,又由迭代式Z k = AZ k -1,可知AZ k-1=λ1Zk-1故由特征值定义知Z k-1即为λ1对应的特征向量,或Zk =λ1Z k-1为λ1对应的特征向量。
这种求矩阵的按模最大特征值及其对应特征向量的方法称为乘幂法。
应用乘幂法计算A 的按模最大特征值λ1和对应特征向量时,由(8.3)易知
11121k
n
k
i k
i i i Z X X λλααλ=????
??=+
???????∑ 当|λ1|>1或|λ1|<1时,Z k
K 的增大而趋于零,用计算机计算就会出现常将迭代向量Z k 先规范化, 用ma x(Z)表示向量Z k 0112X2 +…+αnXn (α1≠0)构造与(8.2)对应的向量序列。
()()()()()
()()()
10
10011022
020
2
122020200100max max max max max max max max k k k k k k k Z AZ Z AY AZ Z AZ A Z Z A Z Z AY AZ Z A Z A Z Z A Z Z AY AZ Z A Z -?====?
?
??====??
????====
??
,Y ,Y ,Y (8.6) 由(8.3)可知
()()
()()11210
1121max max max max k
n
i i i
k i k i k k
k n k i i i i i X X Z A Z X k Z X A Z X X λααλλααλ==??
+ ???==
=→→∞????
?
+ ? ?????
∑∑Y (8.7)
由(8.3)和(8.6)
()()
()()
()001
1001112111111211max max max max max max k k k k k
n k i i i i k n k k i i i i A Z A Z A Z A Z X X k X X Z λλααλλααλλλ--=--=?? ?== ???
???? ?+ ? ?????=→→∞????
?
+ ? ?????
∑∑max (8.8) 也就是说,在满足定理的条件下,规范化的向量序列Yk 仍收敛到A的按模最大特征值对应的特征向量;而向量序列Z k 的绝对值最大的分量收敛到A 的按模最大的特征值λ1。
例8·1 用规范化的乘幂法求矩阵
13361354454688690??
??=??
??---??
A 按模最大的特征值λ1和对应的特征向量X1。
解:取初始向量Z 0=Y 0=(1,1,1)T ,按(8.6)、(8.7)和(8.8)算得Z k、Y k 和max(Z k ),结果列于下表8—1. 表
经七次选代计算,λ1的近似值m ax(Z7)已稳定到小数点后第五位,故可取A 的按模最大的特征值及对应的特征向量分别为
λ1=44.9995,X 1=(1,0.333,-0.6667)T
我们不难求出矩阵A 的三个特征值是
λ1=45,λ2=2,λ3=1
相应的特征向量为:
X 1=(3,1,-2)T ,X2=(3,2,-3)T ,X3=(2,1,-2)T ,
注:(1)若矩阵A n ×n 的按模最大特征值λ1是P重根时,即
|λ1|=|λ2|=…=|λp |>|λp +1|≥|λn |
容易证明定理1的结论仍成立。 (2)此外,定理1中要求初始向量Z 0的α1≠0是必要的,否则就不能得到对应于λ1的结果。如在例1中若取Z 0=(1,1,-1)T,由此出发迭代便得
λ1=2,X1=(1,0.6667,-1)T
显然,这不是矩阵A 的按模最大的特征值和对应的特征向量,出现这一现象,正是由于α1=0。事实上,由于A 的特征向量X1,X 2,X3是线性无关的,故Z 0=(1,1,-1)T可表示为
Z 0=α1X 1+α2X2+α3X 3 即
?1231231233321212321ααααααααα?++=?
++=??
---=-? 解之得
?1230,1,1ααα===-
(3)乘幂法的收敛速度取决于比值 |λ1/λ1|,当这个比值接近于1时,收敛很慢,反之收敛就比较快。例1是收敛较快的例子,如果收敛很慢,可以配合运用加速技术提高收敛速度。具体可参看西安交通大学出版社出版由邓建中等人编写的《计算方法》一书。
§2 反幂法
反幂法可以计算矩阵按模最小的特征值及对应的特征向量。 设An×n 为非奇异矩阵,则A -1存在。若A 的特征值λ1()满足
|λ1|≥|λ2|≥…≥|λn |>0
对应的特征向量为X 1,X 2, …,X n 。因为AX i =λi X i,所以A -1X i =(1/λi)X i ,即(1/λi )(i=1,2,…,n )是A -1的特征值,它满足 ?
1
1
1
n
λλ≥≥
对应的特征向量仍是X i (i=1,2,…,n)。
这就是说,计算A 的按模最小的特征值λn 只要计算A -1按模最大的特征值 ?1
n
λλ=
,从而1
n λλ
=
,而求A -1的按模最大的特征值只须应用前述的乘幂法即
可。.
所以反幂法的选代向量是: 设初始向量 于是
为避免求逆阵(),由()计算()时,可以通过解线性方程组().
§3 QR 方法
§1、§2 介绍了求矩阵A 的部分特征值的方法,对于求它的全部特征值则有QR 方法.
对矩阵A 、B,若在非奇异矩阵P 使得
则称矩阵A 和B 相似,记A()B ,而称P 为化A 为B 的相似变换,并且由于(), 得知相似矩阵有相同的特征值,又因为 () 有 ()
显然,若()为B 相应在于()的特征向量,则()为A 的相应于()的特征向量. 对于特殊的矩阵,例如上三角矩阵,其特征值即为主对角线上的元素,而任一非齐异矩阵与上三角矩阵的关系则有职下定理:
定理8·2设()的特征值()都为实数,那么必存在直交相似变换Q 化A为上三角矩阵,即
由于(),故也可以说A与R相似.特别当A为对称矩阵时,有
()
这里的直交矩阵Q若能知道,即可求生物电A的特征值,但Q的求得并不那么容易,由此矩阵A的特征值也不可能直接求得.一般可由矩阵A通过直交相似变换构造矩阵列(),使其逐步逼近上三角矩阵R,从而求得矩阵A的满足精度要求的近似特征值及相应的特征向量.
定理8·3任一()总可分解为一个直交矩阵Q和一个上三角矩阵R的乘积(),若A非奇异,则这和分解是唯一的.
证明对矩阵A,依()左乘一系列初等旋转矩阵
()
其中()
当()时.取();()当()时,则取().这里()随A每次左乘()而不断变化,而()随之而变化,从而当()时,
()
当()时有
()
最后当()时,有
()
其中()的符号随()的符号而定,于是
()
令(),显然Q为直交矩阵,故有
()
现再证当A非奇异,则R,Q有逆矩阵存在,于是
()
而()为下交矩阵,()为上三角矩阵,则要其相等,()必为对角阵,又根据()的直交性,便知()为单位矩阵,即
()
所以()
并且显然有()
以上证明实际上为我们提供了对A进行QR分解的具体方法.此外,A的QR分解也可通过()直交化过程来实现.
既然任一非奇异矩阵A总有(),则令(),于是有()
那么()有()于是()与()有相同的特征值.再交()进行QR分解,有
()
则()
并令()
有()
于是()与()有相同的特征值.一般有
()
()
令
有()
()
于是()与()有相同的特征值.可以证明,若非齐异实矩阵A有()个不同模的特征值,即
()
则当()时,()本质上收敛于上三角矩阵R(所谓本质上收敛于上三角矩阵是指矩阵列(),收敛于一个上三角矩阵,而这个上三角矩阵除主对角元素外极限并不要求一定存在),R的主对角线元素即为所求的特征值.特别当A为对称矩阵时,()收敛于对角矩阵D.具体计算中,当()与()的主对角元素相差小于预先给定的业度时,则认为()的主对角线元素即为A的特征值.对于QR分解,其有一个重要特点:当A为对称带宽不变,即若A为三角矩阵,则()仍为三对角矩阵.
习题七
1
1)
2)
3)
4)
2.用QR
1()
2()
3()
的全部特征值勤(精确到10-2).
第九章常微分方程的数值解法
本章讨论一阶常微分方程的初值问题
()
()
这类问题在工程计算中是常见的,例如,对于等截面均匀排风风道,风道内静压分布有如下规律:
()
()
我们知道,只要函数()适当光滑,理论上就可以保证初值问题(9·1)—(9·2)的解()存款额并且是唯一的.虽然求解常微分方程有各种各样的解析方法但解菥方法只能用来求解一些特殊类型的方程,大量从实际问题当中归结出来的微分方程主要靠数值解法.
所谓数值解法,就是寻求初值问题()的解()在一系列离散结点
()
上的近似值
()
相邻两个结点间()称作步长,今后如不特别申明,总假定步长()为定数
下面就介绍几种常邮的数值解法:
§1 欧拉(Euler)方法
初值问题()的解,在几何上是通过点()的一条曲线().欧拉法的求解过程是:先过点()作曲线的切线,该切线与直线()相交于点(),再用()作为曲线上点()的纵坐标()近似值.如图9—1所示.
()
因为过()点以()为斜率的切线方程为
()
当()时得
()
即取(),然后,再过()点,以()为斜率作直线
()
当()时得
()
即取()
一般地,如果已求出()则过此点,以()为斜率作直线
()
当()时得
取()
通过上述过程,就可逐步求出点()所对应的数值解()
欧拉法的几何意义,是用一条折线近似代替曲线().欧拉(Euler)法(也叫欧拉折线法)的计算格式为
()
()
欧拉法是最古老的一种数值解法,它体现了数值方法的基本思想民,但精度很低,单独用它来作计算往往不能满足确度要求.
§2改进的欧拉方法
同一种计算格式往往可以通过多种途径构造出来,本节与下一节就会看到这一点. 为了提高精度,本节以改过的欧拉方法为例,介绍构造计算格式的数值积分方法.交方程(9·1)的两端从()到()求积分,得到
()
为要通过这个积分关系式得()的近似值,只要近似地求出积分项()即可.选择不同的近似方法计算这个积分项会得到不同的计算格式.
例如:用矩形分式计算积分项
()
代入(9·4)得
()
若用()代替上式中的()并交右端的值作为()的近似值().这样建立起来的格式就是欧拉法的计算格式(9·3).由于用矩形公式求积分值很粗糙,故导出欧拉格式精度也很低,不难证明,欧拉格式(9·3)的截断误差为()
即()
为了改造精度,我们必用梯形法计算左端积分
()
()
将其中的()分别用()代替,则有下列计算格式
()
(9·5)式被称为解常微分方程的梯形法则.
应该注意,格式(9·3)与(9·5)有本质上的区别,欧拉格式(9·3)是个直接的计算公式,这类格式称作显式的,而梯形法则(9·5)则由于其右端含有未知的()故被除数称作是隐式的.它实际上是关于(),可以用选代法求解(参看第五章),不过计算量比较大.我们将综合使用这两种格式,先用欧拉格式求得一个初步的近似值(),称为预报值,然后用()代替形法则右端的()再直接计算.得到校正值(),这样建立起来的预报一校正系统称作改进的欧拉格式.
预报()
校正()
格式(9·6)的每一步需要两次调次调用函数(),它可以改写成下列形式;()
欧拉法每一步只需对()调用一次,而改进的欧拉法则不然,需对()用两次,其计算量比欧拉法增加了一倍,付出这种代价的目的是为了提高精度.不难证明,改进的欧拉格式(9·6)的截断误差为(),即
()
由此可见,它比欧拉格式的截断误差提高了一阶.
例9·1解初值部题()
取步长()试求从()到()各结点上的数值解.
解我们分别用两种格式进行计算,这里欧拉式的具体形式是
()
而改进的欧拉格式是
()
计算结果见表9—1
表9—1
第9章矩阵特征值问题的数值 方法 9.1 特征值与特征向量 9.2 Hermite矩阵特征值问题 9.3 Jacobi方法 9.4 对分法 9.5 乘幂法 9.6 反幂法 9.7 QR方法
9.1 特征值与特征向量设A是n阶矩阵,x是非零列向量. 如果有数λ存在,满足, (1) 那么,称x是矩阵A关于特征值λ的特征向量.
如果把(1)式右端写为 ,那么(1)式又可写为: x λ ()0 I A x λ-=||0 I A λ-=即1110 ()||...n n n f I A a a a λλλλλ--=-=++++记 它是关于参数λ的n 次多项式,称为矩阵A 的特 征多项式, 其中a 0=(-1)n |A |. (2)
显然,当λ是A的一个特征值时,它必然 是的根. 反之,如果λ是的根,那么齐次方程组(2)有非零解向量x,使(1)式 成立. 从而,λ是A的一个特征值. A的特征值也称为A的特征根 . ()0 fλ= ()0 fλ=
矩阵特征值和特征向量有如下主要性质: 定理9.1.1 n阶矩阵A是降秩矩阵的充分必要 条件是A有零特征值. 定理9.1.2 设矩阵A与矩阵B相似,那么它们 有相同的特征值. 定理9.1.3 n阶矩阵A与A T有相同的特征值. 定理9.1.4 设λ ≠λj是n阶矩阵A的两个互异特 i 征值,x、y分别是其相应的右特征向 量和左特征向量,那么,x T y=0 .
9.2 Hermite矩阵特征值问题?设A为n阶矩阵,其共轭转置矩阵记为A H. 如果A=A H,那么,A称为Hermite矩阵.
求矩阵特征值算法及程序简介 1.幂法 1、幂法规范化算法 (1)输入矩阵A、初始向量( 0),误差eps; (2) k 1; (3)计算V(k)A(k 1); (4)m k max(V(k)) ,m k1max( V ( k 1)); (5) (k)V(k)/m k; (6)如果m k m k 1eps,则显示特征值1和对应的特征向量x(1) ),终止; (7)k k 1, 转(3) 注:如上算法中的符号max(V )表示取向量V 中绝对值最大的分量。本算法使用了数据规范化处理技术以防止计算过程中出现益出错误。 2、规范化幂法程序 Clear[a,u,x]; a=Input[" 系数矩阵A="]; u=Input[" 初始迭代向量u(0)="]; n=Length[u]; eps=Input[" 误差精度eps ="]; nmax=Input[" 迭代允许最大次数nmax="]; fmax[x_]:=Module[{m=0,m1,m2}, Do[m1=Abs[x[[k]]]; If[m1>m,m2=x[[k]];m=m1], {k,1,Length[x]}]; m2] v=a.u; m0=fmax[u]; m1=fmax[v]; t=Abs[m1-m0]//N; k=0; While[t>eps&&k 第五章 矩阵的特征值与特征向量 5.1矩阵的特征值与特征向量 5.1.1矩阵的特征值与特征向量的概念 设A 是n 阶矩阵,若存在数λ及非零的n 维列向量α,使得:λαα=A (0≠α)成立,则称λ是矩阵A 的特征值,称非零向量α是矩阵A 属于特征值λ的特征向量. 5.1.2矩阵的特征值与特征向量的求法 把定义公式λαα=A 改写为()0=-αλA E ,即α是齐次方程组()0=-x A E λ的非零解.根据齐次方程组有非零解的充分条件可得:0=-A E λ. 所以可以通过0=-A E λ求出所有特征值,然后对每一个特征值i λ,分别求出齐 次方程组()0=-x A E i λ的一个基础解系,进而再求得通解. 【例5.1】求??? ? ? ?????------=324262423A 的特征值和特征向量. 解:根据()()0273 2 4 26 24 23 2 =+-=---= -λλλλλλA E ,可得71=λ,22-=λ. 当7=λ时,??? ? ? ?????? ??? ???????=-0000002124242124247A E , 所以()07=-x A E 的一个基础解系为:()T 0,2,11-=α,()T 1,0,12-=α,则相应的特征向量为2211ααk k +,其中21,k k 是任意常数且()()0,0,21≠k k . 当2-=λ时,???? ? ?????--? ??? ? ??????---=--00012014152428242 52A E ,所以()02=--x A E 的一个基础解系为()T 2,1,23=α,则相应的特征向量为33αk ,其中3k 是任意常数且 第五章矩阵的特征值和特征向量 来源:线性代数精品课程组作者:线性代数精品课程组 1.教学目的和要求: (1) 理解矩阵的特征值和特征向量的概念及性质,会求矩阵的特征值和特征向量. (2) 了解相似矩阵的概念、性质及矩阵可相似对角化的充分必要条件,会将矩阵化为相似对 角矩阵. (3) 了解实对称矩阵的特征值和特征向量的性质. 2.教学重点: (1) 会求矩阵的特征值与特征向量. (2) 会将矩阵化为相似对角矩阵. 3.教学难点:将矩阵化为相似对角矩阵. 4.教学内容: 本章将介绍矩阵的特征值、特征向量及相似矩阵等概念,在此基础上讨论矩阵的对角化问题. §1矩阵的特征值和特征向量 定义1设是一个阶方阵,是一个数,如果方程 (1) 存在非零解向量,则称为的一个特征值,相应的非零解向量称为属于特征值的特 征向量. (1)式也可写成, (2) 这是个未知数个方程的齐次线性方程组,它有非零解的充分必要条件是系数行列式 , (3) 即 上式是以为未知数的一元次方程,称为方阵的特征方程.其左端是的 次多项式,记作,称为方阵的特征多项式. == = 显然,的特征值就是特征方程的解.特征方程在复数范围内恒有解,其个数为方程的次数(重根按重数计算),因此,阶矩阵有个特征值. 设阶矩阵的特征值为由多项式的根与系数之间的关系,不难证明 (ⅰ) (ⅱ) 若为的一个特征值,则一定是方程的根, 因此又称特征根,若为 方程的重根,则称为的重特征根.方程的每一个非 零解向量都是相应于的特征向量,于是我们可以得到求矩阵的全部特征值和特征向量的方法如下: 第一步:计算的特征多项式; 第二步:求出特征方程的全部根,即为的全部特征值; 第三步:对于的每一个特征值,求出齐次线性方程组: 的一个基础解系,则的属于特征值的全部特征向量是 (其中是不全为零的任意实数). 例1 求的特征值和特征向量. 解的特征多项式为 = 第八章 矩阵特征值计算 1 特征值性质和估计 工程实践中有许多种振动问题,如桥梁或建筑物的振动,机械机件的振动,飞机机翼的颤动等,这些问题的求解常常归纳为求矩阵的特征值问题。另外,一些稳定分析问题及相关问题也可以转化为求矩阵特征值与特征向量的问题。 1.1 特征值问题及性质 设矩阵n n ?∈A R (或n n ?C ),特征值问题是:求C λ∈和非零向量n R ∈x ,使 λ=Ax x (1.1) 其中x 是矩阵A 属于特征值λ的特征向量。A 的全体特征值组成的集合记为sp()A 。 求A 的特征值问题(1.1)等价于求A 的特征方程 ()det()0p I λλ=-=A (1.2) 的根。因为一般不能通过有限次运算准确求解()0p λ=的根,所以特征值问题的数值方法只能 是迭代法。反之,有时为了求多项式 111()n n n n q a a a λλλλ--=++++L 的零点,可以把()q λ看成矩阵 123101010n a a a a ----???????????????? L O O 的特征多项式(除(1)n -因子不计)。这是一个Hessenberg 矩阵,可用QR 方法求特征值,从而求出代数方程()0q λ=的根。 矩阵特征值和特征向量的计算问题可分为两类:一类是求矩阵A 的全部特征值及其对应的向量;另一类是求部分特征值(一个或几个、按模最大或最小)及其对应的特征向量。本章介绍部分特征值和特征向量的幂法、内积法;求实对称矩阵全部特征值的雅可比法、Given 方法和Householder 方法;求任意矩阵全部特征值的QR 算法。 在第5章已给出特征值的一些重要性质,下面再补充一些基本性质。 定理1 设n n R ?∈A ,则 (1) 设λ为A 的特征值,则λμ-为μ-A I 的特 第五章 矩阵的特征值与特征向量 习题 1 试用施密特法把下列向量组正交化 (1)?? ? ? ? ??=931421111) , ,(321a a a (2)???? ?? ? ??---=011101110111) , ,(321a a a 2 设x 为n 维列向量 x T x 1 令H E 2xx T 证明H 是对称的正交 阵 3 求下列矩阵的特征值和特征向量: (1)??? ?? ??----20133 521 2; (2)??? ? ? ??633312321. 4 设A 为n 阶矩阵 证明A T 与A 的特征值相同 5 设 0是m 阶矩阵A m n B n m 的特征值 证明 也是n 阶矩阵BA 的特 征值. 6 已知3阶矩阵A 的特征值为1 2 3 求|A 35A 2 7A | 7 已知3阶矩阵A 的特征值为1 2 3 求|A * 3A 2E | 8 设矩阵??? ? ? ??=50413102x A 可相似对角化 求x 9 已知p (1 1 1)T 是矩阵???? ? ??---=2135212b a A 的一个特征向量 (1)求参数a b 及特征向量p 所对应的特征值 (2)问A 能不能相似对角化?并说明理由 10 试求一个正交的相似变换矩阵, 将对称阵??? ? ? ??----020212022化为对角 阵. 11 设矩阵????? ??------=12422421x A 与??? ? ? ? ?-=Λy 45 相似 求x y 并 求一个正交阵P 使P 1AP 12 设3阶方阵A 的特征值为1 2 2 2 3 1 对应的特征 向量依次为p 1 (0 1 1)T p 2(1 1 1)T p 3(1 1 0)T 求A . 13 设3阶对称矩阵A 的特征值 1 6 2 3 3 3 与特征值 1 6对应的特征向量为p 1 (1 1 1)T 求A . 14 设?? ? ? ? ??-=340430241A 求A 100 第八章 矩阵的特征值与特征向量的数值解法 某些工程计算涉及到矩阵的特征值与特征向量的求解。如果从原始矩阵出发,先求出特征多项式,再求特征多项式的根,在理论上是无可非议的。但一般不用这种方法,因为了这种算法往往不稳定.常用的方法是迭代法或变换法。本章介绍求解特征值与特征向量的一些方法。 §1 乘幂法 乘幂法是通过求矩阵的特征向量来求特征值的一种迭代法,它适用于求矩阵的按模最大的特征值及对应的特征向量。 定理8·1 设矩阵An ×n 有n 个线性无关的特征向量X i(i=1,2,…,n),其对应的特征值λi (i =1,2,…,n)满足 |λ1|>|λ2|≧…≧|λn | 则对任何n维非零初始向量Z 0,构造Zk = AZ k-1 11()lim ()k j k k j Z Z λ→∞ -= (8·1) 其中(Zk )j表示向量Z k 的第j个分量。 证明 : 只就λi是实数的情况证明如下。 因为A 有n 个线性无关的特征向量X i ,(i = 1,2,…,n)用X i(i = 1,2,…,n)线性表示,即Z 0=α1X 1 + α2X2 +用A 构造向量序列{Z k }其中 ? 21021010, ,k k k Z AZ Z AZ A Z Z AZ A Z -=====, (8.2) 由矩阵特征值定义知AXi =λi X i (i=1,2, …,n),故 ? 0112211122211121k k k k k n n k k k n n n k n k i i i i Z A Z A X A X A X X X X X X ααααλαλαλλλααλ===++ +=+++???? ??=+ ?????? ? ∑ (8.3) 同理有 1 1 11 1121k n k i k i i i Z X X λλααλ---=? ? ????=+ ????? ? ? ∑ (8.4) 将(8.3)与(8.4)所得Zk 及Z k-1的第j 个分量相除,设α1≠0,并且注意到 |λi |<|λ1|(i=1,2,…,n )得 矩阵特征值和特征向量解法的研究 周雪娇 (德州学院数学系,山东德州 253023) 摘 要:对矩阵特征值和特征向量的一些方法进行了系统的归纳和总结.在比较中能够 更容易发现最好的方法,并提高问题的解题效率. 关键词: 矩阵; 特征值; 特征向量; 解法 引言 矩阵是数学中的一个重要的基本概念,是代数学的一个主要研究对象,也是数学研究和应用的一个重要工具.矩阵计算问题是很多科学问题的核心.在很多工程计算中,常常会遇到特征值和特征向量的计算问题,如:机械、结构或电磁振动中的固有值问题;物理学中的各种临界值等,这些特征值的计算往往意义重大.很多科学问题都要归结为矩阵计算的问题,在这里主要研究矩阵计算中三大问题之——特征值问题. 1 矩阵特征值与特征向量的概念及性质 1.1 矩阵特征值与特征向量的定义 设A 是n 阶方阵,如果存在数λ和n 维非零向量x ,使得x Ax λ=成立,则称 λ为A 的特征值,x 为A 的对应于特征值λ的特征向量. 1.2 矩阵特征值与特征向量的性质 矩阵特征值与特征向量的性质包括: (1)若i i r A 的是λ重特征值,则i i s A 有对应特征值λ个线性无关的特征向量,其中i i r s ≤. (2)若线性无关的向量21,x x 都是矩阵A 的对应于特征值0λ的特征向量,则当21,k k 不全为零时,2211x k x k +仍是A 的对应于特征值0λ的特征向量. (3)若A n 是矩阵λλλ,,,21 的互不相同的特征值,其对应的特征向量分别是 n x x x ,,,21 ,则这组特征向量线性无关. (4)若矩阵()n n ij a A ?=的特征值分别为n λλλ,,,21 ,则 nn n a a a +++=+++ 221121λλλ,A n =λλλ 21. (5)实对称矩阵A 的特征值都是实数,且对应不同特征值的特征向量正交. (6)若i λ是实对称矩阵A 的i r 重特征值,则对应特征值i λ恰有i r 个线性无关的特征向量. (7)设λ为矩阵A 的特征值,()x P 为多项式函数,则()λP 为矩阵多项式()A P 的特征值.[]1 2 普通矩阵特征值与特征向量的求法 2.1 传统方法 确定矩阵A 的特征值和特征向量的传统方法可以分为以下几步: (1)求出矩阵A 特征多项式()A E f -=λλ的全部特征根; (2)把所求得的特征根()n i i ,,2,1 =λ逐个代入线性方程组()0=-X A E i λ, 对于每一个特征值,解方程组()0=-X A E i λ,求出一组基础解系,这样,我们也就求出了对应于每个特征值的全部线性无关的特征向量.[]2 例1 已知矩阵 ???? ? ?????-=11 111 110 A 求矩阵A 的特征值和特征向量. 解 A E -λ = 1 1 1 1 1 11 ------λλλ = ()21-λλ 所以,由()012=-λλ知A 的特征根1,0321===λλλ. 第六章 矩阵特征值问题及二次型 6.1 求下列矩阵的特征值与特征向量: 1); 2); 3); ????????4221?????????????6123020663???? ????????3202300054); 5). ??????????422242224????????????? ?00011000010000106.2 设,证明:和有完全相同的特征值。 n n A A ×=T A A 6.3 设12=λ为方阵的特征值,求满足的关系式。 ???? ?????????=a b A 4417447b a ,6.4 设,证明:若有一个常数项不为零的多项式n n A A ×=)(x ?使得0)(=A ?,则的特征值必全不为零。 A 6.5 设λ为阶可逆方阵的特征值,证明:n A 12 +?? ????λA 是()I A +?2的特征值。 6.6 设21,λλ是方阵的两个互异的特征值,A 21,ξξ分别是的属于特征值A 21,λλ的特征向量,证明:21ξξ+不是的特征向量。 A 6.7 设321,,λλλ是方阵的三个互异的特征值,A 321,,ξξξ分别是的属于特征值A 321,,λλλ的特征向量,证明:321ξξξ++不是的特征向量。 A 6.8 设均为阶方阵且可逆,证明:~ B A ,n A AB .BA 6.9 设;求. ????????? ?????=163053064A 10A 6.10 设为2阶实方阵,且A 0trA ,则相似于对角阵A 第八章矩阵的特征值和特征向量的计算 矩阵的特征值和特征向量 乘幂法 反幂法 矩阵特征值和特征向量计算 特征值与特征向量A x = λx ( λ∈C ,x ≠0 ) 性质 (1)tr(A ) = a 11+ a 22+ ???+ a nn = λ1 + λ2+ ???+ λn (2)det(A ) = λ1 λ2???λn (3)若B = P -1AP 则A 与B 具有相同的特征值;x 是B 的特征向量?Px 是A 的特征向量. /* Calculation of Eigenvalue and Eigenvector of Matrix */ 乘幂法 乘幂法:计算实矩阵按模最大的特征值 假设:(1) |λ1| >|λ2| ≥…≥|λn | ≥0 (2)对应的n 个线性无关特征向量为:x 1, x 2, ..., x n 。 计算过程:任取一个非零向量v ,要求满足(x 1,v )≠0 计算v 1=Av 0, v 2=Av 1, ..., v k +1=Av k , ...,直到收敛。 收敛分析 011221(0) n n v x x x αααα=+++≠10111222n n n v Av x x x αλαλαλ==+++111 1222k k k k k n n n v Av x x x αλαλαλ-==+++ 21112211k k k n n n x x x λλλαααλλ??????=+++?? ? ????????? 1 11 k x λα 当k 充分大时,有 1 11k k v x λα≈11111 k k v x λα++≈11k k v v λ+≈又1k k v Av +=1k k Av v λ≈()()11 k j k j v v λ+≈( j =1, 2, ... , n ) v k 为λ1的近似特征向量 乘幂法的收敛速度取决于的大小。 21 r λλ=算法(乘幂法) 任取非零向量v 0,计算 1. v k +1 = Av k 2. 对v k 中所有非零分量(v k )j ,判断是否近似于某个常 数,如果是,则停机;否则转第1 步。 ()()1k j k j v v +乘幂法 习题 1. (1) 若A 2 = E ,证明A 的特征值为1或-1; (2) 若A 2 = A ,证明A 的特征值为0或1. 证明(1)2 2A E A =±所以的特征值为1,故A 的特征值为1 (2) 2222 2 ,,()0,001 A A A X A X AX X X X λλλλλλλ===-=-==所以两边同乘的特征向量得即由于特征向量非零,故即或 2. 若正交矩阵有实特征值,证明它的实特征值为1或 -1. 证明 1,1 T T T A A A E A A A A A λλλλ -=∴==±设是正交阵,故有与有相同的特征值, 1 故设的特征值是,有=,即 3.求数量矩阵A=aE 的特征值与特征向量. 解 A 设是数量阵,则 000000000000a a A aE a a a E A a λλλλ?? ? ?== ? ??? ---= -L L L L L L L L L L L L 所以:特征值为a (n 重), A 属于a 的特征向量为 k 1(1,0,…,0)T + k 2(0,1,…,0)T + k n (0,0,…,1)T ,(k 1, k 2, …, k n 不全为0) 4.求下列矩阵的特征值与特征向量. (1)113012002-?? ? ? ??? (2)324202423?? ? ? ??? (3)??? ?? ??---122212 221 (4)212533102-?? ?- ? ?--?? ()1112221211(5) , , (0,0)0.T T n n n n a a b a a b A b b b a b a a b αβαβαβ?? ???? ? ? ? ? ? ?====≠≠= ? ? ? ? ? ? ? ? ??? ???? L M M M 其中,且 解(1) 11 3 0120,1,2,00 2A E AX λλλ λλλλ ---=-====-0,123求得特征值为:分别代入=求得 A 属于特征值1的全部特征向量为k(1,0,0)T ,(k ≠0) A 属于特征值2的全部特征向量为k(1,2,1)T ,(k ≠0) 解(2) 9 矩阵特征值计算 在实际的工程计算中,经常会遇到求n 阶方阵 A 的特征值(Eigenvalue)与特征向量(Eigenvector)的问题。对于一个方阵A,如果数值λ使方程组 Ax=λx 即(A-λI n )x=0 有非零解向量(Solution Vector)x,则称λ为方阵A的特征值,而非零向量x为特征值λ所对应的特征向量,其中I n 为n阶单位矩阵。 由于根据定义直接求矩阵特征值的过程比较复杂,因此在实际计算中,往往采取一些数值方法。本章主要介绍求一般方阵绝对值最大的特征值的乘幂(Power)法、求对称方阵特征值的雅可比法和单侧旋转(One-side Rotation)法以及求一般矩阵全部特征值的QR 方法及一些相关的并行算法。 1.1 求解矩阵最大特征值的乘幂法 1.1.1 乘幂法及其串行算法 在许多实际问题中,只需要计算绝对值最大的特征值,而并不需要求矩阵的全部特征值。乘幂法是一种求矩阵绝对值最大的特征值的方法。记实方阵A的n个特征值为λi i=(1,2, …,n),且满足: │λ1 │≥│λ2 │≥│λ3 │≥…≥│λn │ 特征值λi 对应的特征向量为x i 。乘幂法的做法是:①取n维非零向量v0 作为初始向量;②对于 k=1,2, …,做如下迭代: 直至u k+1 ∞ - u k u k =Av k-1 v k = u k /║u k ║∞ <ε为止,这时v k+1 就是A的绝对值最大的特征值λ1 所对应的特征向∞ 量x1 。若v k-1 与v k 的各个分量同号且成比例,则λ1 =║u k ║∞;若v k-1 与v k 的各个分量异号且成比例,则λ1 = -║u k ║∞。若各取一次乘法和加法运算时间、一次除法运算时间、一次比较运算时间为一个单位时间,则因为一轮计算要做一次矩阵向量相乘、一次求最大元操作和一次规格化操作,所以下述乘幂法串行算法21.1 的一轮计算时间为n2+2n=O(n2 )。 算法21.1 单处理器上乘幂法求解矩阵最大特征值的算法 输入:系数矩阵A n×n ,初始向量v n×1 ,ε 输出:最大的特征值m ax Begin while (│diff│>ε) do (1)for i=1 to n do (1.1)sum=0 (1.2)for j= 1 to n do sum=sum+a[i,j]*x[j] end for 第3章 矩阵特征值与特征向量的计算 一些工程技术问题需要用数值方法求得矩阵的全部或部分特征值及相关的特征向量。 3.1 特征值的估计 较粗估计ρ(A ) ≤ ||A || 欲将复平面上的特征值一个个用圆盘围起来。 3.1.1 盖氏图 定义3.1-1 设A = [a ij ]n ?n ,称由不等式∑≠=≤-n i j j ij ii a a z 1 所确定的复区域为A 的第i 个盖氏图, 记为G i ,i = 1,2,…,n 。 >≤-=<∑≠=}:{1n i j j ij ii i a a z z G 定理3.1-1 若λ为A 的特征值,则 n i i G 1 =∈ λ 证明:设Ax = λx (x ≠ 0),若k 使得∞ ≤≤==x x x i n i k 1max 因为 k n j j kj x x a λ=∑=1 ?∑≠= -n k j j kj k kk x a x a )(λ ?∑∑∑ ≠=≠=≠≤≤= -n k j j kj n k j j k j kj n k j k j kj kk a x x a x x a a 11λ ? n i i k G G 1 =? ∈λ 例1 估计方阵????? ?? ?? ???----=41 .03.02.05.013.012.01 .035.03.02.01.01A 特征值的范围 解: G 1 = {z :|z – 1|≤ 0.6};G 2 = {z :|z – 3|≤ 0.8}; G 3 = {z :|z + 1|≤ 1.8};G 4 = {z :|z + 4|≤ 0.6}。 注:定理称A 的n 个特征值全落在n 个盖氏圆上,但未说明每个圆盘内都有一个特征值。 3.1.2 盖氏圆的连通部分 称相交盖氏圆之并构成的连通部分为连通部分。 孤立的盖氏圆本身也为一个连通部分。 定理3.1-2 若由A 的k 个盖氏圆组成的连通部分,含且仅含A 的k 个特征值。 证明: 令D = diag(a 11,a 12,…,a nn ),M = A – D ,记 )10(00 0)(2 1 22111222 11≤≤?? ?? ? ? ? ??+??????? ? ?=+=εεεε n n n n nn a a a a a a a a a M D A 则显然有A (1) = A ,A (0) = D ,易知A (ε)的特征多项式的系数是ε的多项式,从而A (ε)的特征 值λ1(ε),λ2(ε),…,λn (ε)为ε的连续函数。 A (ε)的盖氏圆为:)10(,}||||:{)(11≤≤?=≤ -=∑∑≠=≠=εεεεi n i j j ij n i j j ij ii i G a a a z z G 因为A (0) = D 的n 个特征值a 11,a 12,…,a nn ,恰为A 的盖氏圆圆心,当ε由0增大到1时,λi (ε)画出一条以λi (0) = a ii 为始点,λi (1) = λi 为终点的连续曲线,且始终不会越过G i ; 不失一般性,设A 开头的k 个圆盘是连通的,其并集为S ,它与后n – k 个圆盘严格分离,显然,A (ε)的前k 个盖氏圆盘与后n – k 个圆盘严格分离。 当ε = 0时,A (0) = D 的前k 个特征值刚好落在前k 个圆盘G 1,…,G k 中,而另n – k 个特征值则在区域S 之外,ε从0变到1时, k i i G 1 )(=ε与 n k i i G 1 )(+=ε始终分离(严格) 。连续曲线始终在S 中,所以S 中有且仅有A 的k 个特征值。 注:1) 每个孤立圆中恰有一个特征值。 2) 例1中G 2,G 4为仅由一个盖氏圆构成的连通部分,故它们各有一个特征值,而G 1,G 3构成的连通部分应含有两个特征值。 3) 因为例1中A 为实方阵,所以若λ为A 的特征值,则λ也是A 的特征值,所以G 2,G 4 矩阵特征值和特征向量的几何意义(---by 小马哥整理) 从定义来理解特征向量的话,就是经过一个矩阵变换后,空间沿着特征向量的方向上相当于只发生了缩放,比如我们考虑下面的矩阵: A=1.50.50.5 1.0?????? 求这个变换的特征向量和特征值,分别是:0.850.530.530.85U -??=???? (列向量) 特征值为:1λ=1.81,2λ=0.69 注意,这里U 是正交矩阵,根据正交矩阵的性质,我们有1T U U -=。 用一个形象的例子来说明一下几何意义,我们考虑下面笑脸图案: 图1.1 为方便演示笑脸图案在[0,0]和[1,1]围起来的单位正方形里,同时也用两个箭头标出来了特征向量的方向。经过矩阵A=1.50.50.5 1.0?????? 的变换,也就是用这个图案中的每个点的坐标和这个矩阵做乘法,得到下面图案: 图1.1 可以看到就是沿着两个正交的,特征向量的方向进行了缩放。 根据特征向量的定义,我们知道1U AU -=Λ,也即,T U AU =Λ,那么:T A U U =Λ 假设我们把笑脸图案也看作某一个矩阵C ,那么,矩阵A*C ,即把矩阵A 作用于C ,可以理解为:T U U C Λ我们从这个式子就可以看出来,A 矩阵是从旋转和沿轴缩放的角度来作用于C ,分成三步: 第一步,把特征向量所指的方向分别转到横轴和纵轴,这一步相当于用U 的转置,也就是T U 进行了变换 图1.2 第二步,然后把特征值作为缩放倍数,构造一个缩放矩阵1.81 0.69?????? ,矩阵分别沿着横轴和纵轴进行缩放: 图1.3 第三步,很自然地,接下来只要把这个图案转回去,也就是直接乘U 就可以了 图1.4第五章 矩阵的特征值与特征向量
矩阵的特征值和特征向量
第8章 矩阵特征值计算
矩阵的特征值与特征向量习题
第八章矩阵的特征值与特征向量的数值解法
矩阵特征值和特征向量解法的研究
矩阵特征值问题及二次型
第八章 矩阵的特征值和特征向量的计算
第五章 习题与复习题详解(矩阵特征值和特征向量)----高等代数
并行计算-矩阵特征值计算--
3矩阵特征值与特征向量的计算
矩阵特征值和特征向量的几何意义