第八章矩阵的特征值与特征向量的数值解法
- 格式:doc
- 大小:164.50 KB
- 文档页数:11
矩阵的特征值与特征向量矩阵是线性代数中的一个重要概念,具有广泛的应用领域。
在矩阵的运算中,特征值与特征向量是矩阵理论中的重要内容,具有很多重要的性质和应用。
本文将详细介绍矩阵的特征值与特征向量的定义、计算方法及其应用。
特征值与特征向量的定义给定一个n阶方阵A,如果存在一个n维非零向量X,使得AX=λX,其中λ为一个常数,则我们称λ为矩阵A的特征值,X为矩阵A对应于特征值λ的特征向量。
特征值与特征向量的计算方法求解矩阵的特征值与特征向量的计算方法主要有两种:特征多项式法和迭代法。
1. 特征多项式法特征多项式法是求解矩阵特征值与特征向量最常用的方法之一。
具体步骤如下:(1)设A是一个n阶矩阵,I是n阶单位矩阵,记为I_n。
(2)定义特征多项式为f(λ)=|A-λI_n|,其中|A-λI_n|表示A-λI_n的行列式。
(3)求解f(λ)=0的根,即为矩阵A的特征值。
(4)将特征值代入方程(A-λI_n)X=0,求解Ax=λX,即可得到矩阵A对应于特征值λ的特征向量。
2. 迭代法迭代法是求解特征值与特征向量的一种数值方法。
它通过不断迭代矩阵的幂,逐渐逼近特征值与特征向量。
具体步骤如下:(1)选择一个任意的非零向量X_0作为初始向量。
(2)计算矩阵A与初始向量X_0的乘积AX_0。
(3)根据公式X_1=AX_0/|AX_0|,其中|AX_0|表示AX_0的模长。
(4)重复上述步骤,计算X_2=AX_1/|AX_1|,X_3=AX_2/|AX_2|,直到收敛。
(5)当向量X_k满足|AX_k-AX_{k-1}|<ε时,停止迭代,其中ε为预先设定的误差限。
特征值与特征向量的应用特征值与特征向量在实际应用中具有广泛的价值,下面将介绍其在不同领域的应用。
1. 物理学中的应用在量子力学和固体物理学中,特征值和特征向量描述了问题的能量和波函数。
通过求解薛定谔方程,可以得到物质的特征值与特征向量,从而研究其电子能级和波函数分布。
第八章 矩阵的特征值与特征向量的数值解法某些工程计算涉及到矩阵的特征值与特征向量的求解。
如果从原始矩阵出发,先求出特征多项式,再求特征多项式的根,在理论上是无可非议的。
但一般不用这种方法,因为了这种算法往往不稳定。
常用的方法是迭代法或变换法。
本章介绍求解特征值与特征向量的一些方法。
§1 乘幂法乘幂法是通过求矩阵的特征向量来求特征值的一种迭代法,它适用于求矩阵的按模最大的特征值及对应的特征向量。
定理8·1 设矩阵A n ×n 有n 个线性无关的特征向量X i (i=1,2,…,n ),其对应的特征值λi (i =1,2,…,n)满足|λ1|〉|λ2|≧…≧|λn |则对任何n 维非零初始向量Z 0,构造Z k = AZ k —1(k=1,11()lim()k j k k jZ Z λ→∞-= (8·1)其中(Z k )j 表示向量Z k 的第j 个分量。
证明 : 只就λi 是实数的情况证明如下. 因为A 有n 个线性无关的特征向量X i ,(i = 1,2,…,n 可用X i (i = 1,2,…,n)线性表示,即Z 0=α1X 1 + α2X 2 +用A 构造向量序列{Z k }其中 21021010,,k k k Z AZ Z AZ A Z Z AZ A Z -=====, (8.2)由矩阵特征值定义知AX i =λi X i (i=1,2, …,n),故0112211122211121k k k k k n nk k k n n nknki i i i Z A Z A X A X A X X X X X X ααααλαλαλλλααλ===+++=+++⎡⎤⎛⎫⎢⎥=+⎪⎢⎥⎝⎭⎣⎦∑ (8。
3)同理有11111121k nk i k i i i Z X X λλααλ---=⎡⎤⎛⎫⎢⎥=+ ⎪⎢⎥⎝⎭⎣⎦∑ (8.4) 将(8。
3)与(8。
4)所得Z k 及Z k —1的第j 个分量相除,设α1≠0,并且注意到 |λi |<|λ1|(i=1,2,…,n)得11()lim()k j k k jZ Z λ→∞-= 证毕定理8·1的证明过程实际上是给出了矩阵的按模最大特征值的计算方法:1) 先任取一非零向量Z 0,一般可取Z 0=(1,1,1)T ; 2) 按(8.2)式计算Z k =AZ k-1(k=1,2,…); 3) 当K 足够大时,即可求出11()()k j k jZ Z λ-=,为了减少λ1对于所选的第j 个分量的依赖性,还可用各个分量比的平均值来代替,即111()()nk jjk jZ Z nλ=-=∑关于对应于λ1的特征向量的计算:由(8。
特征值和特征向量计算的数值方法在数学和计算机科学领域中,特征值和特征向量是非常重要的概念。
特征值和特征向量的计算有许多不同的数值方法,本文将介绍其中一些常见的数值方法,并分析它们的优劣和适用范围。
一、特征值和特征向量的定义在矩阵理论中,给定一个n×n的矩阵A,如果存在一个非零向量v和一个标量λ,使得Av=λv,那么称v为矩阵A的特征向量,λ为矩阵A的特征值。
特征值和特征向量的计算可以帮助我们理解矩阵的性质以及解决一些实际问题。
二、幂法幂法是计算特征值和特征向量的常用数值方法之一。
幂法的基本思想是通过多次迭代,逐渐逼近矩阵的特征值和特征向量。
具体操作如下:1. 初始化一个非零向量b0;2. 进行迭代计算:bi+1 = A * bi / ||A * bi||;3. 取出近似特征向量的最后一列:v = bn;4. 进行迭代计算特征值:λ = (Av)T * v / (vT * v)。
幂法的主要优点是简单易懂,且只需要进行矩阵向量乘法和内积计算。
然而,幂法仅能求取具有最大特征值的特征向量,而且对于存在多个特征值相等的情况并不适用。
三、反幂法反幂法是幂法的一种改进方法,用于求取矩阵A的最小特征值和对应的特征向量。
反幂法的基本步骤如下:1. 初始化一个非零向量b0;2. 进行迭代计算:bi+1 = (A - μI)^-1 * bi / ||(A - μI)^-1 * bi||;3. 取出近似特征向量的最后一列:v = bn;4. 进行迭代计算特征值:λ = (Av)T * v / (vT * v)。
反幂法的改进之处在于引入了矩阵的逆运算,通过使用矩阵A减去一个合适的常数μ乘以单位矩阵来实现。
反幂法适用于矩阵A的特征值接近于μ的情况。
四、QR方法QR方法也是一种常用的特征值计算方法,它适用于求解所有特征值以及对应的特征向量。
QR方法的基本思想是将一个矩阵分解为正交矩阵Q和上三角矩阵R的乘积,然后迭代地将矩阵A转化为更接近上三角形的形式。
特征值与特征向量矩阵特征值与特征向量的求解方法特征值和特征向量是线性代数中重要的概念,广泛应用于许多领域,如物理学、工程学和计算机科学等。
在本文中,我们将探讨特征值和特征向量的定义、求解方法及其在实际问题中的应用。
一、特征值与特征向量的定义特征值是一个矩阵所具有的与矩阵的线性变换性质有关的一个数值,特征向量是对应于特征值的非零向量。
对于一个n阶矩阵A,如果存在一个非零向量x和一个数λ,使得满足Ax=λx,那么λ就是矩阵A的一个特征值,x是对应于特征值λ的特征向量。
二、求解特征值与特征向量的方法有几种方法可以求解特征值和特征向量,其中比较常用的是特征多项式法和迭代法。
1. 特征多项式法特征多项式法是通过求解特征方程的根来得到特征值。
对于一个n阶矩阵A,其特征多项式定义为det(A-λI)=0,其中I是n阶单位矩阵,det表示行列式运算。
将特征多项式置为零,可以得到n个特征值λ1,λ2,...,λn。
将每个特征值代入原矩阵A-λI,解线性方程组(A-λI)x=0,就可以得到对应的特征向量。
2. 迭代法迭代法是通过不断迭代矩阵的特征向量逼近实际的特征向量。
常用的迭代方法包括幂法、反幂法和Rayleigh商迭代法。
幂法是通过不断迭代向量Ax的归一化来逼近特征向量,其基本原理是向量Ax趋近于特征向量。
反幂法是幂法的反向操作,通过求解(A-λI)y=x逼近特征向量y。
Rayleigh商迭代法是通过求解Rayleigh商的最大值来逼近特征向量,其中Rayleigh商定义为R(x)=x^T Ax/(x^T x),迭代公式为x(k+1)=(A-λ(k)I)^(-1)x(k),其中λ(k)为Rayleigh商的最大值。
三、特征值与特征向量的应用特征值与特征向量在实际问题中有广泛的应用。
其中,特征值可以用于判断矩阵是否可逆,当且仅当矩阵的所有特征值均不为零时,矩阵可逆。
特征向量可用于描述矩阵的稳定性和振动状态,如在结构工程中可以通过求解特征值和特征向量来分析物体的固有频率和振动模态。
第八章 矩阵地特征值与特征向量地数值解法某些工程计算涉及到矩阵地特征值与特征向量地求解 .如果从原始矩阵出发,先求 出特征多项式,再求特征多项式地根,在理论上是无可非议地•但一般不用这种方 法,因为了这种算法往往不稳定•常用地方法是迭代法或变换法•本章介绍求解特 征值与特征向量地一些方法•§ 1乘幂法乘幕法是通过求矩阵地特征向量来求特征值地一种 迭代法,它适用于求矩阵 地按模最大地特征值 及对应地特征向量.b5E2RGbCAP 定理8 • 1设矩阵Ai x n 有n 个线性无关地特征向量 X<i=1,2,…,n ),其对应地特征 值入 i (i =1,2,…,n> 满足 plEanqFDPw|入1|>|入2|三…三|入n |则对任何n 维非零初始向量 乙,构造Z k = AZ k-1(k=1,2.其中(Z k >j 表示向量Z<地第j 个分量. 证明:只就入i 是实数地情况证明如下 因为A 有n 个线性无关地特征向量X,<i = 1,2,用X<i = 1,2, …,n )线性表示,即Z 0=a 1X 1 + 用A 构造向量序列{Z k }其中由矩阵特征值定义知 AXm i X(i=1,2,…,n>,故Z k 二A k Z^ :1A k X^ : 2A k X 2nA kX n 「T ;X1 *〉2';X2- :'n'n Xn同理有li m (ZQ j_______________ <22?=■ 1<8 • 1) Z 1 二 AZ 0,乙二 AZ= A^Z。
,川,Zk-AZ kj-A Zo(8・2>- k' nkTX ii zz2-nJ 2-7k -AZk」=人X ii =2<A1」<8.3)<8.4 ),设a 1工0,并且注意到…,n )所以任何非零向量Z o 都可 a 2茨 + …+a nX <a 1 工 0) DXDiTa9E3d将<8.3 )与<8.4 )所得乙及Z k-1地第j个分量相除| 入i|<| 入…,n> 得RTCrpUDGiT1|(i=1,2,定理8 • 1地证明过程实际上是给出了矩阵地按模最大特征值地计算方法:1) 先任取一非零向量Z 0, 一般可取Z o =(1,1,1> T; 2) 按<8.2 )式计算 乙=AZ -i (k=1,2,…>;3)当K足够大时,即可求出詔;=6为了减少"1对于所选地第j个分量地依赖性,还可用各个分量比地平均值来代替,即关于对应于入1地特征向量地计算:由<8.1 )知,当k 充分大时,Z k =入1Z k-1,又由迭代式 Z k = AZ k-1,可知AZ k-1 =入1Z k-1故 由特征值定义知 Z k-1即为入1对应地特征向量,或Z k =入1Z k-1为入1对应地特征向 量.5PCzVD7HxA这种求矩阵地按模最大特征值及其对应特征向量地方法称为 乘幕法. 应用乘幕法计算A 地按模最大特征值入1和对应特征向量时,由<8.3)易知Z k = *-n厲入+送码J y1X ii 2当|入1|>1或|入1|<1时,Z k 中不为零地分量将会随 K 地增大而无限增大,或随K 地 「 ------------ 增大而趋于零,用计算机计算就会出现“上溢”或“下溢” .为了克服这个缺点,一」无 穷 常将迭代向量 乙先规范化,然后再计算,具体做法是:jLBHrnAILg 一,一用max (Z>S 示向量Z k 地绝对值最大地分量,任取一初始向量Z o =a 1X 1+ a 汎+…+ a n X^V a 1工0)构造与<8.2 )对应地向量序列.xHAQX74J0XAZ o由<8.3)可知Yk = maZk A kZ o max A kZ o max n:X 亠1 1 j ii =2X inM • r ii -2X i丿丿(k tmax X i<8.7J 二 AYA 2Z omax AZ0J 'max 乙max AZ oA 2Z 。
矩阵的特征值和特征向量的计算在线性代数中,矩阵的特征值和特征向量是一对重要的概念。
它们可以帮助我们了解矩阵的性质和特点,对于很多问题的求解具有重要的意义。
本文将详细介绍矩阵特征值和特征向量的计算方法。
一、特征值和特征向量的定义对于 n 阶方阵 A,如果存在非零向量 v 使得Av = λv,其中λ 是一个常数,则称λ 为矩阵 A 的特征值,v 称为对应于特征值λ 的特征向量。
特征值和特征向量的计算可以帮助我们理解矩阵的线性变换效果,以及在某些问题中起到重要的作用。
二、特征值和特征向量的计算方法要计算一个矩阵的特征值和特征向量,我们可以按照以下步骤进行:1. 首先,我们需要求解特征方程 det(A - λI) = 0,其中 A 是待求矩阵,λ 是一个待定常数,I 是单位矩阵。
这个方程是由特征向量的定义出发得到的。
2. 解特征方程可以得到一组特征值λ1, λ2, ... , λn。
这些特征值就是矩阵的特征值,它们可以是实数或复数。
3. 对于每一个特征值λi,我们需要求解方程组 (A - λiI)v = 0,其中 v 是待求特征向量。
这个方程组的解空间就是对应于特征值λi 的特征向量的集合。
4. 对于每一个特征值λi,我们需要求解出它对应的特征向量 vi。
特征向量的计算需要利用高斯消元法或其他适用的方法。
这样,我们就可以计算出矩阵的所有特征值和对应的特征向量。
三、特征值和特征向量的应用矩阵的特征值和特征向量在很多领域有着广泛的应用,以下是其中一些常见的应用:1. 特征值和特征向量可以帮助我们理解矩阵的性质。
例如,特征值的数量可以告诉我们矩阵的维度,而特征向量可以描述矩阵的线性变换效果。
2. 特征值和特征向量在图像处理和模式识别领域有着重要的应用。
通过矩阵的特征向量,我们可以提取图像的特征,进而进行分类和识别。
3. 特征值和特征向量在物理学中也有着广泛的应用。
它们可以用于描述量子力学中的粒子运动,电路中的振动模式等。
矩阵的特征值与特征向量的计算矩阵特征值与特征向量是线性代数中一个重要的概念,应用广泛于数学、物理、计算机科学等领域。
本文将介绍矩阵的特征值与特征向量的定义、计算方法,以及其在实际问题中的应用。
一、矩阵特征值与特征向量的定义对于一个n阶矩阵A,若存在一个非零向量X使得AX=kX,其中k 为一个标量,则称k为矩阵A的一个特征值,X为对应于特征值k的特征向量。
特征值与特征向量的计算是一个求解矩阵特征值问题的过程,这在实际中具有很大的意义。
接下来,我们将介绍矩阵特征值与特征向量的计算方法。
二、矩阵特征值与特征向量的计算方法计算矩阵的特征值与特征向量有多种方法,其中比较常用的方法是特征值分解和特征方程。
1. 特征值分解特征值分解是将一个矩阵表示为特征向量矩阵和特征值矩阵相乘的形式,即A=VΛV^-1。
其中,V是由特征向量构成的矩阵,Λ是由特征值构成的对角矩阵。
特征值分解的计算步骤如下:(1)求解矩阵A的特征方程det(A-λI)=0,其中I为单位矩阵。
(2)解特征方程,得到矩阵A的特征值λ1、λ2、...、λn。
(3)代入特征值,求解方程组(A-λI)X=0,其中X为特征向量。
(4)将得到的特征向量按行组成矩阵V,特征值按对角线组成矩阵Λ。
2. 特征方程法特征方程法是直接求解矩阵A的特征值的方法。
计算步骤如下:(1)求解矩阵A的特征方程det(A-λI)=0。
(2)解特征方程,得到矩阵A的特征值λ1、λ2、...、λn。
(3)代入特征值,求解方程组(A-λI)X=0,其中X为特征向量。
在实际计算中,可以利用计算机软件或在线计算器进行特征值与特征向量的计算,提高计算的效率。
三、矩阵特征值与特征向量的应用矩阵的特征值与特征向量在实际问题中具有广泛的应用,下面将介绍两个常见的应用场景。
1. 矩阵对角化对于一个n阶矩阵A,若能找到一个可逆矩阵P,使得P^-1AP=Λ,其中Λ为对角矩阵,则称矩阵A可对角化。
此时,Λ的对角线上的元素为矩阵A的特征值。
矩阵的特征值和特征向量的计算矩阵的特征值和特征向量是线性代数中比较重要的概念。
在机器学习、信号处理、图像处理等领域都有着广泛的应用。
本文将会介绍矩阵的特征值和特征向量的概念、意义以及计算方法。
一、特征值和特征向量的定义对于一个n阶方阵A,如果存在一个n维向量v和一个常数λ,使得下面的等式成立:Av=λv那么称λ为矩阵A的特征值,v为矩阵A的特征向量。
特征向量是非零向量,因为如果v为0向量,等式就无法成立。
另外,特征向量不唯一,如果v是A的特征向量,k是任意一个非零常数,那么kv也是A的特征向量。
但特征值是唯一的。
二、特征值和特征向量的意义矩阵的特征值和特征向量有着重要的物理和数学含义。
对于一个矩阵A,它的特征向量v和特征值λ描述的是矩阵A对向量v的作用和量变化。
当一个向量v与矩阵A相乘时,向量v的方向可能会发生变化,而特征向量v就是那些方向不变的向量,仅仅发生了缩放,这个缩放的倍数就是特征值λ。
也就是说,特征向量v在被矩阵A作用后仍保持了原来的方向,并且只发生了缩放。
从物理角度理解,矩阵的特征值和特征向量可以描述线性系统的固有特性。
在某些情况下,如机械振动、电路等自然界现象中,系统本身就带有某种特有的振动频率或固有响应。
而这些系统在一些特殊的情况下可以通过线性代数描述,正是因为它们具有特征值和特征向量。
三、特征值和特征向量的计算矩阵的特征值和特征向量可以通过求解特征方程来计算。
特征方程的形式为det(A-λI)=0,其中det(A-λI)表示A-λI的行列式,I是单位矩阵。
求解特征方程可以得到矩阵A的n个特征值λ1,λ2,…,λn。
接下来,针对每个特征值λi,都可以通过求解线性方程组(A-λiI)v=0来得到一个特征向量vi。
需要注意的是,一个矩阵的特征值和特征向量并不一定都能够求出来,只有在某些情况下才可以求出。
例如,对于一个非方阵,就不存在特征值和特征向量。
另外,如果矩阵的特征值出现重复,那么对应于这些特征值的特征向量可能无法确定,可以使用广义特征向量来处理。
第八章 矩阵的特征值与特征向量的数值解法某些工程计算涉及到矩阵的特征值与特征向量的求解。
如果从原始矩阵出发,先求出特征多项式,再求特征多项式的根,在理论上是无可非议的。
但一般不用这种方法,因为了这种算法往往不稳定.常用的方法是迭代法或变换法。
本章介绍求解特征值与特征向量的一些方法。
§1 乘幂法乘幂法是通过求矩阵的特征向量来求特征值的一种迭代法,它适用于求矩阵的按模最大的特征值及对应的特征向量。
定理8·1 设矩阵A n ×n 有n 个线性无关的特征向量X i (i=1,2,…,n ),其对应的特征值λi (i =1,2,…,n)满足|λ1|>|λ2|≧…≧|λn |则对任何n 维非零初始向量Z 0,构造Z k = AZ k-1(k=1,2,11()lim()k j k k jZ Z λ→∞-= (8·1)其中(Z k )j 表示向量Z k 的第j 个分量。
证明 : 只就λi 是实数的情况证明如下。
因为A 有n 个线性无关的特征向量X i ,(i = 1,2,…,n 用X i (i = 1,2,…,n )线性表示,即Z 0=α1X 1 + α2X 2 +…+用A 构造向量序列{Z k }其中 21021010,,k k k Z AZ Z AZ A Z Z AZ A Z -=====, (8.2)由矩阵特征值定义知AX i =λi X i (i=1,2, …,n),故0112211122211121k k k k k n nk k k n n nknki i i i Z A Z A X A X A X X X X X X ααααλαλαλλλααλ===+++=+++⎡⎤⎛⎫⎢⎥=+⎪⎢⎥⎝⎭⎣⎦∑ (8.3)同理有11111121k nk i k i i i Z X X λλααλ---=⎡⎤⎛⎫⎢⎥=+ ⎪⎢⎥⎝⎭⎣⎦∑ (8.4) 将(8.3)与(8.4)所得Z k 及Z k-1的第j 个分量相除,设α1≠0,并且注意到 |λi |<|λ1|(i=1,2,…,n)得11()lim()k j k k jZ Z λ→∞-= 证毕定理8·1的证明过程实际上是给出了矩阵的按模最大特征值的计算方法:1) 先任取一非零向量Z 0,一般可取Z 0=(1,1,1)T ; 2) 按(8.2)式计算Z k =AZ k-1(k=1,2,…); 3) 当K 足够大时,即可求出11()()k j k jZ Z λ-=,为了减少λ1对于所选的第j 个分量的依赖性,还可用各个分量比的平均值来代替,即111()()nk jjk jZ Z nλ=-=∑关于对应于λ1的特征向量的计算:由(8.1)知,当k 充分大时,Z k =λ1Z k-1,又由迭代式Z k = AZ k-1,可知AZ k-1=λ1Z k-1故由特征值定义知Z k-1即为λ1对应的特征向量,或Z k =λ1Z k-1为λ1对应的特征向量。
这种求矩阵的按模最大特征值及其对应特征向量的方法称为乘幂法。
应用乘幂法计算A 的按模最大特征值λ1和对应特征向量时,由(8.3)易知11121knki ki i i Z X X λλααλ=⎡⎤⎛⎫⎢⎥=+⎪⎢⎥⎝⎭⎣⎦∑ 当|λ1|>1或|λ1|<1时,Z k将迭代向量Z k 先规范化 用max(Z)表示向量Z k 01122+…+αn X n (α1≠0)构造与(8.2)对应的向量序列。
()()()()()()()()10100110220202122020200100max max max max max max max max k k k k k k k Z AZ Z AY AZ Z AZ A Z Z A Z Z AY AZ Z A Z A Z Z A Z Z AY AZ Z A Z -⎧====⎪⎪⎪⎪====⎪⎨⎪⎪⎪⎪====⎪⎩,Y ,Y ,Y (8.6) 由(8.3)可知()()()()112101121max max max max kni i i k i k ik kk nk i i i i i X X Z A Z X k Z X A Z X X λααλλααλ==⎛⎫+⎪⎝⎭===→→∞⎛⎫⎛⎫⎪+⎪ ⎪⎝⎭⎝⎭∑∑Y (8.7)由(8.3)和(8.6)()()()()()0011001112111111211max max max max max max k k k k kn k i i i i k n k k i i i i A Z A Z A Z A Z X X k X X Z λλααλλααλλλ--=--=⎛⎫ ⎪== ⎪⎝⎭⎛⎫⎛⎫ ⎪+ ⎪ ⎪⎝⎭⎝⎭=→→∞⎛⎫⎛⎫ ⎪+ ⎪ ⎪⎝⎭⎝⎭∑∑max (8.8) 也就是说,在满足定理的条件下,规范化的向量序列Y k 仍收敛到A 的按模最大特征值对应的特征向量;而向量序列Z k 的绝对值最大的分量收敛到A 的按模最大的特征值λ1。
例8·1 用规范化的乘幂法求矩阵13361354454688690⎡⎤⎢⎥=⎢⎥⎢⎥---⎣⎦A 按模最大的特征值λ1和对应的特征向量X 1。
解:取初始向量Z 0=Y 0=(1,1,1)T ,按(8.6)、(8.7)和(8.8)算得Z k 、Y k 和max(Z k ),结果列于下表8—1. 表经七次选代计算,λ1的近似值max(Z 7)已稳定到小数点后第五位,故可取A 的按模最大的特征值及对应的特征向量分别为λ1=44.9995,X 1=(1,0.333,-0.6667)T我们不难求出矩阵A 的三个特征值是λ1=45,λ2=2,λ3=1相应的特征向量为:X 1=(3,1,-2)T ,X 2=(3,2,-3)T ,X 3=(2,1,-2)T ,注:(1)若矩阵A n ×n 的按模最大特征值λ1是P 重根时,即|λ1|=|λ2|=…=|λp |>|λp+1|≥|λn |容易证明定理1的结论仍成立。
(2)此外,定理1中要求初始向量Z 0的α1≠0是必要的,否则就不能得到对应于λ1的结果。
如在例1中若取Z 0=(1,1,-1)T ,由此出发迭代便得λ1=2,X 1=(1,0.6667,-1)T显然,这不是矩阵A 的按模最大的特征值和对应的特征向量,出现这一现象,正是由于α1=0。
事实上,由于A 的特征向量X 1,X 2,X 3是线性无关的,故Z 0=(1,1,-1)T 可表示为Z 0=α1X 1+α2X 2+α3X 3 即1231231233321212321ααααααααα⎧++=⎪++=⎨⎪---=-⎩解之得1230,1,1ααα===-(3)乘幂法的收敛速度取决于比值 |λ1/λ1|,当这个比值接近于1时,收敛很慢,反之收敛就比较快。
例1是收敛较快的例子,如果收敛很慢,可以配合运用加速技术提高收敛速度。
具体可参看西安交通大学出版社出版由邓建中等人编写的《计算方法》一书。
§2 反幂法反幂法可以计算矩阵按模最小的特征值及对应的特征向量。
设A n ×n 为非奇异矩阵,则A -1存在。
若A 的特征值λ1()满足|λ1|≥|λ2|≥…≥|λn |>0对应的特征向量为X 1,X 2, …,X n 。
因为AX i =λi X i ,所以A -1X i =(1/λi )X i ,即(1/λi )(i=1,2,…,n )是A -1的特征值,它满足111nλλ≥≥对应的特征向量仍是X i (i=1,2,…,n )。
这就是说,计算A 的按模最小的特征值λn 只要计算A -1按模最大的特征值1nλλ=,从而1n λλ=,而求A -1的按模最大的特征值只须应用前述的乘幂法即可。
.所以反幂法的选代向量是: 设初始向量 于是为避免求逆阵(),由()计算()时,可以通过解线性方程组().§3 QR方法§1、§2 介绍了求矩阵A的部分特征值的方法,对于求它的全部特征值则有QR方法.对矩阵A、B,若在非奇异矩阵P使得则称矩阵A和B相似,记A()B,而称P为化A为B的相似变换,并且由于(),得知相似矩阵有相同的特征值,又因为()有()显然,若()为B相应在于()的特征向量,则()为A的相应于()的特征向量. 对于特殊的矩阵,例如上三角矩阵,其特征值即为主对角线上的元素,而任一非齐异矩阵与上三角矩阵的关系则有职下定理:定理8·2设()的特征值()都为实数,那么必存在直交相似变换Q化A为上三角矩阵,即由于(),故也可以说A与R相似.特别当A为对称矩阵时,有()这里的直交矩阵Q若能知道,即可求生物电A的特征值,但Q的求得并不那么容易,由此矩阵A的特征值也不可能直接求得.一般可由矩阵A通过直交相似变换构造矩阵列(),使其逐步逼近上三角矩阵R,从而求得矩阵A的满足精度要求的近似特征值及相应的特征向量.定理8·3任一()总可分解为一个直交矩阵Q和一个上三角矩阵R的乘积(),若A非奇异,则这和分解是唯一的.证明对矩阵A,依()左乘一系列初等旋转矩阵()其中()当()时.取();()当()时,则取().这里()随A每次左乘()而不断变化,而()随之而变化,从而当()时,()当()时有()最后当()时,有()其中()的符号随()的符号而定,于是()令(),显然Q为直交矩阵,故有()现再证当A非奇异,则R,Q有逆矩阵存在,于是()而()为下交矩阵,()为上三角矩阵,则要其相等,()必为对角阵,又根据()的直交性,便知()为单位矩阵,即()所以()并且显然有()以上证明实际上为我们提供了对A进行QR分解的具体方法.此外,A的QR分解也可通过()直交化过程来实现.既然任一非奇异矩阵A总有(),则令(),于是有()那么()有()于是()与()有相同的特征值.再交()进行QR分解,有()则()并令()有()于是()与()有相同的特征值.一般有()()令有()()于是()与()有相同的特征值.可以证明,若非齐异实矩阵A有()个不同模的特征值,即()则当()时,()本质上收敛于上三角矩阵R(所谓本质上收敛于上三角矩阵是指矩阵列(),收敛于一个上三角矩阵,而这个上三角矩阵除主对角元素外极限并不要求一定存在),R的主对角线元素即为所求的特征值.特别当A为对称矩阵时,()收敛于对角矩阵D.具体计算中,当()与()的主对角元素相差小于预先给定的业度时,则认为()的主对角线元素即为A的特征值.对于QR分解,其有一个重要特点:当A为对称带宽不变,即若A为三角矩阵,则()仍为三对角矩阵.习题七11)2) 3)4)2.用QR1()2()3()的全部特征值勤(精确到10-2).第九章 常微分方程的数值解法本章讨论一阶常微分方程的初值问题 () ()这类问题在工程计算中是常见的,例如,对于等截面均匀排风风道,风道内静压分布有如下规律: ()我们知道,只要函数()适当光滑,理论上就可以保证初值问题(9·1)—(9·2)的解()存款额并且是唯一的.虽然求解常微分方程有各种各样的解析方法但解菥方法只能用来求解一些特殊类型的方程,大量从实际问题当中归结出来的微分方程主要靠数值解法.所谓数值解法,就是寻求初值问题()的解()在一系列离散结点()上的近似值()相邻两个结点间()称作步长,今后如不特别申明,总假定步长()为定数下面就介绍几种常邮的数值解法:§1 欧拉(Euler)方法初值问题()的解,在几何上是通过点()的一条曲线().欧拉法的求解过程是:先过点()作曲线的切线,该切线与直线()相交于点(),再用()作为曲线上点()的纵坐标()近似值.如图9—1所示.()因为过()点以()为斜率的切线方程为()当()时得()即取(),然后,再过()点,以()为斜率作直线()当()时得()即取()一般地,如果已求出()则过此点,以()为斜率作直线()当()时得取()通过上述过程,就可逐步求出点()所对应的数值解()欧拉法的几何意义,是用一条折线近似代替曲线().欧拉(Euler)法(也叫欧拉折线法)的计算格式为()()欧拉法是最古老的一种数值解法,它体现了数值方法的基本思想民,但精度很低,单独用它来作计算往往不能满足确度要求.§2改进的欧拉方法同一种计算格式往往可以通过多种途径构造出来,本节与下一节就会看到这一点. 为了提高精度,本节以改过的欧拉方法为例,介绍构造计算格式的数值积分方法. 交方程(9·1)的两端从()到()求积分,得到为要通过这个积分关系式得()的近似值,只要近似地求出积分项()即可.选择不同的近似方法计算这个积分项会得到不同的计算格式.例如:用矩形分式计算积分项()代入(9·4)得()若用()代替上式中的()并交右端的值作为()的近似值().这样建立起来的格式就是欧拉法的计算格式(9·3).由于用矩形公式求积分值很粗糙,故导出欧拉格式精度也很低,不难证明,欧拉格式(9·3)的截断误差为()即()为了改造精度,我们必用梯形法计算左端积分()()将其中的()分别用()代替,则有下列计算格式()(9·5)式被称为解常微分方程的梯形法则.应该注意,格式(9·3)与(9·5)有本质上的区别,欧拉格式(9·3)是个直接的计算公式,这类格式称作显式的,而梯形法则(9·5)则由于其右端含有未知的()故被除数称作是隐式的.它实际上是关于(),可以用选代法求解(参看第五章),不过计算量比较大.我们将综合使用这两种格式,先用欧拉格式求得一个初步的近似值(),称为预报值,然后用()代替形法则右端的()再直接计算.得到校正值(),这样建立起来的预报一校正系统称作改进的欧拉格式.预报()校正()格式(9·6)的每一步需要两次调次调用函数(),它可以改写成下列形式;()图9—2—2欧拉法每一步只需对()调用一次,而改进的欧拉法则不然,需对()用两次,其计算量比欧拉法增加了一倍,付出这种代价的目的是为了提高精度.不难证明,改进的欧拉格式(9·6)的截断误差为(),即()由此可见,它比欧拉格式的截断误差提高了一阶.例9·1 解初值部题()取步长()试求从()到()各结点上的数值解.解我们分别用两种格式进行计算,这里欧拉式的具体形式是()而改进的欧拉格式是()计算结果见表9—1表9—1这个问题有解析解(),按这个解算出的值列在表9—1第四列.同准确解比较,第二列欧拉格式的结果在致只有两位有效数字,而第三列改进的欧拉格式的结果则有三位有数字.§3 龙格一库塔(Runge——Kutta)方法考察差商()由微分中值定理,存在()使得y(Xi+1)于是,利用所给方程()得到y(Xi+1)= y(xi)+hf(Xi+Øh,y(xi+Øh))这里的f(Xi +Øh,y(xi+Øh))称作区间(Xi,Xi+1)上的平均斜率.由此得知,只要对平均斜率提供一种算法,由(9·7)式便相应地得到一种计算格式.欧拉格式由于仅取Xi一个点的斜率值(X i,y i)作为斜率的近似值,所以精度很低.再考察改进的欧拉格式,它可改写为yi+1 = yi +h/2 (Ki+K2)其中 K1 =f(Xi, yi),K2= f(Xi+1,yi+hK1),可见改进的欧拉格式可这样来理解,它用Xi 与Xi+1两个点的斜率值K1和K2取算术平均作为平均斜率的近似值,而Xi+1处的斜率值勤K2,则通过已知信息yi来预报.这个处理过程启发我们,若设法在(Xi ,Xi+1)内多计算几个点的斜率值,然后将它们加权平均斜率的近似值,则有可能构造出更高精度的计算格式.这就是龙格一库塔方法的基本思想.我们首先推广改进的欧拉格式.考察区间(Xi ,Xi+1)内任一点。