中科院矩阵分析_第五章
- 格式:doc
- 大小:579.50 KB
- 文档页数:21
本课程的说明:矩阵分析理论是在线性代数的基础上推广的(数学是在已有的基础理论上模仿,推广而发展的。
要大胆猜想,小心证明!) 矩阵分析理论的组成:四部分:一、基础知识(包括书上的前三章内容)重点、难点:约当标准形与多项式矩阵,矩阵的分解等; 二、矩阵分析(第四章:矩阵函数及其应用)重点、难点:范数,矩阵幂级数,微分方程组; 三、矩阵特征值的估计(第五章)重点、难点:Gerschgorin 圆盘定理;广义逆矩阵; 四、非负矩阵(第六章)(注:不讲)重点、难点:基本不等式,素矩阵,随机矩阵等。
§1 线性空间与度量空间一、线性空间: 1.数域:Df 1:若复数的一个非空集合P 含有非零的数,且其中任意两数的和、差、积、商(除数不为0)仍在这个集合中,则称数集P 为一个数域 eg 1:Q (有理数),R (实数),C (复数),Z (整数),N (自然数)中哪些是数域?哪些不是数域? 2.线性空间— 设P 是一个数域,V 是一个非空集合,若满足:<1> 可加性—指在V 上定义了一个二元运算(加法)即:V ∈∀βα, 经过该运算总存在唯一的元素V ∈γ与之对应,称γ为α与β的和,记βαγ+= 并满足:① αββα+=+② )()(γβαγβα++=++ ③ 零元素—=有θαθααθ+∈∀∈∃Vt s V .(线性空间必含θ)。
④ αβαβθβααβ-+∈∀∈∃=记的负元素为=有对V V<2> 数积:(数乘运算)—在P 与V 之间定义了另一种运算。
即V P k ∈∈∀α,经该运算后所得结果,仍为V 中一个唯一确定的元素(存在唯一确定的元素V ∈δ与之对应),称δ为k 与α的乘积。
记为αδk =并满足:① αα=⋅1② P l k ∈∀, αα)()(kl l k = ③ P l k ∈∀, αααl k l k +=+)( ④ γβα∈∀, βαβαk k k +=+)(则称V 为数域P 上的线性空间(向量空间)记为)...(∙+P V 习惯上V 中的元素—向量, θ—零向量, 负元素—负向量结论:可以证明,线性空间中的零向量是唯一的,负元素也是唯一的,且有:θα=⋅0 θθ=⋅k αα-=⋅-)1( )(βαβα-+=-eg2:}{阶矩阵是n m A A V ⨯= P —实数域R按照矩阵的加法和数与矩阵的乘法,就构成实数域R 上的线性空间,记为:n m R ⨯同样,若V 为n 维向量,则可构成R 上的n 维向量空间n R —线性空间。
矩阵分析及其应用 3.1矩阵序列定义3.1设矩阵序列{A (k )},其中A(k)=( a (k )) C m n ,当k a j" a u 时,称矩阵序列{A (k)}收敛,并称矩阵 A=( a ij )为矩 阵序列{A (k)}的极限,或称{A (k)}收敛于A,记为lim A (k)A 或 A (k) Ak不收敛的矩阵序列称为发散的。
由定义,矩阵序列 A (k )发散的充要条件为存在 j 使得数列a (k)发散。
类似地,我们可以定义矩阵收敛的 Cauchy 定义 定义3.1'矩阵序列{A (k)}收敛的充要条件为 对任给>0存在N(),当k, l N()时有 ||A (k) A (l)|| <其中||.|为任意的广义矩阵范数。
sin 』)n nsin(k)如果直接按定义我们因为求不出 A (n)的极限从而从而只要I 充分大,则当m, n > l 时就有sin(k)k 2这样A (l)收敛。
定理3.1 A (k) A 的充要条件为 ||A (k) A|| 0证明:利用广义矩阵范数的等价性定理,仅对 范数可以证明。
即c 1ILA (k) A||||A (k) AII C 2 ||A (k) AII 性质 0 若 A (k)A ,则 ||A (k) II IIAII 成立。
性质 1. 设 A (k)A m n ,B (k) B m n , 则A (k)+ B(k) A+ B , ,C 性质 2. 设 A (k)A m n ,B (k )B n l ,贝UA (k)B (k)A B证明:由于矩阵范数地等价性,我们可以只讨论相容的 矩阵范数。
||A (k )B (k) A B|| || A (k) B (k) A B (k)||+||AB (k)A B|||| A (k) A|| ||B (k)||+||A||||B (k) B||例 1 A (n)k m 1k(k 1)相反,由于注意||B(k)|| ||B||,则结论可得。
第五章 范数、序列、级数(详解)5-1 解:需要验证给出的公式满足矩阵范数的四个性质。
非负性与齐次性容易验证,先证三角不等式。
若()m nij b C⨯=∈B ,则()11111111mnij iji j mnij iji j mnmnij iji j i j a b a b a b ========+=+≤+=+=+∑∑∑∑∑∑∑∑A B A B最后证矩阵乘法的相容性。
若()m nij a C⨯=∈A ,()m n ij b C ⨯=∈B ,则11111111111111()()()()pmnik kji j k pmnik kji j k ppmnik kji j k k p pm n ik kj i k j k a b a b a b a b ===============≤⎡⎤≤⎢⎥⎣⎦==∑∑∑∑∑∑∑∑∑∑∑∑∑∑AB AB因此所给计算公式的确是矩阵范数。
5-2 解:因为1122222111(),()m nnij i Fi j i a x x =====∑∑∑A根据H lder ö不等式 22211221112222111()()()()m nij ji j mn n ij j i j j m nnij j FFi j j a x a x a x =========⎡⎤≤⎢⎥⎣⎦==∑∑∑∑∑∑∑∑Ax Ax于是22xF≤A Ax5-3 解:取(1,0,,0)T =α ,设12(,,,)T n x x x =x ,则1222*1()nHi i x ====∑x x αx范数是矩阵理论的一个重要概念,在许多方面有广泛应用。
5-4 解:1(1)01k k ⎡⎤=⎢⎥⎣⎦A ,故lim kk →∞A 发散。
(2)A 的特征值12==0.91λλ<,故k A 收敛,且lim 0k k →∞=A 。
1100(3)00.90.9000.9k kk k k -⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦A 由于lim 0.90kk →∞=,1lim 0.90k k -→∞=故kA 收敛,且100lim 000000k k →∞⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦A(4)由于10.91=<A ,k A 收敛,且lim 0k k →∞=A5-5 解:由于111()()()0234λλλλ-=---=E A ,所以A 有三个不同特征值123111,,234λλλ===。
矩阵分析及其应用3.1矩阵序列定义3.1设矩阵序列{应)},其中A«)=(#))£Cms,当k—oo, 佝时,称矩阵序列{A00}收敛,并称矩阵A=(佝)为矩阵序列{A00}的极限,或称{A00}收敛于A,记为lim A a)= A或A,k)-> A ks不收敛的矩阵序列称为发散的。
由定义,矩阵序列A(k)发散的充要条件为存在ij使得数列站发散。
类似地,我们可以定义矩阵收敛的Cauchy定义定义31矩阵序列{A00}收敛的充要条件为对任给£>0存在N(E),当k,l> N(E)时有IIA(k)-A(/)ll < £其中11.11为任意的广义矩阵范数。
例 1 A(n)e~nsin(-)n y,sin(R) k=l K 7如果直接按定义我们因为求不出A㈤的极限从而很难应用定义3.1证明收敛。
相反,由于t^< t^<v 1/m从而只要/充分大,则当m, n > /时就有nz sin(A)这样A")收定理3.1 A(k)->A的充要条件为HA'10-AII T O证明:利用广义矩阵范数的等价性定理,仅对co范数可以证明。
即ci IIA(k) -AIL < IIA(k) -All< c2 IIA(k) -AIL性质 1.设A(k,—> A mxn, B,k,—> B mxn>则a- A(k)+P • B(k) -> a- A+P B, V a,PeC性质2.设A(k)—> A mxn, B,k)—> B nx/,则A(k)由如一A B证明:由于矩阵范数地等价性,我们E以只讨论相容的矩阵范数。
IIA(k).B(k)-A-BII < II A(k) -B(k) -A-B(k)ll+IIAB(k)- A-BII<IIA(k)-AII-IIB(k)ll+IIAIMIB(k)-BII注意IIB(k)||_||BII,则结论可得。
第五章特征值的估计及对称矩阵的极性本章主要讨论数值代数中的三个特殊理论,即特征值的估计广义特征值问题实对称矩阵(一般是Hermite矩阵)特征值的极小极大原理,其次也涉及到一些特征值和奇异值的扰动问题,最后简要地介绍矩阵直积的一些性质及其在线性矩阵方程求解方面的应用。
这几方面的内容,在矩阵的理论研究与实际应用当中都有着相当重要的作用。
5.1特征值的估计一、特征值的界首先给出直接估计矩阵特征值模的上界的一些方法定理 5.1 设A=(a rs) R n X1,令1 , ,M= ma彷总a sr|若表示A任一特征值,则的虚部Im()满足不等式|Im( )| M n(n21)|Im( )| ||A A T||2 / 2|Im( )| ||A A T||1n /2.证明:设x+i y为对应于的A的特征向量, 则A(x+i y)=( + i)(x+i y)其中=+ i.显然x,y为实向量,且x,y为线性无关的向量。
经整理A(x,y)=(x,y)B,其中B= 从而(x,y) T A(x,y)=(x,y) T(x,y)B展开有i 1 j iTT X y X X T T y yy X (求等式两边矩阵的对角元之和,可得 (x T x+y T y)=x T Ax+y T Ay(1) 等式两边矩阵的左上角单元减去右下角单元 可得:(x T x+y T y)=x T (A A T )y1) . 记 B=A A T ,则 |x T By| ||x||2||B||2||y||2 从而 1 1 1凶|2||B||2||y||2 /((||x||2)2 +(||y|2)2)利用 ab/(a 2+b 2) 1/2 可得 | | ||B||2 /2.2) .由于 |x T By| ||B X ||I ||y|| ||B||i ||X ||I ||y||从而 | | ||B||i ||x||i ||y|| /((||X |2)2 +(||y||2)2)易证明 ||x||i ||y|| /((||X ||2)2 +(||y||2) 2)n /2.(显然,不妨假设(||X ||2)2 +(||y||2)2=1,设HyH =t=cos (),则y 必为t e 的形式(为什么?) 从而极值转化为求解如下最大值问题:max ||X ||1,满足约束(||X ||2)2=1 t 2这样有均值不等式 ||x|h i n ||X ||2= 、、n (1 t 2)1/2,从而我们需要求解t(1 t 2)1/2的最大值,设t=cos() 可得t(1 t 2)1/2的最大值为1/2.从而得证。
第五章 特征值的估计及对称矩阵的极性本章主要讨论数值代数中的三个特殊理论,即特征值的估计广义特征值问题实对称矩阵(一般是Hermite 矩阵)特征值的极小极大原理,其次也涉及到一些特征值和奇异值的扰动问题,最后简要地介绍矩阵直积的一些性质及其在线性矩阵方程求解方面的应用。
这几方面的内容,在矩阵的理论研究与实际应用当中都有着相当重要的作用。
5.1特征值的估计一、特征值的界首先给出直接估计矩阵特征值模的上界的一些方法定理5.1 设A=(a rs )∈R n×n ,令 M=||21max ,1sr rs n s r a a -≤≤ λ若表示A 任一特征值,则λ的虚部Im(λ)满足不等式2)1(|)Im(|-≤n n M λ |Im(λ)|≤||A -A T ||2 / 2|Im(λ)|≤||A -A T ||1⋅/2.证明:设x+i ⋅y 为对应于λ的A 的特征向量,则 A(x+i ⋅y)=(α+β⋅i)(x+i ⋅y)其中λ=α+β⋅i.显然x,y 为实向量,且x,y 为线性无关的 向量。
经整理A(x,y)=(x,y)B,其中B=⎪⎪⎭⎫ ⎝⎛-αββα。
从而(x,y)T A(x,y)=(x,y)T (x,y)B展开有⎪⎪⎭⎫ ⎝⎛Ay y Ax y Ay x Ax x T T T T =α⋅⎪⎪⎭⎫ ⎝⎛y y y x y x x x T T T T + β⋅⎪⎪⎭⎫ ⎝⎛--x y y y x x y x T T T T (求等式两边矩阵的对角元之和,可得α(x T x +y T y )=x T Ax +y T Ay (1)等式两边矩阵的左上角单元减去右下角单元可得:β(x T x +y T y )=x T (A -A T )y1).记B=A -A T ,则 |x T By|≤||x||2 ⋅||B||2⋅||y||2从而 |β|≤||x||2 ⋅||B||2⋅||y||2 /((||x ||2)2 +(||y ||2)2)利用ab /(a 2+b 2)≤1/2 可得 |β|≤||B||2 /2.2).由于|x T By|≤||Bx||1 ⋅||y||∞≤||B||1⋅||x||1 ⋅||y||∞从而 |β|≤||B||1 ⋅||x||1 ⋅||y||∞ /((||x ||2)2 +(||y ||2)2)易证明 ||x||1 ⋅||y||∞ /((||x ||2)2 +(||y ||2)2)/2.(显然,不妨假设(||x ||2)2 +(||y ||2)2=1,设||y ||∞=t =cos(α), 则y 必为t ⋅ e j 的形式(为什么?), 从而极值转化为求解如下最大值问题:max ||x||1, 满足约束(||x ||2)2=1-t 2这样有均值不等式||x||1x ||2= -t 2)1/2,从而我们需要求解t (1-t 2)1/2的最大值,设t =cos(α) 可得t (1-t 2)1/2的最大值为1/2. 从而得证。
)因此 |β|≤||B||13). 由于b ii =0, i =1,2,…,n , b ij = -b ji ,因此 |x T By|2=|11()n ij i j j i i j i bx y x y -=>⋅⋅-∑∑|2≤(2M )221||n i j j i i j i x y x y =>⎛⎫- ⎪⎝⎭∑∑(利用(a 1+a 2+…+a n )2≤ n ((a 1)2+(a 2)2+…+(a n )2)≤(2M )2 (n (n -1)/2)21||n i j j i i j i x y x y =>⎛⎫- ⎪⎝⎭∑∑≤(2M )2 (n(n -1)/2)⋅2222111(2)2n n i j i j i j j i i j x y x x y y x y ==-+∑∑=M 2 (n (n -1))⋅2⋅[ (x T x)⋅(y T y )- (x T y)2]利用[ (x T x)⋅(y T y )- (x T y)2]≤(x T x)⋅(y T y )可得|β|≤M (2n (n -1))1/2 (x T x)1/2⋅(y T y )1/2 /(x T x +y T y )≤M (2n (n -1))1/2 / 2=M (n (n -1)/2)1/24). |x T By|=|11()n ij i j j i i j i bx y x y -=>⋅⋅-∑∑|≤1/221||nij i j i b =>⎛⎫ ⎪⎝⎭∑∑1/221||n i j j ii j i x y x y =>⎛⎫- ⎪⎝⎭∑∑ 而 1/221||n i j j i i j i x y x y =>⎛⎫- ⎪⎝⎭∑∑≤(x T x)1/2⋅(y T y )1/2 由此可以有|β|≤(1/2)1/221||nij i j i b =>⎛⎫ ⎪⎝⎭∑∑ 思考题:对于(1)式,利用定理推导的类似技术,求出关于|α|的界。
推论 实对称矩阵的特征值都是实数。
事实上,当A 这实对称矩阵时,M =0.由定理5.1可得Im(λ)=0,即λ为实数。
引理1 设B ∈C n×n ,列向量y ∈C n 满足||y||2=1,则|y H By|∞≤m B ||||.定理5.2 设A ∈C n×n ,则A 的任一特征值λ满足|λ|≤||A||∞m∞+≤m H A A ||||21|)Re(|λ (5.1.3) ∞-≤m H A A ||||21|)Im(|λ (5.1.4) 推论: Hermite 矩阵的特征值都是实数;反Hermite 矩阵的特征值为零或纯虚数。
事实上,当A 为Hermite 矩阵时,由式(5.1.4) 知Im(λ)=0,即λ为实数;当A 为反Hermite 矩阵时,由式(5.1.3)知Re(λ)=0,即为λ为零或纯虚数。
定义.5.1设,)(n n rs Ca A ⨯∈=记∑≠==n rs s rs a A 1r ||)(R ),R (r 简写为.,,1n r =如果00|a r r 0|r R >,则称矩阵A 按行(弱)对角占优。
定义5.2 设A ∈C n×n 。
如果A T 按行严格对角占优,则称A 按列严格对角占优;如果A T 按行(弱)对角占优,则称A 按列(弱)对角占优。
对直接估计矩阵特征之乘积的模的界,再给出以下两个方法。
定理5.3 设A=(a rs )∈C n×n ,令M r =|a rr |+∑∑+=+=-=n r s nr s rs rr r rs a a m a 11|||||,| 如果A 按行严格对角占优,则∏∏∏===≤=≤n r n r nr r r r M A A m 111|)(||det |0λ (5.1.5)且当a rs =0(s>r)时,式(5.1.5)中等号成立。
证明:由于A 按对角占优, 所以det(A)≠0.考虑方程组21222211120,n n n n nn a a a A A a a a ξξ⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪+== ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭因为A 按行对角占优, 因此A 1也按行对角占优。
从而A 1可逆。
上述线性方程组有唯一解x (1)=(ξ2, …,ξn )T .可以证明 |ξ k |=max {|ξ2|, …,|ξn |} <1,事实上,若|ξ k |=0 则显然成立。
若|ξ k |≠0, 我们有 a k 1+2n ks s s aξ=∑=0 (2 ≤ k ≤ n )则有 121n s kk k sks k ks k a a a ξξξ=≠-=+∑ (2 ≤ k ≤ n ) 如果|ξ k | ≥ 1, 则可得12||||||nkk k sk s s k a a a =≠≤+∑ (2 ≤ k ≤ n )这和A 对角占优矛盾。
因此|ξ k |=max {|ξ2|, …,|ξn |} <1成立。
利用分块矩阵的性质和x (1)的定义,我们有det(A)=det (1)110n -⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭A xI = det 1112110n b a a A ⎛⎫⎪⎝⎭ 其中b 11=a 11+12n s s s aξ=∑, |ξs |<1 (s =2,…,n )从而m 1 ≤ |b 11|≤ M 1, 其余类推可得0<1n r r m=∏|det |A ≤1nr r M =≤∏定理5.4 (H adamard’s inequality )设A=(a rs )∈C n×n ,则有122111|()||det |[(||)]n n n rrs r r s A A a λ====≤∑∏∏(5.1.7) 且式(5.1.7)中等号成立的充分条件是某a s 0=0或者(a r ,a s )=0 (r ≠ s ),这里a 1,…,a n 表示A 的n 个列向量。
证明:若a 1,…,a n 线性相关,则式(5.17)显然成立。
不妨设a 1,…,a n 线性无关,则对它们进行Gram-schmidt 正交化过程得到:a 1=b 1a 2=b 2+λ21b 1…a n =b n +λn 1b 1 +λn 2b 2+…+λn , n -1b n -1其中b 1 ,b 2,…b n 为正交向量。
从而||a i ||2≥||b i ||2记B=( b 1 ,b 2,…b n ).则A=BL, 其中L 为单位下三角矩阵。
|det(A)|2=|det(B)|2=det(B T B)=|| b 1||2⋅||b 2||2…||b n ||2.≤|| a 1||2⋅||a 2||2…||a n ||2.推广的定理5.4 (H adamard’s inequality )设A=(a rs )∈C n×n ,则有2121221111|||()||det |[(||max )]||n kl rl n n n l rrs n k s r r kl l a a A A a aλ======≤-∑∑∏∏∑ 证明:由于|det(A)|2=det (A H A )=det 111(,)H a a A αα⎛⎫ ⎪⎝⎭ = det 11111(,)0H H a a A A ααα-⎛⎫- ⎪⎝⎭ 利用对于任给的β ≠0有1211||/H H H A A αααβββ-≥从而有|det(A)|2≤[(a 1,a 1)-|αH β|2/βH A 1β]det(A 1)我们可以取β =e k ,这样我们就有|det(A)|2≤[(a 1,a 1)-max k>1|(a 1,a k )|2/(a k ,a k )]det(A 1) (*) 类似推导可以得到命题的证明。