同济大学--矩阵分析课件---矩阵论§3.7
- 格式:pdf
- 大小:195.73 KB
- 文档页数:8
第三章 矩阵分析在此之前我们只研究了矩阵的代数运算,但在数学的许多分支和工程实际中,特别是涉及到多元分析时,还要用到矩阵的分析运算.本章首先讨论矩阵序列的极限和矩阵级数,然后介绍矩阵函数和它的计算,最后介绍矩阵的微积分,以及矩阵分析在解微分方程组和线性矩阵方程中的应用.§3.1 矩阵序列 定义 3.1 设有Cm n⨯中的矩阵序列{}()k A ,其中()()()k k ij m nAa ⨯=.若()lim (1,2,,;1,2,,)k ij ij k a a i m j n →+∞=== ,则称矩阵序列{}()k A 收敛于()ij m n A a ⨯=,或称A 为矩阵序列{}()k A 的极限,记为()lim k k A A →+∞=或()()k A A k →→+∞不收敛的矩阵序列称为发散. 由定义可见,Cm n⨯中一个矩阵序列的收敛相当于mn 个数列同时收敛.因此,可以用初等分析的方法来研究它.但同时研究mn 个数列的极限未免繁琐.与向量序列一样,可以利用矩阵范数来研究矩阵序列的极限. 定理 3.1 设()k A,C (012)m n A k ,,,⨯∈= .则()lim k k AA →+∞=的充分必要条件是()lim 0k k A A →+∞-=,其中 是C m n ⨯上的任一矩阵范数.证 先取Cm n⨯上矩阵的G-范数.由于()()()()1=1k k k ij ij ij ij Gi,jm nk ijiji j a a a a A Aaa =-≤-=-≤-所以()lim k k A A →+∞=的充分必要条件是()lim 0k Gk A A→+∞-=.又由范数的等价性知,对C m n⨯上任一矩阵范数 ,存在正常数α,β,使得()()()k k k GGAAAA AA αβ-≤-≤-故()lim 0k Gk AA→+∞-=的充分必要条件是()lim 0k k A A →+∞-=.证毕推论 设()k A,C(012)m nA k ,,,⨯∈= ,()lim k k A A →+∞=.则()lim k k A A →+∞=其中 是Cm n⨯上任一矩阵范数.证 由()()k k AA A A -≤-即知结论成立.证毕需要指出的是,上述推论的相反结果不成立.如矩阵序列()1(1)112k k A k ⎛⎫- ⎪=+ ⎪ ⎪⎝⎭不收敛.但()Flim lim k k x A →+∞== 收敛的矩阵序列的性质,有许多与收敛数列的性质相类似. 定理3.2 设()lim k k AA →+∞=,()lim k k B B →+∞=,其中()k A ,()k B ,A ,B 为适当阶的矩阵,α,β∈C .则 (1)()()lim ()k k k AB A B αβαβ→+∞+=+;(2) ()()lim k k k A BAB →+∞=;(3)当()k A与A 均可逆时,()11lim ()k k AA --→+∞=.证 取矩阵范数 ,有()()()()()()()()()()()()()()()k k k k k k k k k k k k k A B A B A A B B A B ABA B A B A B AB A B B A A Bαβαβαβ+-+≤-+--=-+-≤-+-由定理3.1和推论知(1)和(2)成立.因为()1()k A -,1A -存在,所以()lim det det 0k k AA →+∞=≠,又有()lim adj adj k k A A →+∞=.于是()()11()adj adj lim ()lim det det k k k k k A AA A A A--→+∞→+∞=== 证毕 定理3.2(3)中条件()k A与A 都可逆是不可少的,因为即使所有的()k A可逆也不能保证A一定可逆.例如()11111k Ak ⎛⎫+ ⎪= ⎪ ⎪⎝⎭对每一个()k A都有逆矩阵()1()1k kk A k k --⎛⎫=⎪-+⎝⎭,但()11lim 11k k A A →+∞⎛⎫== ⎪⎝⎭而A 是不可逆的. 在矩阵序列中,最常见的是由一个方阵的幂构成的序列.关于这样的矩阵序列有以下的概念和收敛定理. 定义3.2 设n nA C ⨯∈,若()lim 0k k A→+∞=,则称A 为收敛矩阵.定理3.3 设n nA C⨯∈,则A 为收敛矩阵的充分必要条件是ρ(A )<1.证 必要性.已知A 为收敛矩阵,则由谱半径的性质,有(())()k k k A A A ρρ=≤其中 是Cn n⨯上任一矩阵范数,即有lim (())0kk A ρ→+∞=,故ρ(A )<1.充分性.由于ρ(A )<1,则存在正数ε,使得ρ(A )+ε<1.根据定理2.14,存在C n n⨯上的矩阵范数m ,使得()1m A A ρε≤+<从而由kk m mAA ≤得lim 0kmk A →+∞=.故lim 0k k A →+∞=. 证毕推论 设n nA C ⨯∈.若对Cn n⨯上的某一矩阵范数 有1A <,则A 为收敛矩阵.例3.1 判断下列矩阵是否为收敛矩阵:(1)181216A -⎛⎫= ⎪-⎝⎭; (2)0.20.10.20.50.50.40.10.30.2A ⎛⎫⎪= ⎪ ⎪⎝⎭. 解 (1)可求得A 的特征值为156λ=,212λ=-,于是5()16A ρ=<,故A 是收敛矩阵; (2)因为10.91A =<,所以A 是收敛矩阵.§3.2 矩阵级数定义3.3 由Cm n⨯中的矩阵序列{}()k A 构成的无穷和(0)(1)()k A A A ++++ 称为矩阵级数,记为()k k A+∞=∑.对任一正整数N ,称()()NN k k SA ==∑为矩阵级数的部分和.如果由部分和构成的矩阵序列{}()N S收敛,且有极限S ,即()lim N N SS →+∞=,则称矩阵级数()0k k A +∞=∑收敛,而且有和S ,记为()k k S A+∞==∑不收敛的矩阵级数称为发散的.如果记()()()k k ij m n Aa ⨯=,()ij m n S s ⨯=,显然()0k k S A +∞==∑相当于()(1,2,,;1,2,,)k ij ij k a s i m j n +∞====∑即mn 个数项级数都收敛. 例3.2 已知()1π24(0,1,)10(1)(2)k kk A k k k ⎛⎫⎪ ⎪== ⎪ ⎪++⎝⎭研究矩阵级数()k A+∞∑的敛散性.解 因为k 00()()001π2410(1)(2)1π1242341012N Nk Nk k N k N k k N N S A k k N ====⎛⎫⎪ ⎪== ⎪ ⎪++⎝⎭⎛⎫⎛⎫-- ⎪ ⎪⎝⎭ ⎪= ⎪- ⎪+⎝⎭∑∑∑∑所以()4π2lim 301N N S S →+∞⎛⎫⎪= ⎪ ⎪⎝⎭故所给矩阵级数收敛,且其和为S . 定义3.4 设()()()C (0,1,)k k m n ij m n Aa k ⨯⨯=∈= .如果mn 个数项级数()0(1,2,,;1,2,,)k ijk ai m j n +∞===∑ 都绝对收敛,即()k ijk a +∞=∑都收敛,则称矩阵级数()k k A+∞=∑绝对收敛.利用矩阵范数,可以将判定矩阵级数是否绝对收敛转化为判定一个正项级数是否收敛的问题.定理3.4 设()()()C(0,1,)k k m nij m nAa k ⨯⨯=∈= .则矩阵级数()0k k A +∞=∑绝对收敛的充分必要条件是正项级数()0k k A +∞=∑收敛,其中 是C m n ⨯上任一矩阵范数.证 先取矩阵的1m -范数.若1()k k m A +∞=∑收敛,由于1()()()11(1,2,,;1,2,,)mnk k k ijij i j m aa A i m j n ==≤===∑∑从而由正项级数的比较判别法知()k ijk a+∞=∑都收敛,故()k k A+∞=∑绝对收敛.反之,若()k k A+∞=∑绝对收敛,则()0k ijk a+∞=∑都收敛,从而其部分和有界,即()0(1,2,,;1,2,,)Nk ijijk aM i m j n =≤==∑ 记,max ij i jM M =,则有1()()()0011110()()NNmnm n Nk k k ijijk k i j i j k m AaamnM =========≤∑∑∑∑∑∑∑故1()k k m A +∞=∑收敛.这表明()k k A+∞=∑绝对收敛的充分必要条件是1()k k m A +∞=∑收敛.由矩阵范数的等价性和正项级数的比较判别法知,1()k k m A+∞=∑收敛的充分必要条件是()0k k A +∞=∑收敛,其中 是C m n ⨯上任一矩阵范数. 证毕利用矩阵级数收敛和绝对收敛的定义,以及数学分析中的相应结果,可以得到以下一些结论.定理3.5 设()k k AA +∞==∑,()0k k B B +∞==∑,其中()k A ,()k B ,A ,B 是适当阶的矩阵,则(1)()()0()k k k AB A B +∞=+=+∑;(2)对任意λ∈C ,有()k k AA λλ+∞==∑;(3)绝对收敛的矩阵级数必收敛,并且任意调换其项的顺序所得的矩阵级数仍收敛,且其和不变; (4)若矩阵级数()k k A+∞=∑收敛(或绝对收敛),则矩阵级数()k k PAQ +∞=∑也收敛(或绝对收敛),并且有()()0()(3.1)k k k k PAQ P A Q+∞+∞===∑∑(5)若()k k A+∞=∑与()k k B+∞=∑均绝对收敛,则它们按项相乘所得的矩阵级数(0)(0)(0)(1)(1)(0)(0)()(1)(1)(()()(3.2)k k k A B AB A B A B A B A B -++++++++ 也绝对收敛,且其和为AB . 证 只证(4)和(5).若()0k k A+∞=∑收敛,记()()0NN k k SA ==∑,则()lim N N S A →+∞=.从而()()00lim(lim)NNk k N N k k PAQ P AQ PAQ →+∞→+∞====∑∑可见()k k PAQ +∞=∑收敛,且式(3.1)成立.若()k k A+∞=∑绝对收敛,则由定理3.4知()k k A +∞=∑收敛,但()()()k k k PA Q P AQ Aα≤≤其中α是与k 是无关的正数,从而()k k PAQ +∞=∑收敛,即()k k PAQ +∞=∑绝对收敛.当()k k A+∞=∑和()k k B+∞=∑绝对收敛时,由定理3.4知()k k A+∞=∑和()0k k B +∞=∑收敛,设其和分别为1σ与2σ,从而它们按项相乘所得的正项级数(0)(0)(0)(1)(1)(0)(0)()(1)(1)()(0)()()k k k A B A B A B ABABAB-++++++++也收敛,其和为12σσ.因为(0)()(1)(1)()(0)(0)()(1)(1)()(0)k k k k k k A B A B A B ABABAB--+++≤+++所以矩阵级数(3.2)绝对收敛.记()()1NN k k SA==∑,()()2NN k k SB ==∑,()(0)()(1)(1)()(0)3()NN k k k k SA B A B A B -==+++∑则()()()(1)()(2)(1)(2)()()(1)()()123N N N N N N N N N S S S A B A B A B A B A B --=++++++又记()()1NN k k Aσ==∑,()()2NN k k B σ==∑,()(0)()(1)(1)()(0)3()NN k k k k A B A B A B σ-==+++∑显然()()()()()()123123N N N N N N S S S σσσ-≤-故由()()12lim N N N S S AB →+∞=和()()()123lim ()0N N N N σσσ→+∞-=,得()3lim N N S AB →+∞=证毕下面讨论一类特殊的矩阵级数——矩阵幂级数. 定义3.5 设n nA C⨯∈,C(0,1,)k a k ∈= .称矩阵级数kk k a A+∞=∑为矩阵A 的幂级数.利用定义来判定矩阵幂级数的敛散性,需要判别2n 个数项级数的敛散性,当矩阵阶数n 较大时,这是很不方便的,且在许多情况下也无此必要.显然,矩阵幂级数是复变量z 的幂级数0kk k a z+∞=∑的推广.如果幂级数kk k a z+∞=∑的收敛半径为r ,则对收敛圆z r <内的所有z ,kk k a z+∞=∑都是绝对收敛的.因此,讨论kk k a A+∞=∑的收敛性问题自然联系到kk k a z+∞=∑的收敛半径.定理3.6 设幂级数kk k a z+∞=∑的收敛半径为r ,Cn nA ⨯∈.则(1)当ρ(A )<r 时,矩阵幂级数0kk k a A+∞=∑绝对收敛;(2)当ρ(A )>r 时,矩阵幂级数kk k a A+∞=∑发散.证 (1)因为ρ(A )<r ,所以存在正数ε,使得ρ(A )+ε<r .根据定理2.14,存在Cn n⨯上的矩阵范数m ,使得m ()A A r ρε≤+<从m m(())kk k k k k a A a A a A ρε≤≤+而由于幂级数(())kkk aA ρε+∞=+∑收敛,故矩阵幂级数0k k k a A +∞=∑绝对收敛.(2)当ρ(A )>r 时,设A 的,n 个特征值为12,,,n λλλ ,则有某个l λ满足l r λ>.由Jordan 定理,存在n 阶可逆矩阵P ,使得11112(10)i n n P AP J λδδδλλ--⎛⎫⎪⎪== ⎪⎪⎝⎭代表或而kk k a J+∞=∑的对角线元素为0(1,2,,)k k jk a j n λ+∞==∑ .由于0k k lk a λ+∞=∑发散,从而0k k k a J +∞=∑发散.故由定理 3.5(4)知,kkk a A+∞=∑也发散. 证毕推论 设幂级数kkk a z +∞=∑的收敛半径为r ,C n n A ⨯∈.若存在C n n ⨯上的某一矩阵范数 使得A r <,则矩阵幂级数0kk k a A+∞=∑绝对收敛.例3.3 判断矩阵幂级数018216kkk k+∞=-⎛⎫ ⎪-⎝⎭∑的敛散性. 解 令181216A -⎛⎫= ⎪-⎝⎭.例3.1中已求得5()6A ρ=.由于幂级数0kk kz +∞=∑的收敛半径为r =1,故由ρ(A )<1知矩阵幂级数kk kA+∞=∑绝对收敛.最后,考虑一个特殊的矩阵幂级数. 定理3.7 设Cn nA ⨯∈.矩阵幂级数kk A+∞=∑(称为Neumann 级数)收敛的充分必要条件是ρ(A )<1,并且在收敛时,其和为1()I A --. 证 当ρ(A )<1时,由于幂级数kk z+∞=∑的收敛半径r =1,故由定理 3.6知矩阵幂级数0kk A+∞=∑收敛.反之,若kk A+∞=∑收敛,记0kk S A+∞==∑,()()0NN k k SA ==∑则()lim N N S S →+∞=.由于()(1)()(1)lim lim ()=lim lim N N N N N N N N N A S S S S O --→+∞→+∞→+∞→+∞==--故由定理3.3知ρ(A )<1.当kk A+∞=∑收敛时,ρ(A )<1,因此I -A 可逆,又因为()1()N N S I A I A +-=-所以()111()()N N S I A A I A -+-=---故()1lim ()N N S S I A -→+∞==- 证毕 例3.4 已知0.20.10.20.50.50.40.10.30.2A ⎛⎫ ⎪= ⎪ ⎪⎝⎭,判断矩阵幂级数0k k A +∞=∑的敛散性.若收敛,试求其和.解 因为10.91A =<,所以kk A+∞=∑收敛,且102814141()44624214202535k k A I A +∞-=⎛⎫ ⎪=-= ⎪ ⎪⎝⎭∑ §3.3 矩阵函数矩阵函数是以矩阵为变量且取值为矩阵的一类函数.本节介绍矩阵函数的定义和计算方法,并讨论常用矩阵函数的性质. 一、矩阵函数的定义 定义3.5 设幂级数0k k k a z +∞=∑的收敛半径为r ,且当z r <时,幂级数收敛于函数f (z ),即0()()kk k f z a zz r +∞==<∑如果Cn nA ⨯∈满足ρ(A )<r ,则称收敛的矩阵幂级数kk k a A+∞=∑的和为矩阵函数,记为f (A ),即0()(3.3)kk k f A a A+∞==∑根据这个定义,可以得到在形式上和数学分析中的一些函数类似的矩阵函数.例如,对于如下函数的幂级数展开式02120101e ()!(1)sin ()(21)!(1)cos ()(2)!(1)(1)(1)ln(1)(1)1kzk k k k k kk kk k k k z r k z zr k z zr k z z r z zr k +∞=+∞+=+∞=+∞-=+∞+===+∞-==+∞+-==+∞-==-+==+∑∑∑∑∑ 相应地有矩阵函数01e !kk A A k +∞==∑(C n n A ⨯∈) 210(1)sin (21)!kk k A A k +∞+=-=+∑ (C n n A ⨯∈)20(1)cos (2)!k kk A A k +∞=-=∑ (C n n A ⨯∈)1()k k I A A +∞-=-=∑ (ρ(A )<1)1(1)ln()1k k k I A A k +∞+=-+=+∑ (ρ(A )<1)称e A为矩阵指数函数,sin A 为矩阵正弦函数,cos A 为矩阵余弦函数.如果把矩阵函数f (A )的变元A 换成At ,其中t 为参数,则相应得到()()(3.4)kk k f At a At +∞==∑在实际应用中,经常需要求含参数的矩阵函数.二、矩阵函数值的计算以上利用收敛的矩阵幂级数的和定义了矩阵函数f (A ),在具体应用中,要求将f (A )所代表的具体的矩阵求出来,即求出矩阵函数的值.这里介绍几种求矩阵函数值的方法.以下均假设式(3.3)或式(3.4)中的矩阵幂级数收敛. 方法一 利用Hamilton-Cayley 定理利用Hamilton-Cayley 定理找出矩阵方幂之间的关系,然后化简矩阵幂级数求出矩阵函数的值.举例说明如下. 例3.5 已知0110A ⎛⎫=⎪-⎝⎭,求e At.解 可求得2det()1I A λλ-=+.由Hamilton-Cayley 定理知2A I O +=,从而2A I =-,3A A =-,4A I =,5A A =,…即2(1)k k A I =-,21(1)(1,2,)k k A Ak +=-=故243501e 1!2!4!3!5!cos sin (cos )(sin )sin cos Atk k k t t t t A t I t Ak t t t I t A t t +∞=⎛⎫⎛⎫==-+-+-+- ⎪ ⎪⎝⎭⎝⎭⎛⎫=+= ⎪-⎝⎭∑例3.6 已知4阶方阵A 的特征值为π,-π,0,0,求sin A ,cos A .解 因为2422det()(π)(π)πI A λλλλλλ-=-+=-,所以422πA A O -=.于是422πA A =,523πA A =,642πA A =,743πA A =,…即2222πkk A A -=,21223π(2,3,)k k A A k +-==故213223023321323332(1)1(1)sin π(21)!3!(21)!11(1)π3!π(21)!sin ππ1ππk k k k k k k k k A A A A Ak k A A A k A A A A +∞+∞+-==+∞+=--==-+++⎛⎫-=-+ ⎪+⎝⎭=+=-∑∑∑-22222022222(1)1(1)cos π(2)!2!(2)!cos π12ππk k k k k k A A I A Ak k I A I A +∞+∞-==--==-+=+=-∑∑-方法二 利用相似对角化 设C n nA ⨯∈是可对角化的,即存在C n n n P ⨯∈,使得112diag(,,,)n P AP A λλλ-== 则有11112112()()()diag(,,,)diag((),(),,())kkk k k k k k k kk k k k k n k k k n f A a A a P P P a P P a a a P P f f f P λλλλλλ+∞+∞+∞--===+∞+∞+∞-===-==Λ=Λ==∑∑∑∑∑∑同理可得112()diag((),(),,())n f At P f t f t f t P λλλ-=例3.7 已知460350361A ⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭,求e At,cos A .解 可求得2det()(2)(1)I A λλλ-=+-,即A 的特征值为12λ=-,231λλ==.对应12λ=-的特征向量为T 1(1,1,1)p =-,对应231λλ==的两个线性无关的特征向量为T 2(2,1,0)p =-,T 3(0,0,1)p =.于是120110101P --⎛⎫ ⎪= ⎪ ⎪⎝⎭ 使得1211P AP --⎛⎫⎪= ⎪ ⎪⎝⎭故22212222e 2e e 2e 2e 0e e e e2e e 0e e e 2e 2e e tt t t t At tt t t t t t t t tt P P --------⎛⎫⎛⎫-- ⎪ ⎪==--⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭1cos(2)cos cos1cos12cos1cos 22cos12cos 20cos 2cos12cos 2cos10cos 2cos12cos 22cos1cos1A P--⎛⎫⎪= ⎪ ⎪⎝⎭--⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭方法三 利用Jordan 标准形 设Cn nA ⨯∈,且C n nn P ⨯∈,使得121s J J P AP J J -⎛⎫ ⎪⎪== ⎪ ⎪⎝⎭ 其中×1(1,2,,)1i iii i i r rJ i s λλλ⎛⎫ ⎪⎪== ⎪⎪⎝⎭由定理1.12得111111001(1)01(1C C ()C ()()1!(1)!()1!()()1!(1)!i i i i i i i r k r k k i k i k ik k k k i i k i k k k k k ik i r r k k k i k k k k k tr r i f J t a J t a t t t r a t t t f f f r λλλλλλλλλλλλλλλλ--+-+∞+∞-==--+∞==--⎛⎫ ⎪⎪== ⎪ ⎪ ⎪⎝⎭⎛⎫' ⎪- ⎪⎪= ⎪⎪'⎪ ⎪⎝⎭'-=∑∑∑)()()()1!()i tt f t f f λλλλλ=⎛⎫ ⎪ ⎪⎪ ⎪⎪' ⎪ ⎪⎝⎭从而1010110011()()()()()k kk kk k k k k k k k k k k k k k k s k s f At a A t a PJP t a J tP a J t P P P a J t f J t P Pf J t +∞+∞-==+∞=+∞--=+∞=-==⎛⎫⎪ ⎪== ⎪⎪ ⎪ ⎪⎝⎭⎛⎫ ⎪= ⎪ ⎪⎝⎭∑∑∑∑∑例3.8 已知101120403A -⎛⎫⎪= ⎪ ⎪-⎝⎭,求e A,sin At .解 例1.9已求得100111210P ⎛⎫ ⎪=-- ⎪ ⎪⎝⎭,11112P AP J -⎛⎫⎪== ⎪ ⎪⎝⎭于是12222e e e 0ee e 3e e e 2e+e e 4e 03e A P P -⎛⎫⎛⎫ ⎪ ⎪==- ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭-- 1sin cos sin sin sin 2sin 2cos 0cos sin 2cos sin 2sin 2cos sin sin 24cos 02cos sin t t t At P t Pt t t t t t t t t t t t t t t t t t t t -⎛⎫⎪= ⎪ ⎪⎝⎭-⎛⎫ ⎪=+---+ ⎪ ⎪-+⎝⎭根据Jordan 标准形理论可得 定理3.8 设Cn nA ⨯∈,1λ,2λ,…,n λ是A 的n 个特征值,则矩阵函数f (A )的特征值为1()f λ,2()f λ,…,()n f λ. 方法四 待定系数法 设Cn nA ⨯∈,且A 的特征多项式为1212()det()()()()(3.5)srr r s I A ψλλλλλλλλ=-=---其中1λ,2λ,…,s λ是A 的全部互异特征值,12s r r r n +++= .为计算矩阵函数()k kk k f At a A t +∞==∑,记0()k k k k f t a t λλ+∞==∑.将f (λt )改写为()(,)()(,)(3.6)f t q t r t λλψλλ=+其中q (λ,t )是含参数t 的λ的幂级数,r (λ,t )是含参数t 且次数不超过n -1的λ的多项式,即1110(,)()()()n n r t b t b t b t λλλ--=+++由Hamilton-Cayley 定理知ψ(A )=O ,于是由式(3.6)得1110()(,)()(,)()()()n n f At q A t A r A t b t Ab t A b t Iψ--=+=+++可见,只要求出()(0,1,,1)k b t k n =- 即可得到f (At ).注意到()()0(0,1,,1;1,2,,)l i i l r i s ψλ==-=将式(3.6)两边对λ求导,并利用上式,得d d ()(,)d d iil ll l f t r t λλλλλλλλ=== 即d d ()(,)(0,1,,1;1,2,,)(3.7)d d iil l li l l t t f r t l r i s μλλλμλμλ====-=由式(3.7)即得到以0()b t ,1()b t ,…,1()n b t -为未知量的线性方程组. 综上分析,用待定系数法求矩阵函数f (At )或f (A )的步骤如下: 第一步:求矩阵A 的特征多项式(3.5);第二步:设1110()n n r b b b λλλ--=+++ .根据()()()()(0,1,,1;1,2,,)i l l l i i tr t f l r i s λλλλ===-=或()()()()(0,1,,1;1,2,,)l l i i i r f l r i s λλ==-=列方程组求解0b ,1b ,…,1n b -;第三步:计算1110()(())()n n f At f A r A b A b A b I --==+++ 或.例3.9 已知101120403A -⎛⎫ ⎪= ⎪ ⎪-⎝⎭,求e At,cos A .解 可求得2det()(1)(2)I A λλλ-=--.设2210()r b b b λλλ=++则由210212210(1)e (1)2e (2)42e tt t r b b b r b b t r b b b ⎧=++=⎪'=+=⎨⎪=++=⎩解得222120e e e 2e 2e 3e e 2e t t t t t t t t b t b t b t ⎧=--⎪=-++⎨⎪=-⎩于是2222210e 2e 0e e e e 2ee e e e 4e 02e e t tAt t t tt t t t t ttt t b A b A b I t t t t t ⎛⎫-⎪=++=-++-- ⎪ ⎪ ⎪-+⎝⎭而由21021210(1)cos1(1)2sin1(2)42cos 2r b b b r b b r b b b =++=⎧⎪'=+=-⎨⎪=++=⎩解得210sin1cos1cos 23sin12cos12cos 22sin1cos 2b b b =-+⎧⎪=-+-⎨⎪=+⎩从而22102sin1cos 20sin1cos 2sin1cos1cos 2cos 2sin1cos1cos 24sin102sin1cos1A b A b A b I +-⎛⎫ ⎪=++=-+--+ ⎪ ⎪-+⎝⎭如果求得矩阵A 的最小多项式,且其次数低于A 的特征多项式的次数,则计算矩阵函数就要容易一些.例3.10 已知311202113A -⎛⎫ ⎪=- ⎪ ⎪--⎝⎭,求e At ,sin A . 解 例1.9已求得A 的Jordan 标准形为2212J ⎛⎫⎪= ⎪ ⎪⎝⎭于是A 的最小多项式为2()(2)A m λλ=-.设10()r b b λλ=+由21021(2)2e (2)e t tr b b r b t ⎧=+=⎪⎨'==⎪⎩ 解得2120e (12)et t b t b t ⎧=⎪⎨=-⎪⎩ 于是2101e e 21221At t tt t b A b I t tt t t t +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭又由101(2)2sin 2(2)cos 2r b b r b =+=⎧⎨'==⎩ 解得10cos 2sin 22cos 2b b =⎧⎨=-⎩从而10sin 2cos 2cos 2cos 2sin 2cos 2sin 22cos 22cos 2cos 2cos 2sin 2cos 2A b A b I +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭三、常用矩阵函数的性质常用的矩阵函数有e A,sin A ,cos A ,它们有些性质与普通的指数函数和三角函数相同,但由于矩阵乘法不满足交换律,从而有些性质与一般指数函数和三角函数不相同. 定理3.9 对任意Cn n A ⨯∈,总有(1)sin(-A )=-sin A ,cos(-A )=cos A ; (2)i e cos isin AA A =+,i -i 1cos (e e )2A A A =+,i -i 1sin (e e )2iA A A =-. 证 (1)由sin A 与cos A 的矩阵幂级数形式直接得到;(2)i 221000i (1)(1)e i !(2)!(21)!cos isin k k k Ak k k k k k A A A k k k A A+∞+∞+∞+===--==++=+∑∑∑又有-i e cos()isin()cos isin A A A A A =-+-=- 从而i -i 1cos (e e )2A A A =+,i -i 1sin (e e )2iA A A =- 定理3.10 设A ,C n nB ⨯∈,且AB =BA ,则(1)ee e e e A BA B B A +==;(2)sin(A +B )=sin A cos B +cos A sin B ;(3)cos(A +B )=cos A cos B -sin A sin B .证 (1)0022011e e !!1()(2)2!1()e !A Bk k k k k A B k A B k k I A B A AB B A B k +∞+∞==+∞+=⎛⎫⎛⎫= ⎪⎪⎝⎭⎝⎭=++++++=+=∑∑∑(2)i()-i()i i -i -i i -i i -i i -i i -i 11sin()(e e )(e e e e )2i 2i 1111(e e )(e e )(e e )(e e )2i 222i sin cos cos sin A B A B A B A B A A B B A A B B A B A B A B+++=-=-=-+++-=+ 同理可证(3). 证毕在定理3.10中,取A =B ,即得 推论 对任意Cn nA ⨯∈,有22cos 2cos sin A A A =-,sin2A =2sin A cos A 值得注意的是,当AB ≠BA 时,ee e A BA B +=或e e e A B B A +=不成立.如取0010A ⎛⎫= ⎪⎝⎭,0100B ⎛⎫= ⎪⎝⎭,则0110A B ⎛⎫+= ⎪⎝⎭,00100100AB BA ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭且10e 11A⎛⎫= ⎪⎝⎭,11e 01B ⎛⎫= ⎪⎝⎭,-1-1-1-1e+e e e 1e 2e e e+e A B+⎛⎫= ⎪⎝⎭-- 可见1121e e e e 1211A BB A ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭e e e A B A B +≠,e e e A B B A +≠定理3.11 设Cn nA ⨯∈,则有(1)tr dete eA A=;(2)1(e )e A A --=.证 (1)设A 的特征值为1λ,2λ,…,n λ.则由定理3.8知,e A的特征值为1e λ,2e λ,…,e n λ,从而1212tr dete =e e e e e n n A A λλλλλλ++==…+…(2)由于tr dete =e0AA≠,所以e A 总是可逆的.又由定理3.10,得e e e e A A A A OI--===故1(e )e A A --=. 证毕需要指出的是,对任何n 阶方阵A ,e A总是可逆的,但sin A 与cos A 却不一定可逆.如取π00π/2A ⎛⎫=⎪⎝⎭,则00sin 01A ⎛⎫= ⎪⎝⎭,10cos 00A -⎛⎫= ⎪⎝⎭.可见sin A 与cos A 都不可逆.§3.4 矩阵的微分和积分在研究微分方程组时,为了简化对问题的表述及求解过程,需要考虑以函数为元素的矩阵的微分和积分.在研究优化等问题时,则要碰到数量函数对向量变量或矩阵变量的导数,以及向量值或矩阵值函数对向量变量或矩阵变量的导数.本节简单地介绍这些内容. 一、函数矩阵的微分和积分定义 3.6 以变量t 的函数为元素的矩阵()(())i j m n A t a t ⨯=称为函数矩阵,其中()(1,2,,;1,2,,)ij a t i m j n == 都是变量t 的函数.若t ∈[a ,b ],则称A (t )是定义在[a ,b )上的;又若每个()ij a t 在[a ,b ]上连续、可微、可积,则称A (t )在[a ,b ]上是连续、可微、可积的.当A (t )可微时,规定其导数为()(())ijm n A t a t ⨯''=或d d ()()d d ij m nA t a t t t ⨯⎛⎫= ⎪⎝⎭而当A (t )在[a ,b ]上可积时,规定A (t )在[a ,b ]上的积分为()()d ()d bb ijaam nA t t a t t ⨯=⎰⎰例3.11 求函数矩阵23sin cos ()2e 01t t t t t A t t t ⎛⎫⎪= ⎪ ⎪⎝⎭的导数. 解2cos sin 1d ()2ln 2e 2d 003t t t t A t t t t -⎛⎫⎪= ⎪ ⎪⎝⎭关于函数矩阵,有下面的求导法则.定理3.12 设A (t )与B (t )是适当阶的可微矩阵,则(1)d d d(()())()()d d d A t B t A t B t t t t+=+ (2)当λ(t )为可微函数时,有d d d (()())()()()()d d d t A t t A t t A t t t t λλλ⎛⎫=+ ⎪⎝⎭(3)d d d (()())()()()()d d d A t B t A t B t A t B t t t t ⎛⎫=+ ⎪⎝⎭; (4)当u =f (t )关于t 可微时,有d d()()()d d A u f t A u t u'= (5)当1()A t -是可微矩阵时,有111d d (())()()()d d A t A t A t A t t t ---⎛⎫=- ⎪⎝⎭证 只证(2)和(5).设()(())ij m n A t a t ⨯=,()(())ij n p B t b t ⨯=,则111d d (()())(()())d d d d ()()()()d d d d ()()()()d d nik kj m n k n nik kj ik kj k k m nA tB t a t b t t t a t b t a t b t t t A t B t A t B t t t ⨯===⨯=⎛⎫⎛⎫=+ ⎪ ⎪⎝⎭⎝⎭⎛⎫=+ ⎪⎝⎭∑∑∑由于1()()A t A t I-=,两边对t 求导,得11d d ()()()()d d A t A t A t A t O t t --⎛⎫+= ⎪⎝⎭从而111d d ()()()()d d A t A t A t A t t t ---⎛⎫=- ⎪⎝⎭证毕 定理3.13 设C n nA ⨯∈,则有(1)d e e e d AtAt At A A t ==; (2)dsin cos (cos )d At A At At A t ==;(3)dcos sin (sin )d At A At At A t=-=-.证 这里只证(1).(2)和(3)的证明与(1)类似.由0e !k Atkk t A k +∞==∑,并利用绝对收敛级数可以逐项求导,得101111d d e d d !(1)!e (1)!k k At k k k k k k Atk t t A A t t k k tA A A k -+∞+∞==-+∞-===-==-∑∑∑同样11111d e ==e d (1)!(1)!k k At k k At k k t t A A A A t k k --+∞+∞-==⎛⎫= ⎪--⎝⎭∑∑ 证毕根据定义和积分的有关性质,可得定理3.14 设A (t ),B (t )是区间[a ,b ]上适当阶的可积矩阵,A ,B 是适当阶的常数矩阵,λ∈C ,则 (1)(()())d ()d ()d bb baaaA tB t t A t t B t t +=+⎰⎰⎰;(2)()d ()d bba aA t t A t t λλ=⎰⎰;(3)()()d ()d bbaaA tB t A t t B =⎰⎰,()d ()d b baaAB t t A B t t =⎰⎰;(4)当A (t )在[a ,b ]上连续时,对任意t ∈(a ,b ),有()d ()d ()d t aA A t tττ=⎰(5)当A (t )在[a ,b]上连续可微时,有()d ()()baA t t A b A a '=-⎰以上介绍了函数矩阵的微积分概念及一些运算法则.由于d()d A t t仍是函数矩阵,如果它仍是可导矩阵,即可定义其二阶导数.不难给出函数矩阵的高阶导数11d d d ()()d d d k k k k A t A t t t t --⎛⎫= ⎪⎝⎭二、数量函数对矩阵变量的导数定义 3.7 设f (X )是以矩阵()ij m n X x ⨯=为自变量的mn 元函数,且(1,2,,;1,2,,)ijfi m j n x ∂==∂ 都存在,规定f 对矩阵变量X 的导数d d f X 为 1111d d ij m nm mn ff x x n f fX x ff x x ⨯∂∂⎛⎫ ⎪∂∂ ⎪⎛⎫∂ ⎪== ⎪ ⎪ ⎪∂⎝⎭∂∂ ⎪ ⎪∂∂ ⎪⎝⎭特别地,以T12(,,,)n x ξξξ= 为自变量的函数f (x )的导数T12d (,,,)d nf f f f x ξξξ∂∂∂=∂∂∂ 称为数量函数对向量变量的导数,即为在数学分析中学过的函数f 的梯度向量,记为grad f .例 3.12 设T 12(,,,)n a a a a = 是给定的向量,T 12(,,,)n x ξξξ= 是向量变量,且T T ()f x a x x a ==求d d f x. 解 因为1()nk kk f x a ξ==∑而(1,2,,)j jfa j n ξ∂==∂ 所以 TT 1212d (,,,)(,,,)d n nf f f f a a a a x ξξξ∂∂∂===∂∂∂ 例3.13 设()ij m n A a ⨯=是给定的矩阵,()ij n m X x ⨯=是矩阵变量,且()tr()f x Ax =求d d fX. 解 因为1()nikkj m m k AX ax ⨯==∑.所以11()tr()m nsk ks s k f X AX a x ====∑∑而(1,2,,;1,2,,)ijfi n j m x ∂==∂ 故T d ()d ji n m ij n mf f a A X x ⨯⨯⎛⎫∂=== ⎪ ⎪∂⎝⎭ 例 3.14 设()ij n n A a ⨯=是给定的矩阵,T 12(,,,)n x ξξξ= 是向量变量,且T ()f x x Ax =求d d f x. 解 因为T1111()()n nn ns sk ks sk k s k s k f x x Ax aa ξξξξ=======∑∑∑∑而1111,11,111()nj j j j jk k j jj j j j n nj k j n nsj s jk ks k fa a a a a a a a ξξξξξξξξξ--++===∂=+++++++∂=+∑∑∑所以1111111T T d d ()n ns s k k s k n nsn s nk k s k n f a a f x f a a A x Ax A A xξξξξξξ====∂⎛⎫⎛⎫+ ⎪ ⎪∂⎪ ⎪ ⎪== ⎪ ⎪ ⎪∂ ⎪ ⎪+ ⎪⎪∂⎝⎭⎝⎭=+=+∑∑∑∑ 特别地,当A 是对称矩阵时,有d 2d fAx x=例3.15 设()ij n n X x ⨯=是矩阵变量,且det X ≠0.证明1T ddet (det )()d X X X X-= 证 设ij x 的代数余子式为ij X .把det X 按等i 行展开,得1det nikik k X xX ==∑于是det ij ijX X x ∂=∂故 T1T 1Tddet det ()(adj )d ((det ))(det )()ij n n ij n nX X X X X x X X X X ⨯⨯--⎛⎫∂=== ⎪ ⎪∂⎝⎭== 三、矩阵值函数对矩阵变量的导数定义3.8 设矩阵()(())ij s t F X f X ⨯=的元素()(1,2,,;1,2,,)ij f X i s j t == 都是矩阵变量()ij m n X x ⨯=的函数,则称F (X )为矩阵值函数,规定F (X )对矩阵变量X 的导数d d FX为111d d 1FF x x n F X FF x x m mn ∂∂⎛⎫ ⎪∂∂ ⎪⎪= ⎪∂∂ ⎪ ⎪∂∂ ⎪⎝⎭ ,其中1111tij s stf f x x ij ij F x f f x x ij ij ∂∂⎛⎫ ⎪∂∂ ⎪∂⎪=⎪∂ ⎪∂∂ ⎪∂∂ ⎪⎝⎭即其结果为(ms )×(nt )矩阵. 作为特殊情形,这一定义包括了向量值函数对于向量变量的导数,向量值函数对于矩阵变量的导数,矩阵值函数对于向量变量的导数等.例3.16 设T12(,,,)n x ξξξ= 是向量变量,求T T d d d d x xx x=. 解 由定义,得T 1TT 2T 100010d d 001n nx x x I x x ξξξ⎛⎫∂ ⎪∂ ⎪⎛⎫ ⎪∂ ⎪⎪ ⎪===∂ ⎪ ⎪⎪ ⎪⎪⎝⎭ ⎪∂ ⎪∂⎝⎭同理可得T 12d ,,,d n n x x x x I x ξξξ⎛⎫∂∂∂== ⎪∂∂∂⎝⎭例3.17 设T1234(,,,)a a a a a =是给定向量,24()ij X x ⨯=是矩阵变量,求Td()d Xa X,d()d Xa X. 解 因为41121k k k n k k k x a Xa x a ==⎛⎫⎪ ⎪= ⎪ ⎪⎝⎭∑∑,44T 1211()(,)k k k k k k Xa x a x a ===∑∑ 所以T T TT T 13141112T T T T 2122232431243124()()()()d()d ()()()()00000000Xa Xa Xa Xa x x x x Xa XXa Xa Xa Xa xx x x a aa a a a a a ⎛⎫∂∂∂∂⎪∂∂∂∂ ⎪=⎪∂∂∂∂ ⎪ ⎪∂∂∂∂⎝⎭⎛⎫= ⎪⎝⎭而131411122122232412341234()()()()d()()()()()d 00000000Xa Xa Xa Xa x x x x Xa Xa Xa Xa Xa Xxx x x a a a a a a a a ∂∂∂∂⎛⎫⎪∂∂∂∂ ⎪=⎪∂∂∂∂ ⎪∂∂∂∂⎝⎭⎛⎫⎪ ⎪=⎪⎪⎝⎭§3.5 矩阵分析应用举例本节介绍矩阵函数及矩阵微积分的一些应用. 一、求解一阶线性常系数微分方程组在数学或工程技术中,经常要研究一阶常系数微分方程组1111122112211222221122d ()()()()()d d ()()()()()d d ()()()()()d n n n n n n n nn n n x t a x t a x t a x t f t t x t a x t a x t a x t f t t x t a x t a x t a x t f t t ⎧=++++⎪⎪⎪=++++⎨⎪⎪=++++⎪⎩满足初始条件0()(1,2,,)i ix t c i n ==的解.如果记T12(),(,,,)ij n n n A a c c c c ⨯==T 12()((),(),,())n x t x t x t x t = ,T 12()((),(),,())n f t f t f t f t =则上述微分方程组可写为0d ()()()(3.8)d ()x t Ax t f t tx t c⎧=+⎪⎨⎪=⎩因为d d ()(e ())e ()()e d d d ()e ()e ()d At At At At At x t x t A x t t t x t Ax t f t t -----=-+⎛⎫=-= ⎪⎝⎭将上式两边在[0t ,t ]上积分,得00d (e ())d e ()d d tt A A t t x f τττττττ--=⎰⎰ 即00e()e()e ()d tAt A A t x t x t f ττττ----=⎰于是微分方程组的解为00()()e e e ()d tA t t At A t x t c f τττ--+⎰=例3.18 求解微分方程组初值问题113212313123d ()()()1d d ()()2()1d d ()4()3()2d (0)1,(0)0,(0)1x t x t x t t x t x t x t tx t x t x t t x x x ⎧=-++⎪⎪⎪=+-⎪⎨⎪=-++⎪⎪⎪===⎩ 解 记123()10111120,0,()(),()140312()x t A c x t x t f t x t -⎛⎫⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪====- ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎝⎭则微分方程组可以写成式(3.8)的矩阵形式.例3.9已求得222e 2e 0e e e e 2e e e e e 4e 02e e t t tAt t t tt t t t t t t t t t t t t ⎛⎫-⎪=-++-- ⎪ ⎪-+⎝⎭依次计算下列各量e e e e e 2e t t At t t t t c t t ⎛⎫- ⎪= ⎪ ⎪-⎝⎭,00e 1e e ()d e 1e 2e 22e t t t A t tf d τττττττ-------⎛⎫⎛⎫- ⎪ ⎪=-=-+ ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭⎰⎰, 0e 1e e ()d e 12e 2t t At A t tf τττ-⎛⎫- ⎪=-+ ⎪ ⎪-⎝⎭⎰故微分方程组的解为123e e e 1(2)e 1()()()e e 1(1)e 1()e 2e 2e 2(32)e 2t t t tt t t t t t t t t x t x t x t t t x t t ⎛⎫⎛⎫⎛⎫----⎛⎫⎪ ⎪ ⎪ ⎪==+-+=-+ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪----⎝⎭⎝⎭⎝⎭⎝⎭二、求解矩阵方程在控制论与系统理论中,要遇到形如AX +XB =F 的矩阵方程求解问题,这个矩阵方程也称为Lyapunov 方程.关于这个矩阵方程的解有如下结果. 定理3.15 给定矩阵方程 AX +XB =F (3.9) 其中Cm mA ⨯∈,Cn nB ⨯∈,Cm nF ⨯∈.如果A 和B 的所有特征值具有负实部(这种矩阵称为稳定矩阵),则该矩阵方程有惟一解e e d At Bt X F t +∞=-⎰证 记()e e At Bt Y t F =.则有Y (0)=F ,且d ()e e e e ()()(3.10)d At Bt At Bt Y t A F F B AY t Y t B t=+=+设12,,,m λλλ 是A 的m 个特征值,12,,,n μμμ 是B 的n 个特征值.根据利用Jordan 标准形求矩阵函数的方法(见§3.3)知,e At的元素是形如e (0)j tr t r λ≥的项的线性组合.因为A 的所有特征值j λ的实部是负的,所以lim eAtt O →+∞=.同理lim e Bt t O →+∞=.于是lim ()lim e e At Bt t t Y t F O →+∞→+∞==又由于e e At BtF 的元素是形如()e (0)i j tr t r λμ+≥的项的线性组合,且积分()0ed i j tr t t λμ+∞+⎰都存在,故积分e e d At Bt F t +∞⎰存在.对式(3.10)两边从0到+∞积分,得()()0()(0)()d ()d Y Y AY t t Y t t B +∞+∞+∞-=+⎰⎰即()()0()d ()d A Y t t Y t t B F+∞+∞-+-=⎰⎰这说明0e e d At Bt X F t +∞=-⎰是矩阵方程(3.9)的解.惟一性的证明见第七章. 证毕 推论1 设Cm mA ⨯∈,Cn nB ⨯∈,Cm nF ⨯∈,则矩阵微分方程d ()()()d (0)X t AX t X t B tX F⎧=+⎪⎨⎪=⎩的解为()e e At BtX t F =推论2 设A ,C n nF ⨯∈,且A 的所有特征值具有负实部,则矩阵方程HA X XA F+=-的惟一解为H 0ee d (3.11)A tAt X F t+∞=⎰如果F 是Hermite 正定矩阵,则解矩阵X 也是Hermite 正定矩阵.证 只需证明后一结论.当F 是Hermite 正定矩阵时,由式(3.11)可知X 是Hermite 矩阵.又对0Cnx ≠∈,由于eAt总是可逆的,所以e 0Atx ≠,于是HH H e e (e )(e )0A t At At At x F x x F x =>.从而HH 0(e )(e )d 0At At x Xx x F x t +∞=>⎰故X 是Hermite 正定矩阵. 证毕三、最小二乘问题 设Cm nA ⨯∈,C n b ∈.当线性方程组Ax =b 无解时,则对任意C nx ∈都有Ax -b ≠0.此时希望找出这样的向量0C n x ∈,它使2Ax b -达到最小,即022Clim (3.12)nx Ax b Ax b ∈-=-称这个问题为最小二乘问题,称0x 为矛盾方程组Ax =b 的最小二乘解.以下结论给出了当A ,b 分别是实矩阵和实向量时,Ax =b 的最小二乘解所满足的代数方程.定理3.16 设R m nA ⨯∈,R mb ∈,0R n x ∈.若0R n x ∈是Ax =b 的最小二乘解,则0x 是方程组TT(3.13)A Ax A b=的解.称式(3.13)为Ax =b 的法方程组.证 由于2T 2TTTTTT()()()f x Ax b Ax b Ax b x A Ax x A b b Ax b b=-=--=--+若0x 为Ax =b 的最小二乘解,则它应是f (x )的极小值点,从而d 0(3.14)d x f x=根据例3.12和例3.14,得T T d 22d fA Ax A b x=- 由式(3.14)即知T T00A Ax A b -=,故0x 是式(3.13)的解. 证毕 对于含约束条件的最小二乘问题,有如下的结果. 例3.19 设Rm nA ⨯∈,R m b ∈,Rk nB ⨯∈,R kd ∈,且Bx =d 有解.试求约束极小。