同济大学--矩阵分析课件---矩阵论§3.6-2
- 格式:pdf
- 大小:197.77 KB
- 文档页数:10
第三章 矩阵分解把矩阵分解为形式比较简单或具有某种特性的一些矩阵的乘积,在矩阵理论的研究与应用中,都是十分重要的。
因为这些分解式的特殊形式一方面能明显地反映出原矩阵的某些数值特征,如矩阵的秩、行列式、特征值及奇异值等,另一方面分解的方法与过程往往提供了某些有效的数值计算方法和理论分析根据。
本章将分别介绍矩阵的五种分解:三角分解、QR 分解、满秩分解、谱分解和奇异值分解,并简单介绍了矩阵的正则性。
§3.1 矩阵的三角分解三角矩阵的计算,如求行列式、求逆矩阵、求解线性方程组等,都是很方便的,因此首先研究是否可将矩阵分解成一些三角矩阵的乘积。
定义3.1.1 设n n A C ⨯∈,如果存在下三角矩阵n n L C ⨯∈和上三角矩阵n n R C ⨯∈,使得A LR =,则称A 可以作三角分解。
定理 3.1.1 设n n n A C ⨯∈,则A 可以作三角分解的充分必要条件是0k ∆≠(1,2,,1)k n =-,其中det k k A ∆=为A 的k 阶顺序主子式,而k A 为A 的k 阶顺序主子阵。
证明:必要性。
已知A 可以作三角分解,即A LR =,其中()ij n nL l ⨯=(0,)ij l i j =<,()ij n nR r ⨯=(0,)ij r i j =>。
将A ,L 和R 进行分块,得12122122212222kkkA A L O R R A A L L O R ⎛⎫⎛⎫⎛⎫= ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭, 这里k A ,k L 和k R 分别是A ,L 和R 的k 阶顺序主子阵,且k L 和k R 分别是上三角矩阵和下三角矩阵。
由矩阵的分块乘法运算,得k k k A L R = (1,2,,)k n =,由于1111det det det 0nn nn A L R l l r r ==≠,所以1111det det det 0(1,2,1)k k k kkk kk A L R l l r r k n ∆===≠=-充分性。
第三章 矩阵分析在此之前我们只研究了矩阵的代数运算,但在数学的许多分支和工程实际中,特别是涉及到多元分析时,还要用到矩阵的分析运算.本章首先讨论矩阵序列的极限和矩阵级数,然后介绍矩阵函数和它的计算,最后介绍矩阵的微积分,以及矩阵分析在解微分方程组和线性矩阵方程中的应用.§3.1 矩阵序列 定义 3.1 设有Cm n⨯中的矩阵序列{}()k A ,其中()()()k k ij m nAa ⨯=.若()lim (1,2,,;1,2,,)k ij ij k a a i m j n →+∞=== ,则称矩阵序列{}()k A 收敛于()ij m n A a ⨯=,或称A 为矩阵序列{}()k A 的极限,记为()lim k k A A →+∞=或()()k A A k →→+∞不收敛的矩阵序列称为发散. 由定义可见,Cm n⨯中一个矩阵序列的收敛相当于mn 个数列同时收敛.因此,可以用初等分析的方法来研究它.但同时研究mn 个数列的极限未免繁琐.与向量序列一样,可以利用矩阵范数来研究矩阵序列的极限. 定理 3.1 设()k A,C (012)m n A k ,,,⨯∈= .则()lim k k AA →+∞=的充分必要条件是()lim 0k k A A →+∞-=,其中 是C m n ⨯上的任一矩阵范数.证 先取Cm n⨯上矩阵的G-范数.由于()()()()1=1k k k ij ij ij ij Gi,jm nk ijiji j a a a a A Aaa =-≤-=-≤-所以()lim k k A A →+∞=的充分必要条件是()lim 0k Gk A A→+∞-=.又由范数的等价性知,对C m n⨯上任一矩阵范数 ,存在正常数α,β,使得()()()k k k GGAAAA AA αβ-≤-≤-故()lim 0k Gk AA→+∞-=的充分必要条件是()lim 0k k A A →+∞-=.证毕推论 设()k A,C(012)m nA k ,,,⨯∈= ,()lim k k A A →+∞=.则()lim k k A A →+∞=其中 是Cm n⨯上任一矩阵范数.证 由()()k k AA A A -≤-即知结论成立.证毕需要指出的是,上述推论的相反结果不成立.如矩阵序列()1(1)112k k A k ⎛⎫- ⎪=+ ⎪ ⎪⎝⎭不收敛.但()Flim lim k k x A →+∞== 收敛的矩阵序列的性质,有许多与收敛数列的性质相类似. 定理3.2 设()lim k k AA →+∞=,()lim k k B B →+∞=,其中()k A ,()k B ,A ,B 为适当阶的矩阵,α,β∈C .则 (1)()()lim ()k k k AB A B αβαβ→+∞+=+;(2) ()()lim k k k A BAB →+∞=;(3)当()k A与A 均可逆时,()11lim ()k k AA --→+∞=.证 取矩阵范数 ,有()()()()()()()()()()()()()()()k k k k k k k k k k k k k A B A B A A B B A B ABA B A B A B AB A B B A A Bαβαβαβ+-+≤-+--=-+-≤-+-由定理3.1和推论知(1)和(2)成立.因为()1()k A -,1A -存在,所以()lim det det 0k k AA →+∞=≠,又有()lim adj adj k k A A →+∞=.于是()()11()adj adj lim ()lim det det k k k k k A AA A A A--→+∞→+∞=== 证毕 定理3.2(3)中条件()k A与A 都可逆是不可少的,因为即使所有的()k A可逆也不能保证A一定可逆.例如()11111k Ak ⎛⎫+ ⎪= ⎪ ⎪⎝⎭对每一个()k A都有逆矩阵()1()1k kk A k k --⎛⎫=⎪-+⎝⎭,但()11lim 11k k A A →+∞⎛⎫== ⎪⎝⎭而A 是不可逆的. 在矩阵序列中,最常见的是由一个方阵的幂构成的序列.关于这样的矩阵序列有以下的概念和收敛定理. 定义3.2 设n nA C ⨯∈,若()lim 0k k A→+∞=,则称A 为收敛矩阵.定理3.3 设n nA C⨯∈,则A 为收敛矩阵的充分必要条件是ρ(A )<1.证 必要性.已知A 为收敛矩阵,则由谱半径的性质,有(())()k k k A A A ρρ=≤其中 是Cn n⨯上任一矩阵范数,即有lim (())0kk A ρ→+∞=,故ρ(A )<1.充分性.由于ρ(A )<1,则存在正数ε,使得ρ(A )+ε<1.根据定理2.14,存在C n n⨯上的矩阵范数m ,使得()1m A A ρε≤+<从而由kk m mAA ≤得lim 0kmk A →+∞=.故lim 0k k A →+∞=. 证毕推论 设n nA C ⨯∈.若对Cn n⨯上的某一矩阵范数 有1A <,则A 为收敛矩阵.例3.1 判断下列矩阵是否为收敛矩阵:(1)181216A -⎛⎫= ⎪-⎝⎭; (2)0.20.10.20.50.50.40.10.30.2A ⎛⎫⎪= ⎪ ⎪⎝⎭. 解 (1)可求得A 的特征值为156λ=,212λ=-,于是5()16A ρ=<,故A 是收敛矩阵; (2)因为10.91A =<,所以A 是收敛矩阵.§3.2 矩阵级数定义3.3 由Cm n⨯中的矩阵序列{}()k A 构成的无穷和(0)(1)()k A A A ++++ 称为矩阵级数,记为()k k A+∞=∑.对任一正整数N ,称()()NN k k SA ==∑为矩阵级数的部分和.如果由部分和构成的矩阵序列{}()N S收敛,且有极限S ,即()lim N N SS →+∞=,则称矩阵级数()0k k A +∞=∑收敛,而且有和S ,记为()k k S A+∞==∑不收敛的矩阵级数称为发散的.如果记()()()k k ij m n Aa ⨯=,()ij m n S s ⨯=,显然()0k k S A +∞==∑相当于()(1,2,,;1,2,,)k ij ij k a s i m j n +∞====∑即mn 个数项级数都收敛. 例3.2 已知()1π24(0,1,)10(1)(2)k kk A k k k ⎛⎫⎪ ⎪== ⎪ ⎪++⎝⎭研究矩阵级数()k A+∞∑的敛散性.解 因为k 00()()001π2410(1)(2)1π1242341012N Nk Nk k N k N k k N N S A k k N ====⎛⎫⎪ ⎪== ⎪ ⎪++⎝⎭⎛⎫⎛⎫-- ⎪ ⎪⎝⎭ ⎪= ⎪- ⎪+⎝⎭∑∑∑∑所以()4π2lim 301N N S S →+∞⎛⎫⎪= ⎪ ⎪⎝⎭故所给矩阵级数收敛,且其和为S . 定义3.4 设()()()C (0,1,)k k m n ij m n Aa k ⨯⨯=∈= .如果mn 个数项级数()0(1,2,,;1,2,,)k ijk ai m j n +∞===∑ 都绝对收敛,即()k ijk a +∞=∑都收敛,则称矩阵级数()k k A+∞=∑绝对收敛.利用矩阵范数,可以将判定矩阵级数是否绝对收敛转化为判定一个正项级数是否收敛的问题.定理3.4 设()()()C(0,1,)k k m nij m nAa k ⨯⨯=∈= .则矩阵级数()0k k A +∞=∑绝对收敛的充分必要条件是正项级数()0k k A +∞=∑收敛,其中 是C m n ⨯上任一矩阵范数.证 先取矩阵的1m -范数.若1()k k m A +∞=∑收敛,由于1()()()11(1,2,,;1,2,,)mnk k k ijij i j m aa A i m j n ==≤===∑∑从而由正项级数的比较判别法知()k ijk a+∞=∑都收敛,故()k k A+∞=∑绝对收敛.反之,若()k k A+∞=∑绝对收敛,则()0k ijk a+∞=∑都收敛,从而其部分和有界,即()0(1,2,,;1,2,,)Nk ijijk aM i m j n =≤==∑ 记,max ij i jM M =,则有1()()()0011110()()NNmnm n Nk k k ijijk k i j i j k m AaamnM =========≤∑∑∑∑∑∑∑故1()k k m A +∞=∑收敛.这表明()k k A+∞=∑绝对收敛的充分必要条件是1()k k m A +∞=∑收敛.由矩阵范数的等价性和正项级数的比较判别法知,1()k k m A+∞=∑收敛的充分必要条件是()0k k A +∞=∑收敛,其中 是C m n ⨯上任一矩阵范数. 证毕利用矩阵级数收敛和绝对收敛的定义,以及数学分析中的相应结果,可以得到以下一些结论.定理3.5 设()k k AA +∞==∑,()0k k B B +∞==∑,其中()k A ,()k B ,A ,B 是适当阶的矩阵,则(1)()()0()k k k AB A B +∞=+=+∑;(2)对任意λ∈C ,有()k k AA λλ+∞==∑;(3)绝对收敛的矩阵级数必收敛,并且任意调换其项的顺序所得的矩阵级数仍收敛,且其和不变; (4)若矩阵级数()k k A+∞=∑收敛(或绝对收敛),则矩阵级数()k k PAQ +∞=∑也收敛(或绝对收敛),并且有()()0()(3.1)k k k k PAQ P A Q+∞+∞===∑∑(5)若()k k A+∞=∑与()k k B+∞=∑均绝对收敛,则它们按项相乘所得的矩阵级数(0)(0)(0)(1)(1)(0)(0)()(1)(1)(()()(3.2)k k k A B AB A B A B A B A B -++++++++ 也绝对收敛,且其和为AB . 证 只证(4)和(5).若()0k k A+∞=∑收敛,记()()0NN k k SA ==∑,则()lim N N S A →+∞=.从而()()00lim(lim)NNk k N N k k PAQ P AQ PAQ →+∞→+∞====∑∑可见()k k PAQ +∞=∑收敛,且式(3.1)成立.若()k k A+∞=∑绝对收敛,则由定理3.4知()k k A +∞=∑收敛,但()()()k k k PA Q P AQ Aα≤≤其中α是与k 是无关的正数,从而()k k PAQ +∞=∑收敛,即()k k PAQ +∞=∑绝对收敛.当()k k A+∞=∑和()k k B+∞=∑绝对收敛时,由定理3.4知()k k A+∞=∑和()0k k B +∞=∑收敛,设其和分别为1σ与2σ,从而它们按项相乘所得的正项级数(0)(0)(0)(1)(1)(0)(0)()(1)(1)()(0)()()k k k A B A B A B ABABAB-++++++++也收敛,其和为12σσ.因为(0)()(1)(1)()(0)(0)()(1)(1)()(0)k k k k k k A B A B A B ABABAB--+++≤+++所以矩阵级数(3.2)绝对收敛.记()()1NN k k SA==∑,()()2NN k k SB ==∑,()(0)()(1)(1)()(0)3()NN k k k k SA B A B A B -==+++∑则()()()(1)()(2)(1)(2)()()(1)()()123N N N N N N N N N S S S A B A B A B A B A B --=++++++又记()()1NN k k Aσ==∑,()()2NN k k B σ==∑,()(0)()(1)(1)()(0)3()NN k k k k A B A B A B σ-==+++∑显然()()()()()()123123N N N N N N S S S σσσ-≤-故由()()12lim N N N S S AB →+∞=和()()()123lim ()0N N N N σσσ→+∞-=,得()3lim N N S AB →+∞=证毕下面讨论一类特殊的矩阵级数——矩阵幂级数. 定义3.5 设n nA C⨯∈,C(0,1,)k a k ∈= .称矩阵级数kk k a A+∞=∑为矩阵A 的幂级数.利用定义来判定矩阵幂级数的敛散性,需要判别2n 个数项级数的敛散性,当矩阵阶数n 较大时,这是很不方便的,且在许多情况下也无此必要.显然,矩阵幂级数是复变量z 的幂级数0kk k a z+∞=∑的推广.如果幂级数kk k a z+∞=∑的收敛半径为r ,则对收敛圆z r <内的所有z ,kk k a z+∞=∑都是绝对收敛的.因此,讨论kk k a A+∞=∑的收敛性问题自然联系到kk k a z+∞=∑的收敛半径.定理3.6 设幂级数kk k a z+∞=∑的收敛半径为r ,Cn nA ⨯∈.则(1)当ρ(A )<r 时,矩阵幂级数0kk k a A+∞=∑绝对收敛;(2)当ρ(A )>r 时,矩阵幂级数kk k a A+∞=∑发散.证 (1)因为ρ(A )<r ,所以存在正数ε,使得ρ(A )+ε<r .根据定理2.14,存在Cn n⨯上的矩阵范数m ,使得m ()A A r ρε≤+<从m m(())kk k k k k a A a A a A ρε≤≤+而由于幂级数(())kkk aA ρε+∞=+∑收敛,故矩阵幂级数0k k k a A +∞=∑绝对收敛.(2)当ρ(A )>r 时,设A 的,n 个特征值为12,,,n λλλ ,则有某个l λ满足l r λ>.由Jordan 定理,存在n 阶可逆矩阵P ,使得11112(10)i n n P AP J λδδδλλ--⎛⎫⎪⎪== ⎪⎪⎝⎭代表或而kk k a J+∞=∑的对角线元素为0(1,2,,)k k jk a j n λ+∞==∑ .由于0k k lk a λ+∞=∑发散,从而0k k k a J +∞=∑发散.故由定理 3.5(4)知,kkk a A+∞=∑也发散. 证毕推论 设幂级数kkk a z +∞=∑的收敛半径为r ,C n n A ⨯∈.若存在C n n ⨯上的某一矩阵范数 使得A r <,则矩阵幂级数0kk k a A+∞=∑绝对收敛.例3.3 判断矩阵幂级数018216kkk k+∞=-⎛⎫ ⎪-⎝⎭∑的敛散性. 解 令181216A -⎛⎫= ⎪-⎝⎭.例3.1中已求得5()6A ρ=.由于幂级数0kk kz +∞=∑的收敛半径为r =1,故由ρ(A )<1知矩阵幂级数kk kA+∞=∑绝对收敛.最后,考虑一个特殊的矩阵幂级数. 定理3.7 设Cn nA ⨯∈.矩阵幂级数kk A+∞=∑(称为Neumann 级数)收敛的充分必要条件是ρ(A )<1,并且在收敛时,其和为1()I A --. 证 当ρ(A )<1时,由于幂级数kk z+∞=∑的收敛半径r =1,故由定理 3.6知矩阵幂级数0kk A+∞=∑收敛.反之,若kk A+∞=∑收敛,记0kk S A+∞==∑,()()0NN k k SA ==∑则()lim N N S S →+∞=.由于()(1)()(1)lim lim ()=lim lim N N N N N N N N N A S S S S O --→+∞→+∞→+∞→+∞==--故由定理3.3知ρ(A )<1.当kk A+∞=∑收敛时,ρ(A )<1,因此I -A 可逆,又因为()1()N N S I A I A +-=-所以()111()()N N S I A A I A -+-=---故()1lim ()N N S S I A -→+∞==- 证毕 例3.4 已知0.20.10.20.50.50.40.10.30.2A ⎛⎫ ⎪= ⎪ ⎪⎝⎭,判断矩阵幂级数0k k A +∞=∑的敛散性.若收敛,试求其和.解 因为10.91A =<,所以kk A+∞=∑收敛,且102814141()44624214202535k k A I A +∞-=⎛⎫ ⎪=-= ⎪ ⎪⎝⎭∑ §3.3 矩阵函数矩阵函数是以矩阵为变量且取值为矩阵的一类函数.本节介绍矩阵函数的定义和计算方法,并讨论常用矩阵函数的性质. 一、矩阵函数的定义 定义3.5 设幂级数0k k k a z +∞=∑的收敛半径为r ,且当z r <时,幂级数收敛于函数f (z ),即0()()kk k f z a zz r +∞==<∑如果Cn nA ⨯∈满足ρ(A )<r ,则称收敛的矩阵幂级数kk k a A+∞=∑的和为矩阵函数,记为f (A ),即0()(3.3)kk k f A a A+∞==∑根据这个定义,可以得到在形式上和数学分析中的一些函数类似的矩阵函数.例如,对于如下函数的幂级数展开式02120101e ()!(1)sin ()(21)!(1)cos ()(2)!(1)(1)(1)ln(1)(1)1kzk k k k k kk kk k k k z r k z zr k z zr k z z r z zr k +∞=+∞+=+∞=+∞-=+∞+===+∞-==+∞+-==+∞-==-+==+∑∑∑∑∑ 相应地有矩阵函数01e !kk A A k +∞==∑(C n n A ⨯∈) 210(1)sin (21)!kk k A A k +∞+=-=+∑ (C n n A ⨯∈)20(1)cos (2)!k kk A A k +∞=-=∑ (C n n A ⨯∈)1()k k I A A +∞-=-=∑ (ρ(A )<1)1(1)ln()1k k k I A A k +∞+=-+=+∑ (ρ(A )<1)称e A为矩阵指数函数,sin A 为矩阵正弦函数,cos A 为矩阵余弦函数.如果把矩阵函数f (A )的变元A 换成At ,其中t 为参数,则相应得到()()(3.4)kk k f At a At +∞==∑在实际应用中,经常需要求含参数的矩阵函数.二、矩阵函数值的计算以上利用收敛的矩阵幂级数的和定义了矩阵函数f (A ),在具体应用中,要求将f (A )所代表的具体的矩阵求出来,即求出矩阵函数的值.这里介绍几种求矩阵函数值的方法.以下均假设式(3.3)或式(3.4)中的矩阵幂级数收敛. 方法一 利用Hamilton-Cayley 定理利用Hamilton-Cayley 定理找出矩阵方幂之间的关系,然后化简矩阵幂级数求出矩阵函数的值.举例说明如下. 例3.5 已知0110A ⎛⎫=⎪-⎝⎭,求e At.解 可求得2det()1I A λλ-=+.由Hamilton-Cayley 定理知2A I O +=,从而2A I =-,3A A =-,4A I =,5A A =,…即2(1)k k A I =-,21(1)(1,2,)k k A Ak +=-=故243501e 1!2!4!3!5!cos sin (cos )(sin )sin cos Atk k k t t t t A t I t Ak t t t I t A t t +∞=⎛⎫⎛⎫==-+-+-+- ⎪ ⎪⎝⎭⎝⎭⎛⎫=+= ⎪-⎝⎭∑例3.6 已知4阶方阵A 的特征值为π,-π,0,0,求sin A ,cos A .解 因为2422det()(π)(π)πI A λλλλλλ-=-+=-,所以422πA A O -=.于是422πA A =,523πA A =,642πA A =,743πA A =,…即2222πkk A A -=,21223π(2,3,)k k A A k +-==故213223023321323332(1)1(1)sin π(21)!3!(21)!11(1)π3!π(21)!sin ππ1ππk k k k k k k k k A A A A Ak k A A A k A A A A +∞+∞+-==+∞+=--==-+++⎛⎫-=-+ ⎪+⎝⎭=+=-∑∑∑-22222022222(1)1(1)cos π(2)!2!(2)!cos π12ππk k k k k k A A I A Ak k I A I A +∞+∞-==--==-+=+=-∑∑-方法二 利用相似对角化 设C n nA ⨯∈是可对角化的,即存在C n n n P ⨯∈,使得112diag(,,,)n P AP A λλλ-== 则有11112112()()()diag(,,,)diag((),(),,())kkk k k k k k k kk k k k k n k k k n f A a A a P P P a P P a a a P P f f f P λλλλλλ+∞+∞+∞--===+∞+∞+∞-===-==Λ=Λ==∑∑∑∑∑∑同理可得112()diag((),(),,())n f At P f t f t f t P λλλ-=例3.7 已知460350361A ⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭,求e At,cos A .解 可求得2det()(2)(1)I A λλλ-=+-,即A 的特征值为12λ=-,231λλ==.对应12λ=-的特征向量为T 1(1,1,1)p =-,对应231λλ==的两个线性无关的特征向量为T 2(2,1,0)p =-,T 3(0,0,1)p =.于是120110101P --⎛⎫ ⎪= ⎪ ⎪⎝⎭ 使得1211P AP --⎛⎫⎪= ⎪ ⎪⎝⎭故22212222e 2e e 2e 2e 0e e e e2e e 0e e e 2e 2e e tt t t t At tt t t t t t t t tt P P --------⎛⎫⎛⎫-- ⎪ ⎪==--⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭1cos(2)cos cos1cos12cos1cos 22cos12cos 20cos 2cos12cos 2cos10cos 2cos12cos 22cos1cos1A P--⎛⎫⎪= ⎪ ⎪⎝⎭--⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭方法三 利用Jordan 标准形 设Cn nA ⨯∈,且C n nn P ⨯∈,使得121s J J P AP J J -⎛⎫ ⎪⎪== ⎪ ⎪⎝⎭ 其中×1(1,2,,)1i iii i i r rJ i s λλλ⎛⎫ ⎪⎪== ⎪⎪⎝⎭由定理1.12得111111001(1)01(1C C ()C ()()1!(1)!()1!()()1!(1)!i i i i i i i r k r k k i k i k ik k k k i i k i k k k k k ik i r r k k k i k k k k k tr r i f J t a J t a t t t r a t t t f f f r λλλλλλλλλλλλλλλλ--+-+∞+∞-==--+∞==--⎛⎫ ⎪⎪== ⎪ ⎪ ⎪⎝⎭⎛⎫' ⎪- ⎪⎪= ⎪⎪'⎪ ⎪⎝⎭'-=∑∑∑)()()()1!()i tt f t f f λλλλλ=⎛⎫ ⎪ ⎪⎪ ⎪⎪' ⎪ ⎪⎝⎭从而1010110011()()()()()k kk kk k k k k k k k k k k k k k k s k s f At a A t a PJP t a J tP a J t P P P a J t f J t P Pf J t +∞+∞-==+∞=+∞--=+∞=-==⎛⎫⎪ ⎪== ⎪⎪ ⎪ ⎪⎝⎭⎛⎫ ⎪= ⎪ ⎪⎝⎭∑∑∑∑∑例3.8 已知101120403A -⎛⎫⎪= ⎪ ⎪-⎝⎭,求e A,sin At .解 例1.9已求得100111210P ⎛⎫ ⎪=-- ⎪ ⎪⎝⎭,11112P AP J -⎛⎫⎪== ⎪ ⎪⎝⎭于是12222e e e 0ee e 3e e e 2e+e e 4e 03e A P P -⎛⎫⎛⎫ ⎪ ⎪==- ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭-- 1sin cos sin sin sin 2sin 2cos 0cos sin 2cos sin 2sin 2cos sin sin 24cos 02cos sin t t t At P t Pt t t t t t t t t t t t t t t t t t t t -⎛⎫⎪= ⎪ ⎪⎝⎭-⎛⎫ ⎪=+---+ ⎪ ⎪-+⎝⎭根据Jordan 标准形理论可得 定理3.8 设Cn nA ⨯∈,1λ,2λ,…,n λ是A 的n 个特征值,则矩阵函数f (A )的特征值为1()f λ,2()f λ,…,()n f λ. 方法四 待定系数法 设Cn nA ⨯∈,且A 的特征多项式为1212()det()()()()(3.5)srr r s I A ψλλλλλλλλ=-=---其中1λ,2λ,…,s λ是A 的全部互异特征值,12s r r r n +++= .为计算矩阵函数()k kk k f At a A t +∞==∑,记0()k k k k f t a t λλ+∞==∑.将f (λt )改写为()(,)()(,)(3.6)f t q t r t λλψλλ=+其中q (λ,t )是含参数t 的λ的幂级数,r (λ,t )是含参数t 且次数不超过n -1的λ的多项式,即1110(,)()()()n n r t b t b t b t λλλ--=+++由Hamilton-Cayley 定理知ψ(A )=O ,于是由式(3.6)得1110()(,)()(,)()()()n n f At q A t A r A t b t Ab t A b t Iψ--=+=+++可见,只要求出()(0,1,,1)k b t k n =- 即可得到f (At ).注意到()()0(0,1,,1;1,2,,)l i i l r i s ψλ==-=将式(3.6)两边对λ求导,并利用上式,得d d ()(,)d d iil ll l f t r t λλλλλλλλ=== 即d d ()(,)(0,1,,1;1,2,,)(3.7)d d iil l li l l t t f r t l r i s μλλλμλμλ====-=由式(3.7)即得到以0()b t ,1()b t ,…,1()n b t -为未知量的线性方程组. 综上分析,用待定系数法求矩阵函数f (At )或f (A )的步骤如下: 第一步:求矩阵A 的特征多项式(3.5);第二步:设1110()n n r b b b λλλ--=+++ .根据()()()()(0,1,,1;1,2,,)i l l l i i tr t f l r i s λλλλ===-=或()()()()(0,1,,1;1,2,,)l l i i i r f l r i s λλ==-=列方程组求解0b ,1b ,…,1n b -;第三步:计算1110()(())()n n f At f A r A b A b A b I --==+++ 或.例3.9 已知101120403A -⎛⎫ ⎪= ⎪ ⎪-⎝⎭,求e At,cos A .解 可求得2det()(1)(2)I A λλλ-=--.设2210()r b b b λλλ=++则由210212210(1)e (1)2e (2)42e tt t r b b b r b b t r b b b ⎧=++=⎪'=+=⎨⎪=++=⎩解得222120e e e 2e 2e 3e e 2e t t t t t t t t b t b t b t ⎧=--⎪=-++⎨⎪=-⎩于是2222210e 2e 0e e e e 2ee e e e 4e 02e e t tAt t t tt t t t t ttt t b A b A b I t t t t t ⎛⎫-⎪=++=-++-- ⎪ ⎪ ⎪-+⎝⎭而由21021210(1)cos1(1)2sin1(2)42cos 2r b b b r b b r b b b =++=⎧⎪'=+=-⎨⎪=++=⎩解得210sin1cos1cos 23sin12cos12cos 22sin1cos 2b b b =-+⎧⎪=-+-⎨⎪=+⎩从而22102sin1cos 20sin1cos 2sin1cos1cos 2cos 2sin1cos1cos 24sin102sin1cos1A b A b A b I +-⎛⎫ ⎪=++=-+--+ ⎪ ⎪-+⎝⎭如果求得矩阵A 的最小多项式,且其次数低于A 的特征多项式的次数,则计算矩阵函数就要容易一些.例3.10 已知311202113A -⎛⎫ ⎪=- ⎪ ⎪--⎝⎭,求e At ,sin A . 解 例1.9已求得A 的Jordan 标准形为2212J ⎛⎫⎪= ⎪ ⎪⎝⎭于是A 的最小多项式为2()(2)A m λλ=-.设10()r b b λλ=+由21021(2)2e (2)e t tr b b r b t ⎧=+=⎪⎨'==⎪⎩ 解得2120e (12)et t b t b t ⎧=⎪⎨=-⎪⎩ 于是2101e e 21221At t tt t b A b I t tt t t t +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭又由101(2)2sin 2(2)cos 2r b b r b =+=⎧⎨'==⎩ 解得10cos 2sin 22cos 2b b =⎧⎨=-⎩从而10sin 2cos 2cos 2cos 2sin 2cos 2sin 22cos 22cos 2cos 2cos 2sin 2cos 2A b A b I +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭三、常用矩阵函数的性质常用的矩阵函数有e A,sin A ,cos A ,它们有些性质与普通的指数函数和三角函数相同,但由于矩阵乘法不满足交换律,从而有些性质与一般指数函数和三角函数不相同. 定理3.9 对任意Cn n A ⨯∈,总有(1)sin(-A )=-sin A ,cos(-A )=cos A ; (2)i e cos isin AA A =+,i -i 1cos (e e )2A A A =+,i -i 1sin (e e )2iA A A =-. 证 (1)由sin A 与cos A 的矩阵幂级数形式直接得到;(2)i 221000i (1)(1)e i !(2)!(21)!cos isin k k k Ak k k k k k A A A k k k A A+∞+∞+∞+===--==++=+∑∑∑又有-i e cos()isin()cos isin A A A A A =-+-=- 从而i -i 1cos (e e )2A A A =+,i -i 1sin (e e )2iA A A =- 定理3.10 设A ,C n nB ⨯∈,且AB =BA ,则(1)ee e e e A BA B B A +==;(2)sin(A +B )=sin A cos B +cos A sin B ;(3)cos(A +B )=cos A cos B -sin A sin B .证 (1)0022011e e !!1()(2)2!1()e !A Bk k k k k A B k A B k k I A B A AB B A B k +∞+∞==+∞+=⎛⎫⎛⎫= ⎪⎪⎝⎭⎝⎭=++++++=+=∑∑∑(2)i()-i()i i -i -i i -i i -i i -i i -i 11sin()(e e )(e e e e )2i 2i 1111(e e )(e e )(e e )(e e )2i 222i sin cos cos sin A B A B A B A B A A B B A A B B A B A B A B+++=-=-=-+++-=+ 同理可证(3). 证毕在定理3.10中,取A =B ,即得 推论 对任意Cn nA ⨯∈,有22cos 2cos sin A A A =-,sin2A =2sin A cos A 值得注意的是,当AB ≠BA 时,ee e A BA B +=或e e e A B B A +=不成立.如取0010A ⎛⎫= ⎪⎝⎭,0100B ⎛⎫= ⎪⎝⎭,则0110A B ⎛⎫+= ⎪⎝⎭,00100100AB BA ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭且10e 11A⎛⎫= ⎪⎝⎭,11e 01B ⎛⎫= ⎪⎝⎭,-1-1-1-1e+e e e 1e 2e e e+e A B+⎛⎫= ⎪⎝⎭-- 可见1121e e e e 1211A BB A ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭e e e A B A B +≠,e e e A B B A +≠定理3.11 设Cn nA ⨯∈,则有(1)tr dete eA A=;(2)1(e )e A A --=.证 (1)设A 的特征值为1λ,2λ,…,n λ.则由定理3.8知,e A的特征值为1e λ,2e λ,…,e n λ,从而1212tr dete =e e e e e n n A A λλλλλλ++==…+…(2)由于tr dete =e0AA≠,所以e A 总是可逆的.又由定理3.10,得e e e e A A A A OI--===故1(e )e A A --=. 证毕需要指出的是,对任何n 阶方阵A ,e A总是可逆的,但sin A 与cos A 却不一定可逆.如取π00π/2A ⎛⎫=⎪⎝⎭,则00sin 01A ⎛⎫= ⎪⎝⎭,10cos 00A -⎛⎫= ⎪⎝⎭.可见sin A 与cos A 都不可逆.§3.4 矩阵的微分和积分在研究微分方程组时,为了简化对问题的表述及求解过程,需要考虑以函数为元素的矩阵的微分和积分.在研究优化等问题时,则要碰到数量函数对向量变量或矩阵变量的导数,以及向量值或矩阵值函数对向量变量或矩阵变量的导数.本节简单地介绍这些内容. 一、函数矩阵的微分和积分定义 3.6 以变量t 的函数为元素的矩阵()(())i j m n A t a t ⨯=称为函数矩阵,其中()(1,2,,;1,2,,)ij a t i m j n == 都是变量t 的函数.若t ∈[a ,b ],则称A (t )是定义在[a ,b )上的;又若每个()ij a t 在[a ,b ]上连续、可微、可积,则称A (t )在[a ,b ]上是连续、可微、可积的.当A (t )可微时,规定其导数为()(())ijm n A t a t ⨯''=或d d ()()d d ij m nA t a t t t ⨯⎛⎫= ⎪⎝⎭而当A (t )在[a ,b ]上可积时,规定A (t )在[a ,b ]上的积分为()()d ()d bb ijaam nA t t a t t ⨯=⎰⎰例3.11 求函数矩阵23sin cos ()2e 01t t t t t A t t t ⎛⎫⎪= ⎪ ⎪⎝⎭的导数. 解2cos sin 1d ()2ln 2e 2d 003t t t t A t t t t -⎛⎫⎪= ⎪ ⎪⎝⎭关于函数矩阵,有下面的求导法则.定理3.12 设A (t )与B (t )是适当阶的可微矩阵,则(1)d d d(()())()()d d d A t B t A t B t t t t+=+ (2)当λ(t )为可微函数时,有d d d (()())()()()()d d d t A t t A t t A t t t t λλλ⎛⎫=+ ⎪⎝⎭(3)d d d (()())()()()()d d d A t B t A t B t A t B t t t t ⎛⎫=+ ⎪⎝⎭; (4)当u =f (t )关于t 可微时,有d d()()()d d A u f t A u t u'= (5)当1()A t -是可微矩阵时,有111d d (())()()()d d A t A t A t A t t t ---⎛⎫=- ⎪⎝⎭证 只证(2)和(5).设()(())ij m n A t a t ⨯=,()(())ij n p B t b t ⨯=,则111d d (()())(()())d d d d ()()()()d d d d ()()()()d d nik kj m n k n nik kj ik kj k k m nA tB t a t b t t t a t b t a t b t t t A t B t A t B t t t ⨯===⨯=⎛⎫⎛⎫=+ ⎪ ⎪⎝⎭⎝⎭⎛⎫=+ ⎪⎝⎭∑∑∑由于1()()A t A t I-=,两边对t 求导,得11d d ()()()()d d A t A t A t A t O t t --⎛⎫+= ⎪⎝⎭从而111d d ()()()()d d A t A t A t A t t t ---⎛⎫=- ⎪⎝⎭证毕 定理3.13 设C n nA ⨯∈,则有(1)d e e e d AtAt At A A t ==; (2)dsin cos (cos )d At A At At A t ==;(3)dcos sin (sin )d At A At At A t=-=-.证 这里只证(1).(2)和(3)的证明与(1)类似.由0e !k Atkk t A k +∞==∑,并利用绝对收敛级数可以逐项求导,得101111d d e d d !(1)!e (1)!k k At k k k k k k Atk t t A A t t k k tA A A k -+∞+∞==-+∞-===-==-∑∑∑同样11111d e ==e d (1)!(1)!k k At k k At k k t t A A A A t k k --+∞+∞-==⎛⎫= ⎪--⎝⎭∑∑ 证毕根据定义和积分的有关性质,可得定理3.14 设A (t ),B (t )是区间[a ,b ]上适当阶的可积矩阵,A ,B 是适当阶的常数矩阵,λ∈C ,则 (1)(()())d ()d ()d bb baaaA tB t t A t t B t t +=+⎰⎰⎰;(2)()d ()d bba aA t t A t t λλ=⎰⎰;(3)()()d ()d bbaaA tB t A t t B =⎰⎰,()d ()d b baaAB t t A B t t =⎰⎰;(4)当A (t )在[a ,b ]上连续时,对任意t ∈(a ,b ),有()d ()d ()d t aA A t tττ=⎰(5)当A (t )在[a ,b]上连续可微时,有()d ()()baA t t A b A a '=-⎰以上介绍了函数矩阵的微积分概念及一些运算法则.由于d()d A t t仍是函数矩阵,如果它仍是可导矩阵,即可定义其二阶导数.不难给出函数矩阵的高阶导数11d d d ()()d d d k k k k A t A t t t t --⎛⎫= ⎪⎝⎭二、数量函数对矩阵变量的导数定义 3.7 设f (X )是以矩阵()ij m n X x ⨯=为自变量的mn 元函数,且(1,2,,;1,2,,)ijfi m j n x ∂==∂ 都存在,规定f 对矩阵变量X 的导数d d f X 为 1111d d ij m nm mn ff x x n f fX x ff x x ⨯∂∂⎛⎫ ⎪∂∂ ⎪⎛⎫∂ ⎪== ⎪ ⎪ ⎪∂⎝⎭∂∂ ⎪ ⎪∂∂ ⎪⎝⎭特别地,以T12(,,,)n x ξξξ= 为自变量的函数f (x )的导数T12d (,,,)d nf f f f x ξξξ∂∂∂=∂∂∂ 称为数量函数对向量变量的导数,即为在数学分析中学过的函数f 的梯度向量,记为grad f .例 3.12 设T 12(,,,)n a a a a = 是给定的向量,T 12(,,,)n x ξξξ= 是向量变量,且T T ()f x a x x a ==求d d f x. 解 因为1()nk kk f x a ξ==∑而(1,2,,)j jfa j n ξ∂==∂ 所以 TT 1212d (,,,)(,,,)d n nf f f f a a a a x ξξξ∂∂∂===∂∂∂ 例3.13 设()ij m n A a ⨯=是给定的矩阵,()ij n m X x ⨯=是矩阵变量,且()tr()f x Ax =求d d fX. 解 因为1()nikkj m m k AX ax ⨯==∑.所以11()tr()m nsk ks s k f X AX a x ====∑∑而(1,2,,;1,2,,)ijfi n j m x ∂==∂ 故T d ()d ji n m ij n mf f a A X x ⨯⨯⎛⎫∂=== ⎪ ⎪∂⎝⎭ 例 3.14 设()ij n n A a ⨯=是给定的矩阵,T 12(,,,)n x ξξξ= 是向量变量,且T ()f x x Ax =求d d f x. 解 因为T1111()()n nn ns sk ks sk k s k s k f x x Ax aa ξξξξ=======∑∑∑∑而1111,11,111()nj j j j jk k j jj j j j n nj k j n nsj s jk ks k fa a a a a a a a ξξξξξξξξξ--++===∂=+++++++∂=+∑∑∑所以1111111T T d d ()n ns s k k s k n nsn s nk k s k n f a a f x f a a A x Ax A A xξξξξξξ====∂⎛⎫⎛⎫+ ⎪ ⎪∂⎪ ⎪ ⎪== ⎪ ⎪ ⎪∂ ⎪ ⎪+ ⎪⎪∂⎝⎭⎝⎭=+=+∑∑∑∑ 特别地,当A 是对称矩阵时,有d 2d fAx x=例3.15 设()ij n n X x ⨯=是矩阵变量,且det X ≠0.证明1T ddet (det )()d X X X X-= 证 设ij x 的代数余子式为ij X .把det X 按等i 行展开,得1det nikik k X xX ==∑于是det ij ijX X x ∂=∂故 T1T 1Tddet det ()(adj )d ((det ))(det )()ij n n ij n nX X X X X x X X X X ⨯⨯--⎛⎫∂=== ⎪ ⎪∂⎝⎭== 三、矩阵值函数对矩阵变量的导数定义3.8 设矩阵()(())ij s t F X f X ⨯=的元素()(1,2,,;1,2,,)ij f X i s j t == 都是矩阵变量()ij m n X x ⨯=的函数,则称F (X )为矩阵值函数,规定F (X )对矩阵变量X 的导数d d FX为111d d 1FF x x n F X FF x x m mn ∂∂⎛⎫ ⎪∂∂ ⎪⎪= ⎪∂∂ ⎪ ⎪∂∂ ⎪⎝⎭ ,其中1111tij s stf f x x ij ij F x f f x x ij ij ∂∂⎛⎫ ⎪∂∂ ⎪∂⎪=⎪∂ ⎪∂∂ ⎪∂∂ ⎪⎝⎭即其结果为(ms )×(nt )矩阵. 作为特殊情形,这一定义包括了向量值函数对于向量变量的导数,向量值函数对于矩阵变量的导数,矩阵值函数对于向量变量的导数等.例3.16 设T12(,,,)n x ξξξ= 是向量变量,求T T d d d d x xx x=. 解 由定义,得T 1TT 2T 100010d d 001n nx x x I x x ξξξ⎛⎫∂ ⎪∂ ⎪⎛⎫ ⎪∂ ⎪⎪ ⎪===∂ ⎪ ⎪⎪ ⎪⎪⎝⎭ ⎪∂ ⎪∂⎝⎭同理可得T 12d ,,,d n n x x x x I x ξξξ⎛⎫∂∂∂== ⎪∂∂∂⎝⎭例3.17 设T1234(,,,)a a a a a =是给定向量,24()ij X x ⨯=是矩阵变量,求Td()d Xa X,d()d Xa X. 解 因为41121k k k n k k k x a Xa x a ==⎛⎫⎪ ⎪= ⎪ ⎪⎝⎭∑∑,44T 1211()(,)k k k k k k Xa x a x a ===∑∑ 所以T T TT T 13141112T T T T 2122232431243124()()()()d()d ()()()()00000000Xa Xa Xa Xa x x x x Xa XXa Xa Xa Xa xx x x a aa a a a a a ⎛⎫∂∂∂∂⎪∂∂∂∂ ⎪=⎪∂∂∂∂ ⎪ ⎪∂∂∂∂⎝⎭⎛⎫= ⎪⎝⎭而131411122122232412341234()()()()d()()()()()d 00000000Xa Xa Xa Xa x x x x Xa Xa Xa Xa Xa Xxx x x a a a a a a a a ∂∂∂∂⎛⎫⎪∂∂∂∂ ⎪=⎪∂∂∂∂ ⎪∂∂∂∂⎝⎭⎛⎫⎪ ⎪=⎪⎪⎝⎭§3.5 矩阵分析应用举例本节介绍矩阵函数及矩阵微积分的一些应用. 一、求解一阶线性常系数微分方程组在数学或工程技术中,经常要研究一阶常系数微分方程组1111122112211222221122d ()()()()()d d ()()()()()d d ()()()()()d n n n n n n n nn n n x t a x t a x t a x t f t t x t a x t a x t a x t f t t x t a x t a x t a x t f t t ⎧=++++⎪⎪⎪=++++⎨⎪⎪=++++⎪⎩满足初始条件0()(1,2,,)i ix t c i n ==的解.如果记T12(),(,,,)ij n n n A a c c c c ⨯==T 12()((),(),,())n x t x t x t x t = ,T 12()((),(),,())n f t f t f t f t =则上述微分方程组可写为0d ()()()(3.8)d ()x t Ax t f t tx t c⎧=+⎪⎨⎪=⎩因为d d ()(e ())e ()()e d d d ()e ()e ()d At At At At At x t x t A x t t t x t Ax t f t t -----=-+⎛⎫=-= ⎪⎝⎭将上式两边在[0t ,t ]上积分,得00d (e ())d e ()d d tt A A t t x f τττττττ--=⎰⎰ 即00e()e()e ()d tAt A A t x t x t f ττττ----=⎰于是微分方程组的解为00()()e e e ()d tA t t At A t x t c f τττ--+⎰=例3.18 求解微分方程组初值问题113212313123d ()()()1d d ()()2()1d d ()4()3()2d (0)1,(0)0,(0)1x t x t x t t x t x t x t tx t x t x t t x x x ⎧=-++⎪⎪⎪=+-⎪⎨⎪=-++⎪⎪⎪===⎩ 解 记123()10111120,0,()(),()140312()x t A c x t x t f t x t -⎛⎫⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪====- ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎝⎭则微分方程组可以写成式(3.8)的矩阵形式.例3.9已求得222e 2e 0e e e e 2e e e e e 4e 02e e t t tAt t t tt t t t t t t t t t t t t ⎛⎫-⎪=-++-- ⎪ ⎪-+⎝⎭依次计算下列各量e e e e e 2e t t At t t t t c t t ⎛⎫- ⎪= ⎪ ⎪-⎝⎭,00e 1e e ()d e 1e 2e 22e t t t A t tf d τττττττ-------⎛⎫⎛⎫- ⎪ ⎪=-=-+ ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭⎰⎰, 0e 1e e ()d e 12e 2t t At A t tf τττ-⎛⎫- ⎪=-+ ⎪ ⎪-⎝⎭⎰故微分方程组的解为123e e e 1(2)e 1()()()e e 1(1)e 1()e 2e 2e 2(32)e 2t t t tt t t t t t t t t x t x t x t t t x t t ⎛⎫⎛⎫⎛⎫----⎛⎫⎪ ⎪ ⎪ ⎪==+-+=-+ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪----⎝⎭⎝⎭⎝⎭⎝⎭二、求解矩阵方程在控制论与系统理论中,要遇到形如AX +XB =F 的矩阵方程求解问题,这个矩阵方程也称为Lyapunov 方程.关于这个矩阵方程的解有如下结果. 定理3.15 给定矩阵方程 AX +XB =F (3.9) 其中Cm mA ⨯∈,Cn nB ⨯∈,Cm nF ⨯∈.如果A 和B 的所有特征值具有负实部(这种矩阵称为稳定矩阵),则该矩阵方程有惟一解e e d At Bt X F t +∞=-⎰证 记()e e At Bt Y t F =.则有Y (0)=F ,且d ()e e e e ()()(3.10)d At Bt At Bt Y t A F F B AY t Y t B t=+=+设12,,,m λλλ 是A 的m 个特征值,12,,,n μμμ 是B 的n 个特征值.根据利用Jordan 标准形求矩阵函数的方法(见§3.3)知,e At的元素是形如e (0)j tr t r λ≥的项的线性组合.因为A 的所有特征值j λ的实部是负的,所以lim eAtt O →+∞=.同理lim e Bt t O →+∞=.于是lim ()lim e e At Bt t t Y t F O →+∞→+∞==又由于e e At BtF 的元素是形如()e (0)i j tr t r λμ+≥的项的线性组合,且积分()0ed i j tr t t λμ+∞+⎰都存在,故积分e e d At Bt F t +∞⎰存在.对式(3.10)两边从0到+∞积分,得()()0()(0)()d ()d Y Y AY t t Y t t B +∞+∞+∞-=+⎰⎰即()()0()d ()d A Y t t Y t t B F+∞+∞-+-=⎰⎰这说明0e e d At Bt X F t +∞=-⎰是矩阵方程(3.9)的解.惟一性的证明见第七章. 证毕 推论1 设Cm mA ⨯∈,Cn nB ⨯∈,Cm nF ⨯∈,则矩阵微分方程d ()()()d (0)X t AX t X t B tX F⎧=+⎪⎨⎪=⎩的解为()e e At BtX t F =推论2 设A ,C n nF ⨯∈,且A 的所有特征值具有负实部,则矩阵方程HA X XA F+=-的惟一解为H 0ee d (3.11)A tAt X F t+∞=⎰如果F 是Hermite 正定矩阵,则解矩阵X 也是Hermite 正定矩阵.证 只需证明后一结论.当F 是Hermite 正定矩阵时,由式(3.11)可知X 是Hermite 矩阵.又对0Cnx ≠∈,由于eAt总是可逆的,所以e 0Atx ≠,于是HH H e e (e )(e )0A t At At At x F x x F x =>.从而HH 0(e )(e )d 0At At x Xx x F x t +∞=>⎰故X 是Hermite 正定矩阵. 证毕三、最小二乘问题 设Cm nA ⨯∈,C n b ∈.当线性方程组Ax =b 无解时,则对任意C nx ∈都有Ax -b ≠0.此时希望找出这样的向量0C n x ∈,它使2Ax b -达到最小,即022Clim (3.12)nx Ax b Ax b ∈-=-称这个问题为最小二乘问题,称0x 为矛盾方程组Ax =b 的最小二乘解.以下结论给出了当A ,b 分别是实矩阵和实向量时,Ax =b 的最小二乘解所满足的代数方程.定理3.16 设R m nA ⨯∈,R mb ∈,0R n x ∈.若0R n x ∈是Ax =b 的最小二乘解,则0x 是方程组TT(3.13)A Ax A b=的解.称式(3.13)为Ax =b 的法方程组.证 由于2T 2TTTTTT()()()f x Ax b Ax b Ax b x A Ax x A b b Ax b b=-=--=--+若0x 为Ax =b 的最小二乘解,则它应是f (x )的极小值点,从而d 0(3.14)d x f x=根据例3.12和例3.14,得T T d 22d fA Ax A b x=- 由式(3.14)即知T T00A Ax A b -=,故0x 是式(3.13)的解. 证毕 对于含约束条件的最小二乘问题,有如下的结果. 例3.19 设Rm nA ⨯∈,R m b ∈,Rk nB ⨯∈,R kd ∈,且Bx =d 有解.试求约束极小。
第二章 矩阵矩阵及其运算是线性代数的核心,是后续各章的基础,本章主要讨论矩阵的概念、矩阵运算、初等矩阵、逆矩阵与伴随矩阵以及矩阵方程.§1 矩阵的概念定义1 由n m ⨯个数),,2,1;,2,1(n j m i a ij ==排成的m 行n 列的数表:⎪⎪⎪⎪⎪⎭⎫⎝⎛=mn m m n n a a a a a a a a a A 212222111211称为m 行n 列矩阵,其中ij a 称为矩阵A 的第i 行第j 列元素.矩阵可用大写字母 ,,B A 来表示,简记为n m A ⨯或n m ij a A ⨯=)(. 当n m =时, ()n a a a A 11211 =,则称A 称为m 阶方阵或m 阶矩阵;当1=m 时, ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=12111m a a a A ,则称A 称为行矩阵当1=n 时,A 称为列矩阵。
定义2 设n m A ⨯中每个元素都是零的矩阵称为零矩阵,记为:n m O ⨯ 或O . 定义3 矩阵n m ij a ⨯-)(称为矩阵n m ij a A ⨯=)(的负矩阵,记作A -. 定义4 如果n m ij a A ⨯=)(与m xn ij b B )(=,有ij ij b a =),,2,1;,2,1(n j m i ==,那么称这两矩阵相等,记为B A =.几个特殊矩阵(1) 设方阵n n ij a A ⨯=)(中, ),,2,1,,(0n j i j i a ij =≠=,则称它为对角矩阵,记为:),,,(2211nn a a a diag ;特别地,当12211====nn a a a 时,即⎪⎪⎪⎪⎪⎭⎫⎝⎛=100010001 A 时,称A 为n 阶单位矩阵,记作n E 或E .(2)设方阵nn ij a A ⨯=)(中,⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n a a a a a a A 022211211时,当j i >时0=ij a ,称为上三角阵.(4)设方阵nn ij a A ⨯=)(中,⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n a a a a a a A 21222111时,当j i <时0=ij a ,称为下三角阵.§2 矩阵的运算一、矩阵的加法定义 5 设两个同型矩阵n m ij n m ij b B a A ⨯⨯==)(,)(,可以相加,其和是同型矩阵n m ij c C ⨯=)(,其元素是B A ,对应元素之和,称为矩阵B A ,之和,记为B AC +=.即 n m ij ij n m ij b a c ⨯⨯+=)()(由于矩阵的加法归结为两个数表对应元素相加,因而与数的加法有相同运算性质;;A O A =+ A B B A +=+ .)()(C B A C B A ++=++例1 已知.212111320112B A B A +⎪⎪⎭⎫⎝⎛-=⎪⎪⎭⎫⎝⎛-=,求, 解 ⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫ ⎝⎛+++++--+=+5322012312201111)1(2B A . 二、数与矩阵的乘法定义6:数k 与矩阵n m ij a A ⨯=)(相乘,即以数k 乘A 的每个元素,即n m j i ka kA ⨯=)(⎪⎪⎪⎪⎪⎭⎫⎝⎛=mn m m n n ka ka ka ka ka ka ka ka ka 212222111211称为矩阵()nm ij a A ⨯=与数k 的数量乘积,记为kA .由此可知,若矩阵A 的所有元素有公因数,则公因数可提到矩阵A 外作为系数.矩阵=-⨯nm ij a )(⎪⎪⎪⎪⎪⎭⎫⎝⎛---------mn m m n n a a a a a a a a a 212222111211称为矩阵A 的负矩阵,记为A -显然有O A A =-+)( 数量乘积满足以下规律:A kl lA k )()(=;OA =0;AA =1;lAkA A l k +=+)(;kB kA B A k +=+)(三、矩阵的乘法定义7设矩阵s m ik a A ⨯=)(与矩阵n s kj b B ⨯=)(可以相乘,其积AB 是n m ⨯矩阵n m ij c C ⨯=)(,其元素ij c 是矩阵A 的第i 行元素与矩阵B 的第j 列元素对应乘积之和,即AB C =,其中∑==+++=SK kj ik sj is j i j i ij b a b a b a b a c 12211 ,),,2,1;,2,1(n j m i ==.单位矩阵E 与数k 相乘所得矩阵称为数量矩阵,简称数量阵.例2 设⎪⎪⎭⎫⎝⎛--=213012A , ⎪⎪⎪⎭⎫⎝⎛--=051231B ,则AB C =. 解:⎪⎪⎭⎫ ⎝⎛--=⎪⎪⎪⎭⎫⎝⎛--⎪⎪⎭⎫ ⎝⎛--==81570051231213012AB C如果n m ij a A ⨯=)(是一线性方程组的系数矩阵,而⎪⎪⎪⎪⎪⎭⎫⎝⎛=n x x x X21 ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=m b b b B 21,分别是未知量和常数项所成的1⨯n 和1⨯m 矩阵,那么线性方程组可以写成矩阵形式,B AX =.矩阵乘法满足运算规律 (1)矩阵的乘法满足结合律,即)()(BC A C AB =(2)矩阵乘法和加法适合分配律,即BC AC C B A +=+)(,CB CA B A C +=+)((3)矩阵的乘法不适合交换律,即:一般AB ≠BA例3 ⎪⎪⎭⎫ ⎝⎛--=1111A ,⎪⎪⎭⎫⎝⎛--=1111B ,求.AB⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫ ⎝⎛--⎪⎪⎭⎫ ⎝⎛--=000011111111AB .而 ⎪⎪⎭⎫ ⎝⎛--=⎪⎪⎭⎫ ⎝⎛--⎪⎪⎭⎫⎝⎛--=222211111111BA (4)数乘矩阵与所有的n n ⨯矩阵相乘是可交换的.)()(kE A A kE kA ==对于矩阵的乘法,请特别注意:(1) 乘积AB 只有当左矩阵A 的列数等于右矩阵的行数时才有意义.同理,仅当A 为方阵时,2A 才有意义.(2) 矩阵乘法一般不满足交换律.实际上,AB 有意义时,BA 未必有意义,即使AB 与BA 都有意义,二者也未必相等.当BA AB =时,称B A ,相乘是可交换的.特别地,当E AB =时,E BA =也成立.(3)矩阵乘法与数的乘法不同,有O AB =不能得出B A ,至少有一个为O 的结论,由此又得AY AX =及O A ≠不能得出Y X =的结论,这又使得在解矩阵方程时不能像解通常代数方程那样约去非零的因子.四、方阵的幂(1)设A 为n 阶方阵,定义A 的幂为,1A A =,,2 AA A = .1A A A k k -=对于正整数l k ,成立kl l K l k l k A A A A A ==+)(;对于0≠A 时,定义,0E A =,)(1k kA A --=则这两个运算公式可推广于任何整数l k ,.(2) 对任何正整数k ,求方阵的幂kA ,往往需要一定的技巧,常用的几种方法:① 用乘法算出,,32A A 以此观察或通过递推得出kA 的结构,写出一般表达式.必要时用数学归纳法证明.例4 设⎪⎪⎪⎭⎫ ⎝⎛=101020101A ,(1)求);2(E A A -(2)求).2(21≥--n A A n n解 (1) =-)2(E A A ⎪⎪⎪⎭⎫ ⎝⎛--⎪⎪⎪⎭⎫ ⎝⎛101000101101020101⎪⎪⎪⎭⎫ ⎝⎛=000000000(2) =--12n nAA =--)2(1E A A n O E A A An =--)2(2例5 设矩阵⎪⎪⎪⎭⎫ ⎝⎛=010101001A ,证明E A A A n n -+=-22)3(≥n ,并由此计算100A.证明 利用数学归纳法,当3=n 时,由于,1010110010101010010101010012⎪⎪⎪⎭⎫⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛=A,0111020010101010011011110013⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛=A可直接验证E A A A -+=23成立. 设k n =时,E A AA k k-+=-22成立,则对于1+=k n 时:A E A A A A A k k k )(221-+==-+AA A k -+=-31A E A A A k --++=-)(21E A A k -+=-21即对于1+=k n 等式也成立,故对于一切3≥n 成立.利用已经证明的等式计算100A,可得:E A A A -+=298100E A E A A -+-+=2296)()(2296E A A -+= )(3294E A A -+= =)(4922E A A -+=E A 49502-=故.105001500011000100014910101100150100⎪⎪⎪⎭⎫⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛-⎪⎪⎪⎭⎫ ⎝⎛=A② 利用结合律,若方阵的各行对应成比例,则矩阵可写成T αβ的形式,由于αβT是一个数,所以将矩阵的幂归结为数的幂与矩阵之积.例6 设⎪⎪⎪⎭⎫ ⎝⎛=963321642A ,求nA .解 因为矩阵A 的各行对应成比例,设矩阵TA αβ=,⎪⎪⎪⎭⎫⎝⎛=312α(1,2,3)=Tβ(1,2,3)312(1,2,3)312(1,2,3)312(1,2,3)312963321642⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛= nn A)(1,2,3)312(1,2,3)312(1,2,3)312((1,2,3)312⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛= (1,2,3)313121-⎪⎪⎪⎭⎫ ⎝⎛=n (1,2,3)312311⎪⎪⎪⎭⎫ ⎝⎛=-n.311A n -=③ 若矩阵A 是数量矩阵与幂零矩阵之和,即B E A +=λ,且存在l,使0=l B ,则利用公式kn n k n n k n k n k B C B E C B E C E C B E ++++=+---11110)()()()(λλλλ例7设,000000⎪⎪⎪⎭⎫ ⎝⎛=b c a A 求).,3,2( =n A n解,000000000000000000002⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛=ab b c a b c a A,0000000000000000000000023⎪⎪⎪⎭⎫⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛==b c a ab A A A于是,000000002⎪⎪⎪⎭⎫ ⎝⎛=ab A O A n =).3(≥n注 若存在正整数k 使O A k=,则称A 为幂零矩阵,本题中的A 是3阶幂零矩阵,一般主对角线及其下方元素全为0的n 阶矩阵是n 阶幂零矩阵,对一切n k ≥,O A k=.例8 设⎪⎪⎪⎭⎫⎝⎛=λλλ001001A , 求).,3,2( =n A n 解 令,000100010⎪⎪⎪⎭⎫⎝⎛=B 则B E A +=λ,而B 是幂零矩阵.,0000001000001000100001000102⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛=B O B k =).3(≥k于是n n B E A )(+=λkn n k n n k n k n B C B E C B E C E C ++++=---11110)()()(λλλB n n B n E n n n 212)1(---++=λλλ ⎪⎪⎪⎪⎪⎭⎫⎝⎛-=---nn nn n n n n n n λλλλλλ0002)1(121.④ 当矩阵Q P A Λ=,且E PQ =时,求矩阵A 的幂问题.例9设,110111121⎪⎪⎪⎭⎫⎝⎛-=P ,11121133031⎪⎪⎪⎭⎫ ⎝⎛---=Q ⎪⎪⎪⎭⎫⎝⎛=Λ066,Q P A Λ=求n A .解:E QP =⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛-⎪⎪⎪⎭⎫ ⎝⎛---=10001000111011112111121133031QP Q QP P A n ΛΛΛ=⎪⎪⎪⎭⎫⎝⎛---⎪⎪⎪⎭⎫⎝⎛⎪⎪⎪⎭⎫ ⎝⎛-=-111211330310661*********n ⎪⎪⎪⎭⎫⎝⎛---⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛-=--1112113303106611011112111n n .211121112622⎪⎪⎪⎭⎫ ⎝⎛--⋅=-n五、矩阵的转置定义8设矩阵n m A ⨯的第),2,1(m i i =行写成第i 列,也将第),,2,1(n j j =列写成第j 行当⎪⎪⎪⎪⎪⎭⎫⎝⎛=mn m m n n a a a a a a a a a A 212222111211时⎪⎪⎪⎪⎪⎭⎫⎝⎛=nm n nm m T a a a a a a a a a A 212221212111. 注 n m ⨯矩阵转置所得到的矩阵是m n ⨯矩阵 满足条件A A T=的矩阵A 称为对称矩阵. 满足条件A A T -=的矩阵A 称为反对称矩阵. 矩阵的转置规律 (1) A A TT =)((2) TTTB A B A +=+)( (3)TTTA B AB =)((4) T T kA kA =)((k 为实数)证明(3):设s m ij a A ⨯=)( n s ij b B ⨯=)( 则AB 中),(j i 的元素为∑=sk kj ik b a 1所以TAB )(中),(j i 的元素为∑=Sk kijk b a1 (1)其次,TB 中),(k i 的元素为ki b TA 中),(j k 的元素为jk a 故TTA B 中),(j i 的元素即为:∑∑===sk ki jk sk jk kib a a b11(2)比较(1),(2)即得(3)例10设⎪⎪⎭⎫ ⎝⎛-=231102A ,⎪⎪⎪⎭⎫⎝⎛-=102324171B ,求T AB )(. ⎪⎪⎭⎫ ⎝⎛-=⎪⎪⎪⎭⎫⎝⎛-⎪⎪⎭⎫ ⎝⎛-=1013173140102324171231102AB⎪⎪⎪⎭⎫ ⎝⎛-=213012TA ⎪⎪⎪⎭⎫ ⎝⎛-=131027241T BT T T AB A B )(1031314170213012131027241=⎪⎪⎪⎭⎫⎝⎛-=⎪⎪⎪⎭⎫ ⎝⎛-⎪⎪⎪⎭⎫ ⎝⎛-=六、方阵的行列式n 阶方阵A 的2n 个元素按原来的相对位置所成的n 阶行列式称为A 的行列式,记为A 或)det(A .特别需要注意,矩阵与行列式的区别(1) 矩阵A 是2n 个元素按某个规律排成的数表,而行列式A 则是这2n 个元素按某种规则运算所得的数.(2) 两个矩阵当且仅当它们同型且对应元素相等时才相等,而两个行列式相等是指它们经计算所得的值相等,并不要求对应元素相等,甚至阶数都可以不同.(3) 两个同型矩阵相加是对应元素相加,而两个行列式相加必须求得它们的值而后相加,一般不能归结为对应元素之间的运算.(4) 对于矩阵一般不满足A A T=,而行列式A AT=却成立.(5) 当n 阶矩阵A 的每个元素都乘以同一个数l 时,得到的是lA ,而组成行列式A 的每个元素都乘以同一个数l 时,得到的却是A l n .(6) 一般而言BA AB ≠,但却有A B B A AB ==. 例11 设矩阵2112A ⎛⎫= ⎪-⎝⎭,E 为2阶单位矩阵,矩阵B 满足E B BA 2+=,则求B .分析 化简方程乘积形式,两边再取行列式.解:由E B BA 2+=,得E E A B 2)(=-,两边取行列式,得42==-E E A B又,21111=-=-E A 因此2=B . §3 逆矩阵一、逆矩阵定义定义9 对于n 阶矩阵A ,若存在矩阵B ,使,E BA AB ==则称矩阵A 是可逆矩阵或者称A 为非奇异矩阵,矩阵B 为A 的逆矩阵,记为1-=A B .于是E AA A A ==--11.在矩阵运算中,可根据不同情况将单位矩阵E 写成A A 1-或1-AA 是常用的有效技巧.二、逆矩阵的性质① 对于可逆矩阵A ,逆矩阵1-A 是唯一的.证明:假设矩阵C B ,都是矩阵A 的逆矩阵,则有.,E AC E BA ==C EC BAC AC B BE B =====∴)(所以可逆矩阵A 的逆矩阵是唯一的.② 可逆矩阵乘以非零常数为可逆矩阵,可逆矩阵的乘积是可逆矩阵,但可逆矩阵之和未必是可逆矩阵.③ 逆矩阵的运算性质设矩阵B A ,都是可逆矩阵,k 为不为零的常数,则;)(11A A =--111)(---=A B AB ;111)(--=A kkA ;;)()(11T T A A --=.11AA =- 三、伴随矩阵定义10 设ij A 是矩阵⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n a a a a a a a a a A 212222111211中元素ij a 的代数余子式,则矩阵⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=nn nnn n A A A A A A A A A A212221212111*称为A 的伴随矩阵。