《周国标师生交流讲席010》
向量和矩阵的范数的若干难点导引(二)
一.矩阵范数的定义
引入矩阵范数的原因与向量范数的理由是相似的,在许多场合需要“测量”矩阵的“大小”,比如矩阵序列的收敛,解线性方程组时的误差分析等,具体的情况在这里不再复述。
最容易想到的矩阵范数,是把矩阵A C m n可以视为一个mn维的向量(采用所谓“拉
直”的变换),所以,直观上可用C mn上的向量范数来作为A C m n的矩阵范数。比如
m n 1
在∣1 -范数意义下,IIAl1 ;二Ia ijI= tr(A H A) 2; (1.1 )
1
Zl mn A2
在I2-范数意义下,∣∣A∣∣F=∑∑同|2,(1.2)
Iy j A J
注意这里为了避免与以后的记号混淆,下标用“F”,这样一个矩阵范数,称为Frobenius
范数,或F-范数。可以验证它们都满足向量范数的3个条件。
那么是否矩阵范数就这样解决了?因为数学上的任一定义都要与其对象的运算联系起来,矩阵之间有乘法运算,它在定义范数时应予以体现,也即估计AB的“大小”相对于A与B
的“大小”关系。
定义1设A C mn,对每一个A ,如果对应着一个实函数N(A),记为IlAll ,它满足以下条件:
(1)非负性:|| A||_0 ;
(1 a)正定性:A=O mn= IIAII= 0
(2)齐次性:||〉A||=| |||A||, ? C ;
(3)三角不等式:||A||A B||—||A|| ||B||, -B C m n
则称N(A)=|| A||为A的广义矩阵范数。进一步,若对C m n,C n 1C m l上的同类广义矩阵
范数|| || ,有
(4)(矩阵相乘的)相容性:|| A || AB ||_|| A|||| B ||, B C n I , 则称N(A) =||A||为A的矩阵范数。
我们现在来验证前面(1.1 )和(1.2 )定义的矩阵范数是否合法?我们这里只考虑(1.2 ),把较容易的(1.1 )的验证留给同学们,
三角不等式的验证。按列分块,记A=√a1,a2,…,a n), B=√b1,b2,…,b n)。
||A BII F=Ig bj,? b2), ,(a. b n)||F
*1 UII2 IIa2 b2||2 Ha n g ||2
(IIa1II2 +IIdIb ) +…+(IIa n Ib +||b n ||2)
2 2 兰
二険||2 IIa n II;2 || q II2II d ||2 …IIa n II2II b n ||2 IIdII2IIb n II2
对上式中第2个括号内的诸项,应用CaUChy不等式,则有
IIA + BIIF≤IIAII F +2||A||F||B||F +IIBII2=(IIAI F +IIBII F)2(1.3 )于是,两边开方,即得三角不等式。
再验证矩阵乘法相容性。
虽然这仅是一个反例,但是数学的定义是不可以有例外的。
由此,我们必须认识到,
不能随便套用向量范数的形式来构造矩阵范数。 为此,我们仅给出矩阵范数的定义是不够 的,还需要研究如何构成具体的矩阵范数的方法。
当然,你也可以不去考虑构成方法,一个
函数一个函数去试,只要满足条件就行。不过这样做的工作量太大,也很盲目。
第二,在实际计算时,往往矩阵与向量出现在同一个计算问题中, 所以在考虑构造矩阵 范数时,应该使它与向量范数相容。比如要考虑 AX 的“大小”,AX 是一个向量,但它由 A
与X 相乘而得的,它与 A 的“大小”和X 的“大小”的关系如何?
这提出了两类范数相容
的概念。
定义2对于C mn 上的矩阵范数∣∣?∣∣M 和C m ,C n 上的同类向量范数∣∣?∣V ,如果成立 IIAx II V ≤ll A ∣∣M Il X I V , ^A C mn
,-x C n
( 1.5)
则称矩阵范数Il *∣∣M 与向量范数II-I V 是相容的。
1
'm n
X 2 1
例1. 1可以证明
∣∣A ∣∣F = ∑∑ Ia ij I 2
=(tr (A H
A )F 是与向量范数IW 相容。
Iimg
丿
事实上,在(1。2)中,取B =X ? C n1 ,那么
∣∣A X ∣∣2 =II AB ∣∣√≤∣∣ AII F II B ∣∣F =∣∣A ∣∣F ∣∣X ∣∣2
二.矩阵算子范数
现在给出一种构造矩阵范数的一般方法,它可以使构造出的矩阵范数与向量范数相容, 当然,它
也满足定义 1规定的4个条件。
定义3设C m ,C n 上的同类向量范数为∣∣?∣∣V ,A C mn ,定义在C m n 空间上的矩阵A 的由向量范数∣∣?∣V 诱导给出的矩阵范数为
m l 12
一一
2
m IFn
IlABI A∑∑ Σ a k b
j ≤∑∑ ∣∑
Ia i
i 4 j 4 k z 1
i 4 j ?1 Jk 二
Iik
Ilb ki I
m l n
:工二二 Ia
i 4 j 4
m n 2
= ? ∑∑ I a
k I
i 4 k 4
可见,矩阵相容性满足。
ik 4
I 2
'n Ib sj l 2
.s4
(这一步用了 CaUChy 不等式)
∑∑ Ib sj I 2
H ∣A ∣2∣∣B ∣∣F
(1.4 )
这样就完成了对矩阵 F-范数的验证。是不是这样直接将向量范数运用到矩阵范数就可 以了吗? No!
运用L 一-范数于矩阵范数时便出了问题。如果
数在下面一个例子上就行不通。设
A=
-范数的定义,I ∣A ∣∣j 1, ∣∣A ∣∣A ∣"1,
2?? ??■ ■?? ??■??
1
仃
IIA 2
Il A I U=: max Ia ij I ,那么,这样的矩阵范
2
=2A 。因此,按上述矩阵∞ 2
曰
'2
,2 II : := 2,于是
2 咄 A 2
IQIIA A Il 上Il All 』A ∣Q1
但这是矛盾的。所以 简单地将L.-范数运用于矩阵范数,是不可行的
。
I∣A∣V=max
共Il AXI V
IlX I L
(2.1 )
可以验证,这样定义出的矩阵范数IlAl V 满足定义1规定的4个条件,同时又满足矩阵范数 与向量范数相容性要求(定义2)。由于有什么样的向量范数IIJ V ,就有什么样的矩阵范数, 所以,这样的矩阵范数称为由向量范数诱导出的,简称
诱导范数;又因为(2.1 )实际上规
定了一个函数(或算子),故又称为 算子范数。
(2.1 )给定的范数实际是寻求一个最优化问题的最优值,求目标函数
山AX 也的最大
Xll v
值,约束条件是x = 0,也就在C n 空间中除原点外的点中”个n 维向量X ,使I LA X i V V
X
上面第3个等号成立是因为向量
Z
为一个单位向量。
xI V
下面我们从理论上证明这样的矩阵范数 IIAI V 满足定义1规定的4个条件,同时又满足
矩阵范数与向量范数相容性要求。
定理2。1由(2.1 )或(2.2 )给定的C m 浦上的矩阵范数满足矩阵范数定义
1的4个
条件,且与相应的向量范数相容。
证明:首先,矩阵范数与向量范数的相容性是不难证明的,事实上,
对IIxI V =1,
II A I V II XI V HI AI V = max IIAz I V -II Axh ,因此,矩阵范数与向量范数的相容性条件
IIzIV T
(1.5 )成立。
我们下面来验证(2.1 )或(2.2 )满足矩阵范数的4个条件。这4个条件中,前2个也 容易验证,因此这里只来考察第 3,4个条件。
三角不等式的验证:对于任一 ^C mn
IIA BII = maxII (A B )XI^max II Ax BxIkmax IIAII II BII
II 刈#
IIxIU
IIxIIT
=max II AxII max IIBx I^II AII IIBII IIxII 1
II 刈 T
1
矩阵相乘相容性的验证:由(1.5 ),不难有
IIABxI V 勻IAI V IIBxI VW IAIbIIBIbIIxI V
当 X=O 时,II A B X IV 判AII V IIB I V
IIxI V
所以 Il AB Il v = ma 0x ll AB X IV 引 A ∣V I ∣B I V
X R
||x|
V
至此,证实了用算子范数确能给出满足矩阵范数定义和矩阵范数与向量范数的相容性 的矩阵范数。
取得最大值。如果直接考虑这样一个优化问题 方式定义,使问题的处理简单。
IIAII v =max X=0 IIAxI V
IIxII v max I I X V T
IIAxI V
I IxI V
,还是有困难的.可以证明,它可以下列等价 弋鴛宀儿 (
2.2
)
事实上,分母上的IIxII V
是一个正数(XHO ), 那么根据向量范数的齐次性有 max≡V=max X=0
IIxIL X=0
IIxI V 1
AX
=max A
F X [
I ∣x ∣V X 式 V
JIXI V J
^max
V=
mαx ∣Aχ∣V
V
推论1对于C nn 上的任一种向量诱导范数,都有 Illll =max Il Ix 11=1
(2。3)
Il 刈 1 1
但是要注意的是,对一般的矩阵范数,对任一向量
X 三C n
,有
I ∣X ∣I=II ∣X ∣凶l ∣ llllxll
故有
Il I ll_1。
比如,IIAI F 不是诱导矩阵范数,所以 Ill Ik-I 。
几个常用的诱导矩阵范数
上面的论述表明,诱导矩阵范数与向量范数密切相关,
有何种向量范数,就有什么样的
诱导矩阵范数。下面就来具体地构造几个常用的诱导矩阵范数。设 A C mn
。
m
n
m n
n
/ m
Λ
∣∣A X ∣
为 a ij X j ≤Σ Σ Ia Iij IlX j ∣=∑ ∣X j I ∣∑ Ia j |
id : j 壬
y j Λ j I i m
J
n
≤ max I a j I 'T X jI m .max Ia j I
j =1
m
A I L = max I I AX I 1 込 max' Ia j
1 I I X I l 1
吕
1 j i J
另一方面,选取k ,使得
m
7 l4k I = max',Ia j I
i d
j i =1
令 X o 为第 k 的单位向量 e 1. =(0,…0,1,0,…,0)T ,那么 Ax^a^(a 1k ,a 2k/ ,a r υk )τ
m
m
I IAI =n n ax I IAxIg AX 011 =迟 la jk l = max∑ & I (++)
Xl 1 =1
i =I
j y
综合(+)与(++)可知,由向量l 1-范数诱导出的矩阵范数既是 I IAI 1的上界,又是其下界,因
此必有(3.1).
例3.2 设A ^C m "n ,矩阵谱范数由l 2-范数诱导得出的矩阵范数,定义为
Il A Il 2
= max {丸 I 扎是 A H
A 的特征值} = Jh maX (A H A) =
σ1
(3.2) 其中S 为A 的最大奇异值,当时,l IAI 〔2= J 扎max (A T A)
(3.3)
证明:首先由线性代数,A H A 是半正定矩阵,事实上,对任一 C n ,有
(x, A H
AX)= X H
A H
AX = (AX)H
(AX) =∣∣A X ∣∣-0
因此,A A 的特征值都为非负实数,记为 2 V ≥ ? ≥ 0 ,而且A A 具有n 个相互 正交的,∣2-范数等于
例3. 1设A C m n ,由向量h-范数诱导而来的
m
IIAI^nτj ax∑ 冋 I
1
沁V
证明:按列分块,记A = (a ∣,a 2,…,a n ),则由(
Il Alh = max I Ia j Il
1 g 鱼
最大列和诱导矩阵范数
3.1 )和向量I i -范数的定义可知
(3.1)
(+)
1(即标准化了的)特征向量X(I),x⑵,…,x(n),它们分别对应于特征值
'1 _ '2〉■:「n _0。
故这组特征向量构成了一组标准正交基,用它们可表示任一个范数∣∣x∣∣2
n
X f M⑴
i 4
n
而且,由∣∣χ∣2=l,可得到=1。
?=X
n n n
这样,A H AX=A H Aa :?i x⑴八冷(A H AX(i))八>i?iχ(i)。
i 4 i =I i =I
由此
(n . n.、
IlAXIl2 = (x, A H A X)-'「X⑴,”亡i,i x⑴
Iy y 丿
/ n、
=^I | :'1 I2 2 h 2 I2川…川也n N n f ' 1 岸「j「器,
I i= J
也就是∣∣Ax∣∣2< S
由X的任意性和算子范数的定义
Il A Il2=^max Il Ax ||2—?1
2 IXll21 2 1
另一方面,由∣∣X∣∣2=1 ,并且取?1对应的特征向量X(I),考虑
AX(I)Il2=(X(I),A H AX(I))=(X(I), IX(I))「(X(I),x(I))「1 IlX(I)II2「所以
IIAI"ma刘A X∣∣2≥1∣ AX(I)Il2 = λ1
综合(* )和(**),由∣2-范数诱导得出的矩阵范数应为
Il All2=厂I=max{ ‘ I ■是A H A 的特征值} ' max( A H A)=F。
例3. 3设A C m n, L:-范数诱导得出的矩阵范数
n
了max' Ia j
S j d
证明:设X=(^,x2√ ,X n)T,且W",即平乂以十仁
n n
^max' Ia ij X j l=max' Ia ij Ilx j I
i j 壬i jT
n n
WmaX瓦(la j I (max I X j l)) Mmpx迟Ia0I
i j 壬j i j =1
由算子范数,
n
Il All F max l Il AxIF ma^ Ia j I
-- j =A
另一方面,选取k,使得
n n 1的向量X :
(*)
(** )
(3.4 )
n
Il AxIh= max Σ a ii x i
11心1心.,ij j
一
(*)
X Ia kj Fm i aX、& I j T i j d
1, ifa kj=O
令y =(yι,y2, I y n)T)其中y j 二亦∣
, if a kj ≠ 0 a kj
则Ilyll孑m?x I y j μι ,从而有
n
Ay= Σ |a kj l
j 二
由算子范数
(** ) I|A||::=maXlIAx|I:」I Ay||::_' Ia kj | = max' |a j I。
l|x|Q j 二Ijm
综合(*)和(**),便得
n
“僅:二啊' ? l°
--j吕
除了上述3种常用的矩阵范数外,Frobenius范数虽然不是算子范数,但也经常所用,
在讨论序列收敛等问题上是等价的。
(1 -2 \
例3. 4 设A= ,求其各种矩阵范数。
1-3 4J
解:ll Au=最大列和=6 ;
ll All ::-最大行和=7 ;
ll A∣∣F= √∣2223242〉30 : 5.477 ;
ll All2=¥15 221 5.4650
四. 由矩阵范数推出的向量范数
矩阵范数可由向量范数诱导,反过来,向量范数有时也可从矩阵范数推出。
例4. 1设∣∣?∣∣M是C nn上的矩阵范数,任取C n中的非零向量y ,则函数
Ilxll V=IIXy H∣∣M, PXEC n(4。1)
是C n上的向量范数,且矩阵范数∣∣?∣∣M与向量范数Il ? I V相容。
证明:欲证∣∣x∣L是一个向量范数,只须验证它满足向量范数得个条件。
非负性:当X=O时,由于y非零,故IIxI L =IIXy H∣∣M0, -χ C n;
当X=O 时,XyH=On xI,故∣∣X∣V=IIXy H IlM=O。齐次性:对任一常数c? C ,有
IICXIV=IlCXy H
Ih=IeIIlXy H
Ih=ICIIlXI V 。
三角不等式:对任意的x,z? C n ,有
IIx zI V =II(X z)y H
IIMTIXy H
XZ H
II M 即Xy H I M
IIXZ H
II M
=II X H∕ II Z H M 。
因此由向量范数的定义知,I ∣X ∣ V 是一个向量范数。
下面再证两种范数的相容性。如果
A 三c n n
, X 三C n
,那么
A X I V= I I(AX)y H | I M =II A(Xy H ) ∣∣M 即 A ∣∣M ∣∣Xy H ∣ ∣M =∣∣A ∣∣M ∣∣X ∣V 。
可见,矩阵范数I I ?∣∣M 与向量范数I I ?∣V 相容。
五.范数的若干应用
范数的应用很广泛,这里只举
2例。
1.矩阵奇异性的条件
对于矩阵A C nn ,能否根据其范数的大小,来判别 (I -A )的奇异性?判别一个矩阵的奇 异性,并不方便(比如计算 A 的行列式的值是否非零,判断 A 的诸列是否线性无关等,均 不大容易),但矩阵的范数的计算,如 | | A ∣ ∣1, | | A ∣ |:-,还是方便的。 定理5.1(Banach 引理)设矩阵 A ^C n >n ,且对矩阵 C n 妙上的某种矩阵范数
∣∣?∣∣,有
||A||:::1,则矩阵(I -A )非奇异,且有
证明:假设矩阵范数∣∣A ∣∣与向量范数∣∣x ∣∣相容。欲证矩阵(I _A )非奇异,可
通过
det (l 一 A )=O 。
用反证法。假设det (l _A )=0 ,则齐次线性方程组
(l _A )x =0有非零解x 0
,即
(1 一 A)X o =0, X o =0 于是, 两边取范数
X o = Ax °。
I ∣x 0∣∣v -∣∣Ax 0∣V^I ∣A ∣II ∣X 0I V
其中最后一个不等号是由于 ||A||:::1。但上式是矛盾的,假设 det (l _A )=0不成立,
从
而矩阵(I _A )非奇异,故有逆。
再由 两边取范数, 再移(I _A)」(I _ A) =I 可得(I -A)J =^(^A)J A 得 II(I-A)JI=III Z (I -A)J A ∣μ∣∣I || ∣∣(^A)-1
∣∣∣∣A ∣∣ ∣∣(I —A)'||(1-||AIr||1 ||
从而
∣∣(I-A)J I^ ∣∣I ∣∣
1τ∣A ∣∣
这正是我们要想证明的。在推演分析 A x = b 的直接法的误差分析时起重要的作用。
请同学们自行证明下面类似的结果。
∣∣(∣ -A)叩
IIi II 1T ∣A (5.1)
定理5.2设矩阵A C nn,且对矩阵C n n上的某种矩阵范数∣Z∣∣,有∣∣A*1 ,则
2 .近似逆矩阵的误差一一逆矩阵的摄动
在数值计算中,误差无处不在,考虑由于这些误差存在而带来的后果,是一项重要的
课题。设矩阵A C nn的元素Q j带有误差;.a ij, (i, j =1,2- ,n),则矩阵的真实的值应为A JA ,其
中A = Ca i j)称为误差矩阵,又叫摄动矩阵。
若A为非奇异,其逆阵为A J。问题是:(A ? J.A)J与A J的近似程度如何呢?或者说,
(A .:. A)J与A J的"距离”大小为多少?
下面是回答上述问题的摄动定理。
定理5.3 设矩阵AC nn非奇异,B?C nn,且对C n n上的某种矩阵范数∣∣?∣∣,有||A J B||::1,则(1)A B 非奇异;(2)记F=I -(I A」B)」,那么IlF 卜11 A B ll ;仁11ABll
(3)||A」—(A + B)」|J ||A,B||
ll A A II 一1 —||A」B||°
证明:由于|| A j L B|卜:1,所以||-A」B||:::1。由定理5。1,(I A J B)非奇异,故A B=A (I A J B)非奇异。
在定理5。2中,将A换成_A」B ,即得(2 )。又因为A J-(A B)J=(I -(I A J B)J L)
A J L,
两边取范数,并利用(2)的结论,可得
1
」」|| A B || J
||A J-(A B)J|| J ||A」||,
1T|A B||
即可得到(3 )。□
3?矩阵谱半径及其性质
矩阵谱半径是一个重要的概念,在特征值估计,广义逆矩阵,数值计算(特别在数值线
性代数)等理论中,都占有极其重要的地位。
定义4设矩阵A C nn的n个特征值为含重根),称max「i|为矩阵A 的谱半径,记为T(A)。
关于矩阵谱半径的最证明也是最重要的结论是,矩阵A的谱半径不超过其任一种矩阵
范数。这个结果已经在课堂上证明过了。
∣1-i 3 )
作为练习,请同学们对A=I 验证这个结论。
U 1+i 丿
关于矩阵谱半径的第2个重要结论是,如果矩阵A为Hermite矩阵,则|| A ||2= (A)。证明留给大家。
虽然Hermite矩阵的谱半径与其谱范数相等,但是,一般矩阵的谱半径与其谱范数可能相差很大。下面关于矩阵谱半径的第3个重要结论,刻画了谱半径与矩阵范数之间的另一种
定理5。4设矩阵A C n n,对任意正数;,存在一种矩阵范数∣∏∣∣M ,使得
ll A ∣∣A∣∣M ^ '(A);
证明:根据Jordan标准型,对A C n n,存在非奇异的P C n n,使
-4
PAP=J
如果记-■- = diag (,1, 2,, ,n)和
2
0 :-3
0」
=I ,其中?1,,2,…,'n为A的特征值。
又记D =diag(1, E,E2,…,列亠),则有
记S=PD ,那么S为非奇异,且有
IlS J L ASIl I引上;I Il l E T(A);。
另一方面,容易验证,∣∣A∣∣M =IIS d ASI L是C nn上的矩阵范数,所以∣∣A∣∣M =IIS」ASI1「YA);。
5.向量和矩阵范数在求解Ax =b的直接法的误差分析中应用这一内
容我在课堂上讲的比较仔细,这里就略去了。
■0
则Jordan 标准型
(PD)J A(PD^D J P J AP^D J J^^ I =