第6章 神经网络中的线性变换共22页
- 格式:ppt
- 大小:594.00 KB
- 文档页数:11
第6章线性变换和特征值线性变换是线性代数中的重要概念,它是指一个向量空间V到另一个向量空间W之间的映射,满足线性性质。
线性变换在实际应用中有着广泛的应用,特别是在计算机图形学、信号处理、物理学等领域中。
在进行线性变换时,我们通常会对向量进行一系列的操作,如旋转、缩放、投影等。
这些操作可以通过矩阵来表示,因为矩阵可以将一些向量操作统一起来,从而方便计算。
线性变换可以用一个矩阵A表示,对于输入向量x,其变换结果y=Ax。
线性变换的一个重要性质是保持向量的线性组合。
即对于任意的向量x1, x2和标量a,b,有T(ax1 + bx2) = aT(x1) + bT(x2)。
这一性质在实际应用中非常有用,它保证了线性变换的结果仍然是向量空间中的向量。
在线性代数中,我们研究的是向量空间的特征,即向量空间中的一些特殊向量。
对于一个线性变换T,其特征向量是满足T(v)=λv的非零向量v,其中λ是一个标量,称为特征值。
特征向量和特征值可以用来描述线性变换对向量的“拉伸”和“旋转”效果。
特征值和特征向量的计算是线性代数中的关键问题。
一般来说,我们可以通过求解线性变换对应矩阵的特征方程来求解特征值和特征向量。
特征方程是一个关于特征值λ的方程,其形式为det(A - λI) = 0,其中A是线性变换对应的矩阵,I是单位矩阵。
特征值和特征向量在实际应用中有着广泛的应用。
例如,在计算机图形学中,特征值和特征向量可以用来描述3D模型的形状变化。
在信号处理中,特征值和特征向量可以用来解决滤波和降噪问题。
除了特征值和特征向量,线性变换还有一些重要的性质。
例如,对于矩阵为A的线性变换T和标量c,有T(cA)=cT(A),称为线性变换的齐次性质。
此外,线性变换的核是指所有使得T(v)=0的向量v的集合,而像是指线性变换T的所有可能输出向量的集合。
总结起来,线性变换是线性代数中的重要概念,它可以用矩阵来表示,并且具有许多重要的性质。
特征值和特征向量是线性变换的重要度量指标,可以用来描述线性变换的效果。
线性变换知识点总结一、引言线性变换是线性代数中的重要概念,它是在向量空间中的一种特殊映射。
线性变换具有许多重要的性质和应用,因此研究线性变换对于理解线性代数和应用数学有着重要的意义。
本文将从线性变换的基本概念、性质和应用进行总结,希望能够帮助读者对线性变换有更深入的理解。
二、线性变换的定义线性变换是向量空间之间的一种映射,具体来说,设V和W是两个向量空间,f:V→W是从V到W的映射。
如果对于V中的任意向量u、v和任意标量a,b,都有f(au+bv)=af(u)+bf(v)那么f称为一个线性变换。
三、线性变换的矩阵表示线性变换可以用矩阵来表示,假设V和W是n维向量空间,我们选择V和W的基,那么可以得到V和W中的向量可以用n维列向量表示。
设f:V→W是一个线性变换,选择V和W的基分别为{v1,v2,...,vn}和{w1,w2,...,wn},那么f的矩阵表示为[f]=(f(v1) f(v2) ... f(vn))其中f(vi)表示w中的基向量wi在f映射下的像,也就是f(vi)对应的列向量。
根据线性变换的定义,我们可以得到映射f的矩阵表示满足下列关系f(av1+bv2)=af(v1)+bf(v2)等价于[f](av1+bv2)=a[f]v1+b[f]v2其中[f]v1和[f]v2为f(v1)和f(v2)的列向量表示。
四、线性变换的性质1. 线性变换的保直性线性变换f:V→W将V中的任意向量线性映射到W中,这种映射保持向量之间的直线性质,即通过f映射后的图像仍然是一条直线。
这是线性变换的一个重要性质,它保证了线性变换后的图像具有一些有用的性质,比如直线上的点在f映射后仍然在同一条直线上。
2. 线性变换的局部性线性变换f:V→W保持向量之间的“相对位置”不变,即如果向量v1和v2之间的相对位置关系在V中是一定的,那么在映射f下,向量f(v1)和f(v2)之间的相对位置关系也是一定的。
这一性质对于理解线性变换的几何意义有着重要的作用,它意味着线性变换可以保持向量之间的某些几何性质。
第六章 线性变换线性变换的理论是19世纪后半期由凯莱和西尔维斯特建立起来的,它们运用线性变换定义了矩阵的乘法,处理了矩阵的相似合同等关系.变换是集合A 到自身的映射,线性变换是特殊的变换,是在变量的线性替换、坐标变换等基础上建立起来的数学工具之一,在向量空间中,线性变换与矩阵(方阵)有着紧密的联系,线性变换的化简直接转化为对矩阵的化简,因此,它是方阵化简的基本理论依据.从这一意义上来说,本章内容可看作对矩阵讨论的延续.本章重点是求特征值与特征向量.*6.1 线性变换及其运算定义 1 设V 是数域F 上的一个向量空间,σ是V 的一个变换.如果,F k ∈∀ V ∈∀βα,,有1));()()(βσασβασ+=+2)),()(ασασk k =那么称σ是V 的一个线性变换.定义1中的条件1),2)可表示为:,,,,V F l k ∈∀∈∀βα有)()()(βσασβασl k l k +=+.采用数学归纳法容易证明,若σ是V 的线性变换,),,2,1(,s i F k V i i =∈∈α,那么)()()()(22112211s s s s k k k k k k ασασασααασ+++=+++ .例1.设V 是数域F 上的向量空间,F k ∈为一固定的数. 令αασk =)( V ∈∀α,那么, σ是V 的一个线性变换.事实上,,,F b a ∈∀.,V ∈βα)()()()(βαβαβασk b k a b a k b a +=+=+).()(βσασb a +=例1 中的σ称为V 的位似变换.当0=k 时,称σ为零变换,记为θ.当1=k 时,称σ为V 的恒等变换(单位变换).记为ι例 2.)(F M n 表示数域F 上的所有n 阶矩阵作成的向量空间,)(F M A n ∈为一固定矩阵.).(F M X n ∈∀令,)(XA AX X -=σ那么,σ是)(F M n 的一个线性变换.事实上,).(,F M Y X n ∈∀ ,,F b a ∈A bY aX bY aX A bY aX )()()(+-+=+σ=bYA aXA bAV aAX --+).()()()(Y b X a YA AY b XA AX a σσ+=-+-=故σ是)(F M n 的一个线性变换.设)(V L 表示向量空间V 中所有线性变换作成的集,σ,)(V L ∈τ.规定ϕ ),()()(ξτξσξ+= V ∈∀ξ.称ϕ为σ与τ的和,记为τσ+.即有)()())((ξτξσξτσ+=+.τσ+仍是V 的线性变换(读者自行验证).同时线性变换的加法满足: )(,,V L ∈∀ρτσ, 1) σττσ+=+,2) )()(ρτσρτσ++=++, 3) σσθ=+,令)())((ασασ-=-,称σ-为σ的负变换.容易验证).(V L ∈-σ对于σ-,有 4) θσσ=-+)(.再规定)(V L 的一个“数量乘法”:设)(,V L F k ∈∈σ.令 :ϕ ).(|ασαk → V ∈∀α.称ϕ为k 与σ的数量乘积,记为σk .即)())((ασασk k =.)(V L k ∈σ.事实上,V F b a ∈∈βα,,,,))()(()())((βσασβασβασb a k b a k b a k +=+=+ =)()(βσασbk ak + =))(())((βσασk b k a +.对于数乘运算,容易得到如下算律: 5) τστσk k k +=+)(, 6) σσσl k l k +=+)(, 7) )()(σσl k kl =, 8) σσ=1,其中,)(,,,V L F l k ∈∈τσ.根据向量空间的定义,我们得到:)(V L 对于它的加法和数量乘法作成数域F 上的一个向量空间.现在设V 是数域F 上的一个n 维向量空间,n ααα,,,21 是V 的一个基,)(V L ∈σ.由于,,,2,1,)(n i V i =∈ασ因而它们可由基n ααα,,,21 线性表出.令,12211111)(n n a a a αααασ+++=,22221122)(n n a a a αααασ+++= (1)…………………n nn n n n a a a αααασ+++= 2211)(.(1)也可以表为 ()A n n ),,,()(,),(),(2121αααασασασ =,或A n n ),,,(),,(2121αααααασ = , (2)其中⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=nn n n n n a a a a a aa a a A212222111211. 称A 为σ关于基n ααα,,,21 的矩阵.A 的第j 列元为)(j ασ在基n ααα,,,21 下的坐标,,,,2,1n j =因而当取定基之后,σ在这一基下的矩阵是唯一的.例 3 σ是n 维向量空间V 的位似变换:σααασ,,)(V k ∈∀=关于V 的任一个基的矩阵为n 阶数量矩阵:⎪⎪⎪⎪⎪⎭⎫ ⎝⎛k k k .而零变换θ关于V 的任一个基的矩阵为零矩阵.单位变换ι关于V 的任一个基的矩阵是n E .例4 V 是n 维欧氏空间, n ααα,,,21 是V 的一个标准正交基.)(V L ∈σ,且满足α∀、>>=<<∈βαβσασβ,)(),(,V .设()U n n ),,,()(,),(),(2121αααασασασ =其中)(ij u U = .,,2,1,n j i = 由∑==ni iij j u 1)(αασ ,,2,1n j =那么,>=>=<<)(),(,j i j i ασασαα><∑∑==nl l lj nk k kiu u11,αα=∑∑∑===>=<nk nl nk kj ki l k lj kiu u u u111,αα=⎩⎨⎧≠=.,0,,1j i j i 当当这表明U 为正交矩阵.定义2 V 是n 维欧氏空间, )(V L ∈σ.如果,,V ∈∀βα有.,)(),(>>=<<βαβσασ (3) 那么称σ是一个正交变换.由例4知, 正交变换σ在任一标准正交基下的矩阵是正交矩阵.同时,若n ααα,,,21 是标准正交基,那么)(1ασ, )(,),(2n ασασ 也是标淮正交基.正交变换不改变向量的长度.事实上,在(3)中取βα=,便有|||)(|αασ=.反过来可以证明,在欧式空间V 中,若线性变换σ保持向量长度不变,那么σ是正交变换.最后,我们讨论向量空间V 的向量ξ与σ(ξ)关于同一基的坐标之间的关系. 定理6.1.1 设V 是n 维向量空间,)(V L ∈σ ,n ααα,,,21 是V 的一个基,且.),,,(),,,(2121A n n αααααασ =又设n n x x x αααα+++= 2211, n n y y y αααασ+++= 2211)(,那么⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n n x x x A y y y 2121. (4) 证: 由),,,(212211n n n x x x ααααααα =+++= ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n x x x 21,σ是线性变换,那么)()()()(2211n n x x x αασασασ+++==())(,),(),(21n ασασασ ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n x x x 21=A n ),,,(21ααα ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n x x x 21.又⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n n y y y 2121),,,()(αααασ.由于同一个向量在一个基下的坐标是唯一的,所以⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n n x x x A y y y 2121.这一结论表明,若知道线性变换σ关于某个基的矩阵,知道向量α关于这个基的坐标,那么由(4)式,便可求得α在σ下的像)(ασ关于这个基的坐标.习 题1.在3R 中,下列哪些变换是线性变换? (1) );,,(),,(132321a a a a a a =σ(2))0,0,(),,(321321x x x x x x ++=σ; (3) )0,0,(),,(321321x x x x x x =σ;(4) ),,(),,(233221321x x x x x x x +=σ.2.σ是向量空间V 的任一线性变换,证明 (1)0)0(=σ.(2) s ααα,,,21 线性相关,则)(,),(),(21s ασασασ 也线性相关. 3.已知3R 是σ的线性变换:),,,2(),,(13221321x x x x x x x x +-=σ求3R 在σ的自然基321,,εεε下的矩阵.4.σ是欧氏空间V 的线性变换,证明:若对任意的V ∈α有|||)(|αασ=,则σ是正交变换.6.2 特征值与特征向量我们已经看到,在向量空间V 中,取定一个基, V 的一个线性变换对应着唯一的一个n 阶矩阵.我们需要进一步考虑的是,一个线性变换在不同基下的矩阵有什么关系;是否可以找到一个适当的基,使线性变换在这个基下的矩阵最简单——为对角形矩阵.现在设V 是数域F 上的n 维向量空间,n ααα,,,21 与n βββ,,,21 是V 的两个基.)(V L ∈σ.()A n n ),,,()(,),(),(2121αααασασασ =,()B n n ),,,()(,),(),(2121ββββσβσβσ =, (1)由基n ααα,,,21 到基n βββ,,,21 的过渡矩阵是T ,即),,,(21n βββ =T n ),,,(21ααα .(2)因为T 可逆,有=),,,(21n ααα ),,,(21n βββ 1-T .由(2),()T n n ))(,),(),(()(,),(),(2121ασασασβσβσβσ =),,,(21n ααα =AT),,,(21n βββ =1-T AT . (3)比较(1),(3)有.1AT T B -= (4)定义1 设B A ,是数域F 上的两个n 阶矩阵,如果有F 上的可逆矩阵T ,使,1B AT T=-那么称B A 与相似,记为A ∽B .n 阶矩阵的相似关系具有如下性质: 1.自反性: A ∽A (取n E T =则可).2.对称性:由,1B AT T=-有A BT T =---111)(,即若A ∽B ,则B ∽A .3.传递性:若A ∽B ,B ∽C ,那么A ∽C .事实上,由A ∽B ,B ∽C ,则有可逆矩阵S T ,使..,11C BS S B AT T ==--于是.)()()(111C TS A TS S AT T S ==--- 根据定义1及上述推导可得:定理 6.2.1 线性变换σ在不同基下的两个矩阵相似.另一方面,若B AT T =-1,设n ααα,,,21 是V 的基,=))(,),(),((21n ασασασA n ),,,(21ααα .令T n n ),,,(),,,(2121αααβββ =,则n βββ,,,21 也是V 的基.事实上,由 12121),,,(),,,(-=T n n βββααα 知n ααα,,,21 可由n βββ,,,21 线性表示.由替换定理n ααα,,,21 与n βββ,,,21 等价,因而等秩.即秩 (n βββ,,,21 )=n .由(3)式的推导,容易看出B n n ),,,())(,),(),((2121ββββσβσβσ =.这说明,两个相似矩阵可以看成σ在不同基下的矩阵.在(1)中,如果B 是一个对角形矩阵,即⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n B λλλ21, 便有j j j βλβσ=)(,这也就是我们构造基n βββ,,,21 ,使σ在这一基下的矩阵为对角形的基本思路.为了实现这一想法,我们给出如下重要概念.定义2 设V 是数域F 上的向量空间,0,),(≠∈∈αασV V L .如果有F ∈λ,使得λαασ=)(, (5)那么称λ是σ的特征值,称α是σ的属于特征值λ的特征向量.现在设n ααα,,,21 是V 的一个基. ),(),((21ασασ =))(,n ασ A n ),,,(21ααα ,⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=+++=n n n n x x x x x x 21212211),,,(ααααααα,那么⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n n x x x 2121))(,),(),(()(ασασασασ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n n x x x A 2121),,,(ααα.而⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n n x x x 2121),,,(λαααλα.若(5)成立,由定理6.1.1,有⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n n x x x x x x A 2121λ.令Tn x x x X ),,,(21 =,上式即为X AX λ=. (6)(6)中的λ称为矩阵A 的特征值,X 称为A 的属于特征值λ的特征向量.(6)是由(5)推出,反过来,由(6)也可推得(5).因此, σ的特征值也称为A 的特征值.同时,我们看出,特征值与基的选取无关,只由σ(或A )确定.这样,对线性变换σ的特征值的讨论就可以转化为对方阵A 的特征值的讨论.下面我们来讨论如何求A 的特征值λ以及属于特征值λ的特征向量. 设⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n a a a a a a a a a A 212222111211,由(6)可得齐次线性方程组0)(=-X A E λ (7)(7)的系数行列式nnn n nn a a a a a a a a a A E ---------=-λλλλ212222111211|| 是关于λ的一个n 次多项式,称为A 的特征多项式,记为)(λA f .若0||)(=-=A E f A λλ,那么(7)有非零解. (7)中任意一个非零解X 都满足(6)式,因而都是属于特征值λ的特征向量关于基n ααα,,,21 的坐标.如果未提及基,我们就将(7)的非零解X 作为A 的属于特征值λ的特征向量.设α是A 的属于特征值λ的特征向量,0,≠∈k F k ,那么)()(αλλαααk k kA k A ===,这说明αk 也是属于特征值λ的特征向量.于是,若n ααα,,,21 是属于特征值λ的特征向量,那么,它们的线性组合s s k k k ααα+++ 2211(i k 不全为0)仍是属于特征值λ的特征向量.由此可知,A 的属于特征值λ的所有特征向量可以用(7)的一个基础解系来表示.此时,(7)的解空间称为A 的关于λ的特征子空间,记为λV . λV 中任何非零向量都是属于特征值λ的特征向量.例1 求A 的特征值和相应的特征向量⎪⎪⎪⎭⎫ ⎝⎛--=011211211A .解84211211211)(23+--=------=λλλλλλλA f .由综合除法,求得)(λA f 的根为:22,1=λ,23-=λ,即为A 的特征值.对于特征值,22,1=λ相应的齐次方程组为⎪⎩⎪⎨⎧=++-=++-=--,020202321321321x x x x x x x x x 求得基础解系,0111⎪⎪⎪⎭⎫ ⎝⎛=η ⎪⎪⎪⎭⎫ ⎝⎛=1022η.属于特征值2的特征向量为212211,(k k k k ηη+不全为零). 对于23-=λ,相应的齐次线性方程组为⎪⎩⎪⎨⎧=-+-=+--=---,02023023321321321x x x x x x x x x求得基础解系⎪⎪⎪⎭⎫ ⎝⎛-=1113η.属于特征值-2的特征向量为)0(3,33≠k k η.下面我们来看看两个相似矩阵的特征值之间的关系. 设A ∽B ,即有可逆矩阵T ,使,1B AT T =-那么,||||1AT T E B E --=-λλ=|)(|T A E T --λ =||||||T A E T --λ =||A E -λ.于是,有定理6.2.2 相似矩阵有相同特征多项式,因而有相同的特征值.该定理的逆不成立,即A 、B 有相同的特征值,但A 、B 不一定相似.例如⎪⎪⎭⎫ ⎝⎛=0000A , ⎪⎪⎭⎫⎝⎛=0010B . A 、B 的特征值都是021==λλ,但A 、B 不相似.前面曾经提到,矩阵A 的特征多项式)(λA f 是一个关于λ的n 次多项式,设⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n a a a a a a a a a A 212222111211, 那么nnn n nn A a a a a a a a a a f ---------=λλλλ212222111211)(, 其中)())((2211nn a a a ---λλλ 是)(λA f 的项. 该项含且仅含)(λA f 的n λ和1-n λ的项,)(λA f 的常数项, 即不含λ的项(取0=λ)为||)1(A n -.因此,||)1()()(12211A a a a f n n nn n A -+++++-=- λλλ,其中nn a a a +++ 2211为A 的主对角线上元素的和,称为A 的迹,记为)(A T r .根据多项式根与系数的关系,有)(21A T r n =+++λλλ .||21A n =λλλ .以上两式,可以在我们计算A 的特征值后,作为检验计算是否正确的必要条件.只是注意,重根有几个算几个.n 阶矩阵A 的特征值,随给定的数域F 而定.在复数域C 上,由代数基本定理, )(λA f 有n 个复根,因而总有)())(()(21n A f λλλλλλλ---= .习 题1.求下列矩阵在实数域R 内的特征值和相应的特征向量:(Ⅰ) ⎪⎪⎭⎫⎝⎛=2543A , (Ⅱ). ⎪⎪⎪⎭⎫ ⎝⎛-----=175131023A . 2.证明, n 阶矩阵A 与它的转置矩阵T A 有相同的特征值.3.若λ是n 阶矩阵A 的特征值,则kλ是k A 的特征值.4.证明,若n 阶矩阵A 的n 个特证值0≠i λ,n i ,,2,1 =,则A 可逆,且1-i λ是1-A 的特征值.*5.证明,对角形矩阵⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n a a a 21与⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n b b b21 相似,当且仅当n b b b ,,,21 是n a a a ,,,21 的一个排列.6.3 可对角化的矩阵在这一节里,我们讨论在什么情况下,n 阶矩阵A 可以相似于一个对角形矩阵,或者说,在什么情况下,向量空间V 中存在一个基,使V 的线性变换σ这个基下的矩阵为对角形矩阵.定义 1 V 是数域F 上的一个n 维向量空间,)(V L ∈σ.如果V 中有一个基,使σ在这个基下的矩阵为对角形矩阵,那么称σ是可对角化的.将定义1用矩阵的语言来表述,即为:对n 阶矩阵A ,如果存在n 阶可逆矩阵T ,使AT T 1-为对角形矩阵,那么,称A 是可对角化的.σ对角化或A 对角化,其对角形矩阵中,对角线上的元素是σ或A 的全部特征值.σ对角化在于构造一个相应的基,而A 对角化却在于构造可逆矩阵T .若⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=-n AT T λλλ211, 即有⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n T AT λλλ21. 令),,,(21n T βββ =,则可得j j j A βλβ=.这表明T 的第j 列是A 的属于特征值j λ的特征向量,即0)(=-X A E j λ的基础解系的解向量.另一方面,如果n ααα,,,21 是基,且A n n ),,,(),,,(2121αααααασ =,那么满足T n n ),,,(),,,(2121αααβββ =的n βββ,,,21 就是σ对角化需要构造的基.由上所述,σ或A 对角化是有条件的.其一,n 阶矩阵A 是否有构成n 阶对角矩阵的n 个特征值;其二,这些特征值所确定的特征向量是否可以构成可逆矩阵T .第一个条件可通过求A 的特征值来确定.对第二个条件,首先需要考察n 阶矩阵A 的属于不同特征的特征向量之间有什么关系.我们有定理6.3.1 n 阶矩阵A 的属于不同特征值的特征向量线性无关.证 设m ααα,,,21 是A 的分别属于m 个不同特征值m λλλ,,,21 的特征向量.对m 采用归纳法.当1=m 时,特征向量01≠α,1α线性无关.设对于1-m 个不同特征值,定理成立.当不同特征值的个数是m 时,令02211=+++m m k k k ααα , (1) 将A 左乘(1)两边,且由i i i A αλα=, m i ,,2,1 =,有0222111=+++m m m k k k αλαλαλ . (2)将m λ⨯-)1()2(,得.0)()()(111222111=-++-+----m m m m m m k k k αλλαλλαλλ由归纳假设121,,,-m ααα 线性无关,所以只有0)(=-m i i k λλ,1,,2,1-=m i .而0≠-m i λλ,得0=i k .将0=i k 代入(1)式,(1)化为.0=m m k α但0≠m α,于是0=m k .故m ααα,,,21 线性无关.由此定理,我们立即得到推论 若n 阶矩阵A 在给定数域F 中有n 个不同特征值,则A 可对角化.事实上,设n λλλ,,,21 是A 的n 个不同特征值,对于每一个j λ,都可求得齐次线性方程组0)(=-X A E j λ的一个非零解,分别以它们作为T 的第j 个列向量,构成T .由定理6.3.1, T 的这些列向量线性无关,因而T 可逆,且有⎪⎪⎪⎪⎪⎭⎫⎝⎛=-n AT T λλλ211.但是,一般来说,A 的特征值不一定都是)(λA f 的一重根(单根).现在假设在数域F 内t s t s s A f )()()()(2121λλλλλλλ---= ,其中i S ≥1为i λ的重数),,2,1(t i =,而n S S S t =+++ 21.即是说, )(λA f 的重根按重数计,A 有n 个特征值.如果i λ相应的齐次线性方程组0)(=-X A E i λ的基础解系含i S 个解向量,即是说此时i S V i =λdim .那么以这t 组解向量为列构成可逆矩阵T ,则有个个个t t t S S S AT T 2122111⎪⎭⎪⎬⎫⎪⎭⎪⎬⎫⎪⎭⎪⎬⎫⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=-λλλλλλ (3) 反过来,如果(3)成立,那么A 有t 个不同的特征值t λλλ,,,21 ,其重数分别为t s s s ,,,21)(21n s s s t =+++ .而T 的第i 组列向量都是属于特征值i λ的特征向量,也就是齐次线性方程组0)(=-A E i λ的i S 个线性无关的解向量,说明i V λ的维数至少是i S ,即i V λdim ≥i S .但由n S S S t =+++ 21,不可能有i V λdim >i S ,因而i S V i =λdim .由以上论述,我们得到定理6.3.2 数域F 上n 阶矩阵A 可对角化的充分必要条件是: (Ⅰ) A 在F 内有n 个特征值,(Ⅱ) 每一特征值i λ的重数等于相应特征子空间i V λ的维数.现在,我们已经知道,当σ可对角化时,如何来构造这相应的基.事实上,任取V 的一个基,由(3),以T 的列向量为坐标,便可构成n 个线性无关的向量:t ts t s ββββ,,,,,,11111 ,它是V 的一个基,而σ在这个基下的矩阵为对角形矩阵:.121个个t t t S S ⎪⎭⎪⎬⎫⎪⎭⎪⎬⎫⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛λλλλ 若A 可对角化,我们再看V 与它的特征子空间的关系,根据6.2定义2,一个特征向量,只由一个特征值确定.事实上,若αλααλα21,==A A ,那么(),021=-αλλ而0≠α,因此21λλ=.这说明{}0=j i V V λλ ,,j i ≠而此时s V V V V λλλ+++= 21. (4) 上述σ可对角化所选择的基,即由s V V λλ,,1 的基拼凑而成.显然V 的每一个向量在这个基下的表示法是唯一的.(4)中的这个和称为直和,记为s V V V V λλλ⊕⊕⊕= 21.例1 设⎪⎪⎪⎭⎫ ⎝⎛----=163222123A ,求可逆矩阵T ,使AT T1-为对角形矩阵.解)4()2(1612163222123)(23+-=+-=+---+--=λλλλλλλλA f .A 的特征值为4,2,2-.对于特征值2,求得相应齐次线性方程组⎪⎩⎪⎨⎧=+--=-+=+--0363024202321321321x x x x x x x x x 的基础解系:T)0,1,2(1-=η,T)1,0,1(2=η;对于特征值4-,求得相应齐次线性方程组⎪⎩⎪⎨⎧=---=--=+--03630222027321321321x x x x x x x x x的基础解系:T )1,32,31(3-=η. 由于基础解系所含解向量的个数都等于相应特征值的重数,A 可对角化.取⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛--=11032013112T ,则⎪⎪⎪⎭⎫ ⎝⎛-=-4000200021AT T .习 题1. 在实数域R 内,下列哪些矩阵可对角化.(Ⅰ) ⎪⎪⎪⎭⎫ ⎝⎛-----175131023; (Ⅱ) ⎪⎪⎪⎭⎫ ⎝⎛---504941754; (Ⅲ) ⎪⎪⎪⎭⎫⎝⎛---6123020663. 2. 已知三阶矩阵A 的特征值1,2,1321-===λλλ.属于1λ的特征向量T )1,0,1(1=α,属于2λ的特征向量T)1,1,0(2-=α,属于3λ的特征向量T )1,1,1(3-=α.求A .3. 设⎪⎪⎪⎭⎫ ⎝⎛----=163053064A ,求10A .*4. 已知三阶矩阵A 的特征值为1,-1,2,设矩阵235A A B -=,试求B 的特征值.。