35 直接线性变化的基本原理和解算方法.
- 格式:pps
- 大小:148.50 KB
- 文档页数:21
线性变换与线性方程组的解法线性变换和线性方程组是线性代数中的重要概念和方法。
线性变换是指变换结果符合线性性质的一种变换,而线性方程组是由多个线性方程组成的方程组。
在本文中,我们将探讨线性变换与线性方程组的解法及其应用。
一、线性变换线性变换是指保持加法和数乘两种运算的变换。
设V和W是两个向量空间,如果存在一个从V到W的映射T,对于任意的向量u和v 以及标量c,满足以下条件:1. T(u+v) = T(u) + T(v)(加法运算性质)2. T(cu) = cT(u)(数乘运算性质)则称T为从V到W的线性变换。
线性变换在实际问题中有着广泛的应用,比如在图像处理、信号处理等领域都会用到。
二、线性方程组的解法线性方程组是由一组线性方程构成的方程组,其一般形式可以表示为:a₁₁x₁ + a₁₂x₂ + ... + a₁ₙxₙ = b₁a₂₁x₁ + a₂₂x₂ + ... + a₂ₙxₙ = b₂...aₙ₁x₁ + aₙ₂x₂ + ... + aₙₙxₙ = bₙ其中,a₁₁到aₙₙ为已知系数,b₁到bₙ为已知常数,x₁到xₙ为未知数。
求解线性方程组的方法有多种,最常见的包括高斯消元法和矩阵的逆运算。
1. 高斯消元法高斯消元法是一种通过初等变换将线性方程组转化为简化形式的求解方法。
具体步骤如下:(1)将线性方程组写成增广矩阵的形式:[ a₁₁ a₁₂ ... a₁ₙ | b₁ ][ a₂₁ a₂₂ ... a₂ₙ | b₂ ]...[ aₙ₁ aₙ₂ ... aₙₙ | bₙ ](2)利用初等行变换将增广矩阵转化为简化行阶梯形矩阵。
(3)从最后一行开始,逐步求解未知数,得到线性方程组的解。
2. 矩阵的逆运算对于一个非奇异的矩阵A,可以通过求解线性方程组Ax = b来得到未知数x。
如果矩阵A可逆,则可以利用矩阵的逆运算求解该线性方程组:x = A⁻¹b其中A⁻¹为矩阵A的逆矩阵。
三、线性变换与线性方程组的应用线性变换和线性方程组的解法在实际问题中具有广泛的应用。
线性变换的相关知识点总结一、线性变换的定义线性变换是指一个向量空间V到另一个向量空间W的一个函数T,满足以下两条性质:1.加法性质:对于向量空间V中的任意两个向量x和y,有T(x+y)=T(x)+T(y)。
2.数乘性质:对于向量空间V中的任意向量x和标量a,有T(ax)=aT(x)。
根据以上的定义,我们可以得出线性变换的几个重要性质:1. 线性变换保持向量空间中的原点不变;2. 线性变换保持向量空间中的直线和平面不变;3. 线性变换将线性相关的向量映射为线性相关的向量;4. 线性变换将线性无关的向量映射为线性无关的向量。
二、线性变换的矩阵表示在研究线性变换时,我们通常会使用矩阵来表示线性变换。
设V和W分别是n维和m维向量空间,选择它们的一组基{v1, v2, ..., vn}和{w1, w2, ..., wm}。
线性变换T可以用一个m×n的矩阵A来表示,假设向量x在基{v1, v2, ..., vn}下的坐标为[x],向量T(x)在基{w1, w2, ..., wm}下的坐标为[T(x)],则有[T(x)]=[A][x]。
由此可见,矩阵A中的每一列都是T(vi)在基{w1, w2, ..., wm}下的坐标,而T(vi)可以写成基{w1, w2, ..., wm}的线性组合,所以矩阵A的列向量就是线性变换T对基{v1, v2, ..., vn}下的坐标系的映射。
另外,矩阵A的行空间也是线性变换T的像空间,而零空间是T的核空间。
线性变换的基本性质在矩阵表示下也可以得到进一步的解释,例如线性变换的复合、逆变换等都可以在矩阵表示下进行研究。
因此,矩阵表示是研究线性变换的重要工具。
三、特征值和特征向量特征值和特征向量是线性代数中的一个非常重要的概念,它们在研究线性变换的性质时有非常重要的应用。
设T是一个n维向量空间V上的线性变换,那么存在一个标量λ和一个非零向量v,使得Tv=λv。
这里的λ就是T的特征值,v就是T的特征向量。
第 7章 线性变换知识点归纳与要点解析一.线性变换的概念与判别 1.线性变换的定义数域P 上的线性空间V 的一个变换σ称为线性变换,如果对V 中任意的元素,αβ和数域P 中的任意数k ,都有:()()()σαβσασβ+=+,()()k k σασα=; 注:V 的线性变换就是其保持向量的加法与数量乘法的变换;2.线性变换的判别设σ为数域P 上线性空间V 的一个变换,那么:σ为V 的线性变换⇔()()()k l k l ,,V ,k,l P σαβσασβαβ+=+∀∈∀∈ 3.线性变换的性质设V 是数域P 上的线性空间,σ为V 的线性变换,12s ,,,,V αααα∀∈;性质1. ()()00,σσαα==-; 性质2. 若12s ,,,ααα线性相关,那么()()()12s ,,,σασασα也线性相关;性质3. 设线性变换σ为单射,如果12s ,,,ααα线性无关,那么()()()12s ,,,σασασα也线性无关;注:设V 是数域P 上的线性空间,12,,,m βββ,12,,,s γγγ是V 中的两个向量组,如果:11111221221122221122s s s s m m m ms sc c c c c c c c c βγγγβγγγβγγγ=+++=+++=+++记:()()1121112222121212,,,,,,m m m s s s ms c c c c c c c c c βββγγγ⎛⎫ ⎪ ⎪= ⎪⎪⎝⎭于是,若()dim V n =,12,,,n ααα是V 的一组基,σ是V 的线性变换, 12,,,m βββ是V 中任意一组向量,如果:()()()11111221221122221122n n n n m m m mn nb b b b b b b b b σβααασβααασβααα=+++=+++=+++记:()()()()()1212,,,,m m σβββσβσβσβ=那么:()()1121112222121212,,,,,,m m m n n n mn b b c b b c b b c σβββααα⎛⎫⎪ ⎪= ⎪⎪⎝⎭设112111222212m m n n mn b b c b b c B b b c ⎛⎫⎪⎪= ⎪⎪⎝⎭,12,,,m ηηη是矩阵B 的列向量组,如果12,,,r i i i ηηη是12,,,m ηηη的一个极大线性无关组,那么()()()12,ri i iσβσβσβ就是()()()12,m σβσβσβ的一个极大线性无关组,因此向量组()()()12,m σβσβσβ的秩等于秩()B ;4. 线性变换举例1设V 是数域P 上的任一线性空间;零变换: ()00,V αα=∀∈; 恒等变换:(),V εααα=∀∈;幂零线性变换:设σ是数域P 上的线性空间V 的线性变换,如果存在正整数m ,使得σ=m 0,就称σ为幂零变换;幂等变换:设σ是数域P 上的线性空间V 的线性变换,如果2σσ=,就称σ为幂等变换;2nV P =,任意取定数域P 上的一个n 级方阵A ,令:111222n n n n x x x x x x A ,P x x x σ⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪=∀∈ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭; 3[]V P x =,()()()()[]D f x f x ,f x P x '=∀∈; 4n nV P⨯=,()ij A a =是V 中一固定矩阵,()n n X AX ,X P τ⨯=∀∈;二.线性变换的运算、矩阵 1. 加法、乘法、数量乘法1 定义: 设V 是数域P 上的线性空间,,στ是V 的两个线性变换,定义它们的和στ+、乘积στ分别为:对任意的V α∈()()()()στασατα+=+,()()()()σταστα=任取k P ∈,定义数量乘积k σ为:对任意的V α∈()()()k k σασα=σ的负变换-σ为:对任意的V α∈()()()-=-σασα则στ+、στ、k σ与-σ都是V 的线性变换;2()L V ={σσ为V 的线性变换},按线性变换的加法和数乘运算做成数域P 上的维线性空间;2. 线性变换的矩阵1定义:设V 是数域P 上的n 维线性空间,σ是V 的线性变换,12,,,n ααα是V 的一组基,如果:()()()11111221221122221122n n n n n n n nn na a a a a a a a a σαααασαααασαααα=+++=+++=+++那么称矩阵112111222212n n nnnn a a a a a a A a a a ⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭为线性变换σ在基12,,,n ααα下的矩阵;此时:()()()()()()121212,,,,,,,n n n A σααασασασαααα==2线性变换的和、乘积、数量乘积、逆变换、负变换及线性变换多项式的矩阵:设12,,,n ααα是数域P 上的n 维线性空间V 的一组基,(),L V στ∀∈,设它们在12,,,n ααα下的矩阵分别为A,B ;1():n n f L V P ⨯→,A σ是数域P 上的线性空间()L V 到数域P 上的线性空间n n P ⨯的同构映射,因此()n n L V P ⨯≅;2σ可逆⇔A 可逆3①στ+、στ与-σ在基12,,,n ααα下的矩阵分别为A B,AB +与A -; ② 任取k P ∈,k σ在基12,,,n ααα下的矩阵为kA ;③ 若σ为可逆线性变换,则1σ-在基12,,,n ααα下的矩阵为1A -;④ 设()1110mm m m f x a x a xa x a --=++++为数域P 上的任一多项式,那么()1110m m m m f a a a a σσσσε--=++++ε为V 的恒等变换在基12,,,n ααα下的矩阵为:()1110m m m m n f A a A a A a A a E --=++++;三.特征值、特征向量与对角矩阵1. 矩阵的特征值与特征向量1矩阵的特征多项式:设A 为n 级复方阵,将多项式()λλ=-A n f E A 称为A 的特征多项式;注: 1若()ijnnA a =,则:()()()()1112211λλλλ-=-=+-+++++-nn n A n nn f E A a a a A()()()11tr 1λλ-=+-++-nn n A A2 将λ-n E A 称为矩阵A 的特征矩阵,0λ-=n E A 称为矩阵A 的特征方程;2 定义:n 级方阵A 的特征多项式()λλ=-A n f E A 在复数域上的所有根都叫做其特征值根,设0λ∈C 是A 的特征值,齐次线性方程组()0λ-=n E A X 的每个非零解都叫做矩阵A 的属于其特征值0λ的特征向量;3求法:1求()λλ=-A n f E A 在复数域上的所有根12λλλn ,,,重根按重数计算;2对()1λ=k k ,n 解齐次线性方程组()0λ-=k n E A X ,得其一个基础解系12,,,,ηηηk k k k l =-k l n 秩()λ-k n E A ,则矩阵A 的属于特征值λk 的全部特征向量为1122,,ηηη+++k k k k k k k l k l s s s ,其中12,,,,k k k k l s s s 为不全为零的任意常数复数;4 重要结论:1设0λ∈C 是A 的特征值,0X 是A 的属于其特征值0λ的特征向量,()g x 为一复系数多项式;① ()0λg 为()g A 的特征值,0X 为()g A 的属于特征值()0λg 的特征向量; ② 如果A 还是可逆矩阵,那么1λ与λA分别为1-A 和*A 的特征值,0X 为1-A 的属于特征值1λ的特征向量,0X 为*A 的属于特征值λA的特征向量,③ 若12λλλn ,,,是矩阵A 的全部特征值,那么()()()12λλλn g ,g ,,g 就是()g A 的全部特征值,如果A 还是可逆矩阵,则12111λλλn,,,为1-A 的全部特征值,12λλλnA A A,,,为*A 的全部特征值;2若12λλλn,,,是矩阵A的全部特征值,那么()12tr λλλ=+++n A ,12λλλ=n A ;2. 线性变换的特征值与特征向量1定义:设σ是数域P 上的线性空间V 的线性变换,0λ∈P ,若存在0α≠∈V ,使得()0σαλα=,就称0λ为σ的一个特征值,α为σ的一个属于特征值0λ的特征向量;2线性变换的特征多项式设σ是数域P 上的n 维线性空间V 的线性变换,任取V 的一组基12,,,n ααα,设σ在该基下的矩阵为A ,称矩阵为A 的特征多项式λ-n E A 为σ的特征多项式,记为()σλλ=-n f E A ,即线性变换的特征多项式为其在任意基下矩阵的特征多项式;3求法:设σ是数域P 上的n 维线性空间V 的线性变换;1取定V 的一组基12,,,n ααα,求出σ在该基下的矩阵A ;2求()σλλ=-n f E A 在P 中的所有根12λλλm ,,,0≤≤m n ,重根按重数计算,且0=m 表示σ无特征值;3若0>m ,对()1λ=k t ,s 解齐次线性方程组()0λ-=k n E A X ,得其一个基础解系12,,,,ηηηk k k k l =-k l n 秩()λ-k n E A ,则线性变换σ的属于特征值λk 的全部特征向量为()()121122,,,,,αααηηη+++k k n k k k k k l k l s s s ,其中12,,,,k k k k l s s s 为P 中不全为零的任意常数;3. 矩阵相似1定义:设A,B 是数域P 上的两个n 级方阵,如果存在数域P 上的n 级可逆矩阵T ,使得1-=T AT B ,就称矩阵A 相似于矩阵B ,记为A B ;2性质:1矩阵相似是等价关系,即:设A,B,C 都是n 级方阵,那么:①A A ; ② 若A B ,那么B A ;③ 若A B 且B C ,则A C ;2若AB ,那么()()λλλλ=-==-A n B n f E A f E B ,因此矩阵A 与矩阵B 有相同的特征值,相同的迹()()tr tr =A B ,相同的行列式=A B ;3两个实对称阵相似⇔它们有相同的特征值;3有限维线性空间上的线性变换在不同基底下的矩阵彼此相似;4若1-=T AT B ,那么1-+=∀∈kkB T A T ,k Z ;4. 线性变换与矩阵可对角化 1矩阵可对角化1设A 是n 级方阵,如果存在n 级可逆矩阵T ,使得1-T AT 为对角阵,则称A 可对角化;2n 级方阵A 可对角化⇔A 有n 个线性无关特征向量; 3如果n 级方阵A 有n 个不同的特征值,则A 可对角化; 4设12λλλk ,,,是n 级方阵A 的所有不同的特征值,()()()()1212λλλλλλλλ=-=---klll A n k f E A称()12=i l i ,,,k 为λi 的代数重数;称=-i s n 秩()()12λ-=i n E A i ,,,k 为λi 的几何重数;()12≤=i i s l i ,,,k ;n 级方阵A 可对角化⇔对12=i ,,,k 都有λi 的代数重数=λi 的几何重数;注:1. 设齐次线性方程组()0λ-=i n E A X 的解空间为i W ,则()dim =i i s W2. 称{}λααλα=∈=i ni V CA 为n 级方阵A 的属于特征值λi 的特征子空间,那么()dim λ=i i s V2线性变换可对角化1 设σ是数域P 上的n 维线性空间V 的线性变换,如果存在V 的一组基,使得σ 在该基下的矩阵为对角阵,就称σ可对角化;2数域P 上的n 维线性空间V 的线性变换σ可对角化⇔σ有n 个线性无关特征向量; 3设σ是数域P 上的n 维线性空间V 的线性变换,如果σ有n 个不同的特征值,则σ可对角化;4设σ是数域P 上的n 维线性空间V 的线性变换,σ在V 的一组基下的矩阵为A , 设12λλλk ,,,是n 级方阵A 的所有不同的特征值;① 若12λλλ∈k ,,,P ,那么:σ可对角化⇔对12=i ,,,k 都有λi 的代数重数=λi 的几何重数;② 若12λλλk ,,,不全在数域P 中,则σ不可对角化;注:λi 的几何重数 =()dim λi V ,其中(){}λασαλα=∈=i iV V 为σ的属于特征值λi 的特征子空间;四.线性变换的值域与核1.定义:设σ是数域P 上的线性空间V 的线性变换,将()(){}100V σασα-=∈=,(){}V V σσαα=∈分别称为线性变换σ的核与值域()10σ-与V σ也分别记为ker σ与Im σ;2.线性变换的秩与零度: V σ与()10σ-都是V 的子空间,将()dim V σ 与()()1dim 0σ-分别称为σ的秩和零度;3. 有限维线性空间的线性变换的值域与核设V 是数域P 上的n 维线性空间,σ是V 的线性变换,12,,,n ααα为V 的一组基,σ 在该基下的矩阵为A ,=r 秩()A ,1122n n a a a V αααα=+++∈;1()1210n a a a ασ-⎛⎫ ⎪ ⎪∈⇔ ⎪ ⎪⎝⎭是齐次线性方程组0=AX 的解;2若12,,,ηηη-n r 是0=AX 的一个基础解系,那么12,,,γγγ-n r 其中()()12,,,1,2,,γαααη==-k n k k n r 就是()10σ-的一组基,于是:()()1dim0n r σ-=-()(){}1121122120n r n r n r n r L ,,,k k k k ,k ,,k P σγγγγγγ-----==+++∈因此σ的秩和零度为n r -; 3()()()()12n V L,,,σσασασα=于是()()()12σασασαn ,,,的一个极大线性无关组就是V σ的一组基,而()()()12σασασαn ,,,的秩等于秩()A =r ,所以()dim V r σ=,即σ的秩为秩()A =r ; 4()()()1dim dim 0V n σσ-+=;3. 求法:设V 是数域P 上的n 维线性空间,σ是V 的线性变换; 1()10σ-的求法:① 取定V 的一组基12,,,n ααα,求出σ在该基下的矩阵A ;② 解齐次线性方程组0=AX ,得其一个基础解系12,,,ηηη-n r =r 秩()A ;③ 令()()12,,,1,2,,γαααη==-k n k k n r ,得()10σ-的一组基12,,,γγγ-n r ,()(){}1121122120n r n r n r n r L ,,,k k k k ,k ,,k P σγγγγγγ-----==+++∈2V σ的求法:① 取定V 的一组基12,,,n ααα,求出σ在该基下的矩阵A ;② 设矩阵A 的列向量组为12,,,n ηηη,求出12,,,n ηηη的一个极大线性无关组12,,,r i i i ηηη就得到()()()12σασασαn ,,,的一个极大线性无关组()()()12σασασαri i i ,,,,()()()12σασασαri i i ,,,就是V σ的一组基;()()()()12ri i i V L ,,,σσασασα=()()(){}112212σασασα=+++∈r r r i i i i i i i i i l l l l ,l ,,l P五.不变子空间1. 定义:设σ是数域P 上的线性空间V 的线性变换,W 是V 的子空间,如果对α∀∈W ,都有()σα∈W 即()σ⊆W W ,就称W 是σ的不变子空间,也称σ-子空间; 2. 设V 是数域P 上的线性空间,那么{}0与V 都是V 的任一线性变换的不变子空间; 3. 设σ是数域P 上的线性空间V 的线性变换,λ是σ的任意一个特征值,那么σ的特征子空间(){}λασαλα=∈=V V 都是σ的不变子空间;4. 线性变换的循环子空间:设σ是数域P 上的0n >维线性空间V 的线性变换,任取0V α≠∈,必存在正整数m ,使得()()1m ,,,ασασα-线性无关,而()()m ,,,ασασα线性相关,令()()()1m W L ,,,ασασα-=,则W 是σ的不变子空间,称W 为σ的循环子空间;5. 设V 是数域P 上的n 维线性空间,σ是V 的线性变换,W 是σ的不变子空间,()0<dim =<W m n ,取W 的一组基12,,,αααm ,将其扩充为V 的一组基121,,,,,,ααααα+m m n ,那么σ在该基下的矩阵为1230⎛⎫⎪⎝⎭A A A ,其中1A 为σW在W 的基12,,,αααm 下的矩阵;六.若尔当 Jordan 标准形1.若尔当块与若尔当形矩阵: 1若尔当块:形式为()0000100000100001t tJ ,t λλλλλ⨯⎛⎫⎪ ⎪⎪=⎪⎪ ⎪⎝⎭ 的矩阵称为若尔当块,其中λ为复数;2若尔当形矩阵:由若干个若尔当块组成的准对角阵称为若尔当形矩阵,其一般形状如:12s A A A ⎛⎫ ⎪ ⎪ ⎪ ⎪⎝⎭其中:111i ii ii ii k k A λλλλ⨯⎛⎫ ⎪ ⎪⎪= ⎪ ⎪ ⎪⎝⎭,且12s ,,,λλλ中有些可以相等;2. 复数域上有限维线性空间上的线性变换与复方阵1设σ是复数域C 上的0n >维线性空间V 的任意一个线性变换,那么必存在V 的一组基,使得σ在该基下的矩阵为若尔当形矩阵;2每个n 级复矩阵都与一个若尔当形矩阵形矩阵相似;3. 设σ是复数域上的0n >维线性空间V 的线性变换,那么σ幂零⇔σ的特征值都为零;。
线性变换知识点总结一、引言线性变换是线性代数中的重要概念,它是在向量空间中的一种特殊映射。
线性变换具有许多重要的性质和应用,因此研究线性变换对于理解线性代数和应用数学有着重要的意义。
本文将从线性变换的基本概念、性质和应用进行总结,希望能够帮助读者对线性变换有更深入的理解。
二、线性变换的定义线性变换是向量空间之间的一种映射,具体来说,设V和W是两个向量空间,f:V→W是从V到W的映射。
如果对于V中的任意向量u、v和任意标量a,b,都有f(au+bv)=af(u)+bf(v)那么f称为一个线性变换。
三、线性变换的矩阵表示线性变换可以用矩阵来表示,假设V和W是n维向量空间,我们选择V和W的基,那么可以得到V和W中的向量可以用n维列向量表示。
设f:V→W是一个线性变换,选择V和W的基分别为{v1,v2,...,vn}和{w1,w2,...,wn},那么f的矩阵表示为[f]=(f(v1) f(v2) ... f(vn))其中f(vi)表示w中的基向量wi在f映射下的像,也就是f(vi)对应的列向量。
根据线性变换的定义,我们可以得到映射f的矩阵表示满足下列关系f(av1+bv2)=af(v1)+bf(v2)等价于[f](av1+bv2)=a[f]v1+b[f]v2其中[f]v1和[f]v2为f(v1)和f(v2)的列向量表示。
四、线性变换的性质1. 线性变换的保直性线性变换f:V→W将V中的任意向量线性映射到W中,这种映射保持向量之间的直线性质,即通过f映射后的图像仍然是一条直线。
这是线性变换的一个重要性质,它保证了线性变换后的图像具有一些有用的性质,比如直线上的点在f映射后仍然在同一条直线上。
2. 线性变换的局部性线性变换f:V→W保持向量之间的“相对位置”不变,即如果向量v1和v2之间的相对位置关系在V中是一定的,那么在映射f下,向量f(v1)和f(v2)之间的相对位置关系也是一定的。
这一性质对于理解线性变换的几何意义有着重要的作用,它意味着线性变换可以保持向量之间的某些几何性质。
线性变换及其运算概述:线性变换是数学中重要的概念之一。
它是指将一个向量空间中的元素映射为另一个向量空间中的元素,同时保持线性关系的变换。
线性变换可以用矩阵来表示,并且有着丰富的运算规则。
定义:在向量空间V和W之间,如果存在一个映射T,对于任意的向量u和v以及任意的标量k,满足以下两个条件:1.T(u + v) = T(u) + T(v)2.T(ku) = kT(u)这样的映射T被称为线性变换。
线性变换保持向量的线性组合关系,即映射后的向量的线性组合等于原向量线性组合的映射。
线性变换可以将向量空间中的向量映射到另一个向量空间中。
属性:线性变换有许多重要的属性:1.线性变换保持零向量不变:T(0) = 02.线性变换保持向量的长度和角度:对于向量v和w,如果它们的夹角为θ,则经过线性变换后的向量T(v)和T(w)的夹角也为θ,且长度也相同。
3.线性变换保持向量的共线性:对于向量v和w,如果它们共线,则线性变换后的向量T(v)和T(w)依然共线。
4.线性变换在两个向量的和上的作用等于这个线性变换在每个向量上的作用之和:T(u + v) = T(u) + T(v)5.线性变换在一个向量上的作用乘以一个标量等于这个标量乘以这个线性变换在向量上的作用:T(ku) = kT(u)线性变换的运算:线性变换可以进行加法、数乘和复合运算,具体如下:1.加法运算:对于线性变换T1和T2,它们的加法运算是指将T1作用于一个向量v,然后将T2作用于T1作用后的向量T1(v)。
即 (T1 + T2)(v) = T2(T1(v)),其中v为向量。
2.数乘运算:对于线性变换T和标量k,它们的数乘运算是指将T作用于一个向量v,然后将k乘以T作用后的向量T(v)。
即(kT)(v) = k(T(v)),其中v为向量。
3.复合运算:对于线性变换T1和T2,它们的复合运算是指先将T2作用于向量v,然后再将T1作用于T2作用后的向量T2(v)。
第四章 线性变换在第三章中,我们介绍了同构的概念,它研究的是线性空间与线性空间之间的一种联系. 我们研究客观事物,固然要弄清楚个体事物单个的和总体的性质,但单个事物之间的各种各样的联系则更为重要. 基于此,本章将要研究线性空间本身的向量之间的一种最为基本、最为重要的联系——线性变换. 它是线性空间到它自身的映射是几何中旋转变换、投影变换以及别的科目中类似变换的一种推广. 其应用十分广泛,是线性代数的一个主要研究对象.在本章中,如果不特别声明,我们考虑的都是某个数域P 上的线性空间.§4.1 线性变换及其运算一个集合到它自身的映射,称为这个集合的一个变换. 线性变换就是线性空间到它自身的一种特殊变换. 我们给出它的定义.1. 线性变换的概念定义4.1.1 设A 是线性空间V 的一个变换,如果A 对于V 中任意的向量,αβ及数域P 中的任意数k ,满足:()()()+=+A A A αβαβ;()()k k =A A αα.则称A 是线性空间V 的一个线性变换. 以后我们一般用花体大写字母,,,A B C 来表示线性变换,用()A α或A α来表示向量α在线性变换A 下的象.说明 变换仅反映元素之间的一种单纯的对应关系,而线性变换则涉及到了线性空间中向量的运算. 从定义可以看出,线性变换保持向量的加法与数乘.例4.1.2 设V 是数域P 上的上的线性空间,λ是P 中的某个数,定义变换如下:(),()V λλ=∀∈A ααα.则容易看出,λA 是线性空间V 的一个线性变换.说明1)上例中的线性变换λA 称为由数λ决定的数乘变换.2)当1λ=时,就是V 的恒等变换或单位变换,记为E . 即E 将V 中的每个向量变为它自身.3)当0λ=时,0A 就是V 的零变换,记为0. 它把V 中的每个向量都变为0,即(),()V =∀∈00αα.例4.1.3 对于12(,,,)n n a a a P ∀=∈α,变换1211(,,,)(,,,)n n n a a a a a a -=A是n P 的一个线性变换.例4.1.4 令()()([,])xa f x f t dt x ab =∈⎰A ,则A 是线性空间[,]C a b 的一个线性变换.例 4.1.5 平面π上的向量构成了实数域上线性空间. 将π围绕着坐标原点逆时针方向旋转θ角度,就是一个线性变换,我们用θA 表示. 设平面π上的向量α在直角坐标系下的坐标是(,)x y ,那么旋转θ角度后α的坐标按照下面的公式计算:cos sin ()sin cos x x y y θθθθθ'-⎛⎫⎛⎫⎛⎫== ⎪ ⎪⎪'⎝⎭⎝⎭⎝⎭A α. 例 4.1.6 设α是几何空间中某个固定的非零向量,将每个向量η变到它在α上的内射影的变换是一个线性变换,以N α来表示它,即(,)()(,)=N ααηηαα. 其中(,),(,)αηαα表示内积. 例4.1.7 设线性空间3P ,则显然222123123(,,)(,,)a a a a a a =A是3P 的一个变换,但如果取(1,0,0),(2,0,0)==αβ,则()(3,0,0)(9,0,0)+==A A αβ,而()()(1,0,0)(4,0,0)(5,0,0)+=+=A A αβ,则()()()+≠+A A A αβαβ. 所以,A 不是线性变换.2. 线性变换的性质线性变换具有如下的性质:性质1 ();()(),()V =-=-∀∈00A A A ααα.事实上,()(0)0();===0000A A A又()()(())()+-=+-==00A A A A αααα,所以()()-=-A A αα. 性质2 线性变换保持线性组合与线性关系式不变. 也就是说, 如果β是12,,,m ααα的一个线性组合:1122m m k k k =+++βααα,则经过线性变换A 之后,()A β是12(),(),,()m A A A ααα同样的线性组合: 1122()()()()m m k k k =+++A A A A βααα.如果12,,,m ααα之间有线性关系式:1122m m k k k +++=0ααα,则它们的象12(),(),,()m A A A ααα之间也有同样的关系:1122()()()m m k k k +++=0A A A ααα.性质3线性变换把线性相关的向量组变成线性相关的向量组. 也就是说,如果12,,,m ααα线性相关,则12(),(),,()m A A A ααα也线性相关.事实上,若12,,,m ααα线性相关,则在数域P 中存在一组不全为零的数12,,,m k k k 使得1122m m k k k +++=0ααα.则由性质2与性质3得11221122()()()()()m m m m k k k k k k +++=+++==00A A A A A αααααα.从而12(),(),,()m A A A ααα也线性相关.说明 当12(),(),,()m A A A ααα线性相关时,12,,,m ααα未必是线性相关的;当12,,,m ααα线性无关时,12(),(),,()m A A A ααα未必是线性无关的. 如零变换.3. 线性变换的运算线性变换作为映射的一种特殊情形,它当然可以定义乘法、加法及数量乘法.下面我们来介绍线性变换的运算及其简单性质.定义 4.1.8 设12,A A 及A 都是数域P 上线性空间V 上的线性变换,V ∀∈α及k P ∀∈,现在定义:1)线性变换的加法:1212()()()+=+A A A A ααα; 2)线性变换的乘法:1212()()=A A A A αα; 3)数与线性变换的数量乘法:()()k k =A A αα.定理4.1.9 定义4.1.8中的线性变换的和12+A A 、乘积12A A 及数与线性变换的乘积k A 都还是线性变换.证明 仅证明12+A A 是线性变换,其余的类似证明.对于V 中任意的向量,αβ及数域P 上的任意数λ,由于12,A A 都是线性变换,则结合线性变换的和的定义有12121122()()()()()()()()++=+++=+++A A A A A A A A αβαβαβαβαβ 12121212(()())(()())()()()()=+++=+++A A A A A A A A ααββαβ; 1212121212()()()()()()k k k k k k k +=+=+=+=+A A A A A A A A A A αααααααα. 因此,12+A A 是线性空间V 上的线性变换. 证毕.由线性变换的加法及乘积的定义易知下述性质. 性质4 线性变换的加法满足1)结合律:123123()()++=++A A A A A A ; 2)交换律:1221+=+A A A A .说明 1)零变换0与任何线性变换A 的和仍是A ,即+=A 0A . 2)对每个线性变换A ,我们可以定义它的负变换-A :()().V -=-∀∈A A ααα容易看出-A 也是线性的,且()+-=A A 0.性质5 线性变换的乘法满足 1)结合律:123123()()=A A A A A A ;2)对加法的左右分配律:12312113()+=+A A A A A A A ;1231323()+=+A A A A A A A . 说明 线性变换的乘法一般是不满足交换律的. 如在实数域R 上的线性空间[]x R ,定义线性变换0(())(),(())().xf x f x f x f t dt '==⎰D J则乘积D J 是恒等变换,但一般J D 却不是恒等变换.性质6 数与线性变换的数量乘法满足下面的规律:()()kl k l =A A ; ()k l k l +=+A A A ;1212()k k k +=+A A A A ;1=A A .注 线性变换所满足的全部运算规则,同矩阵所满足的运算规则完全一致. 如果用()V M 表示由数域P 上的线性空间V 的全体线性变换构成的集合,则()V M 构成数域P 上的一个线性空间.定义 4.1.10 设A 是数域P 上线性空间V 上的一个线性变换,如果存在V 上的一个变换,记之为1-A,使得11--==A AAA E ,则称1-A为A 的逆变换,且称A 是可逆的.说明 一个线性变换未必有逆变换,如零变换就没有逆变换.定理4.1.12 设A 是数域P 上线性空间V 上的一个线性变换,如果A 是可逆的,则其逆变换1-A也是V 上的线性变换.证明 任取,V ∈αβ及k P ∈,则1111()[()()]----+=+AAA AA Aαβαβ111111()()()()------=+=+AA A AA A A Aαβαβ.11111()[()()][((())]k k k -----==AA A AA A Aααα11111[((())]()[(()]()k k k -----===AA AAA AAααα.故1-A是V 上的线性变换.4. 线性变换的多项式的概念由于线性变换的乘法满足结合律,当若干个线性变换A 相乘时,其最终结果是确定的,与乘积的结合方式无关. 所以我们可以用nn=AA AA .来表示n (n 是正整数)个线性变换A 的乘积,称nA 为A 的n 次幂. 并规定=AE .由此可以推出指数法则: ,()()m nm n m nmn+==AA A AA,(,m n 是正整数). (1.1) 当线性变换A 可逆时,也可以定义A 的负整数幂为1()nn--=A A(n 是正整数). 说明 1)在有了负整数幂概念后,(1.1)中的,m n 就可以取任意的整数了. 2)线性变换乘积的指数法则不成立,一般来说1212()n n n ≠A A A A .设1110()m m m m f x a x a x a x a --=++++是[]P x 上的一个多项式. A 是线性空间V 上的一个线性变换,定义1110()mm m m f a a a a --=++++A AAA E .容易看出,()f A 也是V 上的一个线性变换,称它为线性变换A 的多项式.§4.2 线性变换的矩阵考虑线性方程组=Ax β,其中A 是n 阶方阵,β是常数项向量组. 我们可以这样认为:把矩阵A 当作一种“对象”,它通过乘法“作用”于向量x ,产生的新的向量为Ax .例如,方程31315201134216-⎛⎫⎛⎫⎛⎫ ⎪⎪ ⎪= ⎪⎪ ⎪ ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭↑↑↑A x β0 与31310201304220-⎛⎫⎛⎫⎛⎫ ⎪⎪ ⎪-= ⎪⎪ ⎪ ⎪⎪ ⎪-⎝⎭⎝⎭⎝⎭↑↑↑A u 00通过矩阵A 通过乘法“作用”将x 变成了β. 而将u 变成了0. 于是,解方程A =x β,就要求出n P 中所有经过A “作用”后变为β的向量x . 而线性变换也就是在线性空间内部“作用”,将其中的一个向量变为其中的某个向量. 如此看来,线性变换与矩阵之间会有着千丝万缕的联系. 本节我们将要讨论线性变换与矩阵的关系,且利用矩阵来描述线性变换.1. 线性变换在基下的矩阵设A 是数域P 上线性空间V 的一个线性变换,12,,,n εεε是V 的一组基.则V 的任一向量η都可以用12,,,n εεε来线性表示,即数域P 中存在唯一的一组数12,,,n x x x 使得1122n n x x x =+++ηεεε.由于线性变换A 保持线性关系不变,则1122()()n n x x x =+++A A ηεεε1122()()()n n x x x =+++A A A εεε.(2.1) 也就是说,η的象()A η与基的象12(),(),,()n A A A εεε之间有着相同的关系.所以,只要知道基的象12(),(),,()n A A A εεε,那么线性空间V 中任一向量η的象()A η也就知道了.命题4.2.1 设1A ,2A 都是线性空间V 的线性变换,12,,,n εεε是V 的一组基,如果1A 与2A 在这组基上的作用相同,即12()(),1,2,,i i i n ==A A εε. (2.2)则12=A A .(分析)1A 与2A 相等的意义是它们对V 中的每个向量的作用相同,所以,我们就只要证明对任一向量η,都有12()()=A A ηη即可. 证明 V 中的任一向量η都可以由12,,,n εεε线性表示,即存在一组数12,,,n x x x 使得1122n n x x x =+++ηεεε.则由假设有111121121()()()()n n x x x =+++A A A A ηεεε12122222()()()()n n x x x =+++=A A A A εεεη. 证毕. 说明 命题4.2.1表明了,一个线性变换在V 上的作用,完全由它在任一组基上的作用所决定.命题4.2.2 设12,,,n εεε是数域P 上的线性空间V 的一组基,又12,,,n ααα是V 的任意的n 个向量,则存在唯一的线性变换A 使得(),1,2,,i i i n ==A εα. (2.3)(分析)只要找出这样的线性变换即可. 证明 设β是V 任一向量,且1122n n x x x =+++βεεε.现在定义V 的变换1122()n n x x x =+++A βααα. 我们先来说明A 满足(2.3).因为11100100i i i i n -+=++++++εεεεεε,1,2,,i n =. 所以111()00100i i i i n i -+=++++++=A εαααααα,1,2,,i n =.我们还需要证明A 是线性的.设,ηγ是V 中任意两个向量,k 是P 中任一数,并设1122n n b b b =+++ηεεε,1122n n c c c =+++γεεε.则111222()()()n n n b c b c b c +=++++++ηγεεε;1122n n k kb kb kb =+++ηεεε.按照A 的定义有111222()()()()n n n b c b c b c +=++++++A ηγααα11221122()()()()n n n n b b b c c c =+++++++=+A A ααααααηγ; 11221122()()()n n n n k kb kb kb k b b b k =+++=+++=A A ηααααααη.所以A 是V 上的线性变换.唯一性可由命题4.2.1直接得到. 证毕.下面,我们就来讨论线性变换与矩阵的联系.设12,,,r ααα是数域P 上的线性空间V 的一组向量,A 是V 上的一个线性变换,我们约定1212(,,,)(,,,)r r =A A A A αααααα.定义4.2.3 设12,,,n εεε是数域P 上的线性空间V 的一组基,A 是V 上的一个线性变换,且11112121212122221122,,.n n n nn n n nn n a a a a a a a a a =+++⎧⎪=+++⎪⎨⎪⎪=+++⎩A A A εεεεεεεεεεεε 用矩阵形式表示,即121212(,,,)(,,,)(,,,)n n n ==A A A A A εεεεεεεεε,其中111212122212n n n n nn a a a a a a aa a ⎛⎫⎪⎪= ⎪ ⎪ ⎪⎝⎭A . 矩阵A 称为A 在基12,,,n εεε下的矩阵.例4.2.4 求[]n P x 的线性变换()()f x f x '=D 在基11,,,n x x -下的矩阵.解 因为21210,1,2,,(1),n n x x x x n x --====-D D D D所以D 在基11,,,n x x -下的矩阵为0100002000010000n ⎛⎫ ⎪ ⎪⎪= ⎪- ⎪ ⎪⎝⎭A . 例4.2.5 设W 是()n n m >维线性空间V 的子空间,12,,,m εεε是W 的一组基,把它扩充为V 的一组基12,,,n εεε. 定义线性变换A 如下:,1,2,,,,1,,.i i i i m i m n ==⎧⎨==+⎩0A A εεε 如此定义的线性变换A 称为对子空间W 的投影. 投影A 在基12,,,n εεε下的矩阵为11100m ⎛⎫ ⎪ ⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪⎝⎭个1.说明 在取定一组基之后,我们就建立了由数域P 上的n 维线性空间V 的线性变换到数域P 上的n n ⨯矩阵的一个映射ϕ.定理4.2.6 设V 是数域P 上的n 维线性空间. 则映射:ϕ→A A是数域P 上的线性空间()V M 到n n P ⨯的一个一一映射,其中A 是线性变换在基12,,,n εεε下的矩阵.(分析)需要证明ϕ是双射,即既是单射,又是满射. 证明 ϕ显然是()V M 到n n P ⨯的映射. 设11()ϕ=A A ,22()ϕ=A A . 则112121(,,,)(,,,)n n =A A εεεεεε, 212122(,,,)(,,,)n n =A A εεεεεε.如果12=A A ,则显然有12()(),1,2,,i i i n ==A A εε. 则由命题4.2.1知道,ϕ是单射.又对于n n P ⨯中的任一矩阵A ,令1212(,,,)(,,,)n n =A βββεεε.则由命题4.2.2知道,存在线性变换A 使得(),1,2,,i i i n ==A εβ,即有线性变换A 使得1212(,,,)(,,,)n n =A A εεεεεε.所以ϕ又是满射. 故ϕ是一一映射.这个一一映射的重要性在于它保持运算. 也就是下面的定理.定理4.2.7 设1A ,2A 是数域P 上n 维线性空间V 的任意两个线性变换,1A ,2A 在基12,,,n εεε下的矩阵分别是A 与B . 则在基12,,,n εεε下1)12+A A 的矩阵为+A B ; 2)12A A 的矩阵为AB ; 3)k A 的矩阵为k A . 证明 由于1A ,2A 在基12,,,n εεε下的矩阵分别是A 与B ,则有11212(,,,)(,,,)n n =A A εεεεεε, 21212(,,,)(,,,)n n =B A εεεεεε.1)1212()(,,,)n +A A εεε112212(,,,)(,,,)n n =+A A εεεεεε1212(,,,)(,,,)n n =+A B εεεεεε12(,,,)().n =+A B εεε所以在基12,,,n εεε下,线性变换12+A A 的矩阵为+A B . 2)1212()(,,,)n A A εεε121211211212[(,,,)][(,,,)][(,,,)](,,,).n n n n ====B BAB A A A A εεεεεεεεεεεε因此,在基12,,,n εεε下,线性变换12A A 的矩阵为AB . 3)112()(,,,)n k A εεε1121212[(,,,)][(,,,)](,,,)().n n n k k k ===A A A εεεεεεεεε 因此,在基12,,,n εεε下,线性变换k A 的矩阵为k A . 证毕.说明 结合定理4.2.7可以看出,在定理4.2.6中,V 的全体线性变换所构成的线性空间()V M 与n n P ⨯之间的映射,不仅是一一映射,而且还是同构映射. 即()V M 与n n P ⨯同构.推论4.2.8设A 是数域P 上n 维线性空间V 的一个线性变换. 则A 有逆变换的充分必要条件是A 在任意基下的矩阵都是可逆矩阵.且当A 在某组基下的矩阵为A 时,则1-A在这组基下的矩阵为1-A .证明 设A 有逆变换1-A,12,,,n εεε是V 任一组基,A 与1-A在基12,,,nεεε下的矩阵分别是A 与B ,即1212(,,,)(,,,)n n =A A εεεεεε,11212(,,,)(,,,)n n -=B Aεεεεεε.由定理4.2.7的2)有11212(,,,)(,,,)n n -=AB A Aεεεεεε,则有1212(,,,)(,,,)n n =AB E εεεεεε.而1212(,,,)(,,,)n n =E E εεεεεε,故=AB E .类似地有=BA E ,即有==AB BA E .所以1-=B A .故A 在任意基下的矩阵都是可逆矩阵,而且1-A在12,,,n εεε下的矩阵为1-A .反过来,如果A 在基12,,,n εεε下的矩阵是可逆阵A ,设1-A 是A 的逆矩阵. 则由定理4.2.6,必存在V 的一个唯一的线性变换B 使得11212(,,,)(,,,)n n -=A B εεεεεε.则1121212(,,,)(,,,)(,,,)n n n -==AA E A B εεεεεεεεε, 1121212(,,,)(,,,)(,,,)n n n -==A A E B A εεεεεεεεε.所以==AB B A E . 故A 有逆变换. 证毕.利用线性变换的矩阵,可以直接计算一个向量的象. 我们有下面的定理. 定理4.2.9 设A 是n 维线性空间V 的一个线性变换,A 在基12,,,n εεε下的矩阵是A ,向量α在基12,,,n εεε下坐标为12(,,,)n x x x . 则()A α在基12,,,n εεε下的坐标12(,,,)n y y y 可以按如下的公式计算:1122n n y x y x y x ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭A . (分析)实际上就是要求我们求出()A α在基12,,,n εεε下的坐标.证明 由于1212(,,,)n n x x x ⎛⎫⎪ ⎪= ⎪ ⎪⎝⎭αεεε, 所以11221212()(,,,)(,,,)n n n n x x x x x x ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭A A A A A αεεεεεε. 又1212()(,,,)n n y yy ⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭A αεεε,而12,,,n εεε是V 的一组基,所以1122n n y x y x y x ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭A . 证毕.说明 定理4.2.9说明了,()A α在某组基下的坐标完全由A 在这组基下的矩阵所决定. 这也就是说,对于某组基,如果给定了线性变换在这组基下的矩阵,也就等于给出了这个线性变换.2. 相似矩阵线性变换的矩阵与线性空间的基是密切联系的,一般来说,随着基的改变,同一线性变换的矩阵也会随之而改变. 读者肯定会要问:线性变换的矩阵是如何随着基的改变而改变的呢?亦即改变后的矩阵之间有什么联系呢?下面的定理指明同一线性变换在不同的基下的矩阵之间的联系.定理 4.2.10 设A 是线性空间V 的线性变换,12,,,n εεε与12,,,n ηηη是线性空间V 的两组基,A 在这两组基下的矩阵分别为,A B ,从基12,,,n εεε到12,,,n ηηη的过渡矩阵为C ,则1-=B C AC .证明 因为1212(,,,)(,,,)n n =A A εεεεεε, 1212(,,,)(,,,)n n =B A ηηηηηη,1212(,,,)(,,,)n n =C ηηηεεε,所以1212(,,,)(,,,)n n =B A ηηηηηη,1212121211212(,,,)[(,,,)][(,,,)][(,,,)](,,,)(,,,)n n n n n n -=====A A A ηηηεεεεεεεεεεεεηηηC C A C AC C AC故有1-=B C AC .定义4.2.11 设,A B 是数域P 上的两个n 阶矩阵,如果存在P 上的n 阶可逆矩阵C ,使得1-=C AC B ,则称A 与B 相似,记作A B .定理4.2.12 数域P 上的相似关系是一个等价关系.(分析)需要说明相似关系满足:反身性、对称性及传递性. 证明 设有n 阶矩阵,,A B D .1)因为=AE EA ,则1-=E AE A ,即A A ;2)如果AB ,则存在可逆阵C 使得1-=C AC B ,所以有111()---=C BC A .故BA ;3)如果AB ,BD ,则分别存在可逆阵12,C C 使得111122,--==C AC B C BC D ,所以11121121212()()()---==D C C AC C C C A C C . 故AD . 证毕.定理4.2.13 如果两个矩阵相似,则它们可以看作是同一个线性变换在某两组基下的矩阵.证明 设有n 阶矩阵A 与B 相似. 则n 阶可逆矩阵C 使得1-=C AC B . 又由定理4.2.6,A 可以看作是n 维线性空间V 的一个线性变换A 在某组基12,,,n εεε下的矩阵.则1212(,,,)(,,,)n n =A A εεεεεε.令1212(,,,)(,,,)n n =C ηηηεεε,显然,12,,,n ηηη也是V 的一组基,而又1212121212112(,,,)[(,,,)][(,,,)][(,,,)](,,,)(,,,).n n n n n n -=====C CA C ACC AC A A A ηηηεεεεεεεεεεεεηηη即1212(,,,)(,,,).n n =B A ηηηηηη 证毕.例 4.2.14 设n 阶矩阵A 与B 相似,()f x 为任一多项式. 证明:()f A 与()f B 相似.(分析)需要找出一个可逆阵C 使得1()()f f -=B C A C . 证明 因为A 与B 相似,则存在可逆阵C ,使得1-=C AC B .现在设1110()n n n n f x a x a x a x a --=++++.则1110()n n n n f a a a a --=++++B B B B E11111110[][][][]n n n n a a a a ------=++++C AC C AC C AC C C 11111110[][][][]n n n n a a a a ------=++++C A C C A C C AC C C 11111110()()()()n n n n a a a a ------=++++C A C C A C C A C C E C11110()n n n n a a a a ---=++++C A A A E C1()f -=C A C故()f A 与()f B 相似.§4.3 线性变换的值域与核1. 线性变换的值域与核的概念定义4.3.1 设A 是线性空间V 的一个线性变换,则称集合{}()V ∀∈A αα为A 的值域,记作()V A (或Im A );称集合{}()V ∀∈=0且A ξξξ为A 的核,记作1()-0A(或Ker A ). 即{}()()V V =∀∈A A αα;{}1()()V -∀∈=0=0且A A ξξξ.设,αβ是数域P 上的n 维线性空间V 的任意两个向量,k 是P 中任一常数. 显然()V A 与1()-0A是非空的,即它们都是V 的非空子集. 又由于(),()()k k +=+=A A A A A αβαβαα,即()V A 对加法与数乘是封闭的,所以()V A 是V 的一个子空间. 如果,==00A A αβ,则(),()()k k +=+===00A A A A A αβαβαα.所以1()-0A 也是V 的子空间. 故我们有下面的命题.命题4.3.2 V 的线性变换A 的值域()V A 与核1()-0A都是V 的子空间.定义 4.3.3 将V 的线性变换A 的值域()V A 的维数称为线性变换A 的秩;1()-0A的维数称为线性变换A 的零度.例4.3.4 线性空间V 的零变换0的值域是{}0,而核就是V .例4.3.5线性空间[]n P x 的线性变换()()f x f x '=D ,则D 的值域就是1[]n P x -,D 的核就是P .V 的线性变换的值域()V A 是由全体象的集合而构成的. 这自然使我们联想到基象组12,,,n A A A εεε(12,,,n εεε是V 的一组基),它与值域()V A 之间有哪些联系呢?定理4.3.6 设A 是n 维线性空间V 的线性变换,12,,,n εεε是V 的一组基,在这组基下的矩阵是A ,则1)A 的值域()V A 是由基的象12,,,n A A A εεε所生成的子空间,即12()(,,,)n V L =A A A A εεε.2)A 的秩等于A 的秩.证明 1)设α是线性空间V 的任一向量,它在基12,,,n εεε下的坐标为坐标为12(,,,)n x x x ,即1122n n x x x =+++αεεε.于是11221122()n n n n x x x x x x =+++=+++A A A A A αεεεεεε. 所以12(,,,)n L ∈A A A A αεεε,因而12()(,,,)n V L ⊂A A A A εεε. 再设12(,,,)n L A A A εεε中任一向量η,则存在一组数12,,,n k k k 使得11221122()n n n n k k k k k k =+++=+++A A A A ηεεεεεε这表明了V ⊂A η,所以12(,,,)n L V ⊂A A A A εεε.故12()(,,,)n V L =A A A A εεε.2)因为A 的秩等于dim ()V A ,由1)则有A 的秩等于12(,,,)n rank A A A εεε.又矩阵A 是由基象组的坐标按列而排成的. 而在n 维线性空间V 中取定一组基之后,把V 中的每一向量与它的坐标对应起来,我们就得到了V 到n P 的一个同构映射. 同构映射保持向量组的一切线性关系,因此基象组与它们的坐标组(即矩阵的列向量组)有相同的秩. 证毕.说明 上述定理表明了线性变换与矩阵的对应关系保持秩不变.定理4.3.7设A 是n 维线性空间V 的线性变换,则A 的秩+A 的零度n =.即1dim ()dim ()dim V V -+=0A A.证明 设A 的零度为r . 在核1()-0A中取一组基12,,,r εεε,现在将它扩充为V 的一组基121,,,,,,r r n +εεεεε. 又11()(,,,,,)r r n V L +=A A A A A εεεε,而12,,,r A A A εεε全是零向量,所以1()(,,)r n V L +=A A A εε.下面证明1,,r n +A A εε是()V A 的一组基. 显然()V A 中任一向量均可由1,,r n +A A εε线性表示,只需要证明1,,r n +A A εε线性无关即可. 设11r r n n λλ++++=0A A εε,则有11()r r n n λλ++++=0A εε,所以111()r r n n λλ-++++∈0Aεε,因此,11r r n n λλ++++εε可以用1()-0A 的基12,,,r εεε线性表示,设为111122r r n n r r λλλλλ++++=+++εεεεε. 而121,,,,,,r r n +εεεεε线性无关,所以0(1,2,,)i i n λ==.故1,,r n +A A εε线性无关. 因而A 的秩等于n r -,所以A 的秩+A 的零度n =. 证毕.说明 虽然()V A 与1()-0A的维数和是n ,但1()()V -+0A A 未必就是整个线性空间V . 如例4.3.5.推论4.3.7 设A 是有限维线性空间V 的一个线性变换,则A 是单射⇔A 是满射. 证明 设A 是单射,则1(){}-=00A ,而又1dim ()dim ()dim V V -+=0A A. 所以dim ()dim V V =A .则()V V =A ,所以A 是满射,从而为双射.反过来,设A 是满射,仍由1dim ()dim ()dim V V -+=0A A有1(){}-=00A,即A 是单射,从而是双射.注 这是有限维线性空间的线性变换的一个特性. 对于无限维线性空间并不成立.例4.3.8 设A 是一个n n ⨯矩阵,2=A A . 证明:A 相似于对角阵B . 其中11100⎛⎫ ⎪ ⎪ ⎪ ⎪=⎪ ⎪ ⎪ ⎪ ⎪⎝⎭B . (分析)要证明AB ,只要证明A 与B 是同一线性变换在某两组基下的矩阵即可.证明 设有n 维线性空间V ,12,,,n εεε是V 的一组基. 定义线性变换A 为:1212(,,,)(,,,)n n =A A εεεεεε.下面我们来证明A 在某组基下的矩阵就是B .因为2=A A ,所以2=AA . 对任意的()V ∈A α,则必存在V ∈β,使得()=A αβ.则2()====A A A A A αβββα.所以1()(){}V -0=0A A.而又1dim dim ()V n -+0=A A,所以1()()V V -=⊕0A A.因而在()V A 取一组基12,,,r ηηη,在1()-0A中取一组基1,,r n +ηη,所以121,,,,,,r r n +ηηηηη就是V 的一组基. 显然1122,,,,r r ===A A A ηηηηηη1,,r n +==00A A ηη.故1212(,,,)(,,,)n n =B A ηηηηηη.由定理4.2.13,同一线性变换在不同的基下的矩阵是相似的. 即A 相似于对角阵B . 证毕.2. 线性变换的值域与核的求法现在我们总结一下线性变换的值域与核的求法.设V 是数域P 上的n 维线性空间V ,A 是V 的线性变换,常通过下面的两种方法来求()V A 及1()-0A:第一种 取V 的一组基12,,,n εεε,由于1()(,,)r n V L +=A A A εε,所以先求出基象组12,,,n A A A εεε,再求出12(,,,)n rank A A A εεε及其一个极大无关组,也就得到了()V A 的维数及它的基; 设1()-∈0Aη,根据()=0A η来求确定1()-0A的维数与基.第二种 求出A 在基12,,,n εεε下的矩阵A ,所以A 的秩就等于A 的秩,且由于()i A ε在基12,,,n εεε下的坐标就是A 的第i 个列向量,从定理4.3.6的证明可以看出,利用同构,A 的列向量组的极大无关组对应12,,,n A A A εεε的极大无关组,从而可以确定()V A 的基. 设1()-∈0Aη,则由()=0A η知,η在基12,,,n εεε下的坐标12(,,,)n x x x 就是齐次线性方程组=0Ax 的解向量,所以=0Ax 的基础解系就是1()-0A的基在12,,,n εεε下的坐标.例 4.3.9 设V 是全体次数不超过n 的实系数多项式,再添上零多项式构成实数域上的线性空间,定义V 的线性变换:[()]()()(())f x xf x f x f x V '=-∀∈A .1)求A 的核1()-0A及值域()V A ;2)证明:1()()V V -=⊕0A A .1)解 取V 的一组基21,,,,n x x x ,则22(1,,,,)(1,,,,)n n x x x x x x =A A .其中100000000010001n -⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪-⎝⎭A . 求解齐次线性方程组=0Ax 得到基础解系(0,1,0,,0)T =ε. 令22(1,,,,)(1,,,,)(0,1,0,,0)n n T x x x x x x x ===ηε.则1()()L x -=0A , 1dim ()1-=0A.又22323()(1,,,,)(1,0,,2,(1))(1,,,)n n nV L x xx L x x n x L x x x==--=A A A A A , 所以dim ()V n =A .2)证明 由1)有12323()()()(1,,,)(1,,,,)n n V L x L x x x L x x xx V -+=+==0A A .又1dim ()dim ()1dim V n V -+=+=0A A ,故1()()V V -=⊕0A A . 证毕.§4.4 不变子空间我们知道,同一个线性变换在不同基下的矩阵是相似的,而相似的矩阵也可以认为是同一个线性变换在不同基下的矩阵. 所以,我们可以选择适当的基,使得线性变换的矩阵尽可能的简单,这样通过简单的矩阵来把握所给的线性变换. 因此,我们引入不变子空间的概念.定义4.4.1设A 是数域P 上的n 维线性空间V 的线性变换,W 是V 的子空间. 如果对于W 中任一向量α,均有W ∈A α,则称W 是A 的不变子空间,简记为-A 子空间.如果A 是线性空间V 的线性变换,W 是A 的不变子空间,由于W 中的向量在A 下的象仍然在W 中,这就使得有可能不必在整个线性空间V 中来研究A ,而只需要在W 中来考虑A 即可. 这样A 便又诱导出W 的一个线性变换,这个线性变换称为A 在W 上的限制(或A 在W 中的诱导变换),记作|W A . 因此()()|W W =∀∈A A βββ.在不致发生混淆时,有时也将|W A 记为A .说明 A 与|W A 的异同:A 是V 的线性变换,V 中每个向量在A 下都有确定的象;|W A 是不变子空间W 上的线性变换,对于W ∀∈β,有()|W =A A ββ,但对于V 中不属于W 的向量ξ,()|W =A A ξξ是没有意义的.例4.4.2 对于V 的任何线性变换A ,平凡子空间{}0及V 都是A 的不变子空间. 例4.4.3 []P x 的子空间[]n P x 是关于线性变换()()f x f x '=D的一个不变子空间.例4.4.4 线性变换A 的值域()V A 与核1()-0A都是A 的不变子空间.证明 任取()V ∈A α,则当然有V ∈α,所以有()V ∈A A α,即()V A 对A 不变. 对于任意的1()-∈0Aξ,有1()-=∈00A Aξ,即核1()-0A也是A 的不变子空间.证毕.例4.4.5 任何一个子空间都是数乘变换的不变子空间.证明 设W 是线性空间V 的任一子空间,λA 是数乘变换,则对于W 中的任一向量α,都有λλ=A αα.而W 是V 的子空间,所以W λ∈α,即W λ∈A α. 所以W 是λA 的不变子空间. 证毕.例4.4.6 如果线性变换A 与B 可交换,则B 的核1()-0B 与值域()V B 都是A 的不变子空间. 证明 在B 的核1()-0B 中任取一个向量α,则()()()===00B A B A A αα,所以1()-∈0A Bα. 即1()-0B 是A 的不变子空间.在B 的值域()V B 中任取一个向量()B β,则(())(())()V =∈A B B A B ββ.因此,值域()V B 也是A 的不变子空间. 证毕.例4.4.7 已知123321(,,)(,,)a a a a a a =A 是3P 的一个线性变换. 则子空间1212{(,,0)|,}W x x x x =∈F就不是A 的不变子空间. 如(1,2,0)W ∈,但(1,2,0)(0,2,1)W =∉A .命题 4.4.8 A 的不变子空间的交与和还是A 的不变子空间.证明 设1W 与2W 都是A 的不变子空间,α是12W W 中的任一向量,则1()W ∈A α且2()W ∈A α.所以,12()W W ∈A α. 故12W W 是A 的不变子空间.设β是12W W +中任一向量,则存在1W 中的向量1β与2W 中的向量2β,使得12=+βββ.则1212()()()()=+=+A A A A βββββ.又1122(),()W W ∈∈A A ββ,所以12()W W ∈+A β. 故12W W +也是A 的不变子空间.证毕.2. 不变子空间与线性变换的矩阵化简 下面我们来看不变子空间的一个应用.定理 4.4.9 设A 是n 维线性空间V 的一个线性变换. 如果1W 与2W 都是A 的不变子空间,且12V W W =⊕,则可在V 中选择一组适当的基,使得A 在这组基下的矩阵具有如下形状:1200⎛⎫ ⎪⎝⎭A A . 证明 设12,,,r εεε是1W 的一组基. 由于12V W W =⊕,则可设1,,r n +εε是2W 的一组基,且121,,,,,,r r n +εεεεε是V 的一组基. 又1W 与2W 都是A 的不变子空间,则可设111111111,11,11,1(),(),(),().r r r r rr r r r r r n r n n r n r nn n a a a a a a a a +++++++=++⎧⎪⎪⎪=++⎪⎨=++⎪⎪⎪=++⎪⎩AA A Aεεεεεεεεεεεε所以,A 在基121,,,,,,r r n +εεεεε下的矩阵是1200⎛⎫ ⎪⎝⎭A A . 其中11111r r rr a a a a ⎛⎫⎪=⎪⎪⎝⎭A , 1,11,2,1r r r n n r nn a a a a ++++⎛⎫ ⎪= ⎪ ⎪⎝⎭A . 证毕.说明 定理4.4.9反过来也成立. 如果A 在基121,,,,,,r r n +εεεεε下的矩阵是1200⎛⎫ ⎪⎝⎭A A , 则由12,,,r εεε与1,,r n +εε所生成的子空间都是A 的不变子空间.(请读者自己给出证明)我们将上述定理4.4.9进行推广,其证明是与定理4.4.9类似的. 推论4.4.10 设A 是n 维线性空间V 的一个线性变换. 如果12,,,s W W W 都是A的不变子空间,且12s V W W W =⊕⊕⊕,则可在V 中选择一组适当的基,使得A 在这组基下的矩阵具有如下形状:12s ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭A A A . 说明 推论4.4.10反过来也是成立的. 即如果A 在基12,,,(1,2,,)ii i ini s =εεε下的矩阵是12s ⎛⎫ ⎪ ⎪ ⎪ ⎪⎝⎭A A A , 则由12,,,(1,2,,)ii i in i s =εεε所生成的子空间都是A 的不变子空间.由推论4.4.10立刻有:推论4.4.11设A 是n 维线性空间V 的一个线性变换. 如果12,,,n W W W 都是A的一维不变子空间,且12n V W W W =⊕⊕⊕,则可在V 中选择一组适当的基,使得A 在这组基下的矩阵是对角矩阵:12s a a a ⎛⎫ ⎪ ⎪ ⎪ ⎪⎝⎭.说明 定理4.4.9及上面的推论告诉我们两个事实:1)对于一个线性变换A ,如果V 可以分解成一些子空间的直和,则可以选择适当的基,使得A 在这组基下的矩阵是准对角矩阵.2)矩阵相似于准对角矩阵与线性空间分解为不变子空间的直和是相当的.习题A1. 判别下面的变换,哪些是线性变换,哪些不是:1)在线性空间V 中,()=+A ηηα,其中V ∈α是一固定的向量; 2)在线性空间V 中,()=A ηα,其中V ∈α是一固定的向量; 3)在线性空间[]n P x 中,()()f x f x '=A ;4)在线性空间3P 中,221231233(,,)(,,)x x x x x x x =+A ;123123(,,)(0,,0)x x x x x x =A ;123122331(,,)(,,)x x x x x x x x x =+++A ;123123(,,)(0,,0)x x x x x x =++A ;5)在n n P ⨯中,(),=X AXB A 其中,A B 是n n P ⨯中两个固定的矩阵. 2. 证明:21,1,1x x x +++是线性空间3[]P x 的一组基. 并求出线性变换()()f x f x '=A在这组基下的矩阵. 3. 在22P ⨯中定义线性变换1()a b X c d ⎛⎫= ⎪⎝⎭X A ;2()a b c d ⎛⎫=⎪⎝⎭X X A ;3()a b a b c d c d ⎛⎫⎛⎫=⎪ ⎪⎝⎭⎝⎭X X A . 分别求出1A ,2A ,3A 在基11122122,,,E E E E 下的矩阵.4. 设在数域P 上的三维线性空间V 上的线性变换A 在基123,,εεε下的矩阵为111213212223313233a a a a a a a a a ⎛⎫ ⎪= ⎪ ⎪⎝⎭A . 求1)A 在基321,,εεε下的矩阵;2)A 在基123,,k εεε下的矩阵,其中k P ∈,且0k ≠; 3)A 在基1223,,+εεεε下的矩阵.5.设,A B 是线性变换,如果=,-A B B A E 证明:1=,k kk k --A B B AAk 是大于1的正整数.6.设n 阶矩阵A 和B 相似,且A 可逆. 则AB 与BA 相似.7.设V 是数域P 上的二维线性空间,线性变换A 在基12,εε下的矩阵是2110⎛⎫⎪-⎝⎭. 12,ηη也是V 的一组基,且从基12,εε到12,ηη的过渡矩阵为1112-⎛⎫ ⎪-⎝⎭. 求A 在基12,ηη下的矩阵及21,10kk ⎛⎫⎪-⎝⎭为正整数. 8.证明:方阵12n a a a ⎛⎫⎪⎪ ⎪⎪⎝⎭与 12n i i i a a a ⎛⎫ ⎪⎪ ⎪ ⎪ ⎪⎝⎭相似,其中12,,,n i i i 是1,2,,n 的一个排列.9.如果A 和B 相似,C 和D 相似,证明⎛⎫ ⎪⎝⎭00A B 与⎛⎫ ⎪⎝⎭00C D 相似.10.设1234,,,εεεε是四维线性空间V 的一组基,线性变换A 在基1234,,,εεεε下的矩阵是1021121312552212⎛⎫⎪- ⎪⎪⎪--⎝⎭. 1)求A 在基11242234334342,3,,2=-+=--=+=ηεεεηεεεηεεηε下的矩阵; 2)求A 的值域与核;3)在A 的值域中选择一组基,把它扩充为V 的一组基,并求A 在这组基下的矩阵;4)在A 的核中选择一组基,把它扩充为V 的一组基,并求A 在这组基下的矩阵.11. 设W 是线性空间V 的一个子空间,A 是V 的一个线性变换. 证明:如果W 是A 的不变子空间,则可以选择适当的基,使得A 在这组基下的矩阵具有如下形状:⎛⎫ ⎪⎝⎭0A C B . 12.设A 是n 维线性空间V 的可逆的线性变换,W 是V 的子空间,且对于A 不变.证明:W 也是1-A 的不变子空间.习题B1. 设A 是数域P 上n 维线性空间V 上的线性变换,12,W W 是V 的两个子空间,且12V W W =⊕.证明:A 可逆的充分必要条件是12()()V W W =⊕A A .2. 设A 是n 维线性空间V 的一个线性变换,且1n -≠0A ,n=0A. 证明:在V 中存在一组基,使得A 在这组基下的矩阵是0000100001000010⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭. 3. 设A 是有限维线性空间V 的一个线性变换,W 是V 的一个子空间. 证明:1dim ()dim[()]dim W W W -+=0A A.4. 设,A B 是n 维线性空间V 线性变换. 证明:AB 的秩≥A 的秩+B 的秩n -.5. 设12,,,s A A A 是线性空间V 的s 个两两不同的线性变换,则在V 中必存在向量η,使得12(),(),,()s A A A ηηη也两两不同.6. 设,A B 是线性空间V 线性变换,且2=A A ,2=BB . 证明:1),A B 有相同的值域,⇔==A B B B A A ; 2),A B 有相同的核,⇔==A B A B A B . 7. 设A 是n 维线性空间V 线性变换. 证明:A 的秩=2A 的秩1()()V V -⇔=⊕0A A.8. 设A 是n 维线性空间V 线性变换,且2=A A . 证明:1)1(){()|}V -=-∈0AA ξξξ;2)若B 是V 线性变换,则1()-0A 与()V A 都是B 的不变子空间⇔=AB B A .。
2.3直接线性变换解法直接线性变换 (Direct Linear Transformation)解法是建立像点坐标仪坐标和相应物点物方空间坐标之间直接的线性关系的算法。
这里,坐标仪坐标是指坐标仪上坐标的直接读数,是指无需化算到以像主点为原点的坐标仪上的坐标读数。
直接线性变换解法,因无需内方位元素值和外方位元素的初始近似值,故特别适用于非量测相机所摄影像的摄影测量处理。
直接线性变换解法具有两个显著的特点:一是由像空间坐标直接变换到物空间坐标,因此不需要任何内、外方位元素的初值;二是直接使用原始的影像坐标作为观测值,因此可以进行有效的系统误差的补偿。
2.3.1直接线性变换解法的基本关系式直接线性变换解法于1971年提出,现将几何概念清晰且便于深入分析的一种方法介绍如下。
直接线性变换(DLT)解法,原则上也是从共线条件方程式演绎而来的。
按共线 条件方程式:()()()()()()()()()()()()S A S A S A S A S A S A S A S A S A S A S A S A Z Z c Y Y b X X a Z Z c Y Y b X X a f y y y Z Z c Y Y b X X a Z Z c Y Y b X X a fx x x -+-+--+-+--=∆+--+-+--+-+--=∆+-33322203331110 把非量测相机所摄像片安置在某坐标仪上,如图2.1所示,假设上式中的系统误差改正数(,x y ∆∆)暂时仅包含坐标轴不垂直性误差d β和比例尺不一误差ds 引起的线性误差改正数部分。
坐标仪坐标系c xy -是非直角坐标系,其两坐标轴之间的不垂直度为d β。
以像主点o 为原点有两个坐标系,分别是直角坐标系o xy -和非直角坐标系o xy -。
像主点o 在c xy -内的坐标为(00,x y )。
某像点'p 的坐标仪坐标为(,x y ),点'p 在非直角坐标系o xy -中的坐标为(21,'om om ),此坐标受d β和ds 的影响而包含线性误差。
§2 线性变换的运算 在这一节,我们来介绍线性变换的运算及其简单性质.首先,线性空间的线性变换作为映射的特殊情形当然可以定义乘法.设 A ,B 是线性空间V 的两个变换,定义它们的乘积AB 为()()(())AB A B αα= ()V α∈容易证明,线性变换的乘积也是线性变换 .事实上,()()()(())(()())AB A B A B B αβαβαβ+=+=+(())(())()())()())A B A B AB AB αβαβ=+=+()()()(())(())AB k A B k A kB ααα==(())()())kA B k AB αα==这说明AB 是线性的.既然一般映射的乘法适合结合律,线性变换的乘法当然也适合结合律,即()()AB C A BC =但线性变换的乘法一般是不可变的 . 例如 ,在实数域R 上的线性空间[]R x 中,线性变换(())()D f x f x '=(())()xa J f x f t dt =⎰ 的乘积,DJ E =但一般JD E ≠.对于乘法,单位变换 E 有特殊的地位 .对于任意线性变换 A 都有EA AE A ==其次,对于线性变换还可以定义 加法 .设 A ,B 是线性空间V 的两个线性变换,定义它们的和 A+B 为()()()()A B A B ααα+=+ ()V α∈容易证明,线性变换的和还是线性变换 . 事实上,()()()()()()A B A B αβαβαβ++=+++(()())(()())(()())(()())()()()()A AB B A B A B A B A B αβαβααββαβ=+++=+++=+++这就说明是线性变换.不难证明,线性变换的加法适合结合律与交换率,即A +(B +C )=(A +B )+ C ,A +B = B +A证明留给读者完成 .对于加法,零变换0有着特殊的地位,它与所有线性变换 A 的和仍等于 A :A + 0 = A .对于每个线性变换 A ,我们可以定义它的负变换()A -:()()()A A αα-=-容易看出,负变换()A -也是线性的,且0A A -+=线性变换的乘法对加法有左右分配律,即A (B +C )= AB + AC ,(B +C )A = BA + CA .事实上,(())()(()())A B C A B C αα+=+(()())(())(())()()()()()(),A B C A B A C AB AC AB AC ααααααα=+=+=+=+这就证明了右分配律。
第六章 线性变换线性变换的理论是19世纪后半期由凯莱和西尔维斯特建立起来的,它们运用线性变换定义了矩阵的乘法,处理了矩阵的相似合同等关系.变换是集合A 到自身的映射,线性变换是特殊的变换,是在变量的线性替换、坐标变换等基础上建立起来的数学工具之一,在向量空间中,线性变换与矩阵(方阵)有着紧密的联系,线性变换的化简直接转化为对矩阵的化简,因此,它是方阵化简的基本理论依据.从这一意义上来说,本章内容可看作对矩阵讨论的延续.本章重点是求特征值与特征向量.*6.1 线性变换及其运算定义 1 设V 是数域F 上的一个向量空间,σ是V 的一个变换.如果,F k ∈∀ V ∈∀βα,,有1));()()(βσασβασ+=+2)),()(ασασk k =那么称σ是V 的一个线性变换.定义1中的条件1),2)可表示为:,,,,V F l k ∈∀∈∀βα有)()()(βσασβασl k l k +=+.采用数学归纳法容易证明,若σ是V 的线性变换,),,2,1(,s i F k V i i =∈∈α,那么)()()()(22112211s s s s k k k k k k ασασασααασ+++=+++ .例1.设V 是数域F 上的向量空间,F k ∈为一固定的数. 令αασk =)( V ∈∀α,那么, σ是V 的一个线性变换.事实上,,,F b a ∈∀.,V ∈βα)()()()(βαβαβασk b k a b a k b a +=+=+).()(βσασb a +=例1 中的σ称为V 的位似变换.当0=k 时,称σ为零变换,记为θ.当1=k 时,称σ为V 的恒等变换(单位变换).记为ι例 2.)(F M n 表示数域F 上的所有n 阶矩阵作成的向量空间,)(F M A n ∈为一固定矩阵.).(F M X n ∈∀令,)(XA AX X -=σ那么,σ是)(F M n 的一个线性变换.事实上,).(,F M Y X n ∈∀ ,,F b a ∈A bY aX bY aX A bY aX )()()(+-+=+σ=bYA aXA bAV aAX --+).()()()(Y b X a YA AY b XA AX a σσ+=-+-=故σ是)(F M n 的一个线性变换.设)(V L 表示向量空间V 中所有线性变换作成的集,σ,)(V L ∈τ.规定ϕ ),()()(ξτξσξ+= V ∈∀ξ.称ϕ为σ与τ的和,记为τσ+.即有)()())((ξτξσξτσ+=+.τσ+仍是V 的线性变换(读者自行验证).同时线性变换的加法满足: )(,,V L ∈∀ρτσ, 1) σττσ+=+,2) )()(ρτσρτσ++=++, 3) σσθ=+,令)())((ασασ-=-,称σ-为σ的负变换.容易验证).(V L ∈-σ对于σ-,有 4) θσσ=-+)(.再规定)(V L 的一个“数量乘法”:设)(,V L F k ∈∈σ.令 :ϕ ).(|ασαk → V ∈∀α.称ϕ为k 与σ的数量乘积,记为σk .即)())((ασασk k =.)(V L k ∈σ.事实上,V F b a ∈∈βα,,,,))()(()())((βσασβασβασb a k b a k b a k +=+=+ =)()(βσασbk ak + =))(())((βσασk b k a +.对于数乘运算,容易得到如下算律: 5) τστσk k k +=+)(, 6) σσσl k l k +=+)(, 7) )()(σσl k kl =, 8) σσ=1,其中,)(,,,V L F l k ∈∈τσ.根据向量空间的定义,我们得到:)(V L 对于它的加法和数量乘法作成数域F 上的一个向量空间.现在设V 是数域F 上的一个n 维向量空间,n ααα,,,21 是V 的一个基,)(V L ∈σ.由于,,,2,1,)(n i V i =∈ασ因而它们可由基n ααα,,,21 线性表出.令,12211111)(n n a a a αααασ+++=,22221122)(n n a a a αααασ+++= (1)…………………n nn n n n a a a αααασ+++= 2211)(.(1)也可以表为 ()A n n ),,,()(,),(),(2121αααασασασ =,或A n n ),,,(),,(2121αααααασ = , (2)其中⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=nn n n n n a a a a a aa a a A212222111211. 称A 为σ关于基n ααα,,,21 的矩阵.A 的第j 列元为)(j ασ在基n ααα,,,21 下的坐标,,,,2,1n j =因而当取定基之后,σ在这一基下的矩阵是唯一的.例 3 σ是n 维向量空间V 的位似变换:σααασ,,)(V k ∈∀=关于V 的任一个基的矩阵为n 阶数量矩阵:⎪⎪⎪⎪⎪⎭⎫ ⎝⎛k k k .而零变换θ关于V 的任一个基的矩阵为零矩阵.单位变换ι关于V 的任一个基的矩阵是n E .例4 V 是n 维欧氏空间, n ααα,,,21 是V 的一个标准正交基.)(V L ∈σ,且满足α∀、>>=<<∈βαβσασβ,)(),(,V .设()U n n ),,,()(,),(),(2121αααασασασ =其中)(ij u U = .,,2,1,n j i = 由∑==ni iij j u 1)(αασ ,,2,1n j =那么,>=>=<<)(),(,j i j i ασασαα><∑∑==nl l lj nk k kiu u11,αα=∑∑∑===>=<nk nl nk kj ki l k lj kiu u u u111,αα=⎩⎨⎧≠=.,0,,1j i j i 当当这表明U 为正交矩阵.定义2 V 是n 维欧氏空间, )(V L ∈σ.如果,,V ∈∀βα有.,)(),(>>=<<βαβσασ (3) 那么称σ是一个正交变换.由例4知, 正交变换σ在任一标准正交基下的矩阵是正交矩阵.同时,若n ααα,,,21 是标准正交基,那么)(1ασ, )(,),(2n ασασ 也是标淮正交基.正交变换不改变向量的长度.事实上,在(3)中取βα=,便有|||)(|αασ=.反过来可以证明,在欧式空间V 中,若线性变换σ保持向量长度不变,那么σ是正交变换.最后,我们讨论向量空间V 的向量ξ与σ(ξ)关于同一基的坐标之间的关系. 定理6.1.1 设V 是n 维向量空间,)(V L ∈σ ,n ααα,,,21 是V 的一个基,且.),,,(),,,(2121A n n αααααασ =又设n n x x x αααα+++= 2211, n n y y y αααασ+++= 2211)(,那么⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n n x x x A y y y 2121. (4) 证: 由),,,(212211n n n x x x ααααααα =+++= ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n x x x 21,σ是线性变换,那么)()()()(2211n n x x x αασασασ+++==())(,),(),(21n ασασασ ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n x x x 21=A n ),,,(21ααα ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n x x x 21.又⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n n y y y 2121),,,()(αααασ.由于同一个向量在一个基下的坐标是唯一的,所以⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n n x x x A y y y 2121.这一结论表明,若知道线性变换σ关于某个基的矩阵,知道向量α关于这个基的坐标,那么由(4)式,便可求得α在σ下的像)(ασ关于这个基的坐标.习 题1.在3R 中,下列哪些变换是线性变换? (1) );,,(),,(132321a a a a a a =σ(2))0,0,(),,(321321x x x x x x ++=σ; (3) )0,0,(),,(321321x x x x x x =σ;(4) ),,(),,(233221321x x x x x x x +=σ.2.σ是向量空间V 的任一线性变换,证明 (1)0)0(=σ.(2) s ααα,,,21 线性相关,则)(,),(),(21s ασασασ 也线性相关. 3.已知3R 是σ的线性变换:),,,2(),,(13221321x x x x x x x x +-=σ求3R 在σ的自然基321,,εεε下的矩阵.4.σ是欧氏空间V 的线性变换,证明:若对任意的V ∈α有|||)(|αασ=,则σ是正交变换.6.2 特征值与特征向量我们已经看到,在向量空间V 中,取定一个基, V 的一个线性变换对应着唯一的一个n 阶矩阵.我们需要进一步考虑的是,一个线性变换在不同基下的矩阵有什么关系;是否可以找到一个适当的基,使线性变换在这个基下的矩阵最简单——为对角形矩阵.现在设V 是数域F 上的n 维向量空间,n ααα,,,21 与n βββ,,,21 是V 的两个基.)(V L ∈σ.()A n n ),,,()(,),(),(2121αααασασασ =,()B n n ),,,()(,),(),(2121ββββσβσβσ =, (1)由基n ααα,,,21 到基n βββ,,,21 的过渡矩阵是T ,即),,,(21n βββ =T n ),,,(21ααα .(2)因为T 可逆,有=),,,(21n ααα ),,,(21n βββ 1-T .由(2),()T n n ))(,),(),(()(,),(),(2121ασασασβσβσβσ =),,,(21n ααα =AT),,,(21n βββ =1-T AT . (3)比较(1),(3)有.1AT T B -= (4)定义1 设B A ,是数域F 上的两个n 阶矩阵,如果有F 上的可逆矩阵T ,使,1B AT T=-那么称B A 与相似,记为A ∽B .n 阶矩阵的相似关系具有如下性质: 1.自反性: A ∽A (取n E T =则可).2.对称性:由,1B AT T=-有A BT T =---111)(,即若A ∽B ,则B ∽A .3.传递性:若A ∽B ,B ∽C ,那么A ∽C .事实上,由A ∽B ,B ∽C ,则有可逆矩阵S T ,使..,11C BS S B AT T ==--于是.)()()(111C TS A TS S AT T S ==--- 根据定义1及上述推导可得:定理 6.2.1 线性变换σ在不同基下的两个矩阵相似.另一方面,若B AT T =-1,设n ααα,,,21 是V 的基,=))(,),(),((21n ασασασA n ),,,(21ααα .令T n n ),,,(),,,(2121αααβββ =,则n βββ,,,21 也是V 的基.事实上,由 12121),,,(),,,(-=T n n βββααα 知n ααα,,,21 可由n βββ,,,21 线性表示.由替换定理n ααα,,,21 与n βββ,,,21 等价,因而等秩.即秩 (n βββ,,,21 )=n .由(3)式的推导,容易看出B n n ),,,())(,),(),((2121ββββσβσβσ =.这说明,两个相似矩阵可以看成σ在不同基下的矩阵.在(1)中,如果B 是一个对角形矩阵,即⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n B λλλ21, 便有j j j βλβσ=)(,这也就是我们构造基n βββ,,,21 ,使σ在这一基下的矩阵为对角形的基本思路.为了实现这一想法,我们给出如下重要概念.定义2 设V 是数域F 上的向量空间,0,),(≠∈∈αασV V L .如果有F ∈λ,使得λαασ=)(, (5)那么称λ是σ的特征值,称α是σ的属于特征值λ的特征向量.现在设n ααα,,,21 是V 的一个基. ),(),((21ασασ =))(,n ασ A n ),,,(21ααα ,⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=+++=n n n n x x x x x x 21212211),,,(ααααααα,那么⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n n x x x 2121))(,),(),(()(ασασασασ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n n x x x A 2121),,,(ααα.而⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n n x x x 2121),,,(λαααλα.若(5)成立,由定理6.1.1,有⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n n x x x x x x A 2121λ.令Tn x x x X ),,,(21 =,上式即为X AX λ=. (6)(6)中的λ称为矩阵A 的特征值,X 称为A 的属于特征值λ的特征向量.(6)是由(5)推出,反过来,由(6)也可推得(5).因此, σ的特征值也称为A 的特征值.同时,我们看出,特征值与基的选取无关,只由σ(或A )确定.这样,对线性变换σ的特征值的讨论就可以转化为对方阵A 的特征值的讨论.下面我们来讨论如何求A 的特征值λ以及属于特征值λ的特征向量. 设⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n a a a a a a a a a A 212222111211,由(6)可得齐次线性方程组0)(=-X A E λ (7)(7)的系数行列式nnn n nn a a a a a a a a a A E ---------=-λλλλ212222111211|| 是关于λ的一个n 次多项式,称为A 的特征多项式,记为)(λA f .若0||)(=-=A E f A λλ,那么(7)有非零解. (7)中任意一个非零解X 都满足(6)式,因而都是属于特征值λ的特征向量关于基n ααα,,,21 的坐标.如果未提及基,我们就将(7)的非零解X 作为A 的属于特征值λ的特征向量.设α是A 的属于特征值λ的特征向量,0,≠∈k F k ,那么)()(αλλαααk k kA k A ===,这说明αk 也是属于特征值λ的特征向量.于是,若n ααα,,,21 是属于特征值λ的特征向量,那么,它们的线性组合s s k k k ααα+++ 2211(i k 不全为0)仍是属于特征值λ的特征向量.由此可知,A 的属于特征值λ的所有特征向量可以用(7)的一个基础解系来表示.此时,(7)的解空间称为A 的关于λ的特征子空间,记为λV . λV 中任何非零向量都是属于特征值λ的特征向量.例1 求A 的特征值和相应的特征向量⎪⎪⎪⎭⎫ ⎝⎛--=011211211A .解84211211211)(23+--=------=λλλλλλλA f .由综合除法,求得)(λA f 的根为:22,1=λ,23-=λ,即为A 的特征值.对于特征值,22,1=λ相应的齐次方程组为⎪⎩⎪⎨⎧=++-=++-=--,020202321321321x x x x x x x x x 求得基础解系,0111⎪⎪⎪⎭⎫ ⎝⎛=η ⎪⎪⎪⎭⎫ ⎝⎛=1022η.属于特征值2的特征向量为212211,(k k k k ηη+不全为零). 对于23-=λ,相应的齐次线性方程组为⎪⎩⎪⎨⎧=-+-=+--=---,02023023321321321x x x x x x x x x求得基础解系⎪⎪⎪⎭⎫ ⎝⎛-=1113η.属于特征值-2的特征向量为)0(3,33≠k k η.下面我们来看看两个相似矩阵的特征值之间的关系. 设A ∽B ,即有可逆矩阵T ,使,1B AT T =-那么,||||1AT T E B E --=-λλ=|)(|T A E T --λ =||||||T A E T --λ =||A E -λ.于是,有定理6.2.2 相似矩阵有相同特征多项式,因而有相同的特征值.该定理的逆不成立,即A 、B 有相同的特征值,但A 、B 不一定相似.例如⎪⎪⎭⎫ ⎝⎛=0000A , ⎪⎪⎭⎫⎝⎛=0010B . A 、B 的特征值都是021==λλ,但A 、B 不相似.前面曾经提到,矩阵A 的特征多项式)(λA f 是一个关于λ的n 次多项式,设⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n a a a a a a a a a A 212222111211, 那么nnn n nn A a a a a a a a a a f ---------=λλλλ212222111211)(, 其中)())((2211nn a a a ---λλλ 是)(λA f 的项. 该项含且仅含)(λA f 的n λ和1-n λ的项,)(λA f 的常数项, 即不含λ的项(取0=λ)为||)1(A n -.因此,||)1()()(12211A a a a f n n nn n A -+++++-=- λλλ,其中nn a a a +++ 2211为A 的主对角线上元素的和,称为A 的迹,记为)(A T r .根据多项式根与系数的关系,有)(21A T r n =+++λλλ .||21A n =λλλ .以上两式,可以在我们计算A 的特征值后,作为检验计算是否正确的必要条件.只是注意,重根有几个算几个.n 阶矩阵A 的特征值,随给定的数域F 而定.在复数域C 上,由代数基本定理, )(λA f 有n 个复根,因而总有)())(()(21n A f λλλλλλλ---= .习 题1.求下列矩阵在实数域R 内的特征值和相应的特征向量:(Ⅰ) ⎪⎪⎭⎫⎝⎛=2543A , (Ⅱ). ⎪⎪⎪⎭⎫ ⎝⎛-----=175131023A . 2.证明, n 阶矩阵A 与它的转置矩阵T A 有相同的特征值.3.若λ是n 阶矩阵A 的特征值,则kλ是k A 的特征值.4.证明,若n 阶矩阵A 的n 个特证值0≠i λ,n i ,,2,1 =,则A 可逆,且1-i λ是1-A 的特征值.*5.证明,对角形矩阵⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n a a a 21与⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n b b b21 相似,当且仅当n b b b ,,,21 是n a a a ,,,21 的一个排列.6.3 可对角化的矩阵在这一节里,我们讨论在什么情况下,n 阶矩阵A 可以相似于一个对角形矩阵,或者说,在什么情况下,向量空间V 中存在一个基,使V 的线性变换σ这个基下的矩阵为对角形矩阵.定义 1 V 是数域F 上的一个n 维向量空间,)(V L ∈σ.如果V 中有一个基,使σ在这个基下的矩阵为对角形矩阵,那么称σ是可对角化的.将定义1用矩阵的语言来表述,即为:对n 阶矩阵A ,如果存在n 阶可逆矩阵T ,使AT T 1-为对角形矩阵,那么,称A 是可对角化的.σ对角化或A 对角化,其对角形矩阵中,对角线上的元素是σ或A 的全部特征值.σ对角化在于构造一个相应的基,而A 对角化却在于构造可逆矩阵T .若⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=-n AT T λλλ211, 即有⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n T AT λλλ21. 令),,,(21n T βββ =,则可得j j j A βλβ=.这表明T 的第j 列是A 的属于特征值j λ的特征向量,即0)(=-X A E j λ的基础解系的解向量.另一方面,如果n ααα,,,21 是基,且A n n ),,,(),,,(2121αααααασ =,那么满足T n n ),,,(),,,(2121αααβββ =的n βββ,,,21 就是σ对角化需要构造的基.由上所述,σ或A 对角化是有条件的.其一,n 阶矩阵A 是否有构成n 阶对角矩阵的n 个特征值;其二,这些特征值所确定的特征向量是否可以构成可逆矩阵T .第一个条件可通过求A 的特征值来确定.对第二个条件,首先需要考察n 阶矩阵A 的属于不同特征的特征向量之间有什么关系.我们有定理6.3.1 n 阶矩阵A 的属于不同特征值的特征向量线性无关.证 设m ααα,,,21 是A 的分别属于m 个不同特征值m λλλ,,,21 的特征向量.对m 采用归纳法.当1=m 时,特征向量01≠α,1α线性无关.设对于1-m 个不同特征值,定理成立.当不同特征值的个数是m 时,令02211=+++m m k k k ααα , (1) 将A 左乘(1)两边,且由i i i A αλα=, m i ,,2,1 =,有0222111=+++m m m k k k αλαλαλ . (2)将m λ⨯-)1()2(,得.0)()()(111222111=-++-+----m m m m m m k k k αλλαλλαλλ由归纳假设121,,,-m ααα 线性无关,所以只有0)(=-m i i k λλ,1,,2,1-=m i .而0≠-m i λλ,得0=i k .将0=i k 代入(1)式,(1)化为.0=m m k α但0≠m α,于是0=m k .故m ααα,,,21 线性无关.由此定理,我们立即得到推论 若n 阶矩阵A 在给定数域F 中有n 个不同特征值,则A 可对角化.事实上,设n λλλ,,,21 是A 的n 个不同特征值,对于每一个j λ,都可求得齐次线性方程组0)(=-X A E j λ的一个非零解,分别以它们作为T 的第j 个列向量,构成T .由定理6.3.1, T 的这些列向量线性无关,因而T 可逆,且有⎪⎪⎪⎪⎪⎭⎫⎝⎛=-n AT T λλλ211.但是,一般来说,A 的特征值不一定都是)(λA f 的一重根(单根).现在假设在数域F 内t s t s s A f )()()()(2121λλλλλλλ---= ,其中i S ≥1为i λ的重数),,2,1(t i =,而n S S S t =+++ 21.即是说, )(λA f 的重根按重数计,A 有n 个特征值.如果i λ相应的齐次线性方程组0)(=-X A E i λ的基础解系含i S 个解向量,即是说此时i S V i =λdim .那么以这t 组解向量为列构成可逆矩阵T ,则有个个个t t t S S S AT T 2122111⎪⎭⎪⎬⎫⎪⎭⎪⎬⎫⎪⎭⎪⎬⎫⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=-λλλλλλ (3) 反过来,如果(3)成立,那么A 有t 个不同的特征值t λλλ,,,21 ,其重数分别为t s s s ,,,21)(21n s s s t =+++ .而T 的第i 组列向量都是属于特征值i λ的特征向量,也就是齐次线性方程组0)(=-A E i λ的i S 个线性无关的解向量,说明i V λ的维数至少是i S ,即i V λdim ≥i S .但由n S S S t =+++ 21,不可能有i V λdim >i S ,因而i S V i =λdim .由以上论述,我们得到定理6.3.2 数域F 上n 阶矩阵A 可对角化的充分必要条件是: (Ⅰ) A 在F 内有n 个特征值,(Ⅱ) 每一特征值i λ的重数等于相应特征子空间i V λ的维数.现在,我们已经知道,当σ可对角化时,如何来构造这相应的基.事实上,任取V 的一个基,由(3),以T 的列向量为坐标,便可构成n 个线性无关的向量:t ts t s ββββ,,,,,,11111 ,它是V 的一个基,而σ在这个基下的矩阵为对角形矩阵:.121个个t t t S S ⎪⎭⎪⎬⎫⎪⎭⎪⎬⎫⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛λλλλ 若A 可对角化,我们再看V 与它的特征子空间的关系,根据6.2定义2,一个特征向量,只由一个特征值确定.事实上,若αλααλα21,==A A ,那么(),021=-αλλ而0≠α,因此21λλ=.这说明{}0=j i V V λλ ,,j i ≠而此时s V V V V λλλ+++= 21. (4) 上述σ可对角化所选择的基,即由s V V λλ,,1 的基拼凑而成.显然V 的每一个向量在这个基下的表示法是唯一的.(4)中的这个和称为直和,记为s V V V V λλλ⊕⊕⊕= 21.例1 设⎪⎪⎪⎭⎫ ⎝⎛----=163222123A ,求可逆矩阵T ,使AT T1-为对角形矩阵.解)4()2(1612163222123)(23+-=+-=+---+--=λλλλλλλλA f .A 的特征值为4,2,2-.对于特征值2,求得相应齐次线性方程组⎪⎩⎪⎨⎧=+--=-+=+--0363024202321321321x x x x x x x x x 的基础解系:T)0,1,2(1-=η,T)1,0,1(2=η;对于特征值4-,求得相应齐次线性方程组⎪⎩⎪⎨⎧=---=--=+--03630222027321321321x x x x x x x x x的基础解系:T )1,32,31(3-=η. 由于基础解系所含解向量的个数都等于相应特征值的重数,A 可对角化.取⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛--=11032013112T ,则⎪⎪⎪⎭⎫ ⎝⎛-=-4000200021AT T .习 题1. 在实数域R 内,下列哪些矩阵可对角化.(Ⅰ) ⎪⎪⎪⎭⎫ ⎝⎛-----175131023; (Ⅱ) ⎪⎪⎪⎭⎫ ⎝⎛---504941754; (Ⅲ) ⎪⎪⎪⎭⎫⎝⎛---6123020663. 2. 已知三阶矩阵A 的特征值1,2,1321-===λλλ.属于1λ的特征向量T )1,0,1(1=α,属于2λ的特征向量T)1,1,0(2-=α,属于3λ的特征向量T )1,1,1(3-=α.求A .3. 设⎪⎪⎪⎭⎫ ⎝⎛----=163053064A ,求10A .*4. 已知三阶矩阵A 的特征值为1,-1,2,设矩阵235A A B -=,试求B 的特征值.。