线性代数--第五章++线性空间与线性变换
- 格式:ppt
- 大小:571.51 KB
- 文档页数:42
高等代数第五章知识点总结高等代数是数学中的一个重要分支,主要研究代数结构、线性代数、群论等数学领域。
第五章主要涉及线性方程组、矩阵、向量空间、线性变换等知识点。
以下是对这些知识点的总结:1. 线性方程组:线性方程组是一组线性方程的集合,其中每个方程都是一次多项式。
线性方程组的解称为线性方程组的解,可以用矩阵和向量来表示。
2. 矩阵:矩阵是一种特殊的数组,可以表示线性方程组、线性变换和向量空间等数学对象。
矩阵的加法、数乘等运算符合矩阵的定义,并且矩阵具有一些特殊的性质,如行列式、秩等。
3. 向量空间:向量空间是一个线性空间,其中添加了一个标量值域。
向量空间的元素称为向量,向量空间的基和维数是重要概念。
向量空间的加法、数乘等运算符合向量空间的定义。
4. 线性变换:线性变换是一个将一个线性空间映射到另一个线性空间的函数。
线性变换的特征是保持向量空间的加法和数乘运算。
线性变换的矩阵表示是一个方阵,其中每行每列都是一个向量。
5. 特征值和特征向量:特征值和特征向量是两个重要的概念,用于描述矩阵的性质。
矩阵的特征值是指矩阵在乘以某个向量后得到的值,而特征向量是指与特征值相关的向量。
6. 相似矩阵:相似矩阵是指具有相同特征值的矩阵。
相似矩阵之间具有一些相似性质,如行列式、秩等。
相似矩阵可以用来表示线性变换的缩放比例和旋转角度。
7. 克莱默法则:克莱默法则是一个用于求解线性方程组的公式,可以将线性方程组的系数矩阵转换为阶梯形矩阵或行最简矩阵,从而求解线性方程组的解。
8. 特征值分解:特征值分解是将矩阵分解成一组特征向量的乘积,从而求解矩阵的特征值和特征向量。
特征值分解在矩阵的分解和求解中发挥着重要作用。
9. 二次型:二次型是一种特殊的矩阵,其元素是二次多项式。
二次型可以用来表示线性变换的对称矩阵和非对称矩阵,并且具有一些重要的性质,如行列式、秩等。
以上是第五章的主要知识点总结,这些知识点是高等代数中的重要基础,对于理解代数结构、线性代数和群论等数学领域具有重要意义。
线性空间与线性变换线性空间是线性代数的一个重要概念,扮演着理解线性变换的基础角色。
本文将介绍线性空间的定义、性质以及线性变换的概念和特性。
一、线性空间的定义与性质线性空间,也被称为向量空间,是指一个集合,其中包含一些向量,满足特定的性质。
具体而言,线性空间需要满足以下几个条件:1. 封闭性:对于线性空间中的任意两个向量,它们的线性组合也属于该空间。
即,如果向量a和向量b属于线性空间V,那么对于任意标量α和β,αa + βb也属于V。
2. 加法封闭性:线性空间中的向量满足加法封闭性,即对于任意的向量a和b,它们的和a + b也属于该空间。
3. 数乘封闭性:线性空间中的向量满足数乘封闭性,即对于任意的向量a和标量α,它们的积αa也属于该空间。
4. 满足加法和数乘的运算性质:线性空间中的向量满足加法和数乘的交换律、结合律和分配律。
线性空间的性质还包括零向量、负向量和线性相关性。
零向量表示线性空间中存在一个使其与任何向量相加得到自身的向量,负向量表示线性空间中的向量存在一个加法逆元。
线性相关性指的是线性空间中存在一组向量线性组合为零向量的关系。
二、线性变换的定义和性质线性变换是指在两个线性空间之间的映射,它保持了向量空间中的线性结构。
具体而言,线性变换需要满足以下几个条件:1. 保持加法运算:对于线性变换T,对任意的向量a和b,有T(a +b) = T(a) + T(b)。
2. 保持数乘运算:对于线性变换T和标量α,有T(αa) = αT(a)。
线性变换的性质还包括零变换、恒等变换和可逆性。
零变换表示线性变换将所有向量映射为零向量。
恒等变换表示线性变换将每个向量映射为其本身。
可逆性表示存在一个逆变换,使得两个线性变换进行复合后得到恒等变换。
三、线性空间与线性变换的关系线性空间和线性变换密切相关,线性变换本质上是线性空间之间的映射,它将一个线性空间中的向量映射到另一个线性空间中。
线性变换保持了向量空间的线性结构,在线性代数中起到了重要的作用。
线性代数向量空间与线性变换线性代数是数学的一个分支,研究向量空间和线性变换的性质和特征。
向量空间是线性代数的核心概念之一,而线性变换则是在向量空间内进行变换的关键操作。
本文将介绍向量空间和线性变换的定义、性质以及它们在数学和实际问题中的应用。
一、向量空间向量空间是指一个集合,其中的元素称为向量,满足一定的代数运算规律。
具体来说,一个向量空间必须满足以下条件:1. 封闭性:对于向量空间中的任意两个向量,它们的线性组合仍然属于该向量空间。
即对于任意向量u和v以及任意标量c和d,cu+dv仍然属于该向量空间。
2. 加法运算的结合性:对于向量空间中的任意三个向量u、v和w,满足(u+v)+w = u+(v+w)。
3. 加法运算的交换性:对于向量空间中的任意两个向量u和v,满足u+v = v+u。
4. 存在零向量:向量空间中存在一个零向量0,满足对于任意向量u,u+0 = u。
5. 存在负向量:对于向量空间中的任意向量u,存在一个负向量-v,满足u+(-v) = 0。
6. 标量乘法的结合性:对于标量的乘法运算,满足c(du) = (cd)u。
7. 标量乘法的分配性:对于标量的乘法运算和向量的加法运算,满足(c+d)u = cu+du,以及c(u+v) = cu+cv。
满足以上条件的集合即为向量空间。
在向量空间中,向量可以按照一定的线性关系进行运算和转换。
二、线性变换线性变换是指一个向量空间到另一个向量空间的映射,该映射满足以下两个性质:1. 保持线性关系:对于向量空间V中的任意两个向量u和v以及标量c,线性变换T必须满足T(cu+dv) = cT(u)+dT(v)。
2. 保持零向量:线性变换T必须满足T(0) = 0,即将零向量映射为零向量。
线性变换可以通过矩阵的乘法来表示。
设向量空间V和W分别为n 维和m维的向量空间,线性变换T:V→W可以表示为一个m×n的矩阵A,其中A的第i列为T(ei)的坐标表示,ei为向量空间V的基向量。
第五章 特征值与二次型§1 向量的内积在空间几何中,内积描述了向量的度量性质,如长度、夹角等.由内积的定义:cos ⋅=x y y x θ,可得cos()=y ,⋅=+x yx x yx 且在直角坐标系中123123112233()()=x ,x ,x y ,y ,y x y x y x y .⋅++将上述三维向量的内积概念自然地推广到n 维向量上,就有如下定义。
定义1 设有n 维向量12n x x x ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦x ,12n y y y ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦y ,称[]1122n n x y x y x y ,=+++x y 为x 与y 的内积.内积是向量的一种运算,用矩阵形式可表为[],'=x y x y . 例1 计算[],x y ,其中x,y 如下:(1) x =(0,1,5,-2),y =(-2,0,-1,3);(2) x =(-2,1,0,3),y =(3,-6,8,4). 解 (1) [x,y ]=0·(-2)+1·0+5·(-1)+(-2)·3=-11;(2) [x,y ]=(-2)·3+1·(-6)+0·8+3·4=0.若x、y、z为n 维实向量,λ为实数,则下列性质从内积的定义可立刻推得. (i) [x,y ]=[y,x ], (ii)[λx,y ]=λ[x,y ],(iii)[x+y,z ]=[x,z ]+[y,z ].同三维向量空间一样,可用内积定义n 维向量的长度和夹角. 定义2称==x x 的长度(或X 数),当‖x ‖=1时称x 为单位向量.从向量长度的定义可立刻推得以下基本性质:(i)非负性: 当x ≠0时,‖x ‖>0,当x =0时‖x ‖=0.(ii)齐次性: ‖λx ‖=|λ|‖x ‖.(iii)三角不等式: ‖x +y ‖≤‖x ‖+‖y ‖.(iv)柯西-许瓦茨(Cauchy-Schwarz )不等式: [x ,y ]2≤‖x ‖2‖y ‖2. 由柯西-许瓦茨不等式可得[],⋅x y yx ≤1(‖x ‖·‖y ‖≠0).于是我们定义,当‖x‖≠0,‖y‖≠0时,称[]arccos,θ=⋅x y yx为x 与y 的夹角.当[x ,y ]=0时,称x 与y 正交.显然,n 维零向量与任意n 维向量正交.称一组两两正交的非零向量组为正交向量组.定理1若n 维非零向量12r ,,,ααα为正交向量组,则它们为线性无关向量组.证 设有12r ,,,λλλ使1ri i i λ.==∑0α,分别用k α与上式两端作内积(k =1,2,…,r ),即得k λ[][]0k k k ,.ααα==,0因0k α≠,故[]20k k k,ααα=≠,从而012k ,k ,,,r λ==,于是12r ,,,ααα线性无关.在研究向量空间的问题时,常采用正交向量组作为向量空间的一组基,以便使问题得到简化,那么n 维向量空间的正交基(基中向量两两正交)是否存在呢?定理 2 若12r ,,,ααα是正交向量组,且r<n ,则必存在n 维非零向量x ,使12r ,,,ααα,x 也为正交向量组.证x 应满足12000r ,,,ααα'''===x x x ,即12000r .ααα⎡⎤'⎡⎤⎢⎥⎢⎥⎢⎥'⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦'⎣⎦x记12r ,ααα⎡⎤'⎢⎥⎢⎥'=⎢⎥⎢⎥⎢⎥'⎣⎦A则()R r n =<A ,故齐次线性方程组A x =0必有非零解,此非零解即为所求. 推论r 个(r n <)两两正交的n 维非零向量总可以扩充成R n 的一个正交基. 例2 已知1α=(1,1,1)′,2α=(1,-2,1)′正交,试求一个非零向量3α,使123,,ααα两两正交.解 解方程组12311101210x x ,x ⎡⎤⎡⎤⎡⎤⎢⎥=⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎢⎥⎣⎦得基础解系为101-⎡⎤⎢⎥⎢⎥⎢⎥⎣⎦,取3α=101-⎡⎤⎢⎥⎢⎥⎢⎥⎣⎦,则3α即为所求.定义3 设n 维向量12r ,,,e e e 是向量空间()n V V ⊂R 的一个基,如果12r ,,,e e e 两两正交,且都是单位向量,则称之为V 的一个正交规X 基(标准正交基).若12r ,,,e e e 是V 的一个正交规X 基,则V 中任一向量α可由12r ,,,e e e 惟一线性表示,设为1122r r ,αλλλ=+++e e e则由i i i i i ''==e e e αλλ,得[]i i i i ,,λααλ'==e e 惟一确定,i =1,2,…,r .下面介绍将向量空间()nV V ⊂R 的任一基12r ,,,ααα转换为一正交规X 基的Schmidt正交化方法,其具体步骤如下:取[][][][][][][][]121122111121121112211r r r r r r r r r ,,,,,,,,,,,----==-=----βαβαβαββββαβαβαβαβββββββββ容易验证12r ,,,βββ两两正交,非零.然后将它们单位化,即令121212r r r,,,,ββββββ===e e e 则12r ,,,e e e 就是V 的一个正交规X 基.例3已知1α=(1, -1,0)′、2α=(1,0,1)′,r α=(1, -1,1)′是R 3的一个基,试用施密特正交化方法,构造R 3的一个正交规X 基.解 取[][][][][][]11122211113233312112211011121011221011131122111133200113,,,,,,,,⎡⎤⎢⎥==-⎢⎥⎢⎥⎣⎦⎡⎤⎢⎥⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥=-=-=-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎢⎥⎣⎦⎡⎤-⎡⎤⎢⎥⎢⎥⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥=--=--=---⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎢⎥⎢⎥⎣⎦⎢⎣⎦βαβαβαββββαβαβαββββββ,⎥再将123,,,βββ单位化,即得R 3的一个正交规X 基3121233120,,.ββββββ⎡⎡⎤⎢⎢⎥⎢⎢⎥⎢======⎢⎢⎢⎢⎢⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦e e e 定义4 如果n 阶方阵满足A ′A =E (即A-1=A ′),就称A 为正交矩阵.用A 的列向量表示,即是1212(,,,)=,n n αααααα⎡⎤'⎢⎥⎢⎥'⎢⎥⎢⎥⎢⎥'⎣⎦E亦即()=().i j ij ααδ'由此得到n 2个关系式1==120i j ij i j,i,j ,,,n.i j ααδ=⎧'=⎨≠⎩这说明,方阵A 为正交矩阵的充分必要条件是:A 的列向量组构成R n 的正交规X 基,注意到A′A=E=AA′,所以上述结论对A 的行向量组也成立.例4 验证矩阵1111222211112222000⎡⎤--⎢⎥⎢⎥⎢⎥--⎢⎥=⎢⎥⎥⎥⎥⎢⎢⎣A 是正交矩阵.解A 的每个列向量都是单位向量且两两正交,故A 是正交矩阵. 由正交矩阵定义,不难得到下列性质.(i )若A 是正交矩阵,则|A|2=1.(ii )若A 是正交矩阵,则A′,A-1也是正交矩阵. (iii )若A,B是n 阶正交矩阵,则AB 也是正交矩阵.定义5 若T 是正交矩阵,则线性变换y =Tx 称为正交变换. 设y =Tx 是正交变换,则有.==y x这表明,经正交变换向量的长度保持不变,这是正交变换的优良特性之一.其实正交变换相当于反射和旋转的叠合,例如cos sin sin cos θθθθ-⎡⎤=⎢⎥⎣⎦T 为正交矩阵,正交变换y =Tx 相当于旋转θ角,再关于纵轴对称反射.§2 方阵的特征值和特征向量工程技术中振动问题和稳定性,往往归结为一个方阵的特征值和特征向量的问题,特征值、特征向量的概念,不仅在理论上很重要,而且可以直接用来解决实际问题.定义6 设A 为n 阶方阵,若存在数λ和非零n 维向量x ,使得Ax =λx , (5.1)则称λ为矩阵A 的特征值,称x 为矩阵A 对应于特征值λ的特征向量.(5.1)式也可写成(A-λE)x =0. (5.2)(5.2)式的齐次线性方程组有非零解的充分必要条件是|A-λE|=0. (5.3)(5.3)式的左端为λ的n 次多项式,因此A 的特征值就是该多项式的根.记f (λ)=|A-λE|,称为A 的特征多项式,则矩阵A 的特征值即为其特征多项式的根.方程(5.3)称为A 的特征方程,特征方程在复数X 围内恒有解.其个数为方程的次数(重根按重数计算),因此n 阶方阵A 有n 个特征值.设λ=λi 为其中的一个特征值,则由方程(A-λi E)x =0可求得非零解x =p i ,那么p i 便是A 的对应于特征值λi 的特征向量(若λi 为实数,则p i 可取实向量,若λi 为复数,则p i 为复向量.)例5 求3113-⎡⎤=⎢⎥-⎣⎦A 的特征值和特征向量.解A 的特征方程为231(3)1(4)(2)0,13λλλλλ--=--=--=--所以A 的特征值为122, 4.λλ==当12λ=时,由1232101320x x --⎡⎤⎡⎤⎡⎤=⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦ 可得x 1=x 2,所以对应的特征向量可取为111⎡⎤=⎢⎥⎣⎦p ;当λ2=4时,由1234101340x x --⎡⎤⎡⎤⎡⎤=⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦ 即12110110x x --⎡⎤⎡⎤⎡⎤=⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦ 解得x 1=-x 2,所以对应的特征向量可取为21.1⎡⎤=⎢⎥-⎣⎦p显然,若p i 是对应于特征值λi 的特征向量,则k p i (k ≠0)也是对应于λi 的特征向量,所以特征向量不能由特征值惟一确定,反之,不同的特征值所对应的特征向量绝不会相等,也即一个特征向量只能属于一个特征值.例6 求矩阵110430102-⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦A的特征值和特征向量.解A 的特征多项式为2110(2)(1),430102λλλλλλ--⎡⎤⎢⎥==-----⎢⎥⎢⎥-⎣⎦A E 所以A 的特征值为λ1=2,λ2=λ3=1.当λ1=2时,则方程(A -2E )x =0,由3100102410100100000-⎡⎤⎡⎤⎢⎥⎢⎥-=→-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦A E得基础解系10.01⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦p所以k p 1(k ≠0)是对应于λ1=2的全部特征向量.当λ2=λ3=1时,解方程(A-E )x =0,由210210100420101012101000000--⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥-=→→-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦A E得基础解系21.21⎡⎤⎢⎥=⎢⎥⎢⎥-⎣⎦p所以k p 2(k ≠0)是对应于λ2=λ3=1的全部特征向量.从上述例子可以归纳出具体计算特征值、特征向量的步骤. 第一步:计算特征多项式|A -λE |.第二步:求出|A -λE |=0的全部根,它们就是A 的全部特征值.第三步:对于A 的每一个特征值λi ,求相应的齐次线性方程组(A-λi E )x =0的一个基础解系12r ,,,ααα,则对于不全为零的任意常数12r k ,k ,,k ,1122r r k k k ααα+++即为对应于λi的全部特征向量. 例7 求矩阵460350361⎡⎤⎢⎥=--⎢⎥⎢⎥--⎣⎦A的特征值和特征向量.解 A 的特征多项式为2460(1)(2).350361λλλλλλ-⎡⎤⎢⎥==--+----⎢⎥⎢⎥---⎣⎦A E 所以A 的特征值为λ1=λ2=1,λ3=-2.当λ1=λ2=1时,解方程(A -E )x =0,由41601203510000360000-⎡⎤⎡⎤⎢⎥⎢⎥-=→---⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦A E得基础解系1220.1001-⎡⎤⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦p ,p于是22112212(0)k k k k ++≠p p 为对应于λ1=λ2=1的全部特征向量.当λ3=-2时,解方程(A+2E )x =0,由426011023520011363000+⎡⎤⎡⎤⎢⎥⎢⎥-=→--+-⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦A E得基础解系31.11-⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦p所以k 3p 3(k 3≠0)为对应于λ3=-2的全部特征向量.例8 设λ是方阵A 的特征值,证明λ2是A 2的特征值. 证因λ是A 的特征值,故有p ≠0,使Ap =λp , 于是A 2p =A (Ap )=λAp =λ2p .所以λ2是A 2的特征值.按此例类推,不难证明:若λ是A 的特征值,则λk 是Ak 的特征值;()ϕλ是()ϕA 的特征值(其中0101(),()m m m m a a a a a a ϕλλλϕλ=+++=+++A E A ).例9 设向量1α=(1,2,0)′,2α=(1,0,1)′都是方阵A 的属于特征值λ=2的特征向量,又向量β=(-1,2,-2)′,求Aβ.解 由题设条件有2(1,2)i i i Aαα==又122βαα=- 故12121212(2)222(2)2(2)2(2,4,4)=-=-=-=-'==--AβA ααAαAαααααβ 定理3设λ1,λ2,…,λm 是方阵A 的m 个互不相同的特征值,p 1,p 2,…,p m 依次是与之对应的特征向量,则p 1,p 2,…,p m 线性无关.证 设有常数x 1,x 2,…,x m ,使x 1 p 1+ x 2 p 2+…+ x m p m =0,则A (x 1 p 1+ x 2 p 2+…+ x m p m ) =0,即111222m m m λλλ+++=x p x p x p 0.类推有121122(1,2,,1).m k k k m m k m λλλ+++==-x p x p x p 0把上列各式合写成矩阵形式,得(x 1 p 1,x 2 p 2,…,x m p m )1211121111m m m mm λλλλλλ---⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦=O . 上式等号左边第二个矩阵的行列式为X 德蒙行列式,当λi各不相同时,该矩阵可逆,于是有(x 1 p 1,x 2 p 2,…,x m p m ) =O ,即x i p i =0,但p i ≠0,故x i =0,i =1,2,…,m .所以向量组p 1,p 2,…,p m 线性无关.§3 相似矩阵定义7 设A 与B 是n 阶方阵,如果存在一个可逆矩阵P ,使B =P -1AP ,则称A 与B 是相似的.定理 4若n 阶方阵A 与B 相似,则A 与B 的特征多项式相同,从而A 与B 的特征值相同.证 因A 与B 相似,即有可逆矩阵P ,使P -1AP =B ,故|B -λE |=|P -1AP -P -1(λE )P |=|P -1(A -λE )P |=|P -1||A -λE ||P |=|A -λE |.推论 若n 阶方阵A 与对角矩阵diag (λ1,λ2,…,λn )相似,则λ1,λ2,…,λn 即是A 的特征值.证 因λ1,λ2,…,λn 是diag (λ1,λ2,…,λn )的n 个特征值.由定理4知λ1,λ2,…,λn 也就是A 的特征值.关于相似矩阵我们关心的一个问题是,与A 相似的矩阵中,最简单的形式是什么?由于对角矩阵最简单,于是考虑是否任何一个方阵都相似于一个对角矩阵呢?下面我们就来研究这个问题.如果n 阶矩阵A 能相似于对角矩阵,则称A 可对角化.现设已找到可逆矩阵P ,使P -1AP =Λ=diag (λ1,λ2,…,λn ).把P 用其列向量表示为P=(λ1,λ2,…,λn ),由P -1AP =Λ,得AP =P Λ,即A (p 1,p 2,…,p n )=(p 1,p 2,…,p n )diag (λ1,λ2,…,λn )=(λ1 p 1,λ2 p 2,…,λn p n ).于是有A p i =λi p i (i =1,2,…,n ).可见P 的列向量p i 就是A 的对应于特征值λi 的特征向量.又因P 可逆,所以p 1,p 2,…,p n A 的对角化有如下结论:定理5n 阶方阵A 可对角化的充分必要条件是:A 有n 个线性无关的特征向量p 1,p 2,…,p n ,并且以它们为列向量组的矩阵P ,能使P -1AP 为对角矩阵.而且此对角矩阵的主对角线元素依次是与p 1,p 2,…,p n 对应的A 的特征值λ1,λ2,…,λn .现在的问题是:对于任一矩阵A ,是否一定存在n 个线性无关的特征向量,答案是否定的,在上节例7中A 的特征方程有重根.但仍能找到3个线性无关的特征向量,但在例6中A 的特征方程亦有重根,却找不到3个线性无关的特征向量.从而例6中矩阵A 不能与对角矩阵相似.例10 设A =2125312a b -⎡⎤⎢⎥⎢⎥⎢⎥--⎣⎦的一个特征向量为p =111⎡⎤⎢⎥⎢⎥⎢⎥-⎣⎦. (1) 求参数a,b 的值及A 的与特征向量p 对应的特征值;(2) A 与对角阵是否相似?解 (1)设A 的与特征向量p 相对应的特征值为λ,可得方程组(A -λE )p =0,即21210,53101210a b λλλ--⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥=-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥----⎣⎦⎣⎦⎣⎦即10,20,10.a b λλλ--=⎧⎪-++=⎨⎪++=⎩解得1,3,0.a b λ=-⎧⎪=-⎨⎪=⎩(2) 由3212(1)0533102λλλλλ--==-+=------A E知A 有三重特征值λ1=λ2=λ3=-1.由于312101101101,523523022011101312011000-⎡⎤⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥+=→→→--⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥---⎣⎦⎣⎦⎣⎦⎣⎦A E可知R (A +E )=2,n -R (A +E )=3-2=1,故三阶方阵A 与λ=-1对应的线性无关的特征向量仅有一个.所以A 不与对角阵相似.在矩阵中有一类特殊矩阵,即实对称矩阵是一定可以对角化的,并且对于实对称矩阵A 不仅能找到可逆矩阵P ,使得P -1AP 为对角阵,而且还能够找到一个正交矩阵T ,使T -1AT 为对角矩阵.定理6实对称矩阵的特征值都是实数.证 设复数λ为实对称矩阵A 的特征值,复向量x 为对应的特征向量,即Ax =λx ,x ≠0.用λ表示λ的共轭复数,x 表示x 的共轭复向量,则().λλ====Ax Ax Ax x x于是有λλ'''=x Ax x x =x x及()()().λλ''''''=x Ax x A x =Ax x =x x =x x两式相减,得()0λλ'-=x x .但因x ≠0,所以2110.n ni i i i i x x x =='==≠∑∑x x故0λλ-=,即λλ=,这表明λ是实数.显然,当特征值i λ为实数时,齐次线性方程组()0i λ-=A E x是实系数线性方程组,从而必有实的基础解系,即对应于λi的特征向量必可取实向量.定理7 设λ1,λ2是实对称矩阵的两个特征值,p 1,p 2是对应的特征向量,若λ1≠λ2,则p 1与p 2正交.证λ1p 1=Ap 1,λ2p 2=Ap 2,λ1≠λ2,因A 对称,故λ1p 1′=(λ1 p 1)′=(Ap 1)′= p 1′A ′=p 1′A ,于是λ1 p 1′p 2=p 1′Ap 2= p 1′(λ2p 2)= λ2 p 1′p 2即(λ1-λ2)p 1′p 2=0,但λ1≠λ2,故p 1′p 2=0,即p 1与p 2正交.定理8 设A 为实对称矩阵,则必存在正交矩阵T ,使121,n λλλ-⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎣⎦T AT A 其中λ1,λ2,…,λn 是A 的特征值.在这里,我们主要介绍如何具体算出上述正交矩阵T ,由于T 是正交矩阵,所以T 的列向量组是正交的单位向量组,且如前所述,T 的列向量组是由A 的n 个线性无关的特征向量组成,因此对T 的列向量组有三条要求:1°每个列向量是特征向量. 2°任意两个列向量正交. 3°每个列向量是单位向量.于是求正交矩阵T 使T -1AT 为对角矩阵的具体步骤如下: 第一步:求出A 的所有不同的特征值λ1,λ2,…,λs .第二步:求出A 对应于每个特征值λi 的一组线性无关的特征向量,即求出齐次线性方程组(A-λi E )x =0的一个基础解系.并且利用Schmidt 正交化方法,把此组基础解系正交规X 化,再由定理7知对应于不同特征值的特征向量正交,如此可得A 的n 个正交的单位特征向量.第三步:以上面求出的n 个正交的单位特征向量作为列向量所得的n 阶方阵即为所求的正交矩阵T ,以相应的特征值作为主对角线元素的对角矩阵,即为所求的T -1AT .例11 设A =122212221⎡⎤⎢⎥⎢⎥⎢⎥⎣⎦,求正交矩阵T ,使T -1AT 为对角矩阵.解 显然A ′=A .故一定存在正交矩阵T ,使T -1AT 为对角阵.第一步:先求A 的特征值,由2122522212512221521122(5)(5)(1)0(1)000(1)λλλλλλλλλλλλλλ--==-------=-=-+-+-+A E求得A 的特征值为λ1=-1(二重),λ2=5.第二步:对于λ1=-1,求解齐次线性方程组(A +E )x =0.由222111222000222000⎡⎤⎡⎤⎢⎥⎢⎥+=→⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦A E求得一基础解系为1211,.1001--⎡⎤⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦αα正交化:令[][]1112221111101112101122101,,.,-⎡⎤⎢⎥==⎢⎥⎢⎥⎣⎦⎡⎤-⎢⎥--⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥=-=-=⎢⎥⎢⎥⎢⎥-⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎢⎥⎣⎦βαβαβαβββ再单位化,令121212,.0⎡⎡⎢⎢⎢⎢⎛⎫⎢===⎢⎥ ⎪⎢ ⎪⎢⎥⎝⎭⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦ββγγββ对于λ2=5,求解齐次线性方程组(A -5E )x =0,由4222242241125242242066011224224000000------⎡⎤⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥-=-→-→-→-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦⎣⎦A E求得它的一基础解系为31.11⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦α这里只有一个向量,只要单位化,得333.=αγα 第三步:以正交单位向量组123,,γγγ为列向量的矩阵T 就是所求的正交矩阵,即123(,,).0⎡⎢⎢⎢==⎢⎢⎢⎥⎢⎣T γγγ 有1100.010005--⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦T AT例12 设73113711.11731137--⎡⎤⎢⎥--⎢⎥=⎢⎥--⎢⎥--⎣⎦A 求正交矩阵T ,使T -1AT 为对角矩阵.解731143113711471111734173113741371311102201022(4)(4)48404842260226122212(4)(4)(12)1284026λλλλλλλλλλλλλλλλλλλλλλλλλλλ------⎡⎤⎡⎤⎢⎥⎢⎥------⎢⎥⎢⎥==-⎢⎥⎢⎥------⎢⎥⎢⎥-------⎣⎦⎣⎦------=-=------------=-=-------A E 22184026122(4)(12)(4)(8)(12).062026λλλλλλλλλ-----=--=-------求得A 的不同特征值λ1=4(二重),λ2=8,λ3=12.对于λ1=4.求解齐次线性方程组(A -4E )x =0,由3311113311333311008800114113300880000113300000000------⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥----⎢⎥⎢⎥⎢⎥-=→→⎢⎥⎢⎥⎢⎥---⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦A E 求得一组基础解系为121010,.0101⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦αα显然1α与2α正交,只要单位化,即12121200,;2002⎡⎤⎢⎥====⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦ααγγαα 对于λ2=8,相似地可求得齐次线性方程组(A -8E )x =0的一组单位化的基础解系31212;1212⎡⎤-⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥-⎢⎥⎢⎥⎢⎥⎣⎦γ对于λ3=12,相似地可求得对应的单位特征向量41212.1212⎡⎤⎢⎥⎢⎥⎢⎥-⎢⎥=⎢⎥⎢⎥-⎢⎥⎢⎥⎢⎥⎣⎦γ于是1234110222110222(,,,)1102211022⎤-⎥⎥⎥⎥⎢⎥==⎢⎥-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦T γγγγ 即为所求的正交矩阵,且140000400.00800012-⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦T AT§4 化二次型为标准型前面我们主要研究线性问题,但在实际问题中还存在大量非线性问题,其中最简单的模型就是二次型,本节用矩阵工具来研究二次型,介绍化二次型为标准型的几种方法.定义8n 元变量12,,,n x x x 的二次齐次多项式2221211122212121123231,1(,,,)2222n nn n n n n n n nf x x x a x a x a x a x x a x x a x x a x x --=+++++++++ (5.4)称为二次型.当a ij 为复数时,f 称为复二次型,当a ij 为实数时, f 称为实二次型,我们仅限于讨论实二次型.取a ji =a ij ()i j <则2a ij x i x j =a ij x i x j +a ji x j x i .于是(5.4)式可写成对称形式2211112121121212222221122,1.n n n n n n n n nn nnij iji j f a x a x x a x x a x x a x a x x a x x a x x a x a x x ==++++++++++++=∑ (5.5)记11121121222112,,n n n n nn n a a a x a a a x a a a x ⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦A x (5.6)则(5.5)式可以用矩阵形式简单表示为11121121222112,112(,,,)n nn ij i j n i j n n nn n a a a x a a a x f a x x x x x a a a x =⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦'=∑x Ax,其中A 为实对称矩阵.例如,二次型22224265f x xy y xz yz z =++--+用矩阵表示就是:111(,,).143135x f x y z y z -⎡⎤⎡⎤⎢⎥⎢⎥=-⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦显然这种矩阵表示是惟一的,即任给一个二次型就惟一确定一个对称矩阵,反之任给一个对称矩阵也可惟一确定一个二次型.即二者之间存在一一对应关系,我们把对称矩阵A 称为二次型f 的矩阵,A 的秩称为f 的秩.也称f 为对称矩阵A 的二次型.在平面解析几何中讨论二次曲线时,经常采用的是把二次曲线的一般方程2221ax bxy cy ++=通过坐标变换化成标准型221mx ny ,''+=再根据标准型作出曲线形状的判断.在这里,我们对二次型也类似地进行讨论.即对于一般的二次型12,1(,,,),nn ij i j i j f x x x a x x ='==∑x Ax找到一个非退化的线性变换(即C 是n 阶可逆矩阵)x =Cy ,使得2211()()().n n f y y k y k y ''''====++x Ax Cy A Cy C AC即利用非退化线性变换将二次型化为只含平方项的形式.这种只含平方项的二次型,称为二次型的标准型(或法式).定理9任给可逆矩阵C ,令B =C ′AC ,如果A 为对称矩阵,则B 亦为对称矩阵,且R (B )=R (A ).此时,也称A 与B 合同.证 因A ′=A ,故B ′=(C ′AC )′=C ′A ′C =C ′AC =B 即B 为对称矩阵.又因为B =C ′AC ,而C ′与C 均为可逆矩阵,故A 与B 等价,于是R (B )=R (A ). 这定理说明经可逆变换x =Cy 后,二次型f 的矩阵A 变为对称矩阵C ′AC ,且二次型的秩不变.矩阵的合同关系与相似关系一样,都满足反身性,对称性,传递性.要使二次型f 经可逆变换x =Cy 变成标准型,这就是要使2221122112212(,,,),n nn n n k y k y k y k y k y y y y k y ''=+++⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦y C ACy 也就是要使C ′AC 成为对角矩阵.因此,问题归结为:对于对称矩阵A ,寻求可逆矩阵C ,使C ′AC 为对角矩阵.由上节的定理8知,任给实对称矩阵A ,总有正交矩阵T ,使T-1AT =Λ即T ′AT =Λ为对角矩阵.把此结论应用于二次型,即有如下定理.定理10任给二次型f =,1nij iji j a x x=∑,总有正交变换x =Ty ,使f 化成标准型2221122,n n f y y y λλλ=+++其中12,,,n λλλ是f 的矩阵A =(a ij )的特征值.用正交变换把二次型化为标准型,这在理论上和实际应用上都是非常重要的,而此方法的具体步骤就是上节所介绍的化实对称矩阵为对角矩阵的三个步骤.例13 求一个正交变换x =Ty ,把二次型121323241434222222f x x x x x x x x x x x x =+-+-+化为标准型.解f 的矩阵是301111011,11011110111111(1)(3).111111λλλλλλλ-⎡⎤⎢⎥-⎢⎥=⎢⎥-⎢⎥-⎣⎦--⎡⎤⎢⎥--⎢⎥-==---+⎢⎥--⎢⎥--⎣⎦A A E于是A 的全部特征值为λ1=1(三重),λ2=-3.对于λ1=1.解齐次线性方程组(A -E )x =0,由1111111111110000,111100001111000----⎡⎤⎡⎤⎢⎥⎢⎥--⎢⎥⎢⎥-=→⎢⎥⎢⎥--⎢⎥⎢⎥--⎣⎦⎣⎦A E 求得一组基础解系123111100,,.010001ααα-⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥===⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦令[][][][][][]11122211113233312112211,001112011,1,210,210001112011,,11200,,231100⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎣⎦⎡⎤⎢⎥⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥-=-=-=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎢⎥⎣⎦⎡⎤⎢⎥-⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥-=--=++⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎢⎥⎣⎦βαβαβαββββαβαβαββββββ131.3131⎡⎤-⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦再令31212312362,,.2062βββγγγβββ⎡⎡⎤⎢⎢⎥⎢⎥⎢⎢⎢⎥⎢⎢⎥⎢⎢⎥======⎢⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥⎣⎦⎣⎦对于λ2=-3.解齐次线性方程组(A+3E)x=0,由311111131311010131131001111130000----⎡⎤⎡⎤⎢⎥⎢⎥-⎢⎥⎢⎥+=→⎢⎥⎢⎥-⎢⎥⎢⎥-⎣⎦⎣⎦A E,求得一组基础解系为4444121112.112112ααγα⎡⎤⎢⎥⎢⎥⎡⎤⎢⎥-⎢⎥-⎢⎥⎢⎥===⎢⎥⎢⎥-⎢⎥-⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥⎣⎦,令取正交矩阵123412662122(,,,),121002γγγγ⎤-⎥⎥⎥-⎥⎢⎥==⎢⎥-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦T再令x=Ty,则可得22221234()3.f y y y y y'''===++-x Ax y T AT例14 已知二次型22212312323(,,)2332(0)f x x x x x x ax x a=+++>,通过正交变换可化为标准型22212325f y y y=++,求参数a及所用的正交变换.分析由于二次型f'=x Ax通过正交变换x=Ty化成的标准型2221122n n f y y y λλλ=+++中的平方项系数12,,,n λλλ是A 的特征值,而且变换前后两个二次型的矩阵有下面的关系:12n λλλ⎡⎤⎢⎥⎢⎥'=⎢⎥⎢⎥⎣⎦T AT 所以上式两边取行列式即可求得参数a .解 变换前后二次型的矩阵分别为2001032035a a Λ⎡⎤⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦A设所求正交矩阵为T ,则有T ′AT =Λ,此时两边取行列式,并注意到|T |=±1,得 |T ′||A ||T |=|T |2|A |=|A |=|Λ| 即2(9-a 2)=10.由a >0,得a =2.因为A 的特征值为λ1=1,λ2=2,λ3=5.当λ1=1时,解齐次方程组(A -E )x =0,得特征向量为1011ξ⎡⎤⎢⎥=⎢⎥⎢⎥-⎣⎦同理,可求得与λ2=2,λ3=5对应的特征向量分别为23100,1.01⎡⎤⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦ξξ又因为对应于不同特征值的特征向量是相互正交的,所以123,,ξξξ是正交向量组,将它们单位化得112233123001111,0,.0ξξξξξξ⎡⎤⎡⎤⎢⎥⎢⎥⎡⎤⎢⎥⎢⎥======⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎢⎢⎣p p p 以p 1,p 2,p 3为列即得所求的正交矩阵1230100(,,).0⎡⎤⎢⎥⎢==⎢⎢⎢⎢⎣T p p p 用正交变换化二次型为标准型,具有保持几何形状不变的优点.如果不限于用正交变换,那么还可有多种方法把二次型化成标准型.如配方法,初等变换法等等,下面通过实例来介绍配方法和初等变换法.例15 化二次型22212312132325226f x x x x x x x x x =+++++成标准型,并求所用的变换矩阵.解 由于f 中含变量x 1的平方项,故把含x 1的项归并起来配方可得.22211213232322222123232323232221232233(22)256()2256()44.f x x x x x x x x x x x x x x x x x x x x x x x x x x x =++++=++---+++=+++++ 上式右端除第一项外已不再含x 1,继续配方,得2212323()(2).f x x x x x =++++令 112322333,2,,y x x x y x x y x =++⎧⎪=+⎨⎪=⎩即 112322333,2,,x y y y x y y x y =-+⎧⎪=-⎨⎪=⎩就把f 化成标准型2212f y y =+.所用变换矩阵为 111(10).012001-⎡⎤⎢⎥==≠-⎢⎥⎢⎥⎣⎦C C例16 化二次型121323226f x x x x x x =+-成标准型,并求所用的变换矩阵.解 在f 中不含平方项,由于含有12x x 乘积项,故令11221233,,,x y y x y y x y =+⎧⎪=-⎨⎪=⎩ 代入可得221213132248.f y y y y y y =--+再配方,得222131332()2(2)6.f y y y y y =---+故令 11322333,2,,z y y z y y z y =-⎧⎪=-⎨⎪=⎩即 11322333,2,,y z z y z z y z =+⎧⎪=+⎨⎪=⎩即有222123226f z z z =-+,所用变换矩阵为 110101113(20).110012111001001001⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥===-≠---⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦C C一般地,任何二次型都可用上面两例的方法找到可逆变换化成标准型,且由定理9可知,标准型中所含有的项数就是二次型的秩.我们知道化二次型为标准型就是寻求可逆矩阵C ,使C ′AC 成为对角矩阵.这里A 为二次型的矩阵,而任一可逆矩阵又可分解为若干初等矩阵之积.从而我们有定理11对实对称矩阵A ,一定存在一系列初等矩阵E 1,E 2,…E s ,使得211212n diag(,,,).s s d d d '''=E E E AE E E关于初等矩阵,易见(,)(,),(())(()),(())(()).i j i j i k i k i j k i j k '''==+=+E E E E E E记12,,,s =C E E E .则上述定理还表明:对A 同时施行一系列同类的初等行、列变换,得到对角矩阵,而相应地将这一系列的初等列变换施加于单位阵,就得到变换矩阵C .其具体做法是将n 阶单位阵E 放在二次型的矩阵A 的下面,形成一个2n ×n 矩阵.对此矩阵作相同的行、列变换,把A 化成对角形的同时,把单位阵化成了可逆变换矩阵C ,这就是初等变换法.例17 用初等变换法将例15中二次型化为标准型. 解 二次型f 的矩阵(21(1))(31(1))(32(2))(21(1))(32(2))(31(1))111,123135111100100123012010135024000100111111010010012001001001r r r c c c +-+-+-+-+-+-⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦⎡⎤⎡⎤⎡⎢⎥⎢⎥⎢⎢⎥⎢⎥⎢⎢⎥⎢⎥⎢⎡⎤=−−−−→−−−−→⎢⎥⎢⎥⎢⎥---⎣⎦⎢⎥⎢⎥⎢⎥⎢⎥-⎢⎥⎢⎥⎣⎦⎣⎦⎣A A E ,⎤⎥⎥⎥⎢⎥⎢⎥⎢⎥⎢⎥⎦故令111,012001-⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦x y则2212f y y =+ 例18 用初等变换法将例16中二次型化为标准型.解 所给二次型f 的矩阵1212(12(1))(31(1))(12(1))1212(31(1))011,1031300112121031031302301001000101100010012000r r r c c c ⎛⎫⎛⎫+- ⎪ ⎪⎝⎭⎝⎭+++⎛⎫⎛⎫+- ⎪ ⎪⎝⎭⎝⎭+⎡⎤⎢⎥=-⎢⎥⎢⎥-⎣⎦-⎡⎤⎡⎤⎢⎥⎢⎥--⎢⎥⎢⎥⎢⎥⎢⎥---⎡⎤=−−−−→−−−−→⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦-A A E (32(4))(32(4))2001120022022006,1111132211111122001001r c +-+-⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥--⎢⎥⎢⎥⎢⎥⎢⎥--⎢⎥⎢⎥−−−−→⎢⎥⎢⎥--⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦ 故1132,1112001⎡⎤-⎢⎥⎢⎥=⎢⎥-⎢⎥⎢⎥⎣⎦x y 则222123126.2f y y y =-+§5 正定二次型——符号差也不变).即有如下定理.定理12(惯性定理) 设有二次型f =x ′Ax ,它的秩为r ,有两个实的非退化线性变换x =Cy ,及x =Pz ,使2221122(0)r r i f k y k y k y k =+++≠及2221122(0),r r i f z z z λλλλ=+++≠则12,,,r k k k 中正数的个数与12,,,r λλλ中正数的个数相同.定义9 二次型f (x 1, x 2,…, x r )的标准型中,系数为正的平方项的个数p 称为此二次型的正惯性指数,系数为负的平方项的个数r -p 称为负惯性指数,s =2p -r 称为符号差.这里r 为二次型f 的秩.比较常用的二次型是p =n 的情形.定义10 设有二次型f (x )=x ′Ax ,如果对任何x ≠0,都有f (x )>0(显然f (0)=0),则称f 为正定二次型,称A 为正定矩阵;如果对任何x ≠0,都有f (x )<0,则称f 为负定二次型,其矩阵A 为负定矩阵.定理13f =x ′A x 为正定二次型的充分必要条件是:它的正惯性指数等于n . 证 设可逆变换x =Cy ,使f (x )=f (Cy )=21ni ii k y=∑.设k i >0(i =1,2,…,n ),任给x ≠0,有y =C-1x ≠0,从而f (x )=f (Cy )=210ni ii k y=>∑,即f 是正定二次型.反之假设有某个s (1≤s ≤n ),使k s ≤0.则当y =e s 时f (Ce s )= k s ≤0.这与f 为正定相矛盾.故必有k i >0(i =1,2,…,n ).推论 对称矩阵A 正定,当且仅当A 的特征值全为正.完全相似地,我们有二次型f 为负定二次型当且仅当它的负惯性指数等于n ,对称矩阵A 为负定矩阵当且仅当它的所有特征值全为负.下面我们不加证明的介绍判定矩阵正(负)定的一个充分必要条件,即 定理14对称矩阵A 正定,当且仅当A 的各阶(顺序)主子式全为正,即:1112121222120,1,2,,.r r r r rra a a a a a r n a a a >=对称矩阵A 负定当且仅当A 的奇数阶(顺序)主子式为负,偶数阶(顺序)主子式为正,即:111212122212(1)0,1,2,,.r r rr r rra a a a a a r n a a a ->=例19 判定112312323320(,,)(,,)230001x f x x x x x x x x ⎡⎤⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦的正定性. 解 由|A -λE |=(1-λ)2(5-λ),得A 的特征值为1,1,5.根据定理13之推论知,A 为正定矩阵,从而f 为正定二次型.例20 判别二次型f (x ,y ,z )=-5x 2-6y 2-4z 2+4xy +4xz的正定性.解f 的矩阵为522.260204-⎡⎤⎢⎥=-⎢⎥⎢⎥-⎣⎦A因 11121121225250,260,800,26a a a a a -=-<==>=-<-A则根据定理14知f 为负定二次型.例21 设22212312132344224f x x x x x x x x x λ=+++-+,问λ取何值时,f 为正定二次型. 解f 的矩阵11.42124λλ-⎡⎤⎢⎥=⎢⎥⎢⎥-⎣⎦A由1112211212210,4,4(1)(2),a a a a a λλλ=>=-=--+A根据定理12知当240,4(1)(2)0λλλ⎧->⎨--+>⎩ 即-2<λ<1时所给二次型f 正定.例22 证明若A =(a ij )为正定矩阵.则a ij >0(i =1,2,…,n ). 证 因为A 正定,故对任何x ≠0,有x ′Ax >0,取x =e i 则有x ′Ax =a ii >0(i =1,2,…,n ).类似地若A 负定,则a ii <0.此例表明主对角线上元素均大于零是A 正定的必要条件,但它并非充分条件,例如12,21-⎡⎤=⎢⎥-⎣⎦A有a 11=a 22=1>0,但因|A |=-3<0,故A 不是正定的.最后,作为选讲内容,我们利用二次型的正定性研究多变量函数的极值问题.设n 元函数f (x 1,x 2,…,x n )在点00012(,,,)n P x x x 的某个邻域内有二阶连续偏导数,由多元函数的 泰勒(Taylor )公式得000001122120001212122000121212(Δ,Δ,,Δ)(,,,)ΔΔΔ(,,,)1ΔΔΔ(,,,),2!n n n nn n n n n f x x x x x x f x x x x x x f x x x x x x x x x f x x x R x x x +++-∂∂∂⎛⎫+++= ⎪∂∂∂⎝⎭∂∂∂⎛⎫+++++ ⎪∂∂∂⎝⎭简写为矩阵表达式001(Δ)(),2f P P f P R ''+-=++x x Ax ϕ 其中00000120001122()(,,,),(Δ)(Δ,Δ,,+Δ),n nn f P P x x x f P P f x x x x x x =+=++0022221121112222222122222212ΔΔ,,Δn n n n P n n n Pf ff f x x x x x x x f f f f x x x x x x x x f f f f x x x x x x ⎡⎤∂∂∂∂⎡⎤⎢⎥⎢⎥∂∂∂∂∂∂⎢⎥⎢⎥⎡⎤⎢⎥∂⎢⎥∂∂∂⎢⎥⎢⎥⎢⎥⎢⎥∂==∂∂∂∂∂⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦∂⎢⎥∂∂∂⎢⎥⎢⎥⎢⎥∂∂∂∂∂∂⎣⎦⎣⎦x A =ϕ显然A 为实对称矩阵,由高等数学知,函数f (P )在0P 处有极值的必要条件是ϕ为零向量,即0,1,2,,.iP f i n x ∂==∂在此条件下,点P 0为f 的驻点,这时有001(Δ)()2f P P f P R '+-=+x Ax . 当Δ(1,2,,)i x i n =足够小时,上式右端正负号完全由二次型x ′Ax 来决定,故若这二次型的秩为n ,则(1) 当x ′Ax 为正定时,P 0为f 的一个极小值点. (2) 当x ′Ax 为负定时,P 0为f 的一个极大值点. (3) 当x ′Ax 为不定时,P 0不是f 的极值点.当x ′Ax 的秩小于n 时,要决定f 在点P 0的性态,还需研究余项R ,这里就不再讨论了. 当n =2时,就得到熟知的二元函数在P 0有极值的充分条件,即若120P P f f x x ∂∂==∂∂记00222221122,,P P P f f f a b c x x x x ∂∂∂===∂∂∂∂,得A =a b b c ⎡⎤⎢⎥⎣⎦.于是当R (A )=2时,有(1) A 正定时,f (P 0)为极小值;(2) A 负定时,f (P 0)为极大值; (3) A 不定时,f (P 0)不是极值.例23 求函数f (x ,y )=3xy -x 3-y 3的极值. 解 解方程组22330,330f y x xfx y y∂⎧=-=⎪∂⎪⎨∂⎪=-=∂⎪⎩ 得驻点P 1(0,0),P 2(1,1).又因为222226,3,6,f f fx y x x y y∂∂∂=-==-∂∂∂∂,所以在P 1处有1103,030⎡⎤=≠⎢⎥⎣⎦A A 且1A 为不定,故f (P 1)非极值,而在P 2处,有2263,036-⎡⎤=≠⎢⎥-⎣⎦A A ,且2A 负定,故f (P 2)为极大值.习 题 五1. 计算[],αβ.(1)(1,0,3,5),(4,2,0,1);12(2),.,123423αβαβ=--=-⎤⎡⎤==----⎢⎥⎢⎥⎣⎦⎣⎦ 2. 把下列向量单位化.(1) α=(3,0,-1,4);(2) α=(5,1,-2,0). 3. 利用施密特正交化方法把下列向量组正交化.(1) α1 =(0,1,1)′, α2 =(1,1,0)′, α3 =(1,0,1)′; (2) α1 =(1,0,-1,1), α2 =(1,-1,0,1), α3 =(-1,1,1,0)4. 试证,若n 维向量α与β正交,则对于任意实数k ,1,有k α与l β正交.5. 下列矩阵是否为正交矩阵.111101023101011(1);.1010122110101132⎡⎤-⎢⎥⎡⎤⎢⎥⎢⎥-⎢⎥⎢⎥-⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎢⎥-⎢⎥⎣⎦6. 设x 为n 维列向量,x ′x =1,令H =E -2xx ′.求证H 是对称的正交矩阵.7. 设A 与B 都是n 阶正交矩阵,证明AB 也是正交矩阵.8. 判断下列命题是否正确.(1) 满足Ax =λx 的x 一定是A 的特征向量;(2) 如果x 1,…,x r 是矩阵A 对应于特征值λ的特征向量.则k 1x 1+k 2x 2+…+k r x r 也是A 对应于λ的特征向量;(3) 实矩阵的特征值一定是实数. 9. 求下列矩阵的特征值和特征向量.62423(1),(2),2323142623142200121(3),(4).21201220200112⎡⎤-⎡⎤⎢⎥⎢⎥⎢⎥-⎣⎦⎢⎥⎣⎦--⎡⎤-⎡⎤⎢⎥--⎢⎥⎢⎥--⎢⎥⎢⎥-⎢⎥-⎢⎥⎣⎦⎣⎦10. 设3阶方阵A 的特征值为λ1=1,λ2=0,λ3=-1,对应的特征向量依次为123122,,,221212-⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥===--⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦x x x求矩阵A .11. 设3阶实对称矩阵A 的特征值为-1,1,1,与特征值-1对应的特征向量x =(-1,1,1)′,求A .12. 若n 阶方阵满足A 2=A ,则称A 为幂等矩阵,试证,幂等矩阵的特征值只可能是1或者是零.13. 若A 2=E ,则A 的特征值只可能是±1.14. 设λ1,λ2是n 阶矩阵A 的两个不同的特征根,α1,α2分别是A 的属于λ1, λ2的特征向量,证明α1+α2不是A 的特征向量.15. 求正交矩阵T ,使T -1AT 为对角矩阵.022124(1),(2),23423224342141013201410(3),(4).22201410211014-⎡⎤⎡⎤⎢⎥⎢⎥==---⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦-⎡⎤-⎡⎤⎢⎥-⎢⎥⎢⎥==--⎢⎥⎢⎥-⎢⎥-⎢⎥⎣⎦-⎣⎦A A A A16. 设矩阵20022211x -⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦A 与10002000y -⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦B 相似.(1) 求x 与y ;(2) 求可逆矩阵P ,使P -1AP =B .17. 设111001023-⎡⎤⎢⎥=⎢⎥⎢⎥-⎣⎦A , 求A 100. 18.将下列二次型用矩阵形式表示.(1) f (x 1,x 2,x 3)=22212312233125262x x x x x x x x x -++++;(2) f (x 1, x 2, x 3, x 4)=12233441x x x x x x x x +++;(3) f (x 1, x 2, x 3, x 4)=22112131422463252x x x x x x x x x x +-++-.18. 写出二次型f (x 1, x 2, x 3)=(a 1x 1+ a 2x 2+a 3x 3)2的矩阵.20. 当t 为何值时,二次型f (x 1,x 2,x 3)=222112132233642x x x x x x x x tx +++++的秩为2. 21. 已知二次型222123121213232222f x x x ax x x x x x bx x =++++++经过正交变换化为标准型22232f y y =+,求参数a ,b 及所用的正交变换矩阵.22. 用配方法把下列二次型化为标准型,并求所作变换.221231213231231213(1)(,,)248;(2)(,,)24.f x x x x x x x x x f x x x x x x x =+--=+23. 用初等变换法化下列二次型为标准型,并求所作变换.31 / 31 1234121314232434212311223(1)(,,,);(2)(,,)254.f x x x x x x x x x x x x x x x x f x x x x x x x x =++++-=+-24. 设二次型123121323(,,)222,f x x x x x x x x x =-+(1) 用正交变换化二次型为标准型;(2) 设A 为上述二次型的矩阵,求A 5. 25. 求正交变换,把二次曲面方程2221231213232554481x x x x x x x x x +++--=化成标准方程.26. 判断下列二次型的正定性.22212312232221231223222112132233(1)26422;(2)3454;(3)9912481306071.f x x x x x x x f x x x x x x x f x x x x x x x x x =---++=+++-=-++-+27. t 满足什么条件时,下列二次型是正定的.222123122322(1)4222;(2)2222.f x x x tx x x x f x y xy xz tyz =++++=++-+28. 假设把任意x 1≠0,x 2≠0,…,x n ≠0代入二次型f (x 1,x 2,…,x n )都使f >0,问f 是否必然正定?29. 试证:如果A,B 都是n 阶正定矩阵,则A+B 也是正定的.30. 试证:如果A 是n 阶可逆矩阵,则A ′A 是正定矩阵.31. 试证:如果A 正定,则A ′,A -1,A都是正定矩阵.。
线性空间与线性变换线性空间和线性变换是线性代数中的重要概念,在数学和物理等领域有着广泛的应用。
本文将介绍线性空间和线性变换的概念、性质以及它们之间的关系。
一、线性空间的定义和性质线性空间是指具有加法运算和数乘运算的集合,满足以下条件:1. 加法运算闭合性:对于任意两个向量u和v,它们的和u+v仍然属于该集合。
2. 加法交换律:对于任意两个向量u和v,有u+v = v+u。
3. 加法结合律:对于任意三个向量u、v和w,有(u+v)+w =u+(v+w)。
4. 存在零向量:存在一个特殊的向量0,使得对于任意向量v,有v+0 = v。
5. 对于任意向量v,存在其负向量-u,使得v+(-u) = 0。
6. 数乘运算闭合性:对于任意标量c和向量v,它们的乘积cv仍然属于该集合。
7. 数乘结合律:对于任意标量c和d以及向量v,有(c+d)v = cv+dv。
8. 数乘分配律1:对于任意标量c以及向量u和v,有c(u+v) =cu+cv。
9. 数乘分配律2:对于任意标量c和d以及向量v,有(cd)v = c(dv)。
线性空间的例子包括n维向量空间和函数空间等。
它们满足上述定义中的所有条件。
二、线性变换的定义和性质线性变换是指将一个线性空间映射到另一个线性空间的映射,满足以下条件:1. 对于任意向量v和w以及标量c,线性变换T满足T(v+w) =T(v)+T(w)和T(cv) = cT(v)。
2. 线性变换T保持向量的线性组合关系,即对于任意向量v1、v2、...、vn和标量c1、c2、...、cn,有T(c1v1+c2v2+...+cnvn) =c1T(v1)+c2T(v2)+...+cnT(vn)。
3. 线性变换T将零向量映射为目标线性空间的零向量。
线性变换的例子包括平移、旋转和缩放等。
它们保持向量空间的线性结构和线性关系。
三、线性空间与线性变换的关系线性空间和线性变换之间存在着密切的联系。
给定一个线性空间V,定义一个线性变换T:V→W,其中W是另一个线性空间。
说明:1.本总结只是把课本的重点知识总结了一下,我没有看到期末考试题,所以考着了算是侥幸,考不着也正常。
2.知识点会了不一定做的对题,所以还要有相应的练习题。
3.前后内容要贯穿起来,融汇贯通,建立自己的知识框架。
第一章行列式1.行列式的定义式(两种定义式)-->行列式的性质-->对行列式进行行、列变换化为上下三角(求行列式的各种方法逐行相加、倒叙相减、加行加列、递推等方法,所有方法是使行列式出现尽可能多的0为依据的)。
2.行列式的应用——>克拉默法则(成立的前提、描述的内容、用途,简单的证明可从逆矩阵入手)。
总结:期末第一章可能不再单独考,但会在求特征值/判断正定性等内容时顺便考察行列式的求解。
第二章矩阵1.矩阵是一个数组按一定的顺序排列,和行列式(一个数)具有天壤之别。
2.高斯消元法求线性方程组的解—>唯一解、无解、无穷解时阶梯型的样子(与第三章解存在的条件以及解的结构联系在一起)3.求逆矩阵的方法(初等变换法,I起到记录所有初等变换的作用)、逆矩阵与伴随矩阵的关系。
4.初等矩阵和初等变换的一一对应关系,学会由初等变换找出与之对应的初等矩阵。
5.分块矩阵(运用分块矩阵有时可以很简单的解决一些复杂问题)记得结论A 可逆,则)A -(1|A |A -1T T αααα=+。
第三章 线性方程组第三章从向量组的角度入手,把线性方程组的系数矩阵的每一列看作一个列向量,从而得到一个向量组假设为n 21,,,ααα ,右边常则看作一个向量β,1)若向量β被向量组n 21,,,ααα 表出唯一(即满足关系:n n n ==),,,,(r ),,,(r 2121βαααααα 时,因为只有向量组n 21,,,ααα 线性无关才表出唯一),则只有唯一解;2)若β不能由向量组n 21,,,ααα 线性表出(即满足条件),,,,(r 1),,,(r 2121βααααααn n =+时)则无解;3)若β由向量组n 21,,,ααα 表出不唯一(即满足条件n n n <=),,,,(r ),,,(r 2121βαααααα 时,只有n 21,,,ααα 线性相关才表出不唯一)有无穷解。
线性空间与线性变换线性空间(也称为向量空间)是线性代数的基本概念之一。
它是指由向量集合组成的集合,满足特定的运算规则。
线性空间中的向量可以是实数域上的实向量,也可以是复数域上的复向量。
线性空间的定义涵盖了许多重要的数学概念和定理,在各个领域中都有广泛的应用。
一、线性空间的定义线性空间的定义遵循以下几个基本条件:1. 封闭性:对于线性空间V中任意向量u和v,它们的线性组合也属于V。
即对于任意的标量a和b,有a*u + b*v∈V。
2. 加法结合性:对于线性空间V中任意向量u、v和w,有(u+v)+w = u+(v+w)。
3. 加法交换性:对于线性空间V中任意向量u和v,有u+v = v+u。
4. 零向量存在性:存在一个特殊的向量0,满足对于线性空间V中任意向量u,有u+0 = u。
5. 加法逆元存在性:对于线性空间V中任意向量u,存在一个向量-v,使得u+(-v) = 0。
6. 数量乘法结合性:对于线性空间V中任意的标量a、b和向量u,有(a*b)*u = a*(b*u)。
7. 标量乘法分配律:对于线性空间V中任意的标量a和向量u、v,有a*(u+v) = a*u + a*v。
8. 向量乘法分配律:对于线性空间V中任意的标量a和b,以及向量u,有(a+b)*u = a*u + b*u。
二、线性变换的定义与性质线性变换是一种将一个线性空间映射到另一个线性空间的函数。
线性变换也被称为线性映射或线性算子。
线性变换保持线性空间的线性结构,即对于线性空间V中任意的向量u和v,以及标量a和b,有以下性质:1. 线性变换将零向量映射到零向量,即T(0) = 0,其中T表示线性变换。
2. 线性变换保持向量的线性组合,即对于线性空间V中任意的向量u和v,以及标量a和b,有T(a*u + b*v) = a*T(u) + b*T(v)。
3. 线性变换的像空间是一个线性空间,即对于线性空间V中的线性变换T,其像空间W也是一个线性空间。