直和分解与秩的关系
- 格式:pdf
- 大小:176.09 KB
- 文档页数:7
讨论Jordan 标准形及其过渡矩阵的求法摘要:本文较系统的总结了Jordan 标准形及其过渡矩阵的通用的求法。
关键字:Jordan 标准形,特征向量,过渡矩阵一、求解Jordan 标准形1、通过λ-矩阵求Jordan 标准形定义1:P 是一个数域,λ是一个文字,作多项式环[]P λ。
一个矩阵,若它的元素是λ的多项式,称其为λ-矩阵,用(),(),A B λλ 表示。
定义2:设λ-矩阵()A λ的秩为r ,对于正整数,1k k r ≤≤,()A λ中必有非零的k 级子式,()A λ中全部k 级子式的首相系数为1的最大公因式()k D λ称为()A λ的k 级行列式因子。
定义3:λ-矩阵的初等变换:(,)P i j 、(())P i c 、(,())P i j ϕ。
若()A λ经过有限次初等变换变为()B λ,称()A λ与()B λ等价。
在初等变换过程中,行列式因子是不变的,也就是说等价的λ-矩阵具有相同的行列式因子。
对任意一个非零的s n ⨯的λ-矩阵()A λ进行有限次适当的初等变换总能将其化为以下形式的λ-矩阵12()()()00r d d d λλλ⎛⎫ ⎪⎪⎪ ⎪⎪ ⎪ ⎪⎪ ⎪⎝⎭其中1,()(1,2,)i r d i r λ≥= 是首项系数为1的多项式,且1()()(1,2,1)i i d d i r λλ+=- 。
称其为()A λ的标准形。
依据以上论述可以求得:121()()()()(),()(1,2,)()i k k i i D D d d d d i r D λλλλλλλ-=== ,因此可以断定λ-矩阵的标准形是唯一的。
我们称标准形的主对角线上非零元素()i d λ为()A λ的不变因子;将不变因子分解成为互不相同的首项为1的一次因式方幂的乘积,所有这些一次因式方幂(相同的按出现的次数计算)称为()A λ的初等因子。
下面给出一个定理。
定理2:,A B 为数域P 上n 级矩阵,(),()A B λλ分别为,A B 的特征矩阵。
二、主要复习内容:1. 行列式行列式的定义、性质和常用计算方法(如:三角化法、加边法、降阶法、递推法、裂项法、范得蒙行列式法、数学归纳法、作辅助行列式法)。
重点:n阶行列式的计算。
2. 矩阵理论矩阵的运算,分块矩阵的初等变换与矩阵的秩,可逆矩阵与伴随矩阵,矩阵的三种等价关系(等价、合同、相似),矩阵的特征值和特征向量,矩阵的迹,矩阵的最小多项式,矩阵的对角化,矩阵的常用分解(如:等价分解,满秩分解,实对称矩阵的正交相似分解,实可逆阵的正交三角分解,Jordan分解),几种特殊矩阵的常用性质(如:准对角阵,对称阵与反对称阵,幂等阵,幂零阵,对合阵,正交阵)。
重点:利用分块矩阵的初等变换证明有关矩阵秩的等式与不等式,矩阵的逆与伴随矩阵的性质与求法,矩阵的三种等价关系的关系,矩阵对角化的判断(特别是多个矩阵的同时对角化问题)和证明,矩阵分解的证明及应用(特别是实对称矩阵的正交相似分解,Jordan 标准型的计算与有关证明)。
3. 线性方程组Cramer法则,齐次线性方程组有非零解的充要条件及基础解系的求法和有关证明,非齐次线性方程组的解法和解的结构。
重点:非齐次线性方程组解的结构与其导出组的基础解系的有关证明。
特殊方程组求解。
4.多项式理论多项式的整除,最大公因式与最小公倍式,多项式的互素,不可约多项式与因式分解,多项式函数与多项式的根。
重点:运用多项式理论证明有关问题,如多项式的互素和不可约多项式的性质的有关证明与应用;重要定理的证明,如因式分解唯一性定理,Eisenstein判别法,Gauss引理等,不可约多项式的证明。
5.二次型理论二次型线性空间与对称矩阵空间同构,化二次型为标准形和正规形,Sylvester惯性定律,正定、半正定、负定、半负定及不定二次型的定义和性质,正定矩阵的一些重要结论及其应用。
重点:正定和半正定矩阵的有关证明,n级方阵按合同关系的分类问题,实对称矩阵有关证明。
6. 线性空间与欧氏空间线性空间的定义,向量组的线性关系(线性相关与线性无关,向量组的等价,极大线性无关组的求法,替换定理),基与扩充基定理,维数公式,坐标变换,基变换与坐标变换,生成子空间,子空间的交与和(包括直和),内积和欧氏空间的定义及简单性质,子空间的正交补,度量矩阵与标准正交基的求法以及性质的证明和应用,线性空间的同构。
循环子空间的若干应用谢启鸿【摘要】从线性变换诱导的循环子空间出发,推导出了Cayley-Hamilton定理,并给出了循环子空间在相似标准形理论以及一些相关问题中的若干应用.【期刊名称】《大学数学》【年(卷),期】2016(032)001【总页数】6页(P1-6)【关键词】线性变换;不变子空间;循环子空间;Cayley-Hamilton定理;有理标准形;Jordan标准形【作者】谢启鸿【作者单位】复旦大学数学科学学院,上海200433【正文语种】中文【中图分类】O151.21设V是数域K上的n维线性空间,φ是V上的线性变换.对任意的非零向量α∈V,由α,φ(α),φ2(α),…张成的子空间C(φ,α)称为向量α关于线性变换φ的循环子空间,α称为循环子空间C(φ,α)的循环向量.由定义知道,C(φ,α)是φ的不变子空间,而且是包含向量α的最小不变子空间.讲授相似标准形理论的传统方法是λ-矩阵的方法,这种方法在证明有理标准形和Jordan标准形存在性的基础上,还能教会学生如何计算上述两种标准形,所以对初学者来说是一个较好的选择.而如果要用几何的方法建立相似标准形理论,那么循环子空间将在这一过程中起到举足轻重的作用.例如,由Cayley-Hamilton定理可以得到全空间关于根子空间的直和分解,而每一个根子空间又可以分解为若干个循环子空间的直和,由此即可推导出Jordan标准形的存在性(参考[2]的§7.2.10).虽然仍需要通过进一步的计算来确定Jordan标准形的形状,但循环子空间给予了Jordan标准形理论一个清晰的几何意义,让我们可以看清楚复杂问题的几何内涵.按照近世代数(模论)的观点来看,V是多项式环K[x]上的模,即对任意的多项式f(x)以及任意的向量α∈V,K[x]关于V的作用可定义为f(x)·α=f (φ)(α).由于K[x]是主理想整区,故由主理想整区上有限生成模的结构定理可得V的K[x]-循环子模的直和分解.注意到V的K[x]-循环子模均可写成K[x]·α的形式,其中α是V中的某个向量,根据模结构的定义,上述循环子模就是循环子空间C(φ,α).进一步,对应于V的K[x]-循环子模直和分解的不变因子组和初等因子组,可分别得到φ的有理标准形和Jordan标准形.因此,一个Frobenius块或一个Jordan块对应的子空间就是一个循环子空间.当然,即使不从较高的观点来建立相似标准形理论,一般的高等代数教材(例如[1])也都会引入循环子空间的概念并阐述其几何意义,但通常篇幅不会太长,也很少探讨它的相关应用等.在讲授完相似标准形理论后,作者在复旦大学数学科学学院本科生的高等代数习题课上引入了循环子空间的理论,阐述了它的几何意义,并且深入探讨了它在一些问题中的应用,得到了较好的教学效果.本文试将这些内容进行如下的总结.以下总是假设V是数域K上的n维线性空间,φ是V上的线性变换.我们先证明关于循环子空间的两个引理.引理1 设α是V中的非零向量,C(φ,α)是循环子空间.设di mC(φ,α)=m,则{α,φ(α),…,φm-1(α)}是C(φ,α)的一组基.证设于是α,φ(α),…,φk-1(α)线性无关,但α,φ(α),…,φk(α)线性相关,故φk(α)是α,φ(α),…,φk-1(α)的线性组合.进一步用数学归纳法容易证明:对任意的i≥k,φi(α)都是α,φ(α),…,φk-1(α)的线性组合.因此{α,φ(α),…,φk-1(α)}是C(φ,α)的一组基,从而m=dimC(φ,α)=k,结论得证.引理2 设α是V中的非零向量,使得V=C(φ,α)(此时V称为循环空间,α称为全空间的循环向量).设ψ是V上的另一线性变换且φψ=ψφ,则(i)ψ由它在循环向量α上的取值ψ(α)唯一确定;(ii)存在多项式g(x)∈K[x],使得ψ=g(φ).证(i)由引理1可知,{α,φ(α),…,φn-1(α)}是V的一组基.线性变换ψ由它在基向量上的取值唯一确定,又由φ,ψ的交换性可得ψ(φi(α))=φi(ψ(α))(0≤i≤n-1),因此ψ由ψ(α)唯一确定.(ii)设令则ψ(α)=g(φ)(α),即线性变换ψ,g(φ)在循环向量α上的取值相同.又ψ,g(φ)都与φ可交换,从而由(1)可得ψ=g(φ).先利用循环子空间来证明著名的Cayley-Hamilton定理.定理1 设是φ的特征多项式,则f(φ)=0.证任取非零向量α∈V,设dimC(φ,α)=m,则由引理1可知,{α,φ(α),…,φm-1(α)}是C(φ,α)的一组基.设,令则g(φ)(α)=0.容易验证φ限制在C(φ,α)上在基{α,φ(α),…,φm-1(α)}下的表示矩阵为多项式g(λ)的友阵将{α,φ(α),…,φm-1(α)}扩张为V的一组基,则φ在这组基下的表于是其中是K上的不可约多项式.证先证充分性.设f(λ)是K上的不可约多项式,则与定理1完全相同的证明可得f(λ)=g(λ)h(λ),从而只能是h(λ)=1,于是因此C(φ,α)=V对任意的非零向量α都成立..因此f(φ)(α)=h(φ)g(φ)(α)=0,再由α的任意性即得f(φ)=0.若V有一个非平凡的φ-不变子空间U,任取一个非零向量α∈U,则有C(φ,α)⊆U≠V.反之,若存在一个非零向量α∈V,使得C(φ,α)≠V,则C(φ,α)就是一个非平凡的φ-不变子空间.因此,V只有平凡的φ-不变子空间当且仅当对任意的非零向量α∈V,C(φ,α)=V都成立,即V的任一非零向量都是全空间的循环向量.利用循环子空间的理论,还能给出下列命题的一个简单证明.命题1 V只有平凡的φ-不变子空间当且仅当特征多项式再证必要性.设f(λ)在K上可约,即f(λ)=g(λ)h(λ),其中degg(λ)<n,degh(λ)<n,则由Cayley-Hamilton定理可得f(φ)=g(φ)h(φ)=0.注意到Kerg(φ)和Kerh(φ)不可能同时是零空间,否则g(φ)和h (φ)都是线性同构,这与g(φ)h(φ)=0相矛盾.因此Kerg(φ)和Kerh (φ)至少有一个非零,不妨设Kerg(φ)≠0.进一步可设其中m<n,再任取0≠α∈Kerg(φ),则有用数学归纳法容易证明:对任意的i≥m,φi(α)都是α,φ(α),…,φm-1(α)的线性组合,因此C(φ,α)的维数小于等于m,从而C(φ,α)≠V.设φ的不变因子组为1,…,1,d1(λ),…,dk(λ),其中di(λ)是K上的非常数首一多项式,且di(λ)|di+1(λ)(1≤i≤k-1),则由有理标准形理论可知,存在V的一组基{e1,e2,…,en},使得φ在这组基下的表示矩阵为其中F(di(λ))表示多项式di(λ)的友阵(形状见定理1的证明).例如,若设则有如下的关系图成立:这说明第一个Frobenius块F(d1(λ))对应的子空间L(e1,e2,…,em)就是由e1生成的循环子空间C(φ,e1).因此全空间V可以分解为若干个基向量生成的循环子空间的直和:我们来看一个特殊情形.若φ的不变因子组为1,…,1,f(λ),即极小多项式等于特征多项式f(λ),则φ的有理标准形只含一个Frobenius块F(f(λ)),此时V=C(φ,e1)就是一个循环空间.反之,若V=C(φ,α)是一个循环空间,则由引理1可知{α,φ(α),…,φn-1(α)}是V的一组基,仿照定理1的证明可得φ在这组基下的表示矩阵为F(f(λ)),其中f(λ)是φ的特征多项式,也是φ的极小多项式.利用上述一一对应可得如下两个有趣的推论.推论1 设A=F(f(λ))为n次首一多项式f(λ)的友阵,B为同阶方阵,若AB=BA,则存在次数小于n的多项式g(λ),使得B=g(A).证利用代数与几何之间的对应关系和引理2(2)即得结论.推论2 设V是数域K上的n维线性空间,φ是V上的线性变换,α1≠0,α2,…,αm是V中的向量,满足令若g(λ)在K上不可约,则α1,α2,…,αm线性无关.证显然,U=L(α1,α2,…,αm)=C(φ,α1)是V的循环子空间.记φ在U上的限制为φ1,则U=C(φ1,α1)也是一个循环空间.设φ1的特征多项式为h(λ),则h(λ)也是φ1的极小多项式.由假设可知g(φ1)(α1)=0,故由引理2(1)可得g(φ1)=0,再由极小多项式的基本性质可得h(λ)|g(λ).因为g(λ)在K上不可约,所以只能是h(λ)=g(λ),于是U的维数等于degh(λ)=degg(λ)=m,从而{α1,α2,…,αm}是U的一组基,故必线性无关.一个循环空间还可以分解为若干个循环子空间的直和,我们来看下面的命题.命题2 设V是数域K上的n维线性空间,φ是V上的线性变换,f(λ)是φ的特征多项式.设存在非零向量α∈V,使得V=C(φ,α)为循环空间,则以下结论等价:(i)f(λ)=P1(λ)m1…Pr(λ)mr,其中Pi(λ)(1≤i≤r)是数域K上互异的首一不可约多项式,mi(1≤i≤r)是正整数;(ii)r=max{s∈Z+|存在非零向量α1,…,αs∈V,使得证(i)由前面的讨论可知,存在非零向量α∈V,使得V=C(φ,α)当且仅当φ的不变因子组为1,…,1,f(λ).改写(ii)为:(ii)k=max{s∈Z+|存在非零向量α1,…,αs∈V,使得,只要证明:由(i)可推出k≥r;由(ii)可推出r≥k,于是有k=r,因此(i)与(ii)等价.假设(i)成立,因为初等因子组是相似关系下的全系不变量,故由[2]的例7.2可知,存在直和分解,使得的不变因子组为于是存在使得Vi从而因为k是这种分解的直和因子的最大个数,所以有k≥r.假设(ii)成立,设dimC(φ,αi)=ni,则由引理1可知,是C(φ,αi)的一组基.于是是V的一组基,φ在这组基下的表示矩阵为其中fi(λ)是φ限制在C(φ,αi)上的特征多项式,F(fi(λ))是fi(λ)的友阵.一方面考察特征多项式,有f(λ)=f1(λ)…fk(λ);另一方面考察极小多项式,由[1]的命题6.3.3可知,f(λ)是f1(λ),…,fk(λ)的最小公倍式,因此f1(λ),…,fk(λ)必两两互素,于是f(λ)的互异的首一不可约因式至少有k个,从而r≥k.设φ是n维复线性空间V上的线性变换,φ的初等因子组为,根据Jordan标准形理论,存在V的一组基{e1,e2,…,en},使得φ在这组基下的表示矩阵为Jordan标准型其中Jri(λi)是如下ri阶的Jordan块:例如,设则有如下的关系图成立:这说明第一个Jordan块Jr1(λ1)对应的子空间V1=L(e1,e2,…,er1)就是由er1生成的循环子空间C(φ1,er1).因此全空间V可以分解为若干个基向量生成的循环子空间的直和:注意到φi=φ|Vi-λiIVi,其中Vi是第i个Jordan块对应的子空间,因此上述循环子空间都是关于不同线性变换的循环子空间,而且每一个循环轨道(上述关系图)都是以零向量结尾,这些都是与有理标准形诱导的循环子空间直和分解不同的.下面利用Jordan块对应的循环子空间来给出两个有趣的应用.推论3 设A=Jn(λ0)是特征值为λ0的n阶Jordan块,B为同阶方阵,若AB=BA,则存在次数小于n的多项式g(λ),使得B=g(A).证用几何的语言来证明.设φ是n维复线性空间V上的线性变换,φ在V的一组基{e1,e2,…,en}下的表示矩阵是Jordan标准形Jn(λ0),ψ是另一线性变换且与φ可交换,令φ0=φ-λ0IV,则V=C(φ0,en)为循环空间且φ0ψ=ψφ0.由引理2(2)可知,存在次数小于n的多项式g0(λ),使得ψ=g0(φ0),令g(λ)=g0(λ-λ0),则ψ=g(φ).如果已知n阶方阵A的Jordan标准形为J=diag{Jr1(λ1),Jr2(λ2),…,Jrk(λk)},一个自然的问题是,对任意的正整数m,Am的Jordan标准型如何确定?要回答这个问题,只要对Jordan块Jn(λ0)来考虑即可.若λ0≠0,则通过Jordan标准形理论不难证明Jn(λ0)m的Jordan标准形是(参考[2]的例7.35);若要考虑Jn(0)m的Jordan标准形,如用代数的方法,则需要通过矩阵的秩与Jordan块个数的关系来得到结论(参考[2]的例7.33和例7.36).在这里我们将通过Jordan块对应的循环子空间来给出上述问题的几何解法.例1 求Jn(0)m(m≥1)的Jordan标准形.解若m≥n,则Jn(0)m=O.以下可设m<n,并作带余除法n=mq+r,其中0≤r<m.用几何的语言来考虑,设φ是n维复线性空间V上的线性变换,φ在V的一组基{e1,e2,…,en}下的表示矩阵是Jordan标准形Jn(0),则V =C(φ,en)为循环空间.由φm可诱导出如下的循环轨道:是K上的不可约多项式,用反证法来证明结论.若任取Im(φψ-ψφ)中的非零向量α,则Im(φψ-ψφ)=L(α).因为φ的特征多项式f(λ)在K上不可约,由命题1充分性的证明可得V=C(φ,α),再由引理1可知,{α,φ(α),…,φn-1(α)}是V的一组基.设线性变换φψ-ψφ在这组基下的表示矩阵为C=(cij),则由Im(φψ-ψφ)=L(α)可得cij=0对任意的i>1成立,于是一般地,对任意的k≥1,考虑线性变换(φψ-ψφ)φk-1在上述基下的表示矩阵,这是一个从第二行开始都为零且第(1,1)元素等于c1k的矩阵,于是从而C=O,即φψ-ψφ=0,这与r(φψ-ψφ)=1相矛盾.注意到命题1,推论2和例2中都有不可约多项式的条件,因此利用互素多项式的性质也可以给出上述题目的其他证明(推论2的另证可参考[2]的例5.76);另外,推论1和推论3也有代数的证明(可参考[2]的例7.22和例7.23).可能某些证明要比本文中的证明更简单,然而循环子空间的方法却给出了清晰的几何意义,让学生们能通过几何直观抓住问题的本质,从而加深对问题的理解,最终找到解决问题的有效途径.事实上,这也是复旦大学数学科学学院高等代数教学中的一条主线,即在要求学生熟练掌握代数方法的同时,也要求学生深入理解概念和定理的几何意义,强调代数与几何之间的相互转换和有机统一,而本文所阐述的循环子空间的若干应用正是从一个侧面反映了这种理念在高等代数教学中的实践.致谢在本文的撰写过程中,得到了复旦大学数学科学学院姚慕生教授、吴泉水教授、朱胜林教授的热心指导和大力斧正,在此谨表示衷心的感谢.由循环轨道与Jordan块之间的对应可知,只要将旧基{e1,e2,…,en}按照上述循环轨道进行重排,则φm在新基{er,…,en-m,en;…;e1,…,en -r+1-m,en-r+1;em,…,en-r-m,en-r;…;er+1,…,en-2 m +1,en-m+1}下的表示矩阵为diag{Jq+1(0),…,Jq+1(0),Jq (0),…,Jq(0)},其中有r个Jq+1(0),m-r个Jq(0).由Jordan 标准形的唯一性可知,这就是φm或Jn(0)m的Jordan标准形.最后,给出一个综合运用循环子空间理论的例题.例2 设A,B是数域K上的n阶方阵,且A的特征多项式f(λ)是K上的不可约多项式,证明:r(AB-BA)≠1.证换成几何的语言来证明,设V是数域K上的n维线性空间,φ,ψ是V上的线性变换,CLC Number:O29 Document Code:A Article ID:1672-1454(2016)01-0007-04Received date:2015-05-20Foundation item:National Science Foundation of China(11401534),(11226050)and(61272007)Low density parity check codes were firstly introduced by R.G.Gallager in 1962[1].These classes of codes can be defined by very sparse parity matrix.For their decoding performance are near to the Shannon limit[2-3],LDPC codes were investigated wildly.There are two classes of LDPC codes.If the parity check matrix has weight kin each row and weight l in each column exactly,the code can be called(k,l)-regular LDPC code and irregular otherwise.Two methods can be used to construct LDPC codes:random or pseudo-random ways and algebraic way.In general,irregular LDPC codes constructed by random or pseudo-random ways have been shown surpassing performance in AWGN channel than regular LDPC codes generated by algebraic way when the code has more long length.But these methods also face to its shortage.With losing of structure,the complexity will increase unavoidably both of encoding and decoding proceedings.So the requirement will be high both for hardware and software.LDPC codes can be formed from Reed-Solomon code[4],which is a typical block code.It is an useful way to construct LDPC codes from other good codes.A code is self-dual if the generator matrix of the code identifies its parity check matrix.It implies that the code has rate 1/2.In[5],an useful way to generate self-dual code fromq-ary circulant matrices based on orthogonal design has been introduced.In this paper,we will build binary LDPC code from the generator matrix of the q-ary self-dual code.Let GF(q)be a Galois field with qelements andαbe a primiti ve element of GF(q).If we denoteα-∞=0,then all elements of GF(q)can be presented asα0=1,α1,α2,…,αq-2,α-∞=0.We can make a one-one corresponding between elements of GF(q)and a subset of(q-1)-dimensional vector space Rq-1on real number field by a function Z.Definition 2.1 The functionis calledα-location vector function on GF(q),whereThe vector corresponding toαiis called the location vector[4]ofαi.Given a q-ary matrix,the function Zcan be generalized to deal with a matrix.Definition 2.2is called aα-location vector function of G.Given a q-ary circulant matrix A,if there exists a circulant matrix Bsuch thatthen a self-dual code can be generated by the following matrix[5]Based on the generator matrix of self-dual code,we can construct a LDPC code byα-location vector function.Proposition 2.1 Let Gbe a generator matrix of a q-ary self-dual code in the form of(a)and H arise fromby deleting its all-zero columns.Thenis a parity check matrices of a LDPC code.Obviously,I2nwill be remained,whendelete its all-zero columns.It implies that rows ofare linear independence and the number of columns ofis at mostHence the maximum rate of the codes isBut for the existence of all-zero columns in the second half of the matrix,the value of the maximum rate can hardly be achieved.Now we will calculate the length and rate of the code.Let a1,a2,…,ambe a sequence comes fromGF(q).The set Dis composed of all different nonzero elements of a1,a2,…,am.If wedenote the number of elements in Dby l(a1,a2,…,am),then Lemma 2.2 The number of all non-zero columns of(Z(a1)T,Z(a2)T,…,Z(am)T)Tis l(a1,a2,…,am).Proof Letαbe a primitive element in GF(q)and aibe a power ofα.If ai≠aj,then location vectors of aiand ajare distinct.So 1stays in different positions of their location vectors.If b∈GF(q)and b∉D,then the corresponding columns of b in(Z(a1)T,Z(a2)T,…,Z(am)T)Tare all zero.Otherwise,location vector of b appear and there is a 1in theright place.It implies that b∈D,contradictorily.The formulation of length Land rate Rof the code corresponding toisand then the rate of the code Ris are given by:Theorem 2.3 The length Lof the LDPC code corresponding towhere(α1,…,αn),(β1,…,βn)are first rows of Aand Brespectively.Proof Because Aand Bare all circulant,ATand-BTare circulant.Then all columns of Aand ATare composed of(α1,…,αn),all columns of Bare composed of(β1,…,βn)and all columns of-BTare composed of(-β1,…,-βn).We only need to observe first rows of(A,B)and(A,-B)respectively.By lemma 2.2,the conclusion is straightforward.The following corollary shows the region of R.Corollary 2.4Proof We consider two especial cases.Firstly,if A=Inand B=O,then the rate reach low bound.Secondly,if first rows of(A,B)and(A,-B)contain all q-1nonzeroelements of GF(q),then the rate can attain the upper boundAs an example,by computer searching,when n=4and q=11,we have Example 2.1 When is 60and the rate of the code is 0.8667.The code hasn’t the largest rate and the longest length in the situation that self-dual codes have length 16on GF(11).But if we ignore the identity matrix in the front ofthe length of the code corresponding to,the remain satisfy RC-constraint by computer testing.If the generator matrix of a code can be gained just by elementary transformation of rows and columns from another one’s,two codes are called equivalent.In general,self-dual codes with the same length are not unique under equivalence relationship.Suppose that there are Ninequivalent selfdual codes in the form of(a)with length n.We choose integer numbers s and t satisfying st≤N.Thenst inequivalent self-dual codes with length ncan be selected out for arranging a matrix G*with their generator matrices as G*′s elements.Now we replace everyαiby their location vectors and delete columns with all 0elements.We have a parity check matrix of LDPC codes.Proposition 2.5 Let Gij(i=1,…,s;j=1,…t)be generator matrices of self-dual codes in the form of(a),which are inequivalent each other.Denote G*=(Gij)s×t.Letis arisen fromZ(G*)by deleting its all-zero columns.Thenis parity check matrix for some LDPC code.•Based on self-dual codes with length 4n,we have the main method of constructing LDPC codes from theα-location vector function of generatormatrix of self-dual codes.•By considering the first row of generator matrix of the corresponding self -dual code,we investigate the length and the rate of LDPC code,and show the range of rates of this codes.•To expand the method,we consider all inequivalent self-dual codes with the same size as cells,constructing a more large matrix.The size of LDPC code can be more adaptable.•By computer searching,when n=4and q=11,the superior code with high rate have been found.The method shows a way to search codes with high rate and good algebraic structure.[1] Gallager RG.Low Density Parity Check Codes[M].Cambridge,MA:MIT Press,1963.[2] Shannon CE.A mathematical theory of communication[J].Bell systems Technology Journal,1948,27:379-423.[3] Chung S,Forney GD,Richardson JJ and Urbanke R.On the design of low-denisty parity-check codes within 0.0045 db of the Shannon limit[J].IEEE Commun.Lett.,2001,5:58-60.[4] Djurdjevic I,Xu J,Abdel-Ghaffar K and Lin S.A class of Low-density parity-check codes Constructed based on Reed-Solomon codes with two information symbols[J].IEEE Commun.Lett.,2003,7:317-319.[5] Koichi Betsumiya,Telio Georgiou,Aron Gulliver T,Masaaki Haradaand Christos Koukouvinos.On self-Dual Codes over Some Prime Fields [J].Discrete Math.,2003,262:37-58.【相关文献】[1]姚慕生,吴泉水,谢启鸿.高等代数学[M].3版.上海:复旦大学出版社,2014.[2]姚慕生,谢启鸿.高等代数(大学数学学习方法指导丛书)[M].3版.上海:复旦大学出版社,2015.。
第六章 线性空间一.内容概述(一) 基本概念⒈线性空间的定义-----两个集合要明确。
两种运算要封闭,八条公理要齐备。
V ,数域F V ∙V →V V ∈∀βα、 使V ∈+βα。
V F ⨯→V ∀k V ∈使k V ∈α。
满足下述八条公理:⑴αββα+=+; ⑵)()(γβαγβα++=++; ⑶对于,V ∈α都有αα=+0,零元素;⑷对于V ∈α,都有0=+βα,称β为α的负元素,记为α-; ⑸βαβαk k k +=+)(;⑹αααl k l k +=+)(;⑺)()(ααl k kl =; ⑻αα=1。
常用的线性空间介绍如下:(ⅰ)2V 、3V 分别表示二维,三维几何空间。
(ⅱ)nF 或nP 表示数域)(P F 上的n 维列向量构成的线性空间。
(ⅲ)[]x F 表示数域上全体多项式组成的线性空间。
[]x F n 表F 上次数不大于n 的多项式集合添上零多项式构成的线性空间。
(ⅳ)()F M n m ⨯表示数域F 上n m ⨯矩阵的集合构成的线性空间。
当n m =时,记为()F M n m ⨯。
(ⅴ)[]b a R ,表示在实闭区间[]b a ,上连续函数的集合组成的线性空间。
⒉基,维数和坐标------刻画线性空间的三个要素。
⑴基 线性空间()F V 的一个基指的是V 中一组向量{}n ααα,,21 满足(ⅰ)n ααα,,21 线性无关;(ⅱ)V 中每一向量都可由n ααα,,21 线性表出。
⑵维数 一个基所含向量的个数,称为维数。
记为V dim 。
⑶坐标 设n ααα,,21 为()F V n 的一个基。
()F V n ∈∀α有n n a a a αααα+++= 2211则称有序数组n a a a ,,21 为α关于基n ααα,,21 的坐标。
记为(n a a a ,,21 )。
⑷过渡矩阵 设()F V n 的二个基n ααα,,21 (ⅰ)n βββ ,,21(ⅱ)且∑==ni iij j a 1αβn j 2,1=则称n 阶矩阵。
矩阵论线性空间定义:本质是个集合,满足一定条件卜•的集合。
首先定义了加法运算(满足加法的交换结合律),在这个集合中能找到零元素,与负元素;然后定义数乘运算(数域上的元素与集合当中的元素相乘),并且满足数乘的分配,结合律(集合中的兀素能否进行乘法运算并没有定义)。
最后指出,这些运算都是封闭的,运算的结果与集合中的九素唯一对应。
称这样的一个集合为线性空间。
注总:运算结果与集介中的元素对应。
例如0*a=0 (此零非彼零,不是数域里的零,而是线性空间当中的零,即集合当中的零元素<很可能不是零〉)核空间:矩阵A对应于齐次线性方程组Ax=O的解空间。
子空间:线性空间对应集合的一个子集,并且也满足线性空间的定义的一个子集。
其中,冬空间,与线性空间本身构成平凡子空间,还存在的其他子空河构成非平凡子空间。
矩阵A的核空间就是他的•个子空间,相当于对矩阵A构成的空间中的尤素进行了限定。
矩阵A的列向量的线性组介构成了矩阵A的值域空间(其中的基为最人无关组的个数)。
注意:子空间交,与子空间的和任然为子空间,但子空间的并集不一定再是子空间。
属于两个子空间的线性无关的两个基的并基构成新的元素,但是这个元素不在属于原来的两个子空间的任意一个。
子空间中的几个等价定义:(1)直和定义为VI与V2的交空间只包含零元素(不一定是数字零),构成零子空间(2)直和空间中的元素表达式唯一。
(3)VI的基于V2的基直接构成直和空间的基。
(4)和空间的维度等于VI巧V2维度的和。
线性映射性质:(1)VI的零元素经过线性映射变为V2的零元素(2 )线性相关组经过线性映射之后任然为线性相关(3)线性无关组经过单射线性映射后任然为线性无关同构:两个线性空间之间存在一个一一对应的线性变换,则称这两个矩阵是同构的。
相应的线性变换称为同构映射。
任一线性空间都能够找到一个数域向量与其同构,这个向最就是坐标。
线性变换T的秩,线性映射的坐标表示:T表示线性空间到线性空间的映射,在貝体的基底下(两个线性空间基都确定的情况),可以由一个矩阵A表示T,为V到V '的线性映射。
矩阵的秩的一类新的证明方法唐睿;董晓亮;薛淑悦;朱乾宏【摘要】基于齐次线性方程组解的理论,利用集合的包含关系,给出了若干个关于矩阵的秩的不等式的新的证明方法.【期刊名称】《宁夏师范学院学报》【年(卷),期】2018(039)001【总页数】3页(P80-81,87)【关键词】矩阵的秩;齐次线性方程组;包含关系;直和【作者】唐睿;董晓亮;薛淑悦;朱乾宏【作者单位】北方民族大学数学与信息科学学院,宁夏银川750021;北方民族大学数学与信息科学学院,宁夏银川750021;北方民族大学数学与信息科学学院,宁夏银川750021;北方民族大学数学与信息科学学院,宁夏银川750021【正文语种】中文【中图分类】O221.2董晓亮,(1981-),男,甘肃静宁人,讲师,博士,硕士生导师.研究方向:最优化理论及方法.矩阵的秩作为高等代数中基本而重要的概念,体现了矩阵在初等变换下的不变量,刻画矩阵在运算前后的秩之间的变化关系.矩阵的秩的关系式内容丰富,其证明方法多样且有一定难度,一直是教学的重点和难点[1,2].教科书中对于矩阵中关于秩的关系式的证明多是考虑其列(或行)极大线性无关组,通过向量组的秩建立相应的关系式.本文中,尝试通过构造齐次线性方程组,利用直和分解和方程组的解空间等理论去证明秩的关系式.1 预备知识定义1[1] 设A∈Rs×n,矩阵的行秩和矩阵的列秩统称为矩阵A的秩;一个矩阵A 的秩为r的充分必要条件是矩阵A中有一个r阶子式不为零,而所有的r+1阶子式都为零.定义1分别从向量组的秩和矩阵中的行列式的关系刻画了矩阵的秩.对于一个实际问题而言,通常采取用初等变换法、子式法和求矩阵的列向量组或行向量组的极大无关组去求解矩阵的秩.定理1[1] 给定向量组η1,η2,…,ηt,其生成子空间L=L{η1,η2,…,ηt}.则子空间的维数和向量组的秩二者相等,即dim(L)=R{η1,η2,…,ηt}.对一个矩阵A而言,与A相关的有三个重要的线性空间,分别是A的行向量组和列向量组分别生成的子空间,以及将A看作是一个线性变换,该线性变换的核子空间.下面给出它们的定义.定义2[1] 设A∈Rs×n,由矩阵A的行向量组生成的子空间称为A的行空间;由矩阵A的列向量组生成的子空间称为A的列空间;以矩阵A为系数矩阵对应的齐次线性方程组的解集形成的子空间称方程组Ax=0的解空间(矩阵A的的零空间),记为ΩA={x|Ax=0}.定理2[1] 设V1,V2是有限维线性空间W的子空间,令W=V1+V2,则直和W=V1⊕V2成立与如下几个命题等价:①dim(W)=dim(V1)+dim(V2);②V1∩V2={0};③零元素的分解是唯一的,即0=01+02,0i∈Vi(i=1,2).定理3[1] 在齐次线性方程组AX=0有非零解的情况下,它的基础解系所含解的个数等于n-r,这里n是变量的个数,r=r(A).注1 设A∈Rs×n,以及η1,η2,…,ηs是A的s个行向量,齐次线性方程组AX=0对应了即A构成的行空间正交于解空间.换言之,A的行空间和方程组Ax=0的解空间构成直和Rn,即ΩA⊕A行空间=Rn,则由定理2知矩阵的秩+解空间的维数=n.这一点实际是定理3在空间分解上的关于维数公式的生动诠释.2 若干结论本节考虑基于齐次线性方程组解的理论,利用集合的包含关系,给出了若干个关于矩阵的秩的关系式的新的证明方法.命题1 R(AB)≤min{R(A),R(B)}.证明构造线性方程组BX=0和ABX=0,其中系数矩阵A∈Rm×s,B∈Rs×n.不妨设相应的解集为ΩB和ΩAB.容易知道,BX=0的任一解为ABX=0的解,从而ΩB⊆ΩAB,以及dim(ΩAB)≥dim(ΩB).另一方面,由注1可得如下关系式(1)则有R(AB)≤R(B).基于对称的思想,利用“转置运算不改变矩阵的秩”这一事实,可类似地构造方程组ATY=0,BTATY=0,并仿上证得R(BTAT)=R(AB)≤R(A).综上所述,R(AB)≤min{R(A),R(B)}.注2 系数矩阵的行空间与对应的齐次线性方程组的解空间形成了直和,从而“两个空间的和的维数等于各自维数的和”.既然ΩB⊆ΩAB,从而结论可以看作是“此增彼减”的反映.而矩阵中三秩合一,两个行空间的秩的大小关系就反映到矩阵的秩的大小变化关系.命题2 R(A)=R(AT)=R(AAT)=R(ATA).证明观察得到:构造线性方程组AX=0,两边左乘AT得ATAX=0,说明二者对应的解集存在ΩA⊆ΩATA.反之,如果ATAX=0,在ATAX=0两边左乘XT从而XTATAX=(AX)T(AX)=||AX||2=0,即AX=0,故ΩATA⊆ΩA.综上所述,两个方程组同解,结合注1知R(ATA)=R(A),类似地,可得到R(A)=R(AT)=R(ATA)=R(AAT).命题3 若AB=0,其中A∈Rm×s,B∈Rs×n则有R(A)+R(B)≤n.证明记则有设β1,β2,…,βn是方程组AX=0的解,而β1,β2,…,βn的生成子空间L{β1,β2,…,βn}⊆ΩA.由定理2可得:dim(ΩA)=n-R(A),R(B)≤dim(ΩA)=n-R(A).从而命题获证.命题4 若A∈Rm×n,B∈Rm×n,则有R(A+B)≤R([AT,BT]).证明构造线性方程组其中x∈Rn两边同时左乘[Im,Im],得到另一个齐次线性方程组则有Ω[AT,BT]≤ΩA+B.根据注1,则命题结论成立.3 结束语本文通过构造齐次线性方程组,利用解集的包含关系讨论了几类基本的秩的关系式.从中可以看出,通过矩阵A的行空间和方程组Ax=0解空间形成直和的实质可以更方便的得到矩阵的秩的变化关系,可以进一步理解和掌握其中矩阵的秩的相关结论的证明.参考文献:【相关文献】[1] 北京大学数学系几何与代数教研室代数小组.高等代数[M].北京: 北京大学出版社,2000:126-154.[2] 孟道骥.高等代数与解析几何[M].北京:科学出版社,1998:215-221.。
物理学中的群论第⼀章线性代数物理学中的群论第⼀章线性代数声明:这是我根据黄飞⽼师上课内容记的笔记(易懂)。
教材:马中骐的物理学中的群论书(不好懂,所以我没看)。
希望对学群论的⼈有所帮助。
这两章线性代数考试不会考,但⾮常重要,后⾯都在⽤。
1.1节线性空间和⽮量基1.⽮量基有加法和数乘、⼀组线性⽆关的客体2.⽮量3.m维线性空间:就是定义了加法和数乘m个基⽮量对应m维简单来说,线性空间就是⽮量空间,线性空间中只有加法和数乘(即只有两个⽮量相加、数乘),但是没有⽮量乘法,也没有长度这样的概念。
如果在线性空间中引⼊点乘,长度、垂直的概念,此时称为内积空间。
线性空间性质:4.实线性空间:5.⽮量、基⽮量的矩阵表⽰⽮量矩阵表⽰:列矩阵基⽮量矩阵表⽰:、、按基⽮量展开,其第个分量为基⽮量矩阵表⽰是只有⼀个分量为1,其他分量为零的列矩阵。
6.线性空间的维数1)线性相关、线性⽆关2)线性空间的维数线性空间的维数:线性空间中线性⽆关的⽮量的最⼤个数。
m 维线性空间中,线性⽆关的⽮量数⽬不能⼤于m 。
⽮量基是线性⽆关的,m 维线性空间中任何 m 个线性⽆关的⽮量都可以作为⼀组⽮量基。
7.线性空间的⼦空间⼦空间就是在m 维线性空间中,有⽐m 维数⼩的个数的线性⽆关⽮量的所有的线性组合,构成⼀个n 维线性空间。
⽐如三维空间中,两个基⽮量的所有线性组合构成x-y 平⾯,是⼆维线性空间,是⼦空间。
我们通常说的⼦空间是⾮平庸的⼦空间,不包括零空间和全空间。
8.两个⼦空间的和两个⼦空间的和:两个⼦空间和的所有⽮量及这些⽮量的线性组合的集合, 记作;注意并⾮和的所有⽮量的集合,因为除了将这些⽮量放在⼀块以外,还需要将它们线性组合。
例如,构成的⼦空间和构成的⼦空间的和是整个三维空间。
9.两个⼦空间的交两个⼦空间的交:,例如,构成的⼆维⼦空间和构成的⼀维⼦空间的交是零空间(零⽮量构成的空间)。
10.两个⼦空间的直和两个⼦空间的直和:若是、的和(即),且下⾯三个等价的条件中任意⼀条成⽴:则称为两个⼦空间和的直和,记作 ,此时与称为中互补的⼦空间。
数分高代定理大全《髙等代数》第一章帶余除法对于P[x]中任意两个多项式/'(兀)与g(x),其中g(x)HO, —定有P[A]中的多项式q(x), r(x)存在,使/(x) = g(x)g(x) + r(x)成立,其中d(r(x)) < d(g(x)) 或者心)=0,并且这样的<?(x),r(x)是唯一决定的.定理1对于数域P上的任意两个多项式f(x)9g(x),其中g(x)H0,g(x)I/*(x)的充分必要条件是g(x)除/(x)的余式为零.定理2对于P[X]中任意两个多项式/(A), g(x),在P[x]中存在一个最大公因式d(x),且d(x)可以表示成f (x), g(x)的一个组合,即有P[x]中多项式M(X),V(A)使d(x) = w(x)/(x) + y(x)g(x).定理3 P[x]中两个多项式/(A-), g(x)互素的充分必要条件是有P[x]中的多项式/心),v(x)使«(x)/(x) + v(x)g(x) = 1 .定理 4 如果(f(x),g(x)) = l,且/(x)I g(x)h(x),那么f(x)I h(x).定理5如果“(X)是不可约多项式,那么对于任意的两个多项式/(x),g(x),由p(x) I f(x)gM一定推出p(x) I f(x)或者p(x)\ g(x).因式分解及唯一性定理数域P上每一个次数XI的多项式/(X)都可以唯一地分解成数域P上一些不可约多项式的乘积.所谓唯一性是说,如果有两个分解式f(X)= Pl (x)p2 (x)•- p s (x) = 4 (x)§2 (x) ••q (x),那么必有s = t ,并且适当排列因式的次序后有Pi(x) = c i q i(x),i = 1,2,•••,$,其中Cf(i = 1,2,…,s)是一些非零常数. 定理6如果不可约多项式"(x)是/(X)的k重因式(k>\),那么它是微商广(x)的—1重因式.定理7 (余数定理)用一次多项式A-6Z去除多项式/(X),所得的余式是一个常数,这个常数等于函数值/(&).定理8 P[x]中n次多项式(// > 0)在数域P中的根不可能多于〃个,重根按重数计算.定理9如果多项式/(x), g(x)的次数都不超过川,而它们对幵+ 1个不同的数弘冬,•••£+]有相同的值,即/g)= g(e),i = 1,2,•••/1 + 1,那么f(x) = g(x). 代数基本定理每个次数21的复系数多项式在复数域中有一根.复系数多项式因式分解定理每个次数的复系数多项式在复数域上都可以唯一地分解成一次因式的乘积.实系数多项式因式分解定理每个次数XI的实系数多项式在实数域上都可以唯一地分解成一次因式与二次不可约因式的乘积.定理10 (高斯(Gauss)引理)两个本原多项式的乘积还是本原多项式.定理11如果一非零的整系数多项式能够分解成两个次数较低的有理系数多项式的乘积,那么它一定能分解成两个次数较低的整系数多项式的乘积.定理12设/(朗=唧+%的+・•• +如是一个整系数多项式,而二是它的有理S根,其中互素,那么必有s\a n,r\a0.特别地,如果/(x)的首项系数"” =1 , 那么/(x)的有理根是整根,而且是心的因子.I定理13 (艾森斯坦(Eisenstein)判别法)设f(x) = a…x n + a…_x x n~x + • • •+a0是一个整系数多项式,如果有一个素数",使得1. p I a n ;2・PI勺_],%_2昇・・,°0;3・ p 2 / a ()那么/(x)在有理数域上是不可约的.第二章定理1对换改变排列的奇偶性.定理2任意一个"级排列与排列12・."都可以经过一系列对换互变,并且所作 对换的个数与这个排列有相同的奇偶性.立:a kA\ + % 人2 + ••• +a kn A m Cl \l A \ j + Cl 2!A 2 丿 + …+ 勺/帀定理4 (克拉默法则)如果线性方程组 a [X x A +a n x 2+-- + a Xn x n =b r“2內 + «22X 2 + ・・・ + a 2n X n = b 2,<°"內+°”2兀2+••• + %"="“ 4如…"J 的系数矩阵A=如如…①”♦ • • ♦ • •.a n\ Cl n2 …%.的行列式〃=国H 0 ,定理3设d =5 (':2 ,州表示元素®的代数余子式,则下列公式成〃,当《 =二 飞当kHi那么该线性方程组有解, 并且解是唯一的,解可以通过系数表为旦,… d=佥, 其中©是把矩阵A 中第丿•列换成方程组的常数项所成的行列式,即定理5如果齐次线性方程组4內+如七+•••+"],耳=°, 。
第六章 特征值我们接着第四章进行讨论. 我们已经知道,对于n 维线性空间V 的一个线性变换A 来说,如果V 可以分解为一些不变子空间的直和,则可以通过选择适当的基12,,,n εεε,使得A 在这组基下的矩阵为准对角阵. 当然,这种分解是越细越好. 即各不变子空间的维数是越小越好. 最为理想的是能将V 分解为n 个一维不变子空间的直和, 这样可通过选择适当的基,A 在这组基下的矩阵为对角阵:12n a a a ⎛⎫ ⎪ ⎪ ⎪ ⎪⎝⎭此时,线性变换A 的许多性质便能一目了然. 例如,若12,,,r a a a 均不为零,但1,,r n a a +全为零,则A 的秩为r ,12Im (,,,)r L =A εεε,而1K e r (,,)r n L +=A εε.但能否这样分解,完全取决于所给的线性变换. 本章将对此展开讨论.§6.1 特征值和特征向量1. 特征值与特征向量概念定义 6.1.1 设A 是数域P 上n 维线性空间V 的一个线性变换. 如果对于数域P 中一个数0λ,在V 中存在一个非零向量ξ,使得0()λ=A ξξ, (1.1) 则称0λ是线性变换A 的一个特征值,向量ξ称为A 的属于特征值0λ的特征向量.说明 从几何上来看,在经过线性变换后,特征向量的方向保持在同一条直线上,若00λ>,保持方向不变;若00λ<,保持方向相反;若00λ=,特征向量就变为了零向量.现在设A 在某组基下的矩阵是A ,向量ξ在这组基下可以表示为一个列向量α,此时(1.1)式等价于0λ=A αα.从而等价于0()n λ-=0E A α.定义6.1.2 设A 是数域P 上的n 阶方阵,如果存在0P λ∈及n 维非零列向量α,使得0λ=A αα,则称0λ是矩阵A 的一个特征值, α称为A 的属于特征值0λ的特征向量.关于特征值与特征向量,我们有下面三个命题:命题6.1.3 如果ξ是A 的属于特征值0λ的特征向量. 则对P 的任意数0k ≠,k ξ都是属于特征值0λ的特征向量.证明 由于0()λ=A ξξ,≠0ξ,所以对0k ≠有k ≠0ξ,且00()()()()k k k k λλ===A A ξξξξ.故k ξ是属于特征值0λ的特征向量. 证毕命题6.1.4 一个特征向量只能属于一个特征值.证明 设≠0ξ是A 的一个特征向量,且0()λ=A ξξ, 0()λ'=A ξξ, 则00λλ'=ξξ. 而≠0ξ,所以00λλ'=. 证毕. 命题6.1.5 向量≠0ξ生成的子空间()L ξ对A 不变⇔ξ是A 的一个特征向量. 证明 若()L ξ对A 不变,则()()L ∈A ξξ. 所以存在0P λ∈,使得0()λ=A ξξ. 即ξ是A 的一个特征向量.反过来,若ξ是A 的一个特征向量. 则≠0ξ,且有0()λ=A ξξ,则由命题6.1.3,对于()L ξ的任意向量k ξ有00()()()()k k k L λλ==∈A ξξξξ,即()L ξ对A 不变,从而是关于A 的一维不变子空间. 证毕.2. 特征值与特征向量的求法读者自然会问:如何判断一个向量是不是特征向量呢?如果是,又如何求相应的特征值呢?下面对有限维线性空间来进行讨论.设A 是数域P 上n 维线性空间V 的一个线性变换,12,,,n εεε是V 的一组基,A 在这组基下的矩阵是A . ξ是A 的属于特征值0λ的一个特征向量,即0()λ=A ξξ,≠0ξ,0P λ∈.设ξ在基12,,,n εεε下的坐标为12(,,,)n k k k ,则11221212()(,,,)(,,,)n n n n k k k k k k ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭A A A ξεεεεεε, 11220012120(,,,)(,,,)n n n n k k k k k k λλλ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭ξεεεεεε. 所以11220n n k k k k k k λ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭A , 即12000()0n n k k k λ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪-= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭E A . 这就表明:12(,,,)T n k k k 是系数矩阵为0n λ-E A 的齐次线性方程组0()n λ-=0E A x的一个非零解. 因此,系数矩阵的行列式等于零,即00n λ-=E A .这也说明了特征值0λ是关于λ的n 次多项式()n f λλ=-E A 的一个根.反过来,坐标为0()n λ-=0E A x 的非零解的向量便是A 的属于特征值0λ的特征向量.我们引入下面的定义.定义6.1.6 设111212122212n n n n nn a a a a a a a a a ⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭A λ是一个符号或文字,则称矩阵111212122212n n n n nn a a a a a a a a a λλλλ---⎛⎫ ⎪--- ⎪-= ⎪ ⎪---⎝⎭E A 为A 的特征矩阵. 称()f λλ=-E A为A 的特征行列式或特征多项式.于是上面的分析可以归纳为下面的定理.定理6.1.7 设A 是数域P 上的n 维线性空间V 的一个线性变换,A 在V 的基12,,,n εεε下的矩阵是A . 若ξ是A 的属于特征值0λ的一个特征向量,即0()λ=A ξξ,≠0ξ,0P λ∈,则A 的特征值0λ是特征多项式()f λλ=-E A 的根,而属于0λ的特征向量ξ的坐标就是齐次线性方程组0()λ-=0E A x 的非零解. 反之,如果0λ是多项式()f λλ=-E A 的根,且0P λ∈,则0λ是线性变换A 的一个特征值. 而以0()λ-=0E A x 的非零解为坐标的向量便是A 的属于特征值0λ的特征向量.把上面的分析逆推回去即得定理的后一部分的证明.例6.1.8 设A 是数域P 上3维线性空间V 的一个线性变换,123,,εεε是V 的一组基,A 在这组基下的矩阵是122212221⎛⎫ ⎪= ⎪ ⎪⎝⎭A ,求A 的特征值及相应的特征向量.(分析)先求出特征值,即求出()f λλ=-E A 的根0λ; 再将0λ代入到0()λ-=0E A x 中,求0()λ-=0E A x 的非零解,这非零解便是属于0λ的特征向量的坐标.解 1)先求特征值. 由于2122()212(1)(5)221f λλλλλλλ---=-=---=+----E A , 所以11λ=-(二重根),25λ=. 由于任何数域都包含有理数域,所以12,P λλ∈,从而1,5-都是A 的特征值.2)求属于特征值11λ=-的特征向量. 解方程组1()λ-=0E A x ,即112311231213(1)220,2(1)20,22(1)0.x x x x x x x x x λλλ---=⎧⎪-+--=⎨⎪--+-=⎩得到1231231232220,2220,2220.x x x x x x x x x ---=⎧⎪---=⎨⎪---=⎩容易求得它的基础解系是100,111⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭. 所以113=-ξεε,223=ξε-ε是属于特征值11λ=-的特征向量. 因而属于特征值11λ=-的全部特征向量为1122k k +ξξ. 其中12,k k P ∈,且不全为零.同样的,可以求得3123=++ξεεε是属于特征值25λ=的特征向量. 因而属于特征值25λ=的全部特征向量为3k ξ. 其中k P ∈,且不为零.例6.1.9 在n 维线性空间中数乘变换k A 在任一组基下的矩阵都是k E ,它的特征多项式是()n k k λλ-=-E E . 所以k A 的特征值只有k . 由数乘变换k A 的定义可知,每个非零向量都是属于k 的特征向量.例6.1.10设A 是实数域R 上3维线性空间V 的一个线性变换,123,,εεε是V 的一组基,A 在这组基下的矩阵是332112310⎛⎫ ⎪=- ⎪ ⎪--⎝⎭A ,求A 的特征值及相应的特征向量.解 1)先求特征值. 由于2332()112(4)(4)31f λλλλλλλ---=-=--=+-E A , 所以特征多项式的根为2i ±,4. 但2i ±不属于实数域R ,故不是特征值,所以只有4是A 的特征值.2)求属于特征值14λ=的特征向量. 解方程组1()λ-=0E A x ,即112311231213(3)320,(1)20,30.x x x x x x x x x λλλ---=⎧⎪-+-+=⎨⎪++=⎩得到123123123220,320,340.x x x x x x x x x --=⎧⎪-++=⎨⎪++=⎩容易求得它的基础解系是11,1⎛⎫ ⎪ ⎪ ⎪-⎝⎭.所以123=+-ξεεε,是属于特征值14λ=的特征向量. 因而属于特征值14λ=的全部特征向量为k ξ. 其中k P ∈,且不为零.我们再来介绍特征向量的一个重要性质.定理6.1.11 属于不同特征值的特征向量线性无关.证明 设A 是数域P 上n 维线性空间V 的一个线性变换,12,,,m λλλ是A 的m 个互异的特征值,如果i ≠0ξ是属于(1,2,,)i i m λ=的特征向量,即()(,,1,2,,)i i i i i P i m λλ=≠∈=0A ξξξ.我们需要证明12,,,m ξξξ在P 上线性无关. 对m 用数学归纳法.当1m =时,因为1≠0ξ,所以1ξ线性无关,定理成立. 假设定理对1(1)m m ->成立,现在考虑m 的情形.设112211m m m m k k k k --++++=0ξξξξ. (1.1) (1.1)式两边同乘以m λ有112211m m m m m m m m k k k k λλλλ--++++=0ξξξξ. (1.2) 再对(1.1)的两边同时作用线性变换A ,则有111222111m m m m m m k k k k λλλλ---++++=0ξξξξ. (1.3) 所以(1.2)-(1.3)有 111222111()()()m m m m m m k k k λλλλλλ----+-++-=0ξξξ. 由归纳假设121,,,m -ξξξ线性无关,而12,,,m λλλ互异,所以 1210m k k k -====.因而,再由(1.1)式有m m k =0ξ,而m ≠0ξ,故0m k =. 所以12,,,m ξξξ线性无关. 证毕.§6.2 特征多项式在上节里,我们介绍了特征多项式概念,本节我们要进一步讨论它. 设111212122212n n n n nn a a a a a a a a a ⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭A 则A 的特征多项式为111212122212()n n n n nna a a a a a f a a a λλλλλ------=-=---E A 11122()(1)n n n nn a a a λλ-=-+++++-A . 因此我们有下面的结论. 命题6.2.1 n 阶方阵A 的特征多项式是一个首项为1的n 次多项式.定义6.2.2 n 阶方阵A 的特征多项式()f λ在复数域内的根,称为A 的特征根.设A 的特征根为12,,,n λλλ,则由Vieta 定理我们又有下面的结论.命题6.2.3 设n 阶方阵()ij n n a ⨯=A 的特征根为12,,,n λλλ,则 1)112212Tr()nn n a a a λλλ=+++=+++A ; 2)12n λλλ=A .注意,命题6.2.3中的1)并不意味着一定有111222,,,nn n a a a λλλ===. 我们知道同一个线性变换在不同基下的矩阵是相似的,那么相似的矩阵是否有相同的特征值呢?下面的定理作出了肯定的回答.定理6.2.4 相似阵有相同的特征多项式.证明 设方阵,A B 相似,即存在满秩方阵P 使得1-=B PAP .所以,111λλλ----=-=-E B E PAP PP PAP11()λλλ--=-=-=-P E A P P E A P E A .证毕.说明 1)相似的方阵既然有相同的特征多项式,当然也就有相同的特征根. 因而结合命题6.2.3,相似的矩阵就有相同的行列式.2)定理6.2.4的逆不成立,即有相同特征多项式的矩阵却未必相似.如1011,0101⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭E A . 有相同的特征根,但并不相似. 因为和E 相似的矩阵只有它自身.3)由于一个线性变换A 在不同基下的矩阵是相似的,则由定理6.2.4,A 在任何基下的矩阵的特征多项式都是相同的.于是我们给出下面的定义.定义6.2.5 设A 有限维线性空间V 的一个线性变换,A 在V 的任意一组基下的矩阵的特征多项式就称为线性变换A 的特征多项式,而其在复数域内的根称为A 的特征根.说明 如果A 是数域P 上的有限维线性空间V 的一个线性变换,那么A 的特征值必是A 的特征根. 但A 的特征根未必是A 的特征值,只有属于P 的特征根才是A 的特征值. 对于矩阵的特征值与特征根的情形是相似的(如本章第一节例6.1.10).最后,我们指出特征多项式的一个重要性质.定理6.2.6(Hamilton-Caylay 定理)设()ij n n a ⨯=A 是数域P 上的一个n 阶方阵,()f λλ=-E A 是A 的特征多项式,则11122()()(1)n n n nn f a a a -=-+++++-=0A A A A E . 证明 设()()λλ*=-B E A 是λ-E A 的伴随矩阵. 由伴随矩阵的性质,有()()()f λλλλ-=-=B E A E A E E .由于伴随矩阵()λB 中的元素都是λ-E A 的各个元素的代数余子式,因而也都是次数不超过1n -的多项式. 于是由矩阵的运算性质,可以把()λB 写成:120121()n n n n λλλλ----=++++B B B B B , 其中0121,,,,n n --B B B B 都是n n ⨯数字矩阵.设111()n n n n f a a a λλλλ--=-+++,则111()n n n n f a a a λλλλ--=-+++E E E E E . (2.1) 又()()()120121()n n n n λλλλλλ-----=++++-B E A B B B B E A ()()()1201021121n n n n n n B λλλλ-----=+-+-++--B B A B B A B B A B A . (2.2)将(2.1)与(2.2)进行比较得 01012121211,,,,.n n n n n a a a a ----=⎧⎪-=⎪⎪-=⎪⎨⎪⎪-=⎪-=⎪⎩B E B B A E B B A E B B A E B A E (2.3)用1,,,,n n -A A A E 依次从右边乘(2.3)的第一式,第二式,,第n 式,第1n +式,得0111101121222122212111,,,,.n n nn n n n n nn n n n n n n n a a a a a a a ------------⎧==⎪-==⎪⎪-==⎪⎨⎪⎪-==⎪⎪-=⎩B A EA A B A B A EA A B A B A EA A B A B A EA A B A E (2.4)把(2.4)的1n +个式子左边与右边分别相加,左边就变为了零,而右边即为()f A . 所以()f =0A . 证毕.设A 是数域P 上的n 维线性空间V 的一个线性变换,由于P 上的线性变换的集合()M V 与n n P ⨯同构,又当A 在某组基下的矩阵为A 时,m A的矩阵为m A ,从而由Hamilton-Caylay 定理有下面的推论.推论6.2.7 设A 是数域P 上的n 维线性空间V 的一个线性变换,()f λ是A 的特征多项式,则()f =A 0. 其中0是零变换.例6.2.8 设,A B 是两个n 阶方阵,则AB 与BA 有相同的特征多项式,从而有相同的特征根. 证明 由于,λλλλ--⎛⎫⎛⎫⎛⎫= ⎪⎪⎪⎝⎭⎝⎭⎝⎭00E A E A E AB E B E B E 上式两边取行列式,并利用Laplace 定理有nn λλλλ=-EAE AB B E. 又,λλλλ⎛⎫⎛⎫⎛⎫= ⎪⎪ ⎪--⎝⎭⎝⎭⎝⎭00EE A E A B E BE E AB 同理有nn λλλλ=-EAE BA B E. 因而有n n λλλλ-=-E AB E BA .故λλ-=-E AB E BA .§6.3 对角化对于某个线性空间一个线性变换,我们关心的是:能否找到一组基,使得这个线性变换在这组基下的矩阵具有特别简单的形状?对角矩阵可以认为是最为简单的一种矩阵. 而同一线性变换在不同基下的矩阵是相似的. 那么我们的问题就是:是否所有线性变换的矩阵都相似于对角阵呢?如果不然,哪些线性变换的矩阵可以相似于对角阵呢?在这一节里,我们主要讨论这个问题.1. 方阵的对角化定义6.3.1 如果数域P 上的方阵A 与P 上的一个对角矩阵相似,则称方阵A 在P 上可以对角化. 如果数域P 上的有限维线性空间V 的线性变换A 的矩阵在P上可以对角化,则称线性变换A 可以对角化.说明 从上面的定义可以看出,如果线性变换A 可对角化,那么通过选择适当的基,A 在这组基下的矩阵是对角阵.定理6.3.2 设A 是n 维线性空间V 的一个线性变换,那么A 可以对角化的充分必要条件是A 有n 个线性无关的特征向量. 证明 设A 在基12,,,n εεε下的矩阵是A ,即1212(,,,)(,,,)n n =A A εεεεεε.如果A 可以对角化,即存在可逆阵P 使得121n λλλ-⎛⎫⎪⎪= ⎪ ⎪⎝⎭P AP , 则1212(,,,)(,,,)n n =P αααεεε也是V 的一组基,且11212(,,,)(,,,)n n -=P AP A αααααα1212(,,,)n n λλλ⎛⎫⎪⎪= ⎪ ⎪⎝⎭ααα, 则有 (),1,2,,i i i i n λ==A αα.这说明12,,,n ααα是A 特征向量,而它们显然是线性无关的.反过来,如果12,,,n ααα是A 的n 个线性无关的特征向量. 则它同时可以认为就是V 的一组基,而A 在12,,,n ααα下的矩阵是对角阵,即A 可以对角化. 证毕.说明 定理6.3.2可以用矩阵的语言叙述:如果A 是n 阶方阵,则A 相似于对角阵的充分必要条件是A 有n 个线性无关的特征向量(这样的矩阵A 称为可对角化矩阵).推论6.3.3设A 是数域P 上的n 维线性空间V 的一个线性变换. 如果A 的特征多项式在P 中有n 个单根,则A 在P 上可以对角化.证明 由于A 的特征多项式在P 上有n 个单根,即A 在P 上有n 个互异的特征值,而属于不同的特征值的特征向量都是线性无关的,所以A 有n 个线性无关的特征向量,从而由定理6.3.2知,A 在P 上可以对角化.推论6.3.4 设A 是复数域上的n 维线性空间V 的一个线性变换. 如果A 的特征多项式没有重根,则A 可以对角化.说明 上面的两个推论可以用矩阵语言来叙述. 即1)如果复数域上的矩阵A 有n 个单根,则A 在P 上可以对角化.2)如果复数域上的矩阵A 的特征多项式没有重根,则A 在P 上可以对角化.2. 特征子空间下面我们进一步讨论对角化定义6.3.5设A 是数域P 上的n 维线性空间V 的一个线性变换,0λ是A 的一个特征值,则称{}00,()V V λλ=∈=A αααα为A 的属于特征值0λ的特征子空间.因为0()λ=A αα等价于0()()λ-=0E A α,则00Ker()V λλ=-E A . 所以0V λ的确是V 的子空间. 又因为00()()λλ-=-A E A E A A ,则再由第四章§4.4的例4.4.6,我们有下面的命题.命题6.3.6 特征子空间0V λ是A 的不变子空间.现在我们讨论特征值0λ的重数与特征子空间0V λ的维数之间的关系. 定理6.3.7设A 是数域P 上的n 维线性空间V 的一个线性变换,0λ是A 的一个特征值,0V λ是属于A 的特征子空间,则00dim V λλ≤的重数.证明 设0dim V m λ=,且12,,,m ααα是0V λ的一组基,现在将它扩充为V 的一组基:121,,,,,,m m n +ααααα.因为0V λ是属于A 的特征子空间,则0V λ是V 的不变子空间. 因而可设101202011,112,12,11122(),(),(),(),().m m m m m n m n n n n nn n a a a a a a λλλ++++====+++=+++A A A A A αααααααααααααα于是A 在基121,,,,,,m m n +ααααα下的矩阵为01,110,1m n n m nn a a a a λλλ++⎛⎫⎪ ⎪ ⎪ ⎪=⎪ ⎪ ⎪ ⎪ ⎪⎝⎭A . 于是有0()()m g λλλλ-=-E A ,其中()g λ为A 中右下角小块的特征多项式. 故0λ在特征多项式()f λλ=-E A中的重数m ≥,亦即00dim V λλ≤的重数.证毕.定理6.3.8 如果12,,,k λλλ是线性变换A 的不同的特征值,而1,,i i ir αα是属于特征值(1,2,,)i i k λ=的线性无关的特征向量,那么向量组11111,,,,,,k r k kr αααα线性无关.(分析)根据线性无关的定义进行证明. 证明 设1111111111k k r r k k kr kr l l l l ++++++=0αααα令11,1,2,,i i i i i i ir ir l l V i k λ=++∈=ααα. 则上式即为 12k +++=0ααα.所以i α只可能是0,或者是属于i λ的特征向量. 如果12,,,k ααα不全为0,我们不妨设12,,,()s s k ≤ααα都不是0,即它们分别是属于12,,,s λλλ的特征向量,而其余的都是0,则有12s +++=0ααα.这说明12,,,s ααα线性相关,而属于不同特征值的特征向量线性无关,从而引出矛盾. 所以12,,,k ααα全为0,亦即11,1,2,,i i i i i ir ir l l i k =++==0ααα.又1,,i i ir αα线性无关,所以10,1,2,,i i ir l l i k ====.故向量组11111,,,,,,k r k kr αααα线性无关. 证毕.定理6.3.9设A 是数域P 上的n 维线性空间V 的一个线性变换. 则A 可以对角化的充分必要条件是,A 的特征根都是特征值,而且对每个特征值i λ都有dim i i V λλ=的重数.证明 充分性. 设A 的特征根都是特征值,也就是说A 的特征根都在P 中. 令12,,,k λλλ是A 的全部互异的特征根,重数依次为12,,,k r r r . 则12k r r r n +++=.又dim ,(1,,)i i V r i k λ==,则可设1,,i i ir αα是i V λ的一组基. 所以由定理3.8,这n 个特征向量11111,,,,,,k r k kr αααα线性无关. 于是由定理6.3.2,A 可以对角化.必要性. 设A 可以对角化,即A 在某组基下的矩阵是对角阵,则A 有n 个线性无关的特征向量. 这些特征向量经过适当的排列为:11111,,,,,,t s t ts εεεε.其中1,,i i is εε是同一个特征值(1,,)i i t λ=的特征向量.显然,11111,,,,,,t s t ts εεεε也是V 的一组基. 那么A 在这组基下的矩阵为111ttt s s λλλλ⎛⎫⎫ ⎪⎪⎬ ⎪⎪ ⎪⎭⎪ ⎪ ⎪⎫ ⎪⎪ ⎪⎬ ⎪⎪ ⎪⎭⎝⎭, 则A 的特征多项式为1212()()()()t s s s t f λλλλλλλ=---,由于1t s s n ++=,这说明A 的特征根都是特征值. 而(1,,)i i t λ=互异,则i λ的重数为i s . 又由于11111,,,,,,t s t ts εεεε是V 的一组基,线性无关,所以dim i i V s λ≥.而由定理6.3.7,dim i i V s λ≤. 故dim i i V λλ=的重数.证毕 .说明 1)用矩阵语言来叙述:设A 是数域P 上的n 阶方阵. 则A 可以对角化的充分必要条件是,A 的特征根都是特征值,而且对每个特征值i λ都有dim i i V λλ=的重数.2)这个定理给出了一个线性变换A 可对角化的充分必要条件.对于可对角化矩阵A ,现在我们来详细讨论如何求出P ,使得1-P AP 为对角阵.由于A 可对角化,则可设A 的特征值为12,,,n λλλ. 因为P 是可逆阵,不妨设12(,,,)n =P ααα是对P 按列进行分块. 由于121n λλλ-⎛⎫⎪⎪= ⎪ ⎪⎝⎭P AP , 所以12n λλλ⎛⎫⎪⎪= ⎪ ⎪⎝⎭AP P . 因此121122(,,,)(,,,)n n n λλλ=A A A αααααα.即有,i i i λ=A αα所以,可以认为i α就是属于特征值i λ的特征向量. 因此P 的n 个列向量就是A 的n 个线性无关的特征向量. 这表明只要我们求出A 的n 个线性无关特征向量,将它们放在一起组成的矩阵就是所要求的P .说明 因为特征向量不唯一,所以P 不唯一. 另外第i 个列向量对应于第i 个特征值.例6.3.10 判断矩阵100252241⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭A是否相似于对角阵,如果是,求出可逆矩阵P ,使得1-P AP 为对角阵. (分析)首先需要求出特征值,并根据相应的特征向量来判断A 是否相似于对角阵. 解 由于23100252(1)(3)241λλλλλλ--=--=--+E A . 所以A 特征根1(二重)及3(一重),并且都是特征值. 将1λ=代入()3λ-=0E A x 有1231232420,2420.x x x x x x -+=⎧⎨-+=⎩ 容易求得该齐次线性方程组的基础解系为12211,001-⎛⎫⎛⎫ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭εε.将3λ=代入()3λ-=0E A x 后,容易求出这个方程组的基础解系为301.1⎛⎫⎪= ⎪ ⎪⎝⎭ε这说明A 有3个线性无关的特征向量,则它可以对角化. 因而根据上面的讨论有1210100101,010011003--⎛⎫⎛⎫ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭P P AP .推论6.3.11 设A 是数域P 上的n 阶方阵. 则A 在P 上可对角化的充分必要条件是A 的特征根都在P 中,并且对每个特征根i λ都有()i i R n r λ-=-E A ,其中i r 是特征根i λ的重数.证明 对于A 的每个特征根i λ,齐次线性方程组()i λ-=0E A x的解空间的维数为()i n R λ--E A . 而该齐次线性方程组的解空间实际上就是相应于i λ的特征子空间i V λ,所以dim ()i i V n R λλ=--E A .又由定理6.3.9,A 可对角化的充分必要条件是,每个特征根i P λ∈,且dim i i V λλ=的重数i r =.故()i i R n r λ-=-E A . 证毕.例6.3.12 判断下面方阵能否对角化:452221111-⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭A .解 容易求得1是A 的三重特征根;又容易看出(1)033R ⋅-≠=-E A .故A 在任何数域上都不能对角化. 习题A1. 求下列矩阵的特征值与特征向量:1)110143202⎛⎫ ⎪⎪ ⎪⎝⎭; 2)010100001⎛⎫ ⎪ ⎪ ⎪⎝⎭; 3)1100230000230014-⎛⎫⎪⎪ ⎪ ⎪⎝⎭. 2. 已知()()1212,,,,,,,n n a a a b b b ==αβ是两个非零向量且'=0αβ,求矩阵'=αβA 的全部特征值.3. 设A 使线性空间V 上的线性变换,V 有一个直和分解:12m V V V V =⊕⊕⊕,其中每个i V 是A 的不变子空间. 设A 限制在i V 上的特征多项式为()i f λ,求证:A 的特征多项式12()()()()m f f f f λλλλ=.4. 证明:n 阶矩阵A 以任一非零n 列向量为特征向量的充分必要条件是c =A E ,其中c 是常数.5. 设15310ac b c a -⎛⎫ ⎪= ⎪ ⎪--⎝⎭A .如果1=-A ,*A 有一个特征值0λ且属于0λ的一个特征向量为()1,1,1T--. 求0,,,a b c λ的值.6.判断下列矩阵是否相似于对角阵,如果是,求出可逆矩阵P ,使得1-P AP 为对角阵.1)212533102-⎛⎫⎪=- ⎪ ⎪--⎝⎭A ;2)142340313--⎛⎫ ⎪=- ⎪ ⎪-⎝⎭A .7. 矩阵A 是3阶方阵,其特征值为1,1,3,对应的特征向量依次为()()()2,1,0,1,0,1,0,1,1T T T -,求出矩阵A .8. 设3221423kk -⎛⎫ ⎪=-- ⎪ ⎪-⎝⎭A 当k 为何值时,存在可逆矩阵P ,使得1-P AP 为对角阵. 求出P 和对角阵.9. 设12,λλ是A 的两个不同的特征值,12,ξξ分别是12,λλ的特征值,则12+ξξ必不是A 的特征向量.10. 设V 使复数域上的n 维线性空间,A 与B 是V 的两个线性变换,且=A B B A .证明:1)如果0λ是A 的一个特征值,那么0V λ是B 的不变子空间.2)A 与B 至少有一个公共的特征向量.习题B1. 设T =B AA ,其中12(,,,)T n a a a =A ,且(1,2,,)i a i n =为非零实数.1)证明:k l =B B ,并求出数l ,这里k 是正整数;2)求可逆阵C ,使得1-C BC 为对角阵,并写出该对角阵.2. 设A 是m n ⨯矩阵,B 是n m ⨯矩阵,且m n ≥. 求证:m n m n λλλ--=-E AB E BA .3. 设A 是数域P 上n 维线性空间V 的线性变换且可逆. 证明:1)A 的特征值不为零;2)如果0λ是A 的特征值,则10λ-是1-A 的特征值.4. 设A 是数域P 上n 维线性空间V 的线性变换,证明:A 的行列式为零的充分必要条件是A 的一个特征值为零.5. 设A 是一个n 阶下三角阵,证明:1)如果当i j ≠时,ii jj a a ≠,,1,2,,i j n =,那么A 相似于一个对角阵. 2)如果1122nn a a a ===,而至少有一个00000,()i j a i j ≠>,那么A 不相似于对角阵.6. 证明:对任一n 阶复方阵A ,存在可逆矩阵P ,使得1-P AP 为上三角矩阵.。
【⾼等代数】05-线性变换 线性变换是线性代数的核⼼概念,包含的内容和结论⼗分丰富。
之前的讨论其实已经⽐较完备了,但这⾥我还是想把它的主要脉络再梳理⼀遍,然后再补充⼀些重要的问题和结论。
1. 线性变换和不变⼦空间1.1 线性变换 线性变换\mathscr{A}\alpha(或线性映射)的概念⾃⽆需多说,它是线性空间V之间的⼀种映射关系。
⽽映射最重要的概念就是象和原象,尤其是变换的象\mathscr{A}V与核\text{Ker}\mathscr{A},通过关系式(1)搭建起了变换\mathscr{A}的基本机构。
它直观地描述了线性变换在维度上的意义,你可以轻松说出V,\,\text{Ker}\mathscr{A},\,\mathscr{A}V三者之间的关系。
更甚地,可以把V表⽰成某个直交和\text{Ker}\mathscr{A}\oplus U,⽽这⾥U必定与\mathscr{A}V同构。
这个简单的关系很容易被忽略,但它在复合变换的论证中起到了核⼼的作⽤,⽐如关于复合变换的秩(象的维数)的估算,再⽐如后⾯关于幂零变换的归纳法证明。
V/\text{Ker}\mathscr{A}\cong\mathscr{A}V\tag{1} 式(1)说明,变换使得V的维数减少了\text{dim}(\text{Ker}\mathscr{A}),这个⾓度⾮常便于讨论复合变换的秩。
对于复合变换\mathscr{AB},它的秩显然有上界\max\{\text{rank}\mathscr{A},\text{rank}\mathscr{B}\}。
从维度减少的⾓度,不难有式(2)的上界式,从⽽轻松得到复合变换秩的下界式(3)。
使⽤这个⾓度,你可以尝试⼀下下⾯的两个问题。
\text{dim}(\text{Ker}\mathscr{AB})\leqslant\text{dim}(\text{Ker}\mathscr{A})+\text{dim}(\text{Ker}\mathscr{B})\tag{2}\text{rank}(\mathscr{AB})\geqslant\text{rank}{\mathscr{A}}+\text{rank}{\mathscr{B}}-\text{dim}(V)\tag{3} • 如果\text{rank}(\mathscr{AB})=\text{rank}(\mathscr{B}),则对任意变换\mathscr{C}都有\text{rank}(\mathscr{ABC})=\text{rank}(\mathscr{BC})。
关于多项式矩阵秩的恒等式及其推广孙季华(莆田学院数学系 指导老师:杨忠鹏)摘要:本文主要从胡付高[1]的一个定理出发,把定理的条件加以弱化,推导出更一般的关于多项式矩阵秩恒等式的结论,利用矩阵的秩和线性变换的秩关系简单的证明了线性变换在互素多项式下直和分解的结论,同时对[5]的一个猜想给出了证明。
关键词:互素 线性变换 直和 核 二次矩阵Abstract :This paper deduces a more general conclusion about rank identities of the polynomial matrix, whichis based on a theorem of hu fugao.and the condition of the theorem has been weakened.Acorrding to the relations between the rank ot the matrix and the rank of the linear transformation,the conclusions of the direct sum decomposition of the linear transformation under the relatively prime polynomials has been proved easily.Meantime the conjecture of the literature[5] has been proved.Keywords: relatively prime linear transformation direct sum nucleus quadratic matrix0符号说明及引言矩阵的秩的研究是高等代数的一个重要内容,本文在参考文献[1]的一个定理出发对多项式矩阵的秩做进一步的讨论,结合矩阵的知识,分块的初等变换法得到一个更为精确的结论,本文更重要的是利用矩阵和线性变换的秩关系,从而更加简单的证明了线性变换在互素多项式下直分解的结论,并加以推广得到相关的结果,本文进一步对文献[5]的一个尚未解决的猜想给以提出来并加以证明。
主理想环上的扭模总是用D 表示一个主理想整环。
定义 设M 为D 模,如果对任何M m ∈都存在D r ∈使0=rm ,则称M 为扭模。
对于D 中的元a ,定义}0|{)(=∈=am M m a M 。
对于D 中的素元p ,)(1ii p p M M ∞== 称为M 的p 零化子模。
定理 设M 为D 扭模,则p p M M 素元⊕≅。
证:对于任意的M m ∈,ann >=<s r s r p p m 11 ,其中i p 为素元,存在D q i ∈满足,112131212131221=+++--s s s r s r r s r s r r r s r p p p q p p p q p p q令m p p p p q m s i i r s r i r i r i i 111111+-+-=,则i p i M m ∈,所以s p p s M M m m m ++∈++= 11。
由m 的任意性可知p p M M 素元+=。
若对于素元p ,)(q p q p M M m ≠+∈ ,即存在不同的素元s p p p ,,1,满足0=m p i ,0=k r k m p k ,s m m m ++= 1,所以011=m p p kr k r 。
由于存在D r q ∈,使111=+s r s r i p rp qp ,于是011=+=m p rp m qp m s r s r i 。
这说明0)(=+≠q p q p M M 。
所以p p M M 素元⊕≅。
定义 设M 为D 扭模,如果对于D 中的素元p ,p M M =,则称M 为p 模。
定理 设M 为p 模,则∞∞=⊕⊕=M M M i i )(1,其中x D M i i p x i Λ∈⊕≅,∞=,,2,1 i , x D k p 表示由x 生成的循环子模满足D p D x D k p k /≅, ,2,1=k ,x D p ∞表示由},,,{210 x x x x =生成的满足关系1-=i i x px ,,2,1=i 的子模,等价地,x D p ∞为由},/,/,{2 p x p x x (n n x p x =/)生成的M 的子模。