矩阵可对角化的判定条件及推广
- 格式:doc
- 大小:825.26 KB
- 文档页数:8
对角化的充要条件
可对角化的充要条件是n阶方阵存在n个线性无关的特征向量。
矩阵可对角化的充分条件:
第一:矩阵A为n阶方阵。
第二:充要条件是有n个线性无关的特征向量。
第三充分条件n个特征值互不相等也就是由特征值求出n个特征向量,组成变换矩阵P,P=(a1,a2,。
an),那么:P逆AP=主对角线为特征值的对角阵。
矩阵对角化的条件
有个线性无关的特征向量,可对角化矩阵是线性代数和矩阵论中重要的一类矩阵。
如果一个方块矩阵A相似于对角矩阵,也就是说,如果存在一个可逆矩阵P使得P1AP是对角矩阵,则它就被称为可对角化的。
对角化的充分必要条件
有两条,其一是n阶方阵存在n个线性无关的特征向量,其二是如果阶n方阵存在重复的特征值,每个特征值的线性无关的特征向量的个数恰好等于该特征值的重复次数。
可对角化矩阵
对合在实数上(甚至特征不是2 的任何域)是可对角化的,带有
1 和-1 在对角线上。
有限阶自同态(包括对合)是在复数,或域的特征不整除自同态的阶的任何代数闭合域(因为单位一的根是不同的)是可对角化的,带有单位根在对角线上。
这是循环群的表示理论的一部分。
投影是可对角化的,带有0 和1 在对角线上。
20.1 矩阵可对角化的条件设矩阵有个线性无关的特征向量令则是一个对角矩阵其对角元素是的特征值:20.1 矩阵可对角化的条件事实上,于是因可逆,故20.1 矩阵可对角化的条件若存在可逆矩阵使为对角矩阵,则称矩阵是可对角化的(diagonalized).由上面的分析知,反之也成立. 故有定理:矩阵可对角化的充要条件是有个线性无关的特征向量.20.1 矩阵可对角化的条件例:的特征值为故只有个线性无关的特征向量,因此不能对角化.20.1 矩阵可对角化的条件定理:设是的互异特征值,是相应特征向量. 则线性无关.证明:设两边左乘得再左乘得不断左乘直到得故有20.1 矩阵可对角化的条件左边第二个矩阵的行列式行列式因此该矩阵可逆,故由于特征向量均为非零向量,故所以线性无关.20.1 矩阵可对角化的条件推论:具有个两两互异特征值的矩阵可以对角化.但若矩阵有相同特征值,其也可能对角化.例:有重特征值任何可逆矩阵都使是对角阵. 这反映了所有非零向量都是单位矩阵的特征向量.20.2 特征值的代数重数和几何重数定义:设其中称为特征值的代数重数(algebraicmultiplicity),记作称为特征值的几何重数(geometric multiplicity),记作例:20.2 特征值的代数重数和几何重数例:例:20.2 特征值的代数重数和几何重数一般地,命题:引理1:相似矩阵具有相同的特征多项式.事实上,设可逆,则我们有20.2 特征值的代数重数和几何重数引理2:任意复方阵相似于上三角阵,且其对角元为矩阵的特征值. 证明:对方阵的阶数用数学归纳法.时结论成立. 假设对阶复方阵结论成立.对任意阶复方阵设其有特征值及相应特征向量则可将其扩充得的一组基有记则有20.2 特征值的代数重数和几何重数对阶复方阵由归纳假设, 存在可逆阵使得为上三角阵.令为上三角阵.则结论第一部分得证.由引理1知上三角阵的对角元为的特征值.20.2 特征值的代数重数和几何重数命题的证明:由引理2,相似于上三角阵则和有相同特征值,且对任意特征值因此,不妨设是上三角阵,即于是故20.2 特征值的代数重数和几何重数定理:复方阵可对角化对任意特征值事实上,若则故有个线性无关的特征向量.从而可对角化.20.2 特征值的代数重数和几何重数例:判断是否可对角化,若可以求使为对角阵.解:于是又因此,可对角化.20.2 特征值的代数重数和几何重数对的基础解系为对的基础解系为20.2 特征值的代数重数和几何重数令则20.2 特征值的代数重数和几何重数注:可以看到,使对角化的矩阵不是唯一的. 一个特征向量乘以非零常数后仍是属于同一特征值的特征向量,所以若用任意非零常数乘以的各列,则得一个新的使对角化的矩阵. 而对于重特征值则有更大自由度. 上例中由的任意线性组合得到的两个线性无关的向量都可充当的前两列.20.2 特征值的代数重数和几何重数例:设其中为矩阵.的秩为的秩为故可对角化.20.3 矩阵可对角化的应用若矩阵可对角化,则可快速计算例:设求解:的特征值可对角化.20.3 矩阵可对角化的应用对的基础解系为对的基础解系为20.3 矩阵可对角化的应用令 则故20.3 矩阵可对角化的应用例(Markov过程):每年海淀区以外人口的迁入海淀区,而海淀区人口的迁出. 这给出一个差分方程:设最初外部人口为内部人口为则一年以后外部人口内部人口即20.3 矩阵可对角化的应用这个虚构的人口迁移过程有两个特点:(1)人口总数保持不变;(2)海淀区外部和内部的人口数不是负的. 我们称之为Markov(马尔科夫)过程.由性质(1),矩阵每一列元素之和为由性质(2),矩阵元素非负. 同样等也非负.20.3 矩阵可对角化的应用记取则20.3 矩阵可对角化的应用于是我们可求和年之后的人口分布:20.3 矩阵可对角化的应用可以看出,经过很多年之后,会变得非常小,从而这个解达到一个极限状态:此时,总人口仍为与初始状态相同. 但在此极限状态下,总人口的在外部,在内部, 并且这个数据无论初始分布怎样总成立.20.3 矩阵可对角化的应用注意到即这个稳定状态是Markov矩阵关于的特征向量.20.3 矩阵可对角化的应用例(Fibonacci数列):数列满足规律这是一个差分方程.怎样由出发,求出Fibonacci数列的通项公式呢?20.3 矩阵可对角化的应用令则即于是只需求20.3 矩阵可对角化的应用故20.3 矩阵可对角化的应用初始值给出于是Fibonacci数是这个乘积的第二个分量20.3 矩阵可对角化的应用我们希望研究由差分方程描述的离散动力系统的长期行为,即时解的性质.设可对角化,即存在可逆矩阵其中使为对角阵.则其中即可以看出,的增长由因子支配. 因此系统的稳定性依赖于的特征值.20.3 矩阵可对角化的应用对由一个差分方程定义的离散动力系统,当的所有特征值时,它是稳定的(stable),且;当所有时,它是中性稳定的(neutrally stable),且有界;而当至少有一个特征值时,它是不稳定的(unstable),且是无界的.Markov过程是中性稳定的,Fibonacci数列是不稳定的.20.3 矩阵可对角化的应用例:考虑差分方程其中的特征值为其对角元和故该系统是稳定的.由任何一个初始向量出发,的解必定最终趋向于如:20.3 矩阵可对角化的应用可以看到从开始,而的实际作用是,若把分解成的两个特征向量的和:则把属于的特征向量化为零,而把属于的特征向量乘以20.4 同时对角化问题:给定两个阶矩阵是否存在可逆矩阵使得同时为对角阵,也即同时对角化?命题:若有相同特征向量矩阵使得为对角阵,则事实上,20.4 同时对角化重要的是,“逆”命题也成立. 我们不加证明地给出:定理:若均可对角化,且则可同时对角化.注意到,若则故和是的属于同一特征值的特征向量. 看简单的情况.假设的特征值两两互异,则其所有特征子空间都是一维的. 于是必是的倍数,也即是的特征向量. 从而有公共特征向量矩阵,可同时对角化.20.4 同时对角化定理:对阶复矩阵若矩阵的特征值两两互异,则可同时对角化.20.4 同时对角化小结:1. 矩阵可对角化,指存在可逆矩阵使为对角阵.2. 矩阵可对角化有个线性无关的特征向量.3. 若复矩阵有个互异特征值,则可对角化.4. 复矩阵可对角化任意特征值的几何重数等于代数重数.5. 设可对角化, 即存在可逆阵使则6. 差分方程的解为其中。
矩阵可对角化的判定条件及推广
矩阵的对角化是矩阵理论的一个重要概念,它指的是有一种转换,使给定的方阵成为一个主对角线向量组成的对角矩阵。
矩阵可对角化是一个重要的判定条件,当满足所有下列条件时,矩阵可以对角化:
1、矩阵必须是n阶可逆矩阵,且n>1,即A必须为n阶可逆方阵;
2、所有特征值都是不同的,只有不同的特征值才能保证对角矩阵的特性;
3、矩阵的特征向量必须互相垂直,它们的内积必须为零,两个向量只有在这种状态下才能够形成一个正交矩阵;
4、矩阵的特征向量必须是单位向量,这种向量的模为1,只有确保矩阵的行列式的值不为0,才能让对角矩阵与原矩阵相同。
对角化矩阵的概念可以拓展到实数矩阵,在这种情况下,矩阵可先进行置换变换,让特征值互不相同,然后进行双对角化,将原矩阵分解为两个对角矩阵的乘积,然后将每个矩阵的特征向量分别作为其特征值的正交基,最后将所有对角矩阵的特征值按照其特定顺序汇总起来,从而形成一个新的对角矩阵。
补充到此,实数矩阵也同样满足上述矩阵可对角化的四条条件。
综上所述,矩阵可对角化的判定条件是:矩阵是可逆矩阵,并且特征值各不相同,特征向量互相垂直,且为单位向量,这四条条件同时满足时,矩阵可以对角化。
此外,对角化的概念也可以拓展到实数矩阵,用置换变换与双对角化使实数矩阵可对角化,实数矩阵也必须满足上述四条条件。
实对称矩阵可对角化的充要条件实对称矩阵可对角化的充要条件是它有n个线性无关的特征向量。
这个结论是非常重要的,因为实对称矩阵在很多领域都有广泛的应用,比如线性代数、数学物理、信号处理等等。
实对称矩阵的对角化可以化简矩阵运算,使得问题更加简单和易于处理。
具体来说,实对称矩阵是指一个矩阵和它的转置矩阵相等。
因此,它的所有特征值都是实数。
而且,它的特征向量是两两正交的。
这意味着,我们可以构造一个正交矩阵,使得它的每一列都是实对称矩阵的一个特征向量。
这个正交矩阵的逆矩阵就是实对称矩阵的对角化矩阵。
要证明这个结论,我们需要用到一些基本的线性代数知识。
首先,我们知道一个方阵的特征向量是指在矩阵乘以一个向量后,这个向量的方向没有改变,只是长度变成了原来的特征值倍。
其次,我们知道一个矩阵的特征向量是线性无关的,当且仅当它的特征值都不相同。
最后,我们知道一个矩阵可以对角化的充要条件是它有n个线性无关的特征向量。
因此,我们只需要证明实对称矩阵的特征向量是线性无关的。
假设实对称矩阵A有两个特征向量v和w,对应的特征值分别为λ和μ。
那么,根据特征向量的定义,我们有:Av = λvAw = μw将第一个等式左乘w的转置,右乘v,第二个等式左乘v的转置,右乘w,然后将两个等式相减,得到:(λ - μ)(v·w) = 0其中,v·w表示向量v和w的内积。
由于实对称矩阵的特征值都是实数,因此有λ - μ ≠ 0。
又因为v和w是非零向量,所以v·w ≠ 0。
因此,我们得到了矛盾,即v和w不能同时是实对称矩阵的特征向量。
因此,实对称矩阵的特征向量是线性无关的。
综上所述,实对称矩阵可对角化的充要条件是它有n个线性无关的特征向量。
这个结论不仅是理论上的重要结果,也是实际应用中的重要工具。
矩阵可对角化的条件学生:翟亚丽 指导老师:王全虎一 引言矩阵可对角化的问题是高等代数和矩阵论最基本的问题之一,也是人们一直研究的问题之一。
从矩阵对角化的判别法则到矩阵对角化的方法,从矩阵对角化的方法再到矩阵可对角化的条件,再延伸到矩阵的广义对角化,本文从矩阵可对角化的各种例子和矩阵可对角化的各种定理归纳总结出矩阵可对角化的条件。
二 矩阵可对角化的概念定义【2】 设A 是数域F 上一个n 阶矩阵,如果存在F 上一个n 阶可逆矩阵T 使得T -1AT具有对角形式100n a a ⎛⎫ ⎪ ⎪ ⎪⎝⎭ 那么就称矩阵A 可对角化。
三 矩阵可对角化的相关定理定理1【1】 n 阶矩阵A 相似对角矩阵的充要条件是A 有n 个线性无关的特征向量。
定理2【3】 设i λ是线性变换A 的特征值,它的代数重数为i n ,几何重数为i m ,且1i im n ≤≤则A 可对角化的充分必要条件是:每个特征值的几何重数都等于代数重数。
定理 3【3】 A 可对角化⇔A 的最小多项式没有重根。
四 由矩阵可对角化的定理所引出的矩阵可对角化的条件及其相互之间的关系。
(一)设【12】()n M F A∈,K 重根按k 个计算,则A 可对角化⇒A 有n 个特征根,自然会问:A 有n 个特征根是否也是A 可对角化的充分条件?看例子11()01n M F ⎛⎫A =∈ ⎪⎝⎭则2()(1)A x x λ=-于是A 有2个特征值为1,但A 却不能对角化,故此例告诉我们A 有n 个特征根只是A 可对角化的必要条件,而非充要条件。
而且一般形如1,0k k F k ⎛⎫A =∈ ⎪⎝⎭的矩阵都不能对角化。
在给出A 可对角化的充要条件时需对特征根的特征向量要进一步讨论,若矩阵A 有n 个线性无关的特征向量则该矩阵可对角化,又有定理(二)设()n M F A∈,若在F 中,A 有n 个不同的特征根,则A 可对角化。
因为,不同特征根对应的特征向量必线性无关,则特征向量线性无关时可得出矩阵可对角化。
第二节矩阵可对于角化的条件之阳早格格创做定义1如果矩阵能取对于角矩阵相似,则称可对于角化.例1 设,则有:,即.进而可对于角化.定理1 阶矩阵可对于角化的充分需要条件是有个线性无闭的特性背量.说明:需要性如果可对于角化,则存留可顺矩阵,使得将按列分块得,进而有果此有,所以是的属于特性值的特性背量,又由可顺,知线性无闭,故有个线性无闭的特性背量.充分性设是的个线性无闭的特性背量,它们对于应的特性值依次为,则有.令,则是一个可顺矩阵且有:果此有,即,也便是矩阵可对于角化.注若,则,对于按列分块得,于是有,即,进而.可睹,对于角矩阵的元素便是矩阵的特性值,可顺矩阵便是由的线性无闭的特性背量所形成的,而且特性背量的程序依好于对于角矩阵.定理2矩阵的属于分歧特性值的特性背量是线性无闭的.说明:设是的个互没有相共的特性值,是的属于特性值的特性背量,现对于做数教归纳法说明线性无闭.当时,由于特性背量没有为整,果此定理创造.假设的个互没有相共的特性值对于应的个特性背量是线性无闭的.设是的个互没有相共的特性值,是的属于特性值的特性背量.又设(1)创造.则有,又将(1)式二边共乘得:进而有,由归纳假设得,再由二二互没有相共可得,将其代进(1)式得,果此有,进而线性无闭.推论1若阶矩阵有个互没有相共的特性值,则可对于角化,且.定理3设是阶矩阵的个互同特性值,对于应于的线性无闭的特性背量为,则由所有那些特性背量(共个)形成的背量组是线性无闭的.说明:设,记,,则有,且或者是的属于特性值的特性背量.若存留某个,,则由属于分歧特性值的特性背量线性无闭知,冲突.果此有,,又由已知得,,果此背量组线性无闭.定理4设是阶矩阵的一个沉特性值,对于应于的特性背量线性无闭的最大个数为,则,即齐次线性圆程组的前提解系所含背量个数没有超出特性值的沉数.说明:用反证法.由于是的属于特性值的特性背量当且仅当是齐次线性圆程组的非整解,果此对于应于的特性背量线性无闭的最大个数取齐次线性圆程组的前提解系所含背量个数相等.设是齐次线性圆程组的一个前提解系,且假设,则有.现将扩充为一个维线性无闭背量组,其中一定是的特性背量,但是有是一个维背量,进而可由背量组线性表示,即:果而有:(2)其中有个.令,并将(2)式左端矩阵分块表示,则有,由相似矩阵有相共的特性多项式,得的特性多项式为:其中是的次多项式.进而起码是的沉特性值,取是沉特性值冲突.所以.定理5 阶矩阵可对于角化的充分需要条件是:的每个特性值对于应的特性背量线性无闭的最大个数等于该特性值的沉数(即的每个特性值对于应的齐次线性圆程组的前提解系所含背量个数等于该特性值的沉数,也即的每个特性子空间的维数等于该特性值的沉数).说明:设,其中二二分歧,且有.充分性由于对于应于的特性背量有个线性无闭,又个特性值互同,果此有个线性无闭的特性背量,故可对于角化.需要性(反证法)设有一个特性值所对于应的线性无闭的特性背量的最大个数的沉数,则的线性无闭的特性背量个数小于,故没有克没有及取对于角矩阵相似.例2设,供的特性值战特性背量,并推断是可可对于角化?解:由得的特性值为(二沉特性值).当时,由,即:得前提解系为,进而的属于特性值的特性背量为(为任性非整常数).当时,由,即:得前提解系为,进而的属于特性值的特性背量为(为任性非整常数).由于的特性值对于应的齐次线性圆程组的前提解系所含背量个数小于特性值的沉数,故没有成对于角化.例3巳知,推断是可对于角化?若能对于角化,供可顺矩阵,使得为对于角阵.解:由得的特性值为(二沉特性值).当时,由,即:得前提解系为,进而的属于特性值的特性背量为(为任性非整常数).当时,由,即:得前提解系为及,进而的属于特性值的特性背量为(为任性没有齐为整的常数).由于的每个特性值对于应的齐次线性圆程组的前提解系所含背量个数等于特性值的沉数,故可对于角化.令,则.例4设是阶矩阵,,推断是可可对于角化.解:设的特性圆程的二个根为,则,故有二个分歧的特性值,进而可对于角化.例5设真对于称矩阵,问是可可对于角化?若可对于角化,供矩阵,使得为对于角阵,并供(为正整数).解:由得的特性值为(三沉特性值).当时,由,即:得前提解系为,进而的属于特性值的特性背量为(为任性非整常数).当时,由,即:得前提解系为,,,进而的属于特性值的特性背量为(为任性没有齐为整的常数).由于的每个特性值对于应的齐次线性圆程组的前提解系所含背量个数等于特性值的沉数,故可对于角化.令,则.进而,且例6设阶矩阵谦脚(称为幂等矩阵),说明:的特性值只可为或者,而且可对于角化.说明:设是的属于特性值的特性背量,则,由,得,所以幂等矩阵的特性值只可为或者.设秩,当秩时,,故可对于角化且;当秩时,可顺,由得,故可对于角化且;现设.当特性值时,其特性矩阵的秩为.那是果为由,所以;又,果而,进而有.再由可得对于应于的线性无闭的特性背量的最大个数为.设的属于特性值的个线性无闭的特性背量为.当特性值时,由可得对于应于的线性无闭的特性背量的最大个数为.设的属于特性值的个线性无闭的特性背量为.进而有个线性无闭的特性背量,故可对于角化.令,则,其中主对于角线上的个数为秩个,的个数为个.。
可对⾓化的其他判定准则及其应⽤矩阵或线性变换的可对⾓化判定是⾼等代数的重要知识点. 由于判定准则多, 技巧性强, 故可对⾓化判定⼀直是教学和考试中的难点. ⼀般来说,判定n维复线性空间V上的线性变换\varphi (或n阶复矩阵A) 可对⾓化, 通常有以下六种⽅法 (参考复旦⾼代教材的第六章和第七章):(D1) \varphi可对⾓化的充要条件是\varphi有n个线性⽆关的特征向量;(D2) 若\varphi有n个不同的特征值, 则\varphi可对⾓化;(D3) \varphi可对⾓化的充要条件是V是\varphi的特征⼦空间的直和;(D4) \varphi可对⾓化的充要条件是\varphi有完全的特征向量系, 即对\varphi的任⼀特征值, 其⼏何重数等于其代数重数;(D5) \varphi可对⾓化的充要条件是\varphi的极⼩多项式⽆重根;(D6) \varphi可对⾓化的充要条件是\varphi的 Jordan 块都是⼀阶的, 或等价地, \varphi的初等因⼦都是⼀次多项式.本⽂的主要⽬的是, 给出可对⾓化的⼀些其他的判定准则及其应⽤. 以下总是以线性变换作为对象来阐述和证明结论, 其对应的矩阵版本, 留给读者⾃⼰补充完整.⾸先, 我们来证明⼀个具有良好性质的线性变换的⼤型引理.引理 1 设V是数域\mathbb{K}上的n维线性空间, \varphi是V上的线性变换, 则以下九个结论等价:(1) V=\mathrm{Ker}\varphi\oplus\mathrm{Im}\varphi;(2) V=\mathrm{Ker}\varphi+\mathrm{Im}\varphi;(3) \mathrm{Ker}\varphi\cap\mathrm{Im}\varphi=0;(4) \mathrm{Ker}\varphi=\mathrm{Ker}\varphi^2, 或等价地, \dim\mathrm{Ker}\varphi=\dim\mathrm{Ker}\varphi^2;(5) \mathrm{Ker}\varphi=\mathrm{Ker}\varphi^2=\mathrm{Ker}\varphi^3=\cdots, 或等价地,\dim\mathrm{Ker}\varphi=\dim\mathrm{Ker}\varphi^2=\dim\mathrm{Ker}\varphi^3=\cdots;(6) \mathrm{Im}\varphi=\mathrm{Im}\varphi^2, 或等价地, r(\varphi)=r(\varphi^2);(7) \mathrm{Im}\varphi=\mathrm{Im}\varphi^2=\mathrm{Im}\varphi^3=\cdots, 或等价地, r(\varphi)=r(\varphi^2)=r(\varphi^3)=\cdots;(8) \mathrm{Ker}\varphi存在\varphi-不变补空间, 即存在\varphi-不变⼦空间U, 使得V=\mathrm{Ker}\varphi\oplus U;(9) \mathrm{Im}\varphi存在\varphi-不变补空间, 即存在\varphi-不变⼦空间W, 使得V=\mathrm{Im}\varphi\oplus W.证明由直和的定义可知 (1) \Leftrightarrow (2)+(3), 于是 (1) \Rightarrow (2) 和 (1) \Rightarrow (3) 都是显然的. 根据交和空间维数公式和线性映射维数公式可知\dim(\mathrm{Ker}\varphi+\mathrm{Im}\varphi)=\dim\mathrm{Ker}\varphi+\dim\mathrm{Im}\varphi-\dim(\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi)=\dim V-\dim(\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi),于是 (2) \Leftrightarrow (3) 成⽴,从⽽前三个结论两两等价.(3) \Rightarrow (4): 显然\mathrm{Ker}\varphi\subseteq\mathrm{Ker}\varphi^2成⽴. 任取\alpha\in\mathrm{Ker}\varphi^2, 则\varphi(\alpha)\in\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi=0, 于是\varphi(\alpha)=0, 即\alpha\in\mathrm{Ker}\varphi, 从⽽\mathrm{Ker}\varphi^2\subseteq\mathrm{Ker}\varphi也成⽴, 于是 (4) 成⽴.(4) \Rightarrow (3): 任取\alpha\in\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi, 则存在\beta\in V, 使得\alpha=\varphi(\beta), 于是0=\varphi(\alpha)=\varphi^2(\beta), 即\beta\in\mathrm{Ker}\varphi^2=\mathrm{Ker}\varphi, 从⽽\alpha=\varphi(\beta)=0, 即 (3) 成⽴.(5) \Rightarrow (4) 是显然的, 下证 (4) \Rightarrow (5): 设\mathrm{Ker}\varphi^k=\mathrm{Ker}\varphi^{k+1}已对正整数k成⽴, 先证\mathrm{Ker}\varphi^{k+1}=\mathrm{Ker}\varphi^{k+2}也成⽴, 然后⽤归纳法即得结论. \mathrm{Ker}\varphi^{k+1}\subseteq\mathrm{Ker}\varphi^{k+2}是显然的. 任取\alpha\in\mathrm{Ker}\varphi^{k+2}, 即0=\varphi^{k+2} (\alpha)=\varphi^{k+1}(\varphi(\alpha)), 于是\varphi(\alpha)\in\mathrm{Ker}\varphi^{k+1}=\mathrm{Ker}\varphi^k, 从⽽\varphi^{k+1}(\alpha)=\varphi^k(\varphi(\alpha))=0, 即\alpha\in\mathrm{Ker}\varphi^{k+1}, 于是\mathrm{Ker}\varphi^{k+2}\subseteq\mathrm{Ker}\varphi^{k+1}也成⽴.(3) \Leftrightarrow (6): 考虑\varphi在不变⼦空间\mathrm{Im}\varphi上的限制变换\varphi|_{\mathrm{Im}\varphi}:\mathrm{Im}\varphi\to\mathrm{Im}\varphi, 由限制的定义可知它的核等于\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi, 它的像等于\mathrm{Im}\varphi^2. 由于有限维线性空间上的线性变换是单射当且仅当它是满射,当且仅当它是同构, 故 (3) \Leftrightarrow (6) 成⽴.(7) \Rightarrow (6) 是显然的, 下证 (6) \Rightarrow (7): 设\mathrm{Im}\varphi^k=\mathrm{Im}\varphi^{k+1}已对正整数k成⽴, 先证\mathrm{Im}\varphi^{k+1}=\mathrm{Im}\varphi^{k+2}也成⽴, 然后⽤归纳法即得结论. \mathrm{Im}\varphi^{k+2}\subseteq\mathrm{Im}\varphi^{k+1}是显然的. 任取\alpha\in\mathrm{Im}\varphi^{k+1}, 即存在\beta\in V, 使得\alpha=\varphi^{k+1}(\beta). 由于\varphi^k(\beta)\in\mathrm{Im}\varphi^k=\mathrm{Im}\varphi^{k+1}, 故存在\gamma\in V, 使得\varphi^k(\beta)=\varphi^{k+1}(\gamma), 于是\alpha=\varphi^{k+1}(\beta)=\varphi(\varphi^k(\beta))=\varphi(\varphi^{k+1}(\gamma))=\varphi^{k+2}(\gamma)\in\mathrm{Im}\varphi^{k+2}, 从⽽\mathrm{Im}\varphi^{k+1}\subseteq\mathrm{Im}\varphi^{k+2}也成⽴. (1) \Rightarrow (8) 是显然的, 下证 (8) \Rightarrow (1). 我们先证\mathrm{Im}\varphi\subseteq U: 任取\varphi(v)\in\mathrm{Im}\varphi, 由直和分解可设v=v_1+u, 其中v_1\in\mathrm{Ker}\varphi, u\in U, 则由U的\varphi-不变性可得\varphi(v)=\varphi(v_1)+\varphi(u)=\varphi(u)\in U.考虑不等式\dim V=\dim(\mathrm{Ker}\varphi\oplus U)=\dim\mathrm{Ker}\varphi+\dim U\geq\dim\mathrm{Ker}\varphi+\dim\mathrm{Im}\varphi=\dim V,从⽽只能是U=\mathrm{Im}\varphi, 于是 (1) 成⽴.(1) \Rightarrow (9) 是显然的, 下证 (9) \Rightarrow (1). 我们先证W\subseteq\mathrm{Ker}\varphi: 任取w\in W, 则由W的\varphi-不变性可得\varphi(w)\in\mathrm{Im}\varphi\cap W=0, 即有w\in\mathrm{Ker}\varphi. 考虑不等式\dim V=\dim(\mathrm{Im}\varphi\oplusW)=\dim\mathrm{Im}\varphi+\dim W\leq\dim\mathrm{Im}\varphi+\dim\mathrm{Ker}\varphi=\dim V,从⽽只能是W=\mathrm{Ker}\varphi, 于是(1) 成⽴. \Box注 1 引理 1 是 15 级⾼等代数 I 每周⼀题第 10 题, 其证明思路在⾼代⽩⽪书的例 4.32, 例 4.33, 例 4.34 和例 7.13 中均有所涉及.有了引理 1 做铺垫, 我们可以证明⼀系列的可对⾓化判定准则.定理 1 设\varphi是n维复线性空间V上的线性变换, 则\varphi可对⾓化的充要条件是对\varphi的任⼀特征值\lambda_0, 下列条件之⼀成⽴:(E1) V=\mathrm{Ker}(\varphi-\lambda_0I_V)\oplus\mathrm{Im}(\varphi-\lambda_0I_V);(E2) V=\mathrm{Ker}(\varphi-\lambda_0I_V)+\mathrm{Im}(\varphi-\lambda_0I_V);(E3) \mathrm{Ker}(\varphi-\lambda_0I_V)\cap\mathrm{Im}(\varphi-\lambda_0I_V)=0;(E4) \mathrm{Ker}(\varphi-\lambda_0I_V)=\mathrm{Ker}(\varphi-\lambda_0I_V)^2, 或等价地, \dim\mathrm{Ker}(\varphi-\lambda_0I_V)=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^2;(E5) \mathrm{Ker}(\varphi-\lambda_0I_V)=\mathrm{Ker}(\varphi-\lambda_0I_V)^2=\mathrm{Ker}(\varphi-\lambda_0I_V)^3=\cdots, 或等价地, \dim\mathrm{Ker}(\varphi-\lambda_0I_V)=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^2=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^3=\cdots; (E6) \mathrm{Im}(\varphi-\lambda_0I_V)=\mathrm{Im}(\varphi-\lambda_0I_V)^2, 或等价地, r(\varphi-\lambda_0I_V)=r((\varphi-\lambda_0I_V)^2);(E7) \mathrm{Im}(\varphi-\lambda_0I_V)=\mathrm{Im}(\varphi-\lambda_0I_V)^2=\mathrm{Im}(\varphi-\lambda_0I_V)^3=\cdots, 或等价地,r(\varphi-\lambda_0I_V)=r((\varphi-\lambda_0I_V)^2)=r((\varphi-\lambda_0I_V)^3)=\cdots;(E8) \mathrm{Ker}(\varphi-\lambda_0I_V)存在\varphi-不变补空间, 即存在\varphi-不变⼦空间U, 使得V=\mathrm{Ker}(\varphi-\lambda_0I_V)\oplus U;(E9) \mathrm{Im}(\varphi-\lambda_0I_V)存在\varphi-不变补空间, 即存在\varphi-不变⼦空间W, 使得V=\mathrm{Im}(\varphi-\lambda_0I_V)\oplus W.证明由引理 1 可知, ⽆论是充分性还是必要性, 我们只要选取 (E1)--(E9) 中的⼀个等价条件来证明即可.必要性设\varphi可对⾓化, 即存在V的⼀组基\{e_1,e_2,\cdots,e_n\}, 使得\varphi在这组基下的表⽰矩阵为对⾓阵\mathrm{diag}\{\lambda_1,\lambda_2,\cdots,\lambda_n\}, 不妨设\lambda_1=\cdots=\lambda_r=\lambda_0, \lambda_j\neq\lambda_0\,(r<j\leq n). 由表⽰矩阵的定义可知\varphi(e_i)=\lambda_ie_i\,(1\leq i\leq n), 通过简单的验证可得\mathrm{Ker}(\varphi-\lambda_0I_V)=L(e_1,\cdots,e_r),\mathrm{Im}(\varphi-\lambda_0I_V)=L(e_{r+1},\cdots,e_n), 于是 (E1) 成⽴.充分性对应于不同的等价条件, 我们给出⼏种不同的证法.从 (E3) 出发: ⽤反证法, 设\varphi不可对⾓化, 则由 (D6) 可知, 存在V的⼀组基\{e_1,e_2,\cdots,e_n\}, 使得\varphi在这组基下的表⽰矩阵为 Jordan 标准型\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}, 且⾄少有⼀个 Jordan 块的阶数⼤于 1.不妨设r_1>1, 则由表⽰矩阵的定义可知\varphi(e_1)=\lambda_1e_1,\,\,\,\,\varphi(e_2)=e_1+\lambda_1e_2.于是(\varphi-\lambda_1I_V) (e_1)=0, (\varphi-\lambda_1I_V)(e_2)=e_1, 从⽽0\neq e_1\in\mathrm{Ker}(\varphi-\lambda_1I_V)\cap\mathrm{Im}(\varphi-\lambda_1I_V),这与已知⽭盾.从 (E5) 出发: 由\mathrm{Ker}(\varphi-\lambda_0I_V)=\cdots=\mathrm{Ker}(\varphi-\lambda_0I_V)^n可知, \lambda_0的根⼦空间等于其特征⼦空间. 因为全空间V可以分解为根⼦空间的直和, 故全空间V也是特征⼦空间的直和, 从⽽由判定准则 (D3) 即得结论.从 (E5) 出发: 由\dim\mathrm{Ker}(\varphi-\lambda_0I_V)=\cdots=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^n可知, \lambda_0的⼏何重数\dim\mathrm{Ker}(\varphi-\lambda_0I_V)等于其代数重数\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^n, 从⽽由判定准则 (D4) 即得结论.从 (E5) 出发: 设\varphi的全体不同特征值为\lambda_1,\lambda_2,\cdots,\lambda_k, \varphi的特征多项式为f(\lambda)=(\lambda-\lambda_1)^{m_1}(\lambda-\lambda_2)^{m_2}\cdots(\lambda-\lambda_k)^{m_k},则对任意的\alpha\in V, 由 Cayley-Hamilton 定理可知(\varphi-\lambda_1I_V)^{m_1}(\varphi-\lambda_2I_V)^{m_2}\cdots(\varphi-\lambda_kI_V)^{m_k}(\alpha)=0,即(\varphi-\lambda_2I_V)^{m_2}\cdots(\varphi-\lambda_kI_V)^{m_k}(\alpha)\in\mathrm{Ker}(\varphi-\lambda_1I_V)^{m_1}=\mathrm{Ker}(\varphi-\lambda_1I_V), 从⽽(\varphi-\lambda_1I_V)(\varphi-\lambda_2I_V)^{m_2}\cdots(\varphi-\lambda_kI_V)^{m_k}(\alpha)=0.不断这样做下去,最终可得对任意的\alpha\in V, 总有(\varphi-\lambda_1I_V)(\varphi-\lambda_2I_V)\cdots(\varphi-\lambda_kI_V)(\alpha)=0,即\varphi适合多项式g(\lambda)=(\lambda-\lambda_1)(\lambda-\lambda_2)\cdots(\lambda-\lambda_k), 从⽽\varphi的极⼩多项式m(\lambda)\midg(\lambda). ⼜由极⼩多项式的性质可知g(\lambda)\mid m(\lambda), 于是m(\lambda)=g(\lambda)⽆重根, 从⽽由判定准则 (D5) 即得结论.从 (E6) 出发: ⽤反证法, 设\varphi不可对⾓化, 则由 (D6) 可知, \varphi的 Jordan 标准型J=\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}中⾄少有⼀个 Jordan 块的阶数⼤于 1. 不妨设r_1>1, 则有r(J_{r_1}(\lambda_1)-\lambda_1I_{r_1})=r_1-1, ⽽r((J_{r_1}(\lambda_1)-\lambda_1I_{r_1})^2)=r_1-2. 由矩阵秩的基本不等式可知, r(J-\lambda_1I_n)>r((J-\lambda_1I_n)^2), 即有r(\varphi-\lambda_1I_V)>r((\varphi-\lambda_1I_V)^2), 这与已知⽭盾. \Box推论 1 设\varphi是n维复线性空间V上的线性变换, 则\varphi可对⾓化的充要条件是V的任⼀\varphi-不变⼦空间都存在\varphi-不变补空间, 即对任⼀\varphi-不变⼦空间U, 都存在\varphi-不变⼦空间W, 使得V=U\oplus W.证明充分性可由定理 1 的 (E8) 或 (E9) 得到. 再证必要性, 因为\varphi可对⾓化, 故由 (D1) 可知, 存在V的⼀组基\{e_1,e_2,\cdots,e_n\}, 它们都是\varphi的特征向量. 由⾼代教材的推论 7.6.3 可知, \varphi在不变⼦空间U上的限制\varphi|_U也可对⾓化, 故同理存在U的⼀组基\ {\alpha_1,\cdots,\alpha_r\}, 它们也都是\varphi的特征向量. 由基扩张定理的证明可知, 我们可从\{e_1,e_2,\cdots,e_n\}中取出n-r个向量, 不妨设为e_{r+1},\cdots,e_n, 使得\{\alpha_1,\cdots,\alpha_r,e_{r+1},\cdots,e_n\}成为V的⼀组新基. 令W=L(e_{r+1},\cdots,e_n), 则W是\varphi-不变⼦空间且满⾜V=U\oplus W. \Box推论 2 设\varphi是数域\mathbb{K}上n维线性空间V上的线性变换 (或A是数域\mathbb{K}上的n阶⽅阵), 并且\varphi (或A) 的所有特征值都在\mathbb{K}中, 则\varphi (或A) 可对⾓化的判定准则 (D1)--(D6) 以及 (E1)--(E9) 在数域\mathbb{K}上也成⽴.证明与复数域\mathbb{C}上的证明完全类似, 具体细节留给读者⾃⼰完成. \Box注 2 定理 1 在复旦⼤学⾼等代数习题课教学视频 [3] 的第 16 讲“可对⾓化的判定 (下)”中作为例 9 出现, 它是⾼代⽩⽪书的例 7.13 和例 7.14的⾃然推⼴. 推论 1 是⾼代⽩⽪书的例 7.15.接下去, 我们将不利⽤⾣相似标准型理论和正交相似标准型理论, ⽽利⽤定理 1 直接证明复正规阵可对⾓化以及实对称阵可实对⾓化这两个重要结论.引理 2 设A为m\times n阶复矩阵, 则r(\overline{A}'A)=r(A\overline{A}')=r(A).证明这是⾼代⽩⽪书的例 3.72 的复版本, 其证明完全类似. \Box引理 3 设A为n阶复正规阵, 即满⾜A\overline{A}'=\overline{A}'A, 则r(A)=r(A^2).证明若A是 Hermite 阵, 即满⾜\overline{A}'=A, 则由引理 2 可知r(A)=r(A^2). 若A是复正规阵, 注意到A\overline{A}'是 Hermite 阵, 则由引理 2 可得r(A^2)=r(A^2\overline{A^2}')=r(AA\overline{A}'\overline{A}')=r(A\overline{A}'A\overline{A}')=r((A\overline{A}')^2)=r(A\overline{A}')=r(A),结论得证. \Box引理 4 设A为n阶复正规阵, \lambda_0是A的特征值, 则A-\lambda_0I_n也是复正规阵.证明由复正规阵的定义验证即得. \Box推论 3 复正规阵可对⾓化. 特别地, 实对称阵, 实反对称阵, Hermite 阵, 斜 Hermite 阵, 正交阵, ⾣阵均可复对⾓化.证明由引理 4, 引理 3 以及定理 1 (E6) 即得结论. \Box引理 5 实对称阵的特征值全为实数.证明设A为n阶实对称阵, \lambda_0\in\mathbb{C}是A的任⼀特征值, \alpha=(a_1,a_2,\cdots,a_n)'\in\mathbb{C}^n是对应的特征向量, 即A\alpha=\lambda_0\alpha. 上式两边同时左乘\overline{\alpha}', 则有\overline{\alpha}'A\alpha=\lambda_0\overline{\alpha}'\alpha. 注意到\alpha是⾮零向量, 故\overline{\alpha}'\alpha=\sum\limits_{i=1}^n|a_i|^2>0. 注意到A为实对称阵, 故\overline{(\overline{\alpha}'A\alpha)}'=\overline{\alpha}'A\alpha, 即\overline{\alpha}'A\alpha是⼀个实数, 从⽽\lambda_0=\dfrac{\overline{\alpha}'A\alpha}{\overline{\alpha}'\alpha}也是实数. \Box推论 4 实对称阵在实数域上可对⾓化.证法 1 设A为实对称阵, 由⾼代⽩⽪书的例 3.72 可得r(A)=r(A^2). 再由引理 5 可知, A的特征值全为实数, 于是根据推论 2 可得A在实数域上可对⾓化.证法 2 由推论 3 可知实对称阵可复对⾓化, ⼜其特征值全为实数, 故实对称阵复相似于实对⾓阵. 再由⾼代教材的推论 7.3.4 (相似关系在基域扩张下的不变性) 可知, 实对称阵可实对⾓化. \Box注 3 推论 3 和推论 4 是教学博⽂ [4] 的主要结果, 其证明的关键点也是本⽂的引理 3 以及定理 1 的类似思想.我们将推论 3 和推论 4 合并起来, 补充如下的可对⾓化判定准则:(D7) 若复⽅阵相似于复正规阵, 则可对⾓化; 若实⽅阵实相似于实对称阵, 则可实对⾓化.我们先给出⼀个相似于复正规阵的例⼦.例 1 (⽩⽪书的例 6.33) 设n阶复⽅阵A可对⾓化, 证明: 矩阵\begin{pmatrix} A & A^2 \\ A^2 & A \\ \end{pmatrix}也可对⾓化.证明设P为⾮异阵, 使得P^{-1}AP=\Lambda为对⾓阵. 考虑相似变换\begin{pmatrix} P^{-1} & 0 \\ 0 & P^{-1} \\\end{pmatrix}\begin{pmatrix} A & A^2 \\ A^2 & A \\ \end{pmatrix}\begin{pmatrix} P & 0 \\ 0 & P \\ \end{pmatrix}=\begin{pmatrix} \Lambda &\Lambda^2 \\ \Lambda^2 & \Lambda \\ \end{pmatrix},通过简单的验证可知, \begin{pmatrix} \Lambda & \Lambda^2 \\ \Lambda^2 & \Lambda \\ \end{pmatrix}是复正规阵, 故由判定准则 (D7) 可知结论成⽴. \Box最后, 我们给出⼀个相似于实对称阵的例⼦, 更多的例题请参考⾼代⽩⽪书的例 9.63--例 9.65.例 2 (⽩⽪书的例 6.40) 设a,b,c为复数且bc\neq 0, 证明下列三对⾓矩阵可对⾓化: T(a,b,c)=\begin{pmatrix} a & b & & & & \\ c & a & b & & & \\ & c & a & b & & \\ & & \ddots & \ddots & \ddots & \\ & & & c & a & b \\ & & & & c & a \\ \end{pmatrix}.证明要证T(a,b,c)可对⾓化, 只要证T(a,b,c)-aI_n=T(0,b,c)可对⾓化即可, 故不妨设a=0. 由于bc\neq 0, 故对T(0,b,c)实施如下的相似初等变换: 依次将第i+1⾏乘以\sqrt{\bigg(\dfrac{b}{c}\bigg)^i}, 再将第i+1列乘以\sqrt{\bigg(\dfrac{c}{b}\bigg)^i}(1\leq i\leq n-1), 可得T(0,b,c)复相似于T(0,\sqrt{bc},\sqrt{bc})=\sqrt{bc}\cdot T(0,1,1). 因为T(0,1,1)是实对称阵, 故可对⾓化, 从⽽T(a,b,c)也可对⾓化. \Box参考⽂献[1] ⾼代教材: 姚慕⽣, 吴泉⽔, 谢启鸿编著, ⾼等代数学 (第三版), 复旦⼤学出版社, 2014.[2] ⾼代⽩⽪书: 姚慕⽣, 谢启鸿编著, 学习⽅法指导书: ⾼等代数 (第三版), 复旦⼤学出版社, 2015.Processing math: 0%。
矩阵可对角化的判定条件及推广数学与计算机科学学院 数学与应用数学(S ) 学号:2011031103 姓名:方守强 指导教师:梁俊平摘要:矩阵是否可以对角化,是矩阵的一条很重要的性质。
对相似可对角化的充分必要条件的理解,一直是线性代数学习中的一个困难问题。
本文给出了矩阵可对角化的几个充分必要条件和相应的证明。
关键词:方阵;特征值;特征向量;对角化引言:矩阵是高等代数中的重要组成部分,是许多数学分支研究的重要工具。
而对角矩阵作为矩阵中比较特殊的一类,其形式简单,研究起来也非常方便。
研究矩阵的对角化及其理论意义也很明显,矩阵相似是一种等价关系,对角化相当于对一类矩阵在相似意义下给出了一种简单的等价形式,这对理论分析是方便的。
相似的矩阵拥有很多相同的性质,比如特征多项式、特征根、行列式……如果只关心这类性质,那么相似的矩阵可以看作是没有区别的,这时研究一个一般的可对角化矩阵,只要研究它的标准形式——一个对角形矩阵就可以了。
而对角矩阵是最简单的一类矩阵,研究起来非常方便。
在本课题中通过阅读参考文献、查阅相关资料,初步总结出了矩阵可对角化的若干充分必要条件,并给予了相应的证明过程。
一、矩阵可对角化的概念1 特征值、特征向量的概念定义1 设A 是数域P 上线性空间V 的一个线性变换, 如果对于数域P 中的一个数0λ存在一个非零向量ε使得ελε0=A ,那么0λ称为A 的一个特征值,而ε 称为A 的属于特征值0λ的一个特征向量。
求方阵A 的特征值与特征向量的步骤:(1)由特征方程A E -λ=0求得A 的n 个特征值,设t λλλ,,,21 是A 的互异特征值,其重数分别为t n n n ,,,21 则n n n n t =+++ 21。
(2)求解齐次线性方程组()0=-X A E i λ()t i ,,2,1 =,其基础解系s i i i p p p ,,,21 (t i n s i i ,,2,11 =≤≤,)就是A 所对应特征值i λ的线性无关的特征向量。
2 矩阵可对角化的概念定义2 设A 是矩阵F 上一个n 阶方阵,如果存在数域F 上的一个可逆矩阵P ,使得AP P 1-为对角形矩阵,那么就说矩阵A 可以对角化。
任意方阵A 的每一个特征值i λ都有一个与之相对应的特征向量i P 满足i i i P AP λ=()n ,1,2,i =,则这个方程可以写成()()n n P P P P P P A ,,,,,,2121 =⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛n λλλ21 , (1) 我们定义矩阵()n P P P P ,,,21 =,()n diag B λλλ,,,21 =则(1)式可写成PB AP =,若矩阵P 是可逆阵,则有()n diag B AP P λλλ,,,211 ==-引理1 设A 、B 都是n 阶矩阵,则有秩()AB ≥秩()A +秩()n B - 。
引理2 设s λλλ,,,21 (n s ≤)为n 阶方阵A 的所有互异特征值,则矩阵A 的线性无关的特征向量的最大个数为()()()I A r I A r I A r sn s λλλ------- 21。
证明 设s λλλ,,,21 (n s ≤)为n 阶方阵A 的所有互异特征值,因为特征值i λ()s ,1,2,i =相应的线性无关的特征向量的最大个数即为线性方程组()0=-XI A i λ的基础解析所含向量的个数,所以特征值()n s s ≤λλλ,,,21 相应的线性无关的特征向量的最大个数分别为()I A r n i λ--,()I A r n 2λ--,…,()I A r n s λ--,而矩阵A 的不同特征值的线性无关的特征向量并在一起仍然线性无关,从而,矩阵A 线性无关的特征向的最大个数为()()()I A r I A r I A r sn s λλλ------- 21。
引理3 设A 为n 阶方阵,s λλλ,,,21 是任意两两互异的数,则()()()()()()()n s I A r I A r I A r I A I A I A r s s 1][2121---++-+-=---λλλλλλ 。
二、矩阵可对角化的充分必要条件1 矩阵可对角化的充分必要条件及其证明定理1 数域P 上n 阶方阵A 可对角化的充分必要条件是A 有n 个线性无关的特征向量。
证明(1)充分性 假设n P P P ,,,21 是矩阵A 的n 个线性无关的特征向量,即有i i i P AP λ=()n ,1,2,i =,令矩阵()n P P P P ,,,21 =由特征向量n P P P ,,,21 组成,因为n P P P ,,,21 是线性无关的,因此矩阵P 是非奇异矩阵,其逆矩阵记为1-P ,根据逆矩阵的定义有P P 1-=()n P P P P P P 12111,,,--- ,另一方面,由i i i P AP λ=易知,()n AP AP AP AP ,,,21 = =()n n P P P λλλ,,,2211 ,给此式左乘矩阵1-P ,则有n I AP P =-1⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n λλλ21=⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛n λλλ21, 即充分性得证。
(2)必要性 令矩阵A 和对角形矩阵D 相似,即存在可逆矩阵P 使得D AP P =-1,则有PD AP =,于是记P =(n P P P ,,,21 ),()Tn d d d D ,,,21 =则PD AP =可以写成()n AP AP AP ,,,21 =(n n P d P d P d ,,,2211 )即有i i i P d AP =()n ,1,2,i =,这说明矩阵P 的列向量i P 是矩阵A 的特征向量,而已知P 是可逆阵,故P 的n 个列向量n P P P ,,,21 线性无关,必要性得证。
定理2 设 n n P A ⨯=,则A 可以对角化的充分必要条件是: (1)A 的特征根都在数域P 内, (2)对A 的每个特征根λ,有,()k =--A E n λ秩,其中k 是λ的重数。
条件(2) 也可改述为:特征根λ的重数等于齐次线性方程组()0=-X A E λ的基础解系所含向量的个数(简称为代数重数等于几何重数)。
条件(2)还可改述为:令有()[]n A n ri i =-∑=1-E λ秩,即属于A 的不同特征根的线性无关的特征向量总数是n 。
条件(1),(2)还可改述为:A 的属于不同特征值的特征子空间的维数之和等于n 。
证明 设r λλλ,,,21 是A 的所有不同的特征根,j jt j αα,,1 是齐次线性方程组()0=-X A E j λ()r j ,,2,1 =的一个基础解系,则A 的特征向量rrrt r t t ααααα,,,,,,,,111111一定线性无关。
如果n t t t r =+++ 21, 则A 有n 个线性无关的特征向量, 从而A 可以对角化。
若A 可以对角化, 则属于A 的不同特征根的线性无关的特征向量总数一定是n 。
若不然, 则由定理1可设A 的n 个线性无关的特征向量为n ηηη,,,21 ,设j η是属于特征根j λ的特征向量,则j η可由j t j j αα,,1 线性表出,从而可由向量组rrrt r t t ααααα,,,,,,,,111111线性表出,于是,rank{n ηηη,,,21 }≤rank{ttr t r αααα,,,,,,11111}=n t t t r <+++ 21与n ηηη,,,21 线性无关矛盾。
定理3 设A 是n 阶复矩阵, 则A 与对角形矩阵相似的充分必要条件是A 的最小多项式()λm 无重根。
证明 充分性 因())(λλn d m =无重根,由)(λi d |)(1λ+i d 知,A 的每个不变因子)(λi d 都不能有重根,从而特征矩阵A E -λ作为复数域上的λ矩阵,其初等因子全为一次式,故A 必与对角阵相似。
必要性 因A 与对角阵相似,特征矩阵A E -λ的初等因子必均为一次式,故最后一个不变因子()λn d 也只能是不同的一次因式之积,这就证明了最小多项式())(λλn d m =无重根。
此定理3所给出的判别矩阵与对角矩阵相似的条件,形式上还可削弱,我有: 定理4 设σ是n 维向量空间V 的一个线性变换,σ的矩阵可以对角化的充分必要条件是V 可以分解为n 个在σ之下不变的一维子空间n W W W ,,,21 的直和。
证明 :必要性 若σ可以对角化,则存在V 的一组基n ααα,,,21 使得σ在这组基下的矩阵为⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛n λλλ21, 令()()()n n L W L W L W ααα===,,,2211 ,则 n W W W V ⊕⊕⊕= 21, 事实上:(1)V ∈∀η,则n n k k k αααη+++= 2211,又i i i W k ∈α()n ,1,2,i =, n W W W +++∈ 21η, 即n W W W V +++= 21。
(2)()n i i i W W W W W W ++++++∈∀+- 1121ξ,()n ,1,2,i =,i W ∈ξ且n i i W W W W W ++++++∈+- 1121ξ,i ξξ=且n i i ξξξξξξ++++++=+- 1121,()n j W j j ,,2,1, =∈ξ , 又j j W ∈ξ()n ,1,2,j =,j j j W L =ξ,()n ,1,2,j =,i i n n i i i i L L L L L L ααααααξ=++++++=++-- 11112211,即i i n n i i i i i i L L L L L L L ααααααα=+++-+++++-- 11112211又n ααα,,,21 线性无关j L =0,()n ,1,2,j =, 即ξ=0。
充分性:若V 可分解为n 个在σ之下不变的一维子空间n W W W ,,,21 的直和,即n W W W V +++= 21,设n W W W ,,,21 的基分别为n ηηη,,,21 则n ηηη,,,21 可构成V 的一组基。
令()()()n n n ηλησηλησηλησ===,,,222111 ,σ在基n ηηη,,,21 下的矩阵为 ⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛n λλλ21, 即σ可以对角化。
定理5 设A 是数域F 上的一个n 阶矩阵,A 的特征根全在F 内,若n λλλ,,,21 是A 的全部不同的特征根,其重数分别为n r r r ,,,21 ,则A 可对角化的充要条件是秩()j ji i r A I =-∑≠λ()k ,1,2,j =。
证明 :设A 可对角化,则存在可逆矩阵T ,使{}n n I I I diag AT T λλλ,,,22111 =-这里右边是分块对角矩阵,i I 为i r 阶单位阵,于是有秩()⎪⎪⎭⎫⎝⎛-∏≠j i i A I λ =秩()⎪⎪⎭⎫⎝⎛⎪⎪⎭⎫ ⎝⎛-∏≠-T A I T ji i λ1=秩()⎪⎪⎭⎫ ⎝⎛-∏≠-j i i AT T I 1λ =秩{}⎪⎪⎭⎫⎝⎛-∏≠j i k k iI I I diag I λλλλ,,,,2211 =秩()()(){}⎪⎪⎭⎫⎝⎛---∏≠j i k k i i I I I diag λλλλλλ,,,22111 =秩()⎪⎪⎭⎫⎝⎛⎭⎬⎫⎩⎨⎧-∏≠j i j j i I diag 0,,0,,,0,0 λλ =jr 。