当前位置:文档之家› 理解矩阵(个人认为这是关于矩阵最精彩的理解,推荐~~)

理解矩阵(个人认为这是关于矩阵最精彩的理解,推荐~~)

理解矩阵(个人认为这是关于矩阵最精彩的理解,推荐~~)
理解矩阵(个人认为这是关于矩阵最精彩的理解,推荐~~)

理解矩阵(个人认为这是关于矩阵最精彩的理解,推荐~~)来源:曾雅文的日志

线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍逆序数这个“前无古人,后无来者”的古怪概念,然后用逆序数给出行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题——把这行乘一个系数加到另一行上,再把那一列减过来,折腾得那叫一个热闹,可就是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太“无厘头”了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的出场——矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:“这个东西叫做矩阵”的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所有跟“学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。

事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国内外皆然。瑞典数学家Lars Garding在其名著Encounter with Mathematics中说:“如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,...,这就带来了教学上的困难。”事实上,当我们开始学习线性代数的时候,不知不觉就进入了“第二代数学模型”的范畴当中,这意味着数学的表述方式和抽象性有了一次全面的进化,对于从小一直在“第一代数学模型”,即以实用为导向的、具体的数学模型中学习的我们来说,在没有并明确告知的情况下进行如此剧烈的paradigm shift,不感到困难才是奇怪的。

大部分工科学生,往往是在学习了一些后继课程,如数值分析、数学规划、矩阵论之后,才逐渐能够理解和熟练运用线性代数。即便如此,不少人即使能够很熟练地以线性代数为工具进行科研和应用工作,但对于很多这门课程的初学者提出的、看上去是很基础的问题却并不清楚。比如说:

* 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用?

* 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中发挥如此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不是很奇妙的事情?难道在矩阵乘法那看上去莫名其妙的规则下面,包含着世界的某些本质规律?如果是的话,这些本质规律是什么?

* 行列式究竟是一个什么东西?为什么会有如此怪异的计算规则?行列式与其对应方阵本

质上是什么关系?为什么只有方阵才有对应的行列式,而一般矩阵就没有(不要觉得这个问题很蠢,如果必要,针对m x n矩阵定义行列式不是做不到的,之所以不做,是因为没有这个必要,但是为什么没有这个必要)?而且,行列式的计算规则,看上去跟矩阵的任何计算规则都没有直观的联系,为什么又在很多方面决定了矩阵的性质?难道这一切仅是巧合?

* 矩阵为什么可以分块计算?分块计算这件事情看上去是那么随意,为什么竟是可行的?

* 对于矩阵转置运算AT,有(AB)T = BTAT,对于矩阵求逆运算A-1,有(AB)-1 = B-1A-1。两个看上去完全没有什么关系的运算,为什么有着类似的性质?这仅仅是巧合吗?

* 为什么说P-1AP得到的矩阵与A矩阵“相似”?这里的“相似”是什么意思?

* 特征值和特征向量的本质是什么?它们定义就让人很惊讶,因为Ax =λx,一个诺大的矩阵的效应,竟然不过相当于一个小小的数λ,确实有点奇妙。但何至于用“特征”甚至“本征”来界定?它们刻划的究竟是什么?

这样的一类问题,经常让使用线性代数已经很多年的人都感到为难。就好像大人面对小孩子的刨根问底,最后总会迫不得已地说“就这样吧,到此为止”一样,面对这样的问题,很多老手们最后也只能用:“就是这么规定的,你接受并且记住就好”来搪塞。然而,这样的问题如果不能获得回答,线性代数对于我们来说就是一个粗暴的、不讲道理的、莫名其妙的规则集合,我们会感到,自己并不是在学习一门学问,而是被不由分说地“抛到”一个强制的世界中,只是在考试的皮鞭挥舞之下被迫赶路,全然无法领略其中的美妙、和谐与统一。直到多年以后,我们已经发觉这门学问如此的有用,却仍然会非常迷惑:怎么这么凑巧?

我认为,这是我们的线性代数教学中直觉性丧失的后果。上述这些涉及到“如何能”、“怎么会”的问题,仅仅通过纯粹的数学证明来回答,是不能令提问者满意的。比如,如果你通过一般的证明方法论证了矩阵分块运算确实可行,那么这并不能够让提问者的疑惑得到解决。他们真正的困惑是:矩阵分块运算为什么竟然是可行的?究竟只是凑巧,还是说这是由矩阵这种对象的某种本质所必然决定的?如果是后者,那么矩阵的这些本质是什么?只要对上述那些问题稍加考虑,我们就会发现,所有这些问题都不是单纯依靠数学证明所能够解决的。像我们的教科书那样,凡事用数学证明,最后培养出来的学生,只能熟练地使用工具,却欠缺真正意义上的理解。

自从1930年代法国布尔巴基学派兴起以来,数学的公理化、系统性描述已经获得巨大的成功,这使得我们接受的数学教育在严谨性上大大提高。然而数学公理化的一个备受争议的副作用,就是一般数学教育中直觉性的丧失。数学家们似乎认为直觉性与抽象性是矛盾的,因此毫不犹豫地牺牲掉前者。然而包括我本人在内的很多人都对此表示怀疑,我们不认为直觉性与抽象性一定相互矛盾,特别是在数学教育中和数学教材中,帮助学生建立直觉,有助于它们理解那些抽象的概念,进而理解数学的本质。反之,如果一味注重形式上的严格性,学生就好像被迫进行钻火圈表演的小白鼠一样,变成枯燥的规则的奴隶。

对于线性代数的类似上述所提到的一些直觉性的问题,两年多来我断断续续地反复思考了四、五次,为此阅读了好几本国内外线性代数、数值分析、代数和数学通论性书籍,其中像前苏联的名著《数学:它的内容、方法和意义》、龚昇教授的《线性代数五讲》、前面提到

的Encounter with Mathematics(《数学概观》)以及Thomas A. Garrity的《数学拾遗》都给我很大的启发。不过即使如此,我对这个主题的认识也经历了好几次自我否定。比如以前思考的一些结论曾经写在自己的blog里,但是现在看来,这些结论基本上都是错误的。因此打算把自己现在的有关理解比较完整地记录下来,一方面是因为我觉得现在的理解比较成熟了,可以拿出来与别人探讨,向别人请教。另一方面,如果以后再有进一步的认识,把现在的理解给推翻了,那现在写的这个snapshot也是很有意义的。

因为打算写得比较多,所以会分几次慢慢写。也不知道是不是有时间慢慢写完整,会不会中断,写着看吧。

--------------------------------------------------------------------------

今天先谈谈对线形空间和矩阵的几个核心概念的理解。这些东西大部分是凭着自己的理解写出来的,基本上不抄书,可能有错误的地方,希望能够被指出。但我希望做到直觉,也就是说能把数学背后说的实质问题说出来。

首先说说空间(space),这个概念是现代数学的命根子之一,从拓扑空间开始,一步步往上加定义,可以形成很多空间。线形空间其实还是比较初级的,如果在里面定义了范数,就成了赋范线性空间。赋范线性空间满足完备性,就成了巴那赫空间;赋范线性空间中定义角度,就有了内积空间,内积空间再满足完备性,就得到希尔伯特空间。

总之,空间有很多种。你要是去看某种空间的数学定义,大致都是“存在一个集合,在这个集合上定义某某概念,然后满足某些性质”,就可以被称为空间。这未免有点奇怪,为什么要用“空间”来称呼一些这样的集合呢?大家将会看到,其实这是很有道理的。

我们一般人最熟悉的空间,毫无疑问就是我们生活在其中的(按照牛顿的绝对时空观)的三维空间,从数学上说,这是一个三维的欧几里德空间,我们先不管那么多,先看看我们熟悉的这样一个空间有些什么最基本的特点。仔细想想我们就会知道,这个三维的空间:1. 由很多(实际上是无穷多个)位置点组成;2. 这些点之间存在相对的关系;3. 可以在空间中定义长度、角度;4. 这个空间可以容纳运动,这里我们所说的运动是从一个点到另一个点的移动(变换),而不是微积分意义上的“连续”性的运动,

上面的这些性质中,最最关键的是第4条。第1、2条只能说是空间的基础,不算是空间特有的性质,凡是讨论数学问题,都得有一个集合,大多数还得在这个集合上定义一些结构(关系),并不是说有了这些就算是空间。而第3条太特殊,其他的空间不需要具备,更不是关键的性质。只有第4条是空间的本质,也就是说,容纳运动是空间的本质特征。

认识到了这些,我们就可以把我们关于三维空间的认识扩展到其他的空间。事实上,不管是什么空间,都必须容纳和支持在其中发生的符合规则的运动(变换)。你会发现,在某种空间中往往会存在一种相对应的变换,比如拓扑空间中有拓扑变换,线性空间中有线性变换,仿射空间中有仿射变换,其实这些变换都只不过是对应空间中允许的运动形式而已。

因此只要知道,“空间”是容纳运动的一个对象集合,而变换则规定了对应空间的运动。

下面我们来看看线性空间。线性空间的定义任何一本书上都有,但是既然我们承认线性空间是个空间,那么有两个最基本的问题必须首先得到解决,那就是:

1. 空间是一个对象集合,线性空间也是空间,所以也是一个对象集合。那么线性空间是什么样的对象的集合?或者说,线性空间中的对象有什么共同点吗?

2. 线性空间中的运动如何表述的?也就是,线性变换是如何表示的?

我们先来回答第一个问题,回答这个问题的时候其实是不用拐弯抹角的,可以直截了当的给出答案。线性空间中的任何一个对象,通过选取基和坐标的办法,都可以表达为向量的形式。通常的向量空间我就不说了,举两个不那么平凡的例子:

L1. 最高次项不大于n次的多项式的全体构成一个线性空间,也就是说,这个线性空间中的每一个对象是一个多项式。如果我们以x0, x1, ..., xn为基,那么任何一个这样的多项式都可以表达为一组n+1维向量,其中的每一个分量ai其实就是多项式中x(i-1)项的系数。值得说明的是,基的选取有多种办法,只要所选取的那一组基线性无关就可以。这要用到后面提到的概念了,所以这里先不说,提一下而已。

L2. 闭区间[a, b]上的n阶连续可微函数的全体,构成一个线性空间。也就是说,这个线性空间的每一个对象是一个连续函数。对于其中任何一个连续函数,根据魏尔斯特拉斯定理,一定可以找到最高次项不大于n的多项式函数,使之与该连续函数的差为0,也就是说,完全相等。这样就把问题归结为L1了。后面就不用再重复了。

所以说,向量是很厉害的,只要你找到合适的基,用向量可以表示线性空间里任何一个对象。这里头大有文章,因为向量表面上只是一列数,但是其实由于它的有序性,所以除了这些数本身携带的信息之外,还可以在每个数的对应位置上携带信息。为什么在程序设计中数组最简单,却又威力无穷呢?根本原因就在于此。这是另一个问题了,这里就不说了。

下面来回答第二个问题,这个问题的回答会涉及到线性代数的一个最根本的问题。

线性空间中的运动,被称为线性变换。也就是说,你从线性空间中的一个点运动到任意的另外一个点,都可以通过一个线性变化来完成。那么,线性变换如何表示呢?很有意思,在线性空间中,当你选定一组基之后,不仅可以用一个向量来描述空间中的任何一个对象,而且可以用矩阵来描述该空间中的任何一个运动(变换)。而使某个对象发生对应运动的方法,就是用代表那个运动的矩阵,乘以代表那个对象的向量。

简而言之,在线性空间中选定基之后,向量刻画对象,矩阵刻画对象的运动,用矩阵与向量的乘法施加运动。

是的,矩阵的本质是运动的描述。如果以后有人问你矩阵是什么,那么你就可以响亮地告诉他,矩阵的本质是运动的描述。

可是多么有意思啊,向量本身不是也可以看成是n x 1矩阵吗?这实在是很奇妙,一个空间中的对象和运动竟然可以用相类同的方式表示。能说这是巧合吗?如果是巧合的话,那可

真是幸运的巧合!可以说,线性代数中大多数奇妙的性质,均与这个巧合有直接的关系。接着理解矩阵。

上一篇里说“矩阵是运动的描述”,到现在为止,好像大家都还没什么意见。但是我相信早晚会有数学系出身的网友来拍板转。因为运动这个概念,在数学和物理里是跟微积分联系在一起的。我们学习微积分的时候,总会有人照本宣科地告诉你,初等数学是研究常量的数学,是研究静态的数学,高等数学是变量的数学,是研究运动的数学。大家口口相传,差不多人人都知道这句话。但是真知道这句话说的是什么意思的人,好像也不多。简而言之,在我们人类的经验里,运动是一个连续过程,从A点到B点,就算走得最快的光,也是需要一个时间来逐点地经过AB之间的路径,这就带来了连续性的概念。而连续这个事情,如果不定义极限的概念,根本就解释不了。古希腊人的数学非常强,但就是缺乏极限观念,所以解释不了运动,被芝诺的那些著名悖论(飞箭不动、飞毛腿阿喀琉斯跑不过乌龟等四个悖论)搞得死去活来。因为这篇文章不是讲微积分的,所以我就不多说了。有兴趣的读者可以去看看齐民友教授写的《重温微积分》。我就是读了这本书开头的部分,才明白“高等数学是研究运动的数学”这句话的道理。

不过在我这个《理解矩阵》的文章里,“运动”的概念不是微积分中的连续性的运动,而是瞬间发生的变化。比如这个时刻在A点,经过一个“运动”,一下子就“跃迁”到了B点,其中不需要经过A点与B点之间的任何一个点。这样的“运动”,或者说“跃迁”,是违反我们日常的经验的。不过了解一点量子物理常识的人,就会立刻指出,量子(例如电子)在不同的能量级轨道上跳跃,就是瞬间发生的,具有这样一种跃迁行为。所以说,自然界中并不是没有这种运动现象,只不过宏观上我们观察不到。但是不管怎么说,“运动”这个词用在这里,还是容易产生歧义的,说得更确切些,应该是“跃迁”。因此这句话可以改成:

“矩阵是线性空间里跃迁的描述”。

可是这样说又太物理,也就是说太具体,而不够数学,也就是说不够抽象。因此我们最后换用一个正牌的数学术语——变换,来描述这个事情。这样一说,大家就应该明白了,所谓变换,其实就是空间里从一个点(元素/对象)到另一个点(元素/对象)的跃迁。比如说,拓扑变换,就是在拓扑空间里从一个点到另一个点的跃迁。再比如说,仿射变换,就是在仿射空间里从一个点到另一个点的跃迁。附带说一下,这个仿射空间跟向量空间是亲兄弟。做计算机图形学的朋友都知道,尽管描述一个三维对象只需要三维向量,但所有的计算机图形学变换矩阵都是4 x 4的。说其原因,很多书上都写着“为了使用中方便”,这在我看来简直就是企图蒙混过关。真正的原因,是因为在计算机图形学里应用的图形变换,实际上是在仿射空间而不是向量空间中进行的。想想看,在向量空间里相一个向量平行移动以后仍是相同的那个向量,而现实世界等长的两个平行线段当然不能被认为同一个东西,所以计算机图形学的生存空间实际上是仿射空间。而仿射变换的矩阵表示根本就是4 x 4的。又扯远了,有兴趣的读者可以去看《计算机图形学——几何工具算法详解》。

一旦我们理解了“变换”这个概念,矩阵的定义就变成:

“矩阵是线性空间里的变换的描述。”

到这里为止,我们终于得到了一个看上去比较数学的定义。不过还要多说几句。教材上一般

是这么说的,在一个线性空间V里的一个线性变换T,当选定一组基之后,就可以表示为矩阵。因此我们还要说清楚到底什么是线性变换,什么是基,什么叫选定一组基。线性变换的定义是很简单的,设有一种变换T,使得对于线性空间V中间任何两个不相同的对象x和y,以及任意实数a和b,有:

T(ax + by) = aT(x) + bT(y),

那么就称T为线性变换。

定义都是这么写的,但是光看定义还得不到直觉的理解。线性变换究竟是一种什么样的变换?我们刚才说了,变换是从空间的一个点跃迁到另一个点,而线性变换,就是从一个线性空间V的某一个点跃迁到另一个线性空间W的另一个点的运动。这句话里蕴含着一层意思,就是说一个点不仅可以变换到同一个线性空间中的另一个点,而且可以变换到另一个线性空间中的另一个点去。不管你怎么变,只要变换前后都是线性空间中的对象,这个变换就一定是线性变换,也就一定可以用一个非奇异矩阵来描述。而你用一个非奇异矩阵去描述的一个变换,一定是一个线性变换。有的人可能要问,这里为什么要强调非奇异矩阵?所谓非奇异,只对方阵有意义,那么非方阵的情况怎么样?这个说起来就会比较冗长了,最后要把线性变换作为一种映射,并且讨论其映射性质,以及线性变换的核与像等概念才能彻底讲清楚。我觉得这个不算是重点,如果确实有时间的话,以后写一点。以下我们只探讨最常用、最有用的一种变换,就是在同一个线性空间之内的线性变换。也就是说,下面所说的矩阵,不作说明的话,就是方阵,而且是非奇异方阵。学习一门学问,最重要的是把握主干内容,迅速建立对于这门学问的整体概念,不必一开始就考虑所有的细枝末节和特殊情况,自乱阵脚。

接着往下说,什么是基呢?这个问题在后面还要大讲一番,这里只要把基看成是线性空间里的坐标系就可以了。注意是坐标系,不是坐标值,这两者可是一个“对立矛盾统一体”。这样一来,“选定一组基”就是说在线性空间里选定一个坐标系。就这意思。

好,最后我们把矩阵的定义完善如下:

“矩阵是线性空间中的线性变换的一个描述。在一个线性空间中,只要我们选定一组基,那么对于任何一个线性变换,都能够用一个确定的矩阵来加以描述。”

理解这句话的关键,在于把“线性变换”与“线性变换的一个描述”区别开。一个是那个对象,一个是对那个对象的表述。就好像我们熟悉的面向对象编程中,一个对象可以有多个引用,每个引用可以叫不同的名字,但都是指的同一个对象。如果还不形象,那就干脆来个很俗的类比。

比如有一头猪,你打算给它拍照片,只要你给照相机选定了一个镜头位置,那么就可以给这头猪拍一张照片。这个照片可以看成是这头猪的一个描述,但只是一个片面的的描述,因为换一个镜头位置给这头猪拍照,能得到一张不同的照片,也是这头猪的另一个片面的描述。所有这样照出来的照片都是这同一头猪的描述,但是又都不是这头猪本身。

同样的,对于一个线性变换,只要你选定一组基,那么就可以找到一个矩阵来描述这个线性变换。换一组基,就得到一个不同的矩阵。所有这些矩阵都是这同一个线性变换的描述,但又都不是线性变换本身。

但是这样的话,问题就来了如果你给我两张猪的照片,我怎么知道这两张照片上的是同一头猪呢?同样的,你给我两个矩阵,我怎么知道这两个矩阵是描述的同一个线性变换呢?如果是同一个线性变换的不同的矩阵描述,那就是本家兄弟了,见面不认识,岂不成了笑话。

好在,我们可以找到同一个线性变换的矩阵兄弟们的一个性质,那就是:

若矩阵A与B是同一个线性变换的两个不同的描述(之所以会不同,是因为选定了不同的基,也就是选定了不同的坐标系),则一定能找到一个非奇异矩阵P,使得A、B之间满足这样的关系:

A = P-1BP

线性代数稍微熟一点的读者一下就看出来,这就是相似矩阵的定义。没错,所谓相似矩阵,就是同一个线性变换的不同的描述矩阵。按照这个定义,同一头猪的不同角度的照片也可以成为相似照片。俗了一点,不过能让人明白。

而在上面式子里那个矩阵P,其实就是A矩阵所基于的基与B矩阵所基于的基这两组基之间的一个变换关系。关于这个结论,可以用一种非常直觉的方法来证明(而不是一般教科书上那种形式上的证明),如果有时间的话,我以后在blog里补充这个证明。

这个发现太重要了。原来一族相似矩阵都是同一个线性变换的描述啊!难怪这么重要!工科研究生课程中有矩阵论、矩阵分析等课程,其中讲了各种各样的相似变换,比如什么相似标准型,对角化之类的内容,都要求变换以后得到的那个矩阵与先前的那个矩阵式相似的,为什么这么要求?因为只有这样要求,才能保证变换前后的两个矩阵是描述同一个线性变换的。当然,同一个线性变换的不同矩阵描述,从实际运算性质来看并不是不分好环的。有些描述矩阵就比其他的矩阵性质好得多。这很容易理解,同一头猪的照片也有美丑之分嘛。所以矩阵的相似变换可以把一个比较丑的矩阵变成一个比较美的矩阵,而保证这两个矩阵都是描述了同一个线性变换。

这样一来,矩阵作为线性变换描述的一面,基本上说清楚了。但是,事情没有那么简单,或者说,线性代数还有比这更奇妙的性质,那就是,矩阵不仅可以作为线性变换的描述,而且可以作为一组基的描述。而作为变换的矩阵,不但可以把线性空间中的一个点给变换到另一个点去,而且也能够把线性空间中的一个坐标系(基)表换到另一个坐标系(基)去。而且,变换点与变换坐标系,具有异曲同工的效果。线性代数里最有趣的奥妙,就蕴含在其中。理解了这些内容,线性代数里很多定理和规则会变得更加清晰、直觉。

理解矩阵,矩阵背后的现实意义

理解矩阵,矩阵背后的现实意义作者:郭博 这是很早以前已经看过的,最近无意中又把保存的文章翻岀来时,想起很多朋友问过矩阵,虽对 矩阵似懂非懂,但却很想弄懂它,希望这几篇文章能帮你一下,故转之: 线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说, 在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍 逆序数这个前无古人,后无来者”的古怪概念,然后用逆序数给岀行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题一一把这行乘一个系数加到另一行上,再把那一列减过 来,折腾得那叫一个热闹,可就是压根看不岀这个东西有嘛用。大多数像我一样资质平庸的学生 到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太无厘头 了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰 回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的 岀场一一矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:这个东西叫做矩阵”的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰 的一幕!自那以后,在几乎所有跟学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对 于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血 流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。 事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国外皆然。 瑞典数学家Lars Garding在其名著Encounter with Mathematics中说:"如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”然而按照现行的国际标准,线性代 数是通过公理化来表述的,它是第二代数学模型,…,这就带来了教学上的困难。”事实上,当 我们开始学习线性代数的时候,不知不觉就进入了第二代数学模型”的畴当中,这意味着数学的 表述方式和抽象性有了一次全面的进化,对于从小一直在第一代数学模型”即以实用为导向的、 具体的数学模型中学习的我们来说,在没有并明确告知的情况下进行如此剧烈的paradigm shif t,不感到困难才是奇怪的。 大部分工科学生,往往是在学习了一些后继课程,如数值分析、数学规划、矩阵论之后,才逐渐能够理解和熟练运用线性代数。即便如此,不少人即使能够很熟练地以线性代数为工具进行科研 和应用工作,但对于很多这门课程的初学者提岀的、看上去是很基础的问题却并不清楚。比如说: 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩 阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什 么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每 一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用? 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中发挥如 此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不

矩阵的物理意义

矩阵的物理意义 如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,这就带来了教学上的困难。” * 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用? * 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中发挥如此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不是很奇妙的事情?难道在矩阵乘法那看上去莫名其妙的规则下面,包含着世界的某些本质规律?如果是的话,这些本质规律是什么? * 行列式究竟是一个什么东西?为什么会有如此怪异的计算规则?行列式与其对应方阵本质上是什么关系?为什么只有方阵才有对应的行列式,而一般矩阵就没有(不要觉得这个问题很蠢,如果必要,针对m x n矩阵定义行列式不是做不到的,之所以不做,是因为没有这个必要,但是为什么没有这个必要)?而且,行列式的计算规则,看上去跟矩阵的任何计算规则都没有直观的联系,为什么又在很多方面决定了矩阵的性质?难道这一切仅是巧合?* 矩阵为什么可以分块计算?分块计算这件事情看上去是那么随意,为什么竟是可行的?* 对于矩阵转置运算AT,有(AB)T = BTAT,对于矩阵求逆运算A-1,有(AB)-1 = B-1A-1。两个看上去完全没有什么关系的运算,为什么有着类似的性质?这仅仅是巧合吗? * 为什么说P-1AP得到的矩阵与A矩阵“相似”?这里的“相似”是什么意思? * 特征值和特征向量的本质是什么?它们定义就让人很惊讶,因为Ax =λx,一个诺大的矩阵的效应,竟然不过相当于一个小小的数λ,确实有点奇妙。但何至于用“特征”甚至“本征”来界定?它们刻划的究竟是什么? 今天先谈谈对线形空间和矩阵的几个核心概念的理解。首先说说空间(space),这个概念是现代数学的命根子之一,从拓扑空间开始,一步步往上加定义,可以形成很多空间。线形空间其实还是比较初级的,如果在里面定义了范数,就成了赋范线性空间。赋范线性空间满足完备性,就成了巴那赫空间;赋范线性空间中定义角度,就有了内积空间,内积空间再满足完备性,就得到希尔伯特空间。 总之,空间有很多种。你要是去看某种空间的数学定义,大致都是“存在一个集合,在这个集合上定义某某概念,然后满足某些性质”,就可以被称为空间。这未免有点奇怪,为什么要用“空间”来称呼一些这样的集合呢?大家将会看到,其实这是很有道理的。 我们一般人最熟悉的空间,毫无疑问就是我们生活在其中的(按照牛顿的绝对时空观)的三维空间,从数学上说,这是一个三维的欧几里德空间,我们先不管那么多,先看看我们熟悉的这样一个空间有些什么最基本的特点。仔细想想我们就会知道,这个三维的空间:1. 由很多(实际上是无穷多个)位置点组成;2. 这些点之间存在相对的关系;3. 可以在空间中定义长度、角度;4. 这个空间可以容纳运动,这里我们所说的运动是从一个点到另一个点的移动(变换),而不是微积分意义上的“连续”性的运动, 事实上,不管是什么空间,都必须容纳和支持在其中发生的符合规则的运动(变换)。你会发现,在某种空间中往往会存在一种相对应的变换,比如拓扑空间中有拓扑变换,线性空间中有线性变换,仿射空间中有仿射变换,其实这些变换都只不过是对应空间中允许的运动形式而已。 因此只要知道,“空间”是容纳运动的一个对象集合,而变换则规定了对应空间的运动。下面我们来看看线性空间。线性空间的定义任何一本书上都有,但是既然我们承认线性空间是个空间,那么有两个最基本的问题必须首先得到解决,那就是: 1. 空间是一个对象集合,线性空间也是空间,所以也是一个对象集合。那么线性空间是什么样的对象的集合?或者说,线性空间中的对象有什么共同点吗? 2. 线性空间中的运动如何表述的?也就是,线性变换是如何表示的?

矩阵的基本概念

§1 矩阵及其运算 教学要求:理解矩阵的定义、掌握矩阵的基本律、掌握几类特殊矩阵(比如零矩阵,单位矩阵,对称矩阵和反对称矩阵 ) 的定义与性质、注意矩阵运算与通常数的运算异同。能熟练正确地进行矩阵的计算。 知识要点: 一、矩阵的基本概念 矩阵,是由个数组成的一个行列的矩形表格,通常用大写 字母表示,组成矩阵的每一个数,均称为矩阵的元素,通常 用小写字母其元素表示,其中下标都是正整数, 他们表示该元素在矩阵中的位置。比如,或 表示一个矩阵,下标表示元素位于该矩阵的第行、第列。元素全为零的矩阵称为零矩阵。 特别地,一个矩阵,也称为一个维列向量;而一个矩阵,也称为一个维行向量。

当一个矩阵的行数与烈数相等时,该矩阵称为一个阶方阵。对于方阵,从左上角到右下角的连线,称为主对角线;而从左下角到右上角的连线称为付对角线。若一个阶方阵的主对角线上的元素 都是,而其余元素都是零,则称为单位矩阵,记为,即: 。如一个阶方阵的主对角线上(下)方的元 素都是零,则称为下(上)三角矩阵,例如,是 一个阶下三角矩阵,而则是一个阶上三角 矩阵。今后我们用表示数域上的矩阵构成的集合, 而用或者表示数域上的阶方阵构成的集合。 二、矩阵的运算 1、矩阵的加法:如果是两个同型矩阵(即它们具 有相同的行数和列数,比如说),则定义它们的和 仍为与它们同型的矩阵(即),的元素为和 对应元素的和,即:。

给定矩阵,我们定义其负矩阵为:。这样我们 可以定义同型矩阵的减法为:。由于矩阵的加法运算归结为其元素的加法运算,容易验证,矩阵的加法满足下列运算律: ( 1)交换律:; ( 2)结合律:; ( 3)存在零元:; ( 4)存在负元:。 2 、数与矩阵的乘法: 设为一个数,,则定义与的乘积仍 为中的一个矩阵,中的元素就是用数乘中对应的 元素的道德,即。由定义可知:。容易验证数与矩阵的乘法满足下列运算律: (1 ); (2 ); (3 ); (4 )。

读《理解矩阵》的一点心得及整理归类

线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍逆序数这个“前无古人,后无来者”的古怪概念,然后用逆序数给出行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题——把这行乘一个系数加到另一行上,再把那一列减过来,折腾得那叫一个热闹,可就是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太“无厘头”了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的出场——矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:“这个东西叫做矩阵”的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所有跟“学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。 事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国内外皆然。瑞典数学家Lars Garding在其名著Encounter with Mathematics中说:“如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,...,这就带来了教学上的困难。”事实上,当我们开始学习线性代数的时候,不知不觉就进入了“第二代数学模型”的范畴当中,这意味着数学的表述方式和抽象性有了一次全面的进化,对于从小一直在“第一代数学模型”,即以实用为导向的、具体的数学模型中学习的我们来说,在没

矩阵乘法的法则

第六节.矩阵乘法的法则 教学目标: (1)通过几何变换,使学生理解矩阵乘法不满足交换律(但并不是绝对的)。 (2)通过实例,了解矩阵的乘法满足结合律。 教学重点:理解矩阵乘法不满足交换律。 教学难点:从图形变换的角度理解矩阵的乘法不满足交换律。 教学过程: 一、引入:对上节课的练习的讨论: 已知三角形ABC 的三个顶点的坐标分别为:A (0,0),B (2,0),C (2,2), 先将三角形作以原点为中心的反射变换(变换矩阵为?? ????--1001) ,再以x 轴为基准,将所得图形压缩到原来的一半(变换矩阵为??? ? ??? ?21001 ),试求:(1)这连续两次变换所对应的变换矩阵U ; 问:U=??????--1001????????21001=??? ?????--21001 U=????????21001??????--1001=??? ? ????--21001 问题:矩阵的乘法是否满足交换律呢? 2、例题 例1.已知矩阵A 、B ,计算AB 及BA ,并比较他们是否相同,能否从几何变换的角度给予解释? (1)A=???? ??2001,B=?? ????-0110; (2)A=??? ?????21001 ,B=??? ???1003。 解:(1)AB=???? ??2001??????-0110=??? ???-0210,BA=??????-0110? ?????2001=?? ????-0120 显然,AB ≠BA 。 从几何变换的角度,AB 表示先作反射变换(变换矩阵为B ),后作伸缩变换(变换矩阵为A );而BA 表示先作伸缩变换(变换矩阵为A ),后作反射变换(变换矩阵为B )。当连续进行一系列变换时,交换变换次序得到的结果,一般说会不相同。仍以正方形(顶点分别为A(0,0),B(1,0),C(1,1),D(0,1))为例,如下图:

第一讲 矩阵的概念、运算

第一讲 Ⅰ 授课题目(章节): §2.1 矩阵的概念; §2.2 矩阵的计算 Ⅱ 教学目的与要求: 理解矩阵概念; 掌握矩阵的线性运算、乘法、转置及其运算规律。 Ⅲ 教学重点与难点: 矩阵的乘法 Ⅳ 讲授内容: §2.1 矩阵 定义2.1 由n m ?个数),,2,,1;,,2,1(n j m a ij =排成的m 行n 列的数表 mn m m n n a a a a a a a a a 21222 21112 11 称为m 行n 列矩阵,简称n m ?矩阵.为表示它是一个整体,总是加一个括弧,并用大写黑体字母表示它,记作 ??????? ??=?mn m m n n n m a a a a a a a a a A 212222111211 两个矩阵B A ,,如果都是m 行n 列的,称它们是同型矩阵。否则,称它们是不同型的。 n 行n 列的矩阵n n A ?称为n 阶矩阵(或n 阶方阵) ,简记为n A 。 只有一行的矩阵)(21n a a a A =称为行矩阵,又称行向量.只有一列的矩阵 ?????? ? ??=n b b b B 21 称为列矩阵,又称列向量. 定义2.2 如果)()(ij ij b B a A ==与是同型矩阵,并且它的对应元素相等 ,即

),,2,1;,,2,1(,n j m i b a ij ij === 那么就称矩阵A 与B 相等,记作B A =. 元素都是零的m 行n 列矩阵称为零矩阵,记作n m O ?,简记为O .不同型的零矩阵是 不同的. ??????? ??=100010001 n I 称为n 阶单位矩阵,简记作I .这个矩阵的特点是:从左上角到右下角的直线(叫做主对角线)上的元素都是1,其它元素都是0. §2.2 矩阵的运算 1. 矩阵的加法 定义2.3 设有两个n m ?矩阵)(),(ij ij b B a A ==,那么矩阵A 与B 的和记作A +B , 规定为 n m ij ij b a B A ?+=+)( 设矩阵)(),(ij ij a A a A -=-=记,A -称为矩阵A 的负矩阵.显然有 0)(=-+A A . 规定矩阵的减法为)(B A B A -+=-. 2. 数与矩阵相乘: 定义2.4 数λ与矩阵)(ij a A =的乘积记作A λ,规定为n m ij a A ?=)(λλ 数乘矩阵满足下列运算规律(设B A ,为同型矩阵,μλ,为数): )(i )()(A A μλλμ= )(ii A A A μλμλ+=+)( )(iii B A B A λλλ+=+)( 3. 矩阵与矩阵相乘: 定义 2.5 设)(ij a A =是一个s m ?矩阵,)(ij b B =是一个n s ?矩阵,那么规定矩阵

理解矩阵(个人认为这是关于矩阵最精彩的理解,推荐~~)

理解矩阵(个人认为这是关于矩阵最精彩的理解,推荐~~)来源:曾雅文的日志 线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍逆序数这个“前无古人,后无来者”的古怪概念,然后用逆序数给出行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题——把这行乘一个系数加到另一行上,再把那一列减过来,折腾得那叫一个热闹,可就是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太“无厘头”了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的出场——矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:“这个东西叫做矩阵”的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所有跟“学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。 事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国内外皆然。瑞典数学家Lars Garding在其名著Encounter with Mathematics中说:“如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,...,这就带来了教学上的困难。”事实上,当我们开始学习线性代数的时候,不知不觉就进入了“第二代数学模型”的范畴当中,这意味着数学的表述方式和抽象性有了一次全面的进化,对于从小一直在“第一代数学模型”,即以实用为导向的、具体的数学模型中学习的我们来说,在没有并明确告知的情况下进行如此剧烈的paradigm shift,不感到困难才是奇怪的。 大部分工科学生,往往是在学习了一些后继课程,如数值分析、数学规划、矩阵论之后,才逐渐能够理解和熟练运用线性代数。即便如此,不少人即使能够很熟练地以线性代数为工具进行科研和应用工作,但对于很多这门课程的初学者提出的、看上去是很基础的问题却并不清楚。比如说: * 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用? * 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中发挥如此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不是很奇妙的事情?难道在矩阵乘法那看上去莫名其妙的规则下面,包含着世界的某些本质规律?如果是的话,这些本质规律是什么? * 行列式究竟是一个什么东西?为什么会有如此怪异的计算规则?行列式与其对应方阵本

矩阵论课程教学大纲

《矩阵论》课程教学大纲 一、课程基本信息 课程编号: xxxxx 课程中文名称:矩阵论 课程英文名称:Matrix Theory 课程性质:学位课 考核方式:考试 开课专业:工科各专业 开课学期:1 总学时:36学时 总学分: 2学分 二、课程目的和任务 矩阵论是线性代数的后继课程。在线性代数的基础上,进一步介绍线性空间与线性变换、欧氏空间与酉空间以及在此空间上的线性变换,深刻地揭示有限维空间上的线性变换的本质与思想。为了拓展高等数学的分析领域,通过引入向量范数和矩阵范数在有限维空间上构建了矩阵分析理论。 从应用的角度,矩阵代数是数值分析的重要基础,矩阵分析是研究线性动力系统的重要工具。为了矩阵理论的实用性,对于矩阵代数与分析的计算问题,利用Matlab计算软件实现快捷的计算分析。 三、教学基本要求(含素质教育与创新能力培养的要求) 通过本课程的学习,使学生在已掌握本科阶段线性代数知识的基础上,进一步深化和提高矩阵理论的相关知识。并着重培养学生将所学的理论知识应用于本专业的实际问题和解决实际问题的能力。 本课程还要求学生从理论上掌握矩阵的相关理论,会证明简单的一些命题和结论,从而培养逻辑思维能力。要求掌握一些有关矩阵计算的方法,如各种标准型、矩阵函数等,为今后在相关专业中实际应用打好基础。 四、教学内容与学时分配 (一) 线性空间与线性变换 8学时 1. 理解线性空间的概念,掌握基变换与坐标变换的公式;

2. 掌握子空间与维数定理,了解线性空间同构的含义; 3. 理解线性变换的概念,掌握线性变换的矩阵表示。 (二) 内积空间 6学时 1. 理解内积空间的概念,掌握正交基及子空间的正交关系; 2. 了解内积空间的同构的含义,掌握判断正交变换的方法; 3. 理解酉空间的概念,会判定一个空间是否为酉空间 4. 掌握酉空间与实内积空间的异同; 5. 掌握正规矩阵的概念及判定定理和性质。 (三) 矩阵的对角化与若当标准形 6学时 1. 掌握矩阵相似对角化的判别方法; 2. 理解埃尔米特二次型的含义; 3. 会求史密斯标准形; 4. 会求若当标准型。 (四) 矩阵分解4学时 1. 会求矩阵的三角分解和UR分解; 2. 会求矩阵的满秩分解和单纯矩阵的谱分解; 3. 了解矩阵的奇异值和极分解。 (五) 向量与矩阵的重要数字特征4学时 1. 理解向量范数、矩阵范数; 2. 有限维线性空间上向量范数的等价性; 3. 向量范数与矩阵范数的相容性。 (六) 矩阵分析 4学时 1. 理解向量和矩阵的极限的概念; 2. 掌握矩阵幂级数收敛的判定方法; 3. 理解矩阵的克罗内克积; 4. 会求矩阵的微分与积分。 (七) 矩阵函数 4学时 1. 理解矩阵多项式的概念; 2. 掌握由解析函数确定的矩阵函数; 3. 掌握矩阵函数的计算方法。 五、教学方法及手段(含现代化教学手段) 本课程的所有授课内容,均使用多媒体教学方式,教案采用PowerPoint编写,教师使

新理解矩阵(1-6全)

新理解矩阵1 前边我承诺过会写一些关于自己对矩阵的理解。其实孟岩在《理解矩阵》这三篇文章中,已经用一种很直观的方法告诉了我们有关矩阵以及线性代数的一些性质和思想。而我对矩阵的理解,大多数也是来源于他的文章。当然,为了更好地理解线性代数,我还阅读了很多相关书籍,以求得到一种符合直觉的理解方式。孟岩的blog已经很久没有更新了,在此谨引用他的标题,来叙述我对矩阵的理解。 当然,我不打算追求那些空间、算子那些高抽象性的问题,我只是想发表一下自己对线性代数中一些常用工具的看法,比如说矩阵、行列式等。同时,文章命名为“理解矩阵”,也就是说这不是矩阵入门教程,而是与已经有一定的线性代数基础的读者一起探讨关于矩阵的其他理解方式,仅此而已。我估计基本上学过线性代数的读者都能够读懂这篇文章。 首先,我们不禁要追溯一个本源问题:矩阵是什么? 我们不妨回忆一下,矩阵是怎么产生的。矩阵可以看成是一个个向量的有序组合,这说明矩阵可以类比向量;但是向量又是怎么产生的?向量则是一个个数字的有序组合,这又把我们的研究方向指向了“数字是什么”这个问题上。比如,数字1是什么?它可以代表1米,可以代表1千克,也可以代表1分钟、1摄氏度甚至1个苹果。它为什么有这么多的表示意义?答案很简单,因为在本质上,它什么都不是,它就是数字1,一个记号,一个抽象的概念。正因为它抽象,它才可以被赋予各种各样直观的意义!回到矩阵本身,我们才会明白,矩阵的作用如此之大,就是因为书本上那个很枯燥的定义——矩阵就是m行n列的一个数表!它把矩阵抽象出来,让它得到了“进化”。它是一个更一般化的概念:一个向量可以看作一个矩阵,甚至一个数都可以看成一个矩阵,等等。 代数方面的理解 当然,上述说法是含糊的,我们还是需要确切知道它究竟有什么用?这可以从代数和几何的角度来分析,因为做到数形结合才是最完美的。首先我们知道数学最基本的元素就是数字,严格来说是自然数,如0,1,2,...;有了数字,我们就可以做到很多东西。但是数字是单一的,而我们很多时候都要批量处理一些类似的运算,比如同时要计算1+2,1+3,2+3,4+5这四个算式。不论是从记录还是从研究的角度来说,分开研究它们都是比较繁琐的。于是一种“批量”的记号产生了,我们记为(1,1,2,4)+(2,3,3,5),用两个不同记号记录它们,比如 A =(1,1,2,4), B =(2,3,3,5),我们就可以将它记为A +B 。这样不论在研究还是记录方面都能够给我们方便。于是一个我们称之为“向量”的东西产生了,也就是说,从代数的角度来讲,向量是为了研究批量运算而产生的。但是向量并没有解决所有的批量运算的问题。比如3元一次方程组 a11x1+a12x2+a13x3=b1 a21x1+a22x2+a23x3=b2

浅谈矩阵计算

浅谈矩阵计算 一丶引言 矩阵是高等代数学中的常见的工具。在应用数学,物理学,计算机科学中都有很大的作用。研究矩阵的计算,可以简化运算,并深入理解矩阵的性质。在数学中,矩阵(Matrix)是一个按照长方阵列排列的复数或实数集合,最早来自于方程组的系数及常数所构成的方阵。这一概念由19世纪英国数学家凯利首先提出。矩阵常见于统计分析等应用数学学科中。在物理学中,矩阵于电路学、力学、光学和量子物理中都有应用;计算机科学中,三维动画制作也需要用到矩阵。矩阵的运算是数值分析领域的重要问题。将矩阵分解为简单矩阵的组合可以在理论和实际应用上简化矩阵的运算。对一些应用广泛而形式特殊的矩阵,例如稀疏矩阵和准对角矩阵,有特定的快速运算算法。关于矩阵相关理论的发展和应用,请参考矩阵理论。在天体物理、量子力学等领域,也会出现无穷维的矩阵,是矩阵的一种推广。矩阵的研究历史悠久,发展也是历久弥新,拉丁方阵和幻方在史前年代已有人研究。 作为解决线性方程的工具,矩阵也有不短的历史。成书最迟在东汉前期的《九章算术》中,用分离系数法表示线性方程组,得到了其增广矩阵。在消元过程中,使用的把某行乘以某一非零实数、从某行中减去另一行等运算技巧,相当于矩阵的初等变换。但那时并没有现今理解的矩阵概念,虽然它与现有的矩阵形式上相同,但在当时只是作为线性方程组的标准表示与处理方式。 矩阵正式作为数学中的研究对象出现,则是在行列式的研究发展起来后。逻辑上,矩阵的概念先于行列式,但在实际的历史上则恰好相反。日本数学家关孝和(1683年)与微积分的发现者之一戈特弗里德·威廉·莱布尼茨(1693年)近乎同时地独立建立了行列式论。其后行列式作为解线性方程组的工具逐步发展。1750年,加布里尔·克拉默发现了克莱姆法则。 矩阵的现代概念在19世纪逐渐形成。1800年代,高斯和威廉·若尔当建立了高斯—若尔当消去法。1844年,德国数学家费迪南·艾森斯坦(F.Eisenstein)讨论了“变换”(矩阵)及其乘积。1850年,英国数学家詹姆斯·约瑟夫·西尔维斯特(James Joseph Sylvester)首先使用矩阵一词。英国数学家凯利被公认为矩阵论的奠基人。他开始将矩阵作为独立的数学对象研究时,许多与矩阵有关的性质已经在行列式的研究中被发现了,这也使得凯利认为矩阵的引进是十分自然的。他说:“我决然不是通过四元数而获得矩阵概念的;它或是直接从行列式的概念而来,或是作为一个表达线性方程组的方便方法而来的。”他从1858年开始,发表了《矩阵论的研究报告》等一系列关于矩阵的专门论文,研究了矩阵的运算律、矩阵的逆以及转置和特征多项式方程。凯利还提出了凯莱-哈密尔顿定理,并验证了3×3矩阵的情况,又说进一步的证明是不必要的。哈密尔顿证明了4×4矩阵的情况,而一般情况下的证明是德国数学家弗罗贝尼乌斯(F.G.Frohenius)于1898年给出的。1854年时法国数学家埃尔米特(C.Hermite)使用了“正交矩阵”这一术语,但他的正式定义直到1878年才由费罗贝尼乌斯发表。1879年,费罗贝尼乌斯引入矩阵秩的概念。至此,矩阵的体系基本上建立起来了。 无限维矩阵的研究始于1884年。庞加莱在两篇不严谨地使用了无限维矩阵和行列式理论的文章后开始了对这一方面的专门研究。1906年,希尔伯特引入无限二次型(相当于无限维矩阵)对积分方程进行研究,极大地促进了无限维矩阵的研究。在此基础上,施密茨、赫林格和特普利茨发展出算子理论,而无限维矩阵成为了研究函数空间算子的有力工具。 二、矩阵的介绍与基本运算 由m×n个数a ij(i=1,2,…,m;j=1,2,…,n)排成的m行n列的数表称为m行n列矩阵,简称m ×n矩阵。只有一行的矩阵A=(a1,a2…a n)称为行矩阵或行向量,只有一列的矩阵称为列矩阵或列向量。矩阵计算的合适出发点是矩阵与矩阵的乘法。这一问题在数学上虽然简单,但从计算上来看却是十分丰富的。矩阵相乘可以有好几种不同的形式,还将引入矩阵划分的概念,并将其用来刻画计

企业战略管理里矩阵的意义

企业战略管理里矩阵的意义 最近一些朋友问我,企业为什么要实施矩阵管理?我想从项目管理、绩效管理与知识管理三个方面来回答这个问题。 一,项目管理。企业可以被看作是一个饥渴的生物体,而它的食物就是它所接洽的每一个项目。每一个项目从市场中来,到企业中去,通过企业的作业,成为最终的作品,为市场和企业都带来了新鲜的营养。在此期间,矩阵管理为每个“项目”提供了有效的“消化过程”,使得企业不会因“消化不良”而“缺乏营养”,也不会因“吃错喝高”而“上吐下泻”,这就是矩阵管理为企业的项目管理所带来的“理顺作用”。 二,绩效管理。没有懒惰的员工,只有低效的管理。绩效管理机制就像是企业的开胃药,让所有的“组织机能”都加快地运作起来。然而,这味开胃药却需要一个“药引”——团队。员工就像是企业中的“细胞”,而“细胞”只有形成“器脏”,即团队矩阵,组织才能有所作为,绩效管理机制才能施展作业。因此,实施绩效管理机制有两大前提:第一,目标管理。德鲁克曾说过,没有目标的机构,不能称之为组织。然而目标管理,不是想当然,不是凭感觉,而是靠组织的战略性思维文化。第二,团队管理。团队化的实际操

作包括团队构成、团队责任、团队合作、团队考核与团队学习。这些战略性的组织安排都要产生于矩阵模式之上才会发生应有的功效。 三,知识管理。知识管理是一个开始进入人力资源中层管理难度的、跨专业、跨行业的研究课题(由于涉及领域越发广泛,前两项与之相比只是人力资源的初级管理)。知识管理,是建立学习型企业的过程,是个人发展与组织成长的途径,是激发企业凝聚力、形成企业文化的重要手段,是组织实现经久不衰神话的、变革管理的前提。然而,实现这一切的前提,是人。是以人为本的、健康的组织形态。因此,作为一切中层次和高层次人力资源管理的基石,矩阵管理,从一开始就起着决定性的作用。 综上所述,矩阵管理是强健企业的生命力的基础,是加速企业“新陈代谢”的绩效管理与目标管理的硬件,是实现深层次组织发展的必要的前提。

矩阵特征值的意义

矩阵特征值的意义 数学里面的特征值和特征矩阵到底有什么用,它的物理意义在于什么?? 矩阵的特征值要想说清楚还要从线性变换入手,把一个矩阵当作一个线性变换在某一组基下的矩阵,最简单的线性变换就是数乘变换,求特征值的目的就是看看一个线性变换对一些非零向量的作用是否能够相当于一个数乘变换,特征值就是这个数乘变换的变换比,这样的一些非零向量就是特征向量,其实我们更关心的是特征向量,希望能把原先的线性空间分解成一些和特征向量相关的子空间的直和,这样我们的研究就可以分别限定在这些子空间上来进行,这和物理中在研究运动的时候将运动分解成水平方向和垂直方向的做法是一个道理! 特征值时针对方阵而言的。 两个向量只有维数相同时才能考虑相等的问题,才能有和、有差。 引入特征值与特征向量的概念 ? 引例 在一个n 输入n 输出的线性系统y=Ax 中,其中 ? 我们可发现系统A 对于某些输入x ,其输出y ? 恰巧是输入x 的 倍,即 ;对某些输入,其输出与输入就不存在这种按比例放大的关系。 ??????? ??=??????? ??=??????? ??=n n nn n n n n y y y y x x x x a a a a a a a a a A M M L L L L L L L 2121212222111211,,λx y λ=

? 例如,对系统 ,若输入 ? 则 ? ? 若输入 ,则 ? 所以,给定一个线性系统A ,到底对哪些输入,能使其输出按比例放大,放大倍数 等于多少?这显然是控制论中感兴趣的问题。 基于此给出特征值与特征向量的概念: ? 定义 设A 是一个n 阶方阵,若存在着一个数 和一个非零n 维向量x ,使得 则称 是方阵A 的特征值,非零向量x 称为A 对应于特征值 的特征向量,或简称为A 的特征向量 ???? ??=4312A ? ?? ? ??=31x x Ax y 5315155314312=???? ??=???? ??=???? ?????? ??==???? ??=52x x Ax y λ≠???? ??=???? ?????? ??==269524312λx Ax λ=λλ

矩阵乘法的概念

矩阵乘法的概念 The latest revision on November 22, 2020

2006-2007后塍高中高二下学期数学教案(矩阵乘法的概念) 命题人:瞿蕴雅 教学目标: 1.熟练掌握二阶矩阵与二阶矩阵的乘法。 2.理解两个二阶矩阵相乘的结果仍然是一个二阶矩阵,从几何变换的角度来看,它表示的是原来两个矩阵的连续两次变换。 教学重点: 矩阵乘法的概念。 教学过程: 一、问题情境 问题:如果我们对一个平面向量连续实施两次几何变换,结果会是怎样 二、建构数学 1.矩阵乘法法则: 2.矩阵乘法的几何意义: 3.初等变换:在数学中,一一对应的平面几何变换都可看做是伸压、反射、旋转、切变变换的一次或多次复合,而伸压、反射、切变变换通常叫做初等变换,对应的矩阵叫做初等变换矩阵。 三、数学应用 1.例题 例1:(1)已知A= 11 22 11 22 ?? ? ? ? ? ?? ,B= 11 22 11 22 ?? - ? ? ? - ? ?? ,计算AB (2)已知A= 10 02 ?? ? ?? ,B= 14 23 ?? ? - ?? ,计算AB,BA (3)已知A= 10 00 ?? ? ?? ,B= 10 01 ?? ? ?? ,C= 10 02 ?? ? ?? 计算AB,AC 例2:已知梯形ABCD,其中A(0,0),B(3,0),C(2,2),D(1,2),先将梯形作关于x 轴的反射变换,再将所得图形绕原点逆时针旋转0 90 (1)求连续两次变换所对应的变换矩阵M

(2)求点A,B,C,D在 M T作用下所得到的结果 (3)在平面直角坐标系内画出两次变换对应的几何图形,并验证(2)中的结论。 例3: 已知A= cos sin sin cos αα αα - ?? ? ?? ,B= cos sin sin cos ββ ββ - ?? ? ?? ,试求AB,并对其几何意 义给予解释。 2.课堂练习 P46 1,2 四、回顾小结 1. 二阶矩阵乘法运算法则 2. 二阶矩阵乘法的几何意义 五、课外作业 同步导学

浅谈矩阵在实际生活中的应用

浅谈矩阵在实际生活中的应用 摘要:从数学的发展来看,它来源于生活实际,在科技日新月异的今天, 数学越来越多地被应用于我们的生活,可以说数学与生活实际息息相关。我们在学习数学知识的同时,不能忘记把数学知识应用于生活。在学习线性代数的过程中,我们发现代数在生活实践中有着不可或缺的位置。在本文中,我们对代数中的矩阵在成本计算、人口流动、加密解密、计算机图形变换等方面的应用进行了探究。 关键词:线性代数矩阵实际应用 Abstract:From the development of mathematics, we can see that it comes from our life. With the development of science and technology, the math is more and more being used in our lives, it can be said that mathematics and real life are closely related. While learning math knowledge we can not forget to apply mathematical knowledge to our life. In the process of learning linear algebra, we found that algebra has an indispensable position in life practice. In this article, we explore the application of the matrix in the costing, population mobility, encryption and decryption, computer graphics transform. Keywords: linear algebra matrix practical application

深入理解矩阵——矩阵革命(完全版)

矩阵革命-理解矩阵 线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍逆序数这个“前无古人,后无来者”的古怪概念,然后用逆序数给出行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题——把这行乘一个系数加到另一行上,再把那一列减过来,折腾得那叫一个热闹,可就是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太“无厘头”了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的出场——矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:“这个东西叫做矩阵”的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所有跟“学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。 事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国内外皆然。瑞典数学家Lars Garding在其名著Encounter with Mathematics中说:“如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,...,这就带来了教学上的困难。”事实上,当我们

矩阵,矩阵背后的现实意义

这是很早以前已经看过的,最近无意中又把保存的文章翻出来时,想起很多朋友问过矩阵,虽对矩阵似懂非懂,但却很想弄懂它,希望这几篇文章能帮你一下,故转之: 线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍逆序数这个“前无古人,后无来者”的古怪概念,然后用逆序数给出行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题——把这行乘一个系数加到另一行上,再把那一列减过来,折腾得那叫一个热闹,可就是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太“无厘头”了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的出场——矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:“这个东西叫做矩阵”的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所有跟“学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。 事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国内外皆然。瑞典数学家Lars Garding在其名著Encounter with Mathematics中说:”如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,...,这就带来了教学上的困难。”事实上,当我们开始学习线性代数的时候,不知不觉就进入了“第二代数学模型”的范畴当中,这意味着数学的表述方式和抽象性有了一次全面的进化,对于从小一直在“第一代数学模型”,即以实用为导向的、具体的数学模型中学习的我们来说,在没有并明确告知的情况下进行如此剧烈的paradigm shift,不感到困难才是奇怪的。 大部分工科学生,往往是在学习了一些后继课程,如数值分析、数学规划、矩阵论之后,才逐渐能够理解和熟练运用线性代数。即便如此,不少人即使能够很熟练地以线性代数为工具进行科研和应用工作,但对于很多这门课程的初学者提出的、看上去是很基础的问题却并不清楚。比如说: 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用? 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中发挥如此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不

矩阵的认识

什么是矩阵 线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍逆序数这个“前无古人,后无来者”的古怪概念,然后用逆序数给出行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题——把这行乘一个系数加到另一行上,再把那一列减过来,折腾得那叫一个热闹,可就是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太“无厘头”了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的出场——矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:“这个东西叫做矩阵” 的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所有跟“学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定线性代数 的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。 事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国内外皆然。瑞典数学家Lars Garding在其名著Encounter with Mathematics中说:“如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,...,这就带来了教学上的困难。”事实上,当我们开始学习线性代数的时候,不知不觉就进入了“第二代数学模型”的 范畴当中,这意味着数学的表述方式和抽象性有了一次全面的进化,对于从小一直在“第一 代数学模型”,即以实用为导向的、具体的数学模型中学习的我们来说,在没有并明确告知 的情况下进行如此剧烈的paradigm shift,不感到困难才是奇怪的。 大部分工科学生,往往是在学习了一些后继课程,如数值分析、数学规划、矩阵论之后,才逐渐能够理解和熟练运用线性代数。即便如此,不少人即使能够很熟练地以线性代数为工具进行科研和应用工作,但对于很多这门课程的初学者提出的、看上去是很基础的问题却并不清楚。比如说: * 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用? * 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中 发挥如此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不是很奇妙的事情?难道在矩阵乘法那看上去莫名其妙的规则下面,包含着世界的某些本质规律?如果是的话,这些本质规律是什么? * 行列式究竟是一个什么东西?为什么会有如此怪异的计算规则?行列式与其对应方阵本 质上是什么关系?为什么只有方阵才有对应的行列式,而一般矩阵就没有(不要觉得这个问题很蠢,如果必要,针对m x n矩阵定义行列式不是做不到的,之所以不做,是因为没有这

相关主题
文本预览
相关文档 最新文档