矩阵与范数—扫盲

格式：doc
大小：33.00 KB
文档页数：14

下载文档原格式

矩阵的范数和条件数

① A0,& A ,0 A0
② A A,R
③ A B A B, A ,B R n n ④ A B A B, A ,B R n n
⑤ Ax Ax, xRn
上海理工大学理学院
University of Shanghai for Science and Technology
2 2 x x 1 1 6 .0 0 0 0 6 1 x x 2 2 8 8 .0 0 0 0 1 与 2 2 x x 1 1 5 .9 9 9 9 6 9 x x 2 2 8 8 .0 0 0 0 2
其解分别为：x

x1 x2

College of SciA的实值函数N(A)=‖A‖,满足条件:
(1)非负性: ‖A‖0 ,且‖A‖=0当且仅当 A=0; (2)齐次性: ‖A‖=| |‖A‖, R; (3)三角不等式:‖A+B‖‖A‖+‖B‖; (4)柯西－施瓦茨不等式:‖AB‖‖A‖‖B‖. 则称‖A‖为矩阵A的范数.
x
b
上海理工大学理学院
University of Shanghai for Science and Technology
College of Science
注：一般判断矩阵是否病态，并不计算A1，而由经验得出。
行列式很大或很小（如某些行、列近似相关）；元素间相差大数量级，且无规则；主元消去过程中出现小主元；特征值相差大数量级。
A1
很小
A
A
A
A
条件数表示了对误差的放大率
上海理工大学理学院
University of Shanghai for Science and Technology

第五章--向量范数和矩阵范数

圆范数。
当 x 时，|| x ||A 0 ；当 x θ 时由 A 对称
正定知 xH Ax 0 ，即 || x ||A 0 。
对于任意 k C ，有 || k x ||A (kx)T A(kx) | k | xT Ax | k | || x ||A
由于 A 为Hermite正定矩阵，故存在酉矩阵 U ，使得
|| x ||2
| x1 |2 | x2 |2
| xn |2
定义的|| ||2 是 F n上的向量范数，称为2-范数或 l2
范数，也称为 Euclid 范数。
例 7 对任意 x ( x1, x2, , xn) T F n，由
|| x ||p
1/ p n
| xi |p , p 1
i1
定义的|| ||p 是 F n 上的向量范数，称为p -范数或 lp
UT AU Λ diag( λ1, λ2, , λn)
这里 A 的特征值 λi (i 1, 2, , n) 都为正数。
从而有
A UΛUT U Λ Λ UT BT B
此时
|| x ||A xT Ax xT BT Bx (Bx)T Bx || Bx ||2
因此对任意 y C n ， || x y ||A || B( x y) ||2
数 || A || 表示对于任意向量 x F n ， A 可以 “拉伸”向量 x 的最大倍数，即使得不等式
|| A x || C || x || 成立的最小的数 C 。称 || A || 为范数 || || 和 || ||
j1
n
| xj
j1
yj |; yj |;
yj |;
1
yj |m m;
以及与椭圆范数类似的Mahalanobis距离：

2.2矩阵的范数

§2.2 矩阵的范数我们知道：向量本身可以看作是矩阵，而一般的矩阵又有自身的运算特点，比如矩阵的乘法运算。

因此，我们定义矩阵的范数时需要考虑矩阵的本身的特点，这就有了我们以下要讨论的内容：一、矩阵的范数1.矩阵范数的定义设||||:m n C R ×→i 是实值函数，若它满足下述三个条件：（1）非负性：,||||0,and ||||00m n A C A A A ×∀∈≥=⇔= （2）齐次性：,,||||||||||m n k C A C kA k A ×∀∈∈= （3）三角不等式：,,||||||||||||m n A B C A B A B ×∀∈+≤+ 则称||||i 为广义矩阵范数，若||||i 还满足下述第四个性质：（4）相容性：,,||||||||||||m n n l A C B C AB A B ××∀∈∈≤i 则称||||i 为矩阵范数。

注：在相容性的定义中，n l B C ×∈，m l AB C ×∈，实数||||B ，||||AB 的定义规则与实数||||A 的定义规则相同。

2. 矩阵范数的连续性与向量的情况一样，对于矩阵序列而言，它也有极限的概念。

设矩阵序列(){}k A ，其中()k m n A C ×∈，若()k A 的每一个元素()k ij a 均有极限ij a ，则称矩阵序列(){}k A 有极限()ij A a =，或者说(){}k A 收敛到矩阵A ，记作()()lim ()k k k A A A A →+∞=→不收敛的矩阵序列称为发散的。

当然，也可按照范数定义矩阵的收敛性。

即若()lim 0k k A A →∞−=则称(){}k A 在范数||||i 意义下收敛于A 。

由三角不等式，可推知,,m n A B C ×∀∈有||||||||||||||A B A B −≥−。

矩阵范数详解.docx

《周国标师生交流讲席010》向量和矩阵的范数的若干难点导引(二)一.矩阵范数的定义引入矩阵范数的原因与向量范数的理由是相似的，在许多场合需要“测量”矩阵的“大小”，比如矩阵序列的收敛，解线性方程组时的误差分析等，具体的情况在这里不再复述。

最容易想到的矩阵范数，是把矩阵A C m n可以视为一个mn维的向量(采用所谓“拉直”的变换)，所以，直观上可用C mn上的向量范数来作为A C m n的矩阵范数。

比如m n 1在∣1 -范数意义下，IIAl1 ；二Ia ijI= tr(A H A) 2; (1.1 )1Zl mn A2在I2-范数意义下，∣∣A∣∣F=∑∑同|2，(1.2)Iy j A J注意这里为了避免与以后的记号混淆，下标用“F”，这样一个矩阵范数，称为Frobenius范数，或F-范数。

可以验证它们都满足向量范数的3个条件。

那么是否矩阵范数就这样解决了？因为数学上的任一定义都要与其对象的运算联系起来，矩阵之间有乘法运算，它在定义范数时应予以体现，也即估计AB的“大小”相对于A与B的“大小”关系。

定义1设A C mn,对每一个A ,如果对应着一个实函数N(A),记为IlAll ,它满足以下条件：(1)非负性：|| A||_0 ;(1 a)正定性：A=O mn= IIAII= 0(2)齐次性：||〉A||=| |||A||, • C ;(3)三角不等式:||A||A B||—||A|| ||B||, -B C m n则称N(A)=|| A||为A的广义矩阵范数。

进一步，若对C m n,C n 1C m l上的同类广义矩阵范数|| || ,有(4)(矩阵相乘的)相容性:|| A || AB ||_|| A|||| B ||, B C n I , 则称N(A) =||A||为A的矩阵范数。

我们现在来验证前面(1.1 )和(1.2 )定义的矩阵范数是否合法？我们这里只考虑(1.2 ),把较容易的(1.1 )的验证留给同学们，三角不等式的验证。

矩阵的范数及相关数学含义

矩阵的范数及相关数学含义
矩阵的奇异值：
设A为复数域内m*n阶矩阵，A*表⽰A的共轭转置矩阵，A*·A的n个⾮负特征值的算术平⽅根（即A*·A的开根号值）叫作矩阵A的奇异值。

记为σi(A)。

如果把A*·A的特征值记为λi(A*·A)，则σi(A)=sqrt(λi(A*·A))。

或者说矩阵A的奇异值是A*·A 的特征值的平⽅根。

任意矩阵都有奇异值。

对于⼀般的⽅阵来说，其奇异值与是没有关系的。

奇异值的数⽬是矩阵的最⼩的维数。

当A是⽅阵时，其奇异值的⼏何意义是：若X是n维单位球⾯上的⼀点，则Ax是⼀个n维椭球⾯上的点，其中椭球的n个半轴长正好是A的n个奇异值。

简单地说，在⼆维情况下，A将单位圆变成了椭圆，A的两个奇异值是椭圆的长半轴和短半轴。

如果取维空间的单位球，⽤ × 矩阵乘其中对于每个点的向量，这将得到维空间的椭球体. 的奇异值给出椭球体主轴的长度.
矩阵的2-范数 Norm 是椭球体的最⼤的主轴，等于矩阵最⼤的奇异值. 这也是对于任何可能的单位向量，的最⼤的2-范数长度.。

矩阵的范数

矩阵的范数矩阵的范数是线性代数中的一个概念，它是用来衡量矩阵大小的一种方式。

范数是一种将矩阵（或向量）映射到非负实数的函数，反映矩阵（或向量）的大小。

在实际应用中，矩阵的范数被广泛用于求解线性方程组、矩阵分解、数据压缩等各种问题中。

矩阵范数的定义比较抽象，但其有严格的数学定义。

在此先介绍一下向量范数，然后再拓展到矩阵范数的定义。

1. 向量范数向量范数是将一个向量映射到其大小的非负实数函数。

向量范数必须满足以下性质：（1）非负性：对于所有向量x，有||x||>=0。

（2）同一性：当且仅当x=[0,0,...,0]时，有||x||=0。

（3）绝对值：||x||=|-x|。

（4）三角不等式：对于所有向量x和y，有||x+y||<=||x||+||y||。

常见的向量范数有：（2）L2范数：||x||2=√(∑xi^2)。

矩阵范数类似于向量范数，也是将一个矩阵映射到其大小的非负实数函数。

矩阵范数也必须满足向量范数的四个性质（非负性、同一性、绝对值、三角不等式），同时还需要满足以下性质：（5）齐次性：对于所有矩阵A和实数t，有||tA||=|t|||A||。

（2）谱范数：||A||2=max|λi|，其中λi为A的特征值。

（5）核范数：||A||*=\sigma_1(A)+\sigma_2(A)+...+\sigma_r(A)，其中\sigma_1(A)≥\sigma_2(A)≥...≥\sigma_r(A)≥0是A的奇异值。

其中，Frobenius范数是最常用的矩阵范数，它等价于将矩阵展开成一个向量，然后计算向量的L2范数。

谱范数可以被视为矩阵的最大奇异值。

一范数和∞范数则是适用于稀疏矩阵的范数，它们可以度量矩阵的行或列中的非零元素个数。

核范数可以被视为对矩阵进行低秩近似的一种方式。

总之，矩阵范数是一种十分有用的工具，它不仅可以度量矩阵的大小，而且可以用于求解许多数学问题，如线性方程组、矩阵分解、最小二乘问题、数据压缩等。

矩阵论范数知识点总结

矩阵论范数知识点总结一、概述矩阵论是线性代数的一个分支，它研究矩阵及其性质。

矩阵的范数是矩阵的一种性质的度量，它在矩阵分析、数值线性代数、优化理论等领域中有着广泛的应用。

本文将对矩阵范数的定义、性质、应用以及相关的其他知识点进行总结和介绍。

二、矩阵的定义在数学中，矩阵是一个按照矩形排列的复数或实数集合。

也可以看成是一个数域上的矩形阵列。

矩阵的元素可以是实数、复数或者是其他的数学对象。

一个n×n矩阵A是一个由n×n个元素（a_ij）组成的矩形数组。

三、范数的定义在数学中，范数是定义在向量空间中的一种函数，它通常被用来衡量向量的大小或长度。

对于矩阵来说，范数是一种度量矩阵大小的方法。

对于一个矩阵A，它的范数通常记作||A||。

矩阵的范数满足以下性质：1. 非负性：||A|| ≥ 0，并且当且仅当A = 0时，||A|| = 02. 齐次性：对于任意标量c，||cA|| = |c| * ||A||3. 三角不等式：||A+B|| ≤ ||A|| + ||B||四、矩阵范数的种类矩阵范数一般有几种不同的类型。

1. Frobenius范数：矩阵A的Frobenius范数定义为||A||_F = sqrt(Σ_(i=1)^m Σ_(j=1)^n|a_ij|^2)2. 1-范数：矩阵A的1-范数定义为||A||_1 = max(Σ_(i=1)^n |a_ij|)3. 2-范数：矩阵A的2-范数定义为||A||_2 = max(Σ_(i=1)^m Σ_(j=1)^n |a_ij|^2)^(1/2)4. ∞-范数：矩阵A的∞-范数定义为||A||_∞ = max(Σ_(j=1)^n |a_ij|)五、矩阵范数的性质矩阵范数具有一些重要的性质，下面将介绍其中一些主要性质。

1. 非负性：||A|| ≥ 0，并且当且仅当A = 0时，||A|| = 02. 齐次性：对于任意标量c，||cA|| = |c| * ||A||3. 三角不等式：||A+B|| ≤ ||A|| + ||B||4. 乘法范数：||AB|| ≤ ||A|| * ||B||5. 谱半径：对于任意矩阵A，它的谱半径定义为rho(A) = max|λ_i(A)|6. 对称矩阵：对于对称矩阵A，其2-范数定义为rho(A)，即||A||_2 = rho(A)，其中rho(A)是A的最大特征值六、矩阵范数的应用矩阵范数在数学和工程领域有着广泛的应用，下面将介绍一些主要的应用。

矩阵范数的计算公式

矩阵范数的计算公式矩阵范数是矩阵的一种度量，用于衡量矩阵的大小。

它可以帮助我们了解和分析矩阵的特性以及它们在不同数学和计算领域中的应用。

矩阵范数有许多不同的定义和计算方法，下面将介绍一些常见的矩阵范数及其计算公式。

1.矩阵的1-范数：矩阵的1-范数是指矩阵列绝对值之和的最大值，即以列为单位，计算每一列绝对值之和，然后找出最大的一个值。

计算公式如下：A，1 = max{∑，a[i][j]，}, 1≤i≤n2.矩阵的∞-范数：矩阵的∞-范数是指矩阵行绝对值之和的最大值，即以行为单位，计算每一行绝对值之和，然后找出最大的一个值。

计算公式如下：A，∞ = max{∑，a[i][j]，}, 1≤j≤n3.矩阵的2-范数：矩阵的2-范数是指通过矩阵A与其转置矩阵A^T相乘的方式得到的最大特征值的平方根。

计算公式如下：A，2 = √(λ_max(A^T*A))4.矩阵的F-范数：矩阵的F-范数是指矩阵所有元素的平方和的平方根。

计算公式如下：A，F=√(∑，a[i][j]，^2)以上是常见的矩阵范数的计算公式。

其中，1-范数和∞-范数是直接计算每一列或每一行的绝对值之和来求得的；2-范数是通过矩阵的特征值来计算的；F-范数是通过矩阵所有元素的平方和来计算的。

矩阵范数在数学和计算领域中具有广泛的应用。

例如，在线性代数中，矩阵范数可以用来衡量矩阵的条件数和稳定性，以及判断矩阵是否奇异；在机器学习和数据挖掘中，矩阵范数可以用来评估模型的复杂度和泛化能力；在图论和网络分析中，矩阵范数可以用来度量图的连通性和稳定性；在优化和最优控制中，矩阵范数可以用来定义目标函数和约束条件。

总之，矩阵范数是矩阵的一种度量，用于衡量矩阵的大小。

不同的矩阵范数有不同的计算方法和应用领域，通过矩阵范数的计算和分析，可以帮助我们了解和把握矩阵的特性，并在不同的数学和计算问题中得到应用。

矩阵范数

r r 1) 常向量 b 的扰动 δ b 引起解的误差 δ x r r r r r r r r r −1 + 设 A x = b ， A ∃ ， x是精确解。 A y = b r δ b 的解记为 y = x + δ x 。 r 是精确解。 r r r r r r 即 A( xr+ δ x ) = b + δ b ⇒ Ax + Aδ x = b + δ b， r r r r r −1 ) 由Ax = b ，得 A(δ xr = δ b，即δ x = A (δ b )， r ( 9 .2 ) ⇒ || δ x ||≤ || A−1 || || δ b ||， r 1 || A || r r 即 r ≤ r ， ( 9 .3 ) 又 || b ||=|| Ax ||≤|| A || || x || ， r || x || r || b || || δb || x 由（9.2）式及（9.3）式得 || δv || ≤|| A −1 || || A || r ）式及（） || b || || x || 结论：扰动对解的影响扰动对解的影响。结论：b扰动对解的影响。 r r n× n 为精确解，定理27 (1) A ∈ R 为非奇异矩阵，x为精确解， x = b ≠ 0。定理 r 为非奇异矩阵，为精确解 A r r r ( 2)设 A( x + δ x ) = br+ δ b ，则b微小误差扰动、摄动引起解的相微小误差(扰动引起解x的相微小误差扰动、摄动)引起解 r || δx || || δb || ≤|| A −1 || || A || r . v 对误差有估计式对误差有估计式： || x || || b || 上式说明，常数项b微小误差引起解的相对误差可能是说明：上式说明，常数项微小误差引起解的相对误差可能是 r 说明： || δb || r 的 || A−1 || || A || 倍。即上式的不等号中的等号可以成立。即上式的不等号中的等号可以成立。 || b ||

矩阵的三种范数证明

矩阵的三种范数证明矩阵的三种范数是指矩阵的1-范数、2-范数和无穷大范数。

在矩阵理论中，范数是一种度量矩阵大小的方法，它可以帮助我们理解矩阵的性质和特征。

下面我们将分别证明矩阵的三种范数。

1. 矩阵的1-范数证明：矩阵的1-范数定义为矩阵A的每一列元素绝对值之和的最大值，即A ₁= max{∑a_ij : 1 ≤i ≤m}其中a_ij表示矩阵A的第i行第j列的元素。

证明过程如下：首先，我们可以证明1-范数是一种范数。

满足下列性质：1）非负性： A ₁≥0，且只有当A=0时， A ₁=0；2）齐次性：对于任意的标量α，有αA ₁= α A ₁；3）三角不等式：A+B ₁≤ A ₁+ B ₁。

接下来，我们来证明矩阵的1-范数的三角不等式。

对于任意两个矩阵A和B，它们的1-范数分别表示为 A ₁和 B ₁，那么根据1-范数的定义，有：A ₁= max{∑a_ij : 1 ≤i ≤m}B ₁= max{∑b_ij : 1 ≤i ≤m}假设C=A+B，那么C的1-范数可以表示为：C ₁= max{∑c_ij : 1 ≤i ≤m}我们知道c_ij = a_ij + b_ij，所以：∑c_ij = ∑a_ij + b_ij ≤∑a_ij + ∑b_ij由于∑a_ij 和∑b_ij 分别是A和B的1-范数，所以根据定义，有：max{∑a_ij : 1 ≤i ≤m} + max{∑b_ij : 1 ≤i ≤m} = A ₁+ B ₁因此，我们得到了结论：C ₁= max{∑c_ij : 1 ≤i ≤m} = A ₁+ B ₁即矩阵的1-范数满足三角不等式。

2. 矩阵的2-范数证明：矩阵的2-范数定义为矩阵A的最大奇异值，即：A ₂= √(λ₁)其中λ₁表示AᵀA的最大特征值，即A的转置矩阵与A的乘积的最大特征值。

证明过程如下：首先，我们需要证明2-范数是一种范数。

同样满足下列性质：1）非负性： A ₂≥0，且只有当A=0时， A ₂=0；2）齐次性：对于任意的标量α，有αA ₂= α A ₂；3）三角不等式：A+B ₂≤ A ₂+ B ₂。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

矩阵论主要研究的是线性空间以及在线性空间中的一些操作，主要是线性变换。

当然书中主要是针对有限维的情况来讨论的，这样的话就可以用向量和矩阵来表示线性空间和线性变换，同其他的数学形式一样，矩阵是一种表达形式（notation），而这一方面可以简洁地表达出我们平时遇到的如线性方程和协方差关系的协方差矩阵等，另一方面又给进一步的研究或者问题的简化提供了一个平台。

如特征值分析、稳定性分析就对应着诸如统计分布和系统稳定性等实际问题。

而一系列的分解则可以方便方程的数值计算。

作为矩阵论的学习，我们需要了解具体的一些计算究竟是怎么算的，但更关键的是要知道各个概念和方法的实际意义，各个概念之间的关系。

首先介绍的是线性空间，对于线性空间中的任意一个向量的表示有基（相当于度量单位）和坐标（相当于具体的尺度），基既然作为度量标准了，当然要求对每一个向量都适用，同时这个标准本身也应该尽可能的简洁，那么就得到了基定义的两点约束：１、基的组成向量线性无关；２、线性空间中的任一个向量都可以由基的线性表示。

基作为一种“计量标准”，当然可能会存在多种形式，只要满足上面的两点条件，因而就有必要解决不同的度量标准之间的转换关系，从而得到过渡矩阵的概念，同时可以使用这种转换关系（过渡矩阵）去完成度量量（坐标）之间的转换。

在完成了线性空间这一对象的认识和表达之后，下面需要研究对象和对象之间的关系。

这里主要是线性变换，线性变换针对于实际对象主要完成类似于旋转和尺度变换方面的操作，而这种操作也牵涉到表达的问题。

为了保持与空间的一致性，我们也同样是在特定的基下来表示，从而线性变换就具体化为一个变换矩阵，并且，在不同的基下对应的变换矩阵当然也不相同，这里的不同的变换矩阵的关系就是相似的概念。

到此，我们完成了空间中向量的表示和线性变换的矩阵表达。

这里涉及了基、坐标、过渡矩阵、变换矩阵、相似矩阵这几个重要的概念。

上面算是内涵上的认识，下面我们需要知道线性空间里究竟有些什么东西，它是如何组成的，各个组成成分之间的关系，也就是空间的结构性方面的东西。

首先认识子空间（空间的组成部分），当然既然也是空间，也就要满足空间的加法和数乘的封闭性，要满足那八条定律。

后者可以由父空间保证，前面的就要子空间自身素质了。

同时要看子空间之间的并、交、直和运算和相应的秩的关系。

这里提到了维数，就要多说几句了，空间中的元素往往是连续过渡的，但是对于有限空间而言还有离散的性质，那就是维数，我称其为“不伸则已，一伸则增一”，从这也就说明了为什么可以用若干个子空间的直和可以等价于原线性空间。

子空间的形式很多，有生成子空间、值域空间、零空间（木木先生注：此处指核空间）和特征子空间等等，我们重点看看特征子空间。

一个空间可以划分为若干个特征子空间的直和形式，而每个特征子空间的共同特征就是具有相同的特征值，范围就是对应着这个特征值的若干特征向量的生成子空间。

为什么要这样划分？因为我们在平时的研究中，整个线性空间太大了，我们需要缩小研究范围，某一个或几个特征子空间就够了。

或者是模式分类时，每一个样本点就属于某个子空间，我们首先需要知道有哪些类，类的特点是什么，这就是特征子空间。

当然对于协方差矩阵而言，特征值还具有能量属性，在清楚各个特征子空间的位置后，我们可以通过某些变换改变这些子空间的空间分布。

在系统研究中，还可以在清楚特征子空间分布后成功地实现系统或方程的解耦。

呵呵，可能其用途很多很多，但关键的一点就是，我们必须认识空间的结构，在此基础上再结合对应的物理空间或几何空间的实际意义进行进一步的处理。

人心苦不足，在知道了上面的东西之后，大家在想，可视的二维平面和三维立体空间中，为了研究向量的长度及向量和向量之间的角度，提出了内积的概念，在线性空间中，人们也对内积的概念作了延拓，于是将原先的线性空间添油加醋改装成了内积空间（分为实数的欧式空间和复内积空间），这里的油醋就是以下的四点：1、交换律；2、分配律；3、齐次性；4、非负性。

向量自身的内积开二次根得到长度，两个向量内积除以两个向量的长度得到角度的余弦。

所有这些都是与可视空间中的性质是一致的（可以参阅《由相容性想到的》）。

这里要注意的是，它只给出了内积的约束，但在具体的向量空间中内积的计算形式却没有硬性规定，要想量化内积，很自然地就是要知道，量化的标准是什么，这就引出了度量矩阵（结合具体的内积计算式，计算得到的基的内积构成的矩阵）的概念。

考虑到内积的非负性和交换律，度量矩阵必须是对称正定矩阵。

这里也和前面一样，度量矩阵是在一定基下定义的，当基变化了，度量矩阵也会发生改变，相同的内积定义式在不同的基下得到的度量矩阵是合同的，呵呵，又多了一个概念。

而且，对称变换、正交性也在内积这找到了家。

老是待在线性代数的视野范围内，终归有些不爽，下面就正式进入了分析的领域，既然是矩阵分析，首先就是什么是矩阵函数，该如何定义，当然书中是先从矩阵级数出发的，既然是级数，就会牵涉到部分和的收敛问题，收敛就是极限问题，如何定义矩阵的极限？最原始的就是按坐标收敛，不过那么多的元素要收敛，太累了！怎么办呢？其实这从本质上来说是多元衡量尺度一元化的问题，于是就找出了范数的概念，用一个范数来代替多个元素的收敛问题的讨论。

不同矩阵范数的等价性保证了函数极限的一致性。

在某种程度上范数成了距离的代名词，但要注意的是范数的概念要比距离强得多（主要是增加了绝对齐次性），我们会用范数去表示不同样本之间的距离，用范数去表示误差程度，用范数去衡量许许多多的表示某种程度的量。

其实总结到此本来可以宣告结束，但是随着计算技术的发展，诸如线性方程组求解、矩阵求逆等问题都需要一些补充内容：1、矩阵分解（简化方程求解）2、广义逆（病态矩阵和一般矩阵的求逆问题）不过其最小二乘性质还真好使。

3、特征值估计（求高阶的多项式方程可是要命的事，大概知道特征值和特征空间的位置对于一定的应用场合就可以了）这就是我暂时对矩阵论的理解，呵呵，相对于一年前对线性代数的理解要深刻得多了，在以后的研究实践中会进一步丰富的。

什么是范数矩阵论及矩阵计算在介绍主题之前，先来谈一个非常重要的数学思维方法：几何方法。

在大学之前，我们学习过一次函数、二次函数、三角函数、指数函数、对数函数等，方程则是求函数的零点；到了大学，我们学微积分、复变函数、实变函数、泛函等。

我们一直都在学习和研究各种函数及其性质，函数是数学一条重要线索，另一条重要线索——几何，在函数的研究中发挥着不可替代的作用，几何是函数形象表达，函数是几何抽象描述，几何研究“形”，函数研究“数”，它们交织在一起推动数学向更深更抽象的方向发展。

函数图象联系了函数和几何，表达两个数之间的变化关系，映射推广了函数的概念，使得自变量不再仅仅局限于一个数，也不再局限于一维，任何事物都可以拿来作映射，维数可以是任意维，传统的函数图象已无法直观地表达高维对象之间的映射关系，这就要求我们在观念中，把三维的几何空间推广到抽象的n 维空间。

由于映射的对象可以是任何事物，为了便于研究映射的性质以及数学表达，我们首先需要对映射的对象进行“量化”，取定一组“基”，确定事物在这组基下的坐标，事物同构于我们所熟悉的抽象几何空间中的点，事物的映射可以理解为从一个空间中的点到另一个空间的点的映射，而映射本身也是事物，自然也可以抽象为映射空间中的一个点，这就是泛函中需要研究的对象——函数。

从一个线性空间到另一个线性空间的线性映射，可以用一个矩阵来表达，矩阵被看作线性映射，线性映射的性质可以通过研究矩阵的性质来获得，比如矩阵的秩反映了线性映射值域空间的维数，可逆矩阵反映了线性映射的可逆，而矩阵的范数又反映了线性映射的哪些方面的性质呢？矩阵范数反映了线性映射把一个向量映射为另一个向量，向量的“长度”缩放的比例。

范数是把一个事物映射到非负实数，且满足非负性、齐次性、三角不等式，符合以上定义的都可以称之为范数，所以，范数的具体形式有很多种（由内积定义可以导出范数，范数还也可以有其他定义，或其他方式导出），要理解矩阵的算子范数，首先要理解向量范数的内涵。

矩阵的算子范数，是由向量范数导出的，由形式可以知：由矩阵算子范数的定义形式可知，矩阵A把向量x映射成向量Ax，取其在向量x范数为1所构成的闭集下的向量Ax范数最大值作为矩阵A的范数，即矩阵对向量缩放的比例的上界，矩阵的算子范数是相容的。

由几何意义可知，矩阵的算子范数必然大于等于矩阵谱半径（最大特征值的绝对值），矩阵算子范数对应一个取到向量Ax范数最大时的向量x方向，谱半径对应最大特征值下的特征向量的方向。

而矩阵的奇异值分解SVD，分解成左右各一个酉阵，和拟对角矩阵，可以理解为对向量先作旋转、再缩放、最后再旋转，奇异值，就是缩放的比例，最大奇异值就是谱半径的推广，所以，矩阵算子范数大于等于矩阵的最大奇异值，酉阵在此算子范数的意义下，范数大于等于1。

此外，不同的矩阵范数是等价的。

范数理论是矩阵分析的基础，度量向量之间的距离、求极限等都会用到范数，范数还在机器学习、模式识别领域有着广泛的应用。

首先说说空间(space)，这个概念是现代数学的命根子之一，从拓扑空间开始，一步步往上加定义，可以形成很多空间。

线形空间其实还是比较初级的，如果在里面定义了范数，就成了赋范线性空间。

赋范线性空间满足完备性，就成了巴那赫空间；赋范线性空间中定义角度，就有了内积空间，内积空间再满足完备性，就得到希尔伯特空间。

总之，空间有很多种。

你要是去看某种空间的数学定义，大致都是“存在一个集合，在这个集合上定义某某概念，然后满足某些性质”，就可以被称为空间。

这未免有点奇怪，为什么要用“空间”来称呼一些这样的集合呢？大家将会看到，其实这是很有道理的。

我们一般人最熟悉的空间，毫无疑问就是我们生活在其中的（按照牛顿的绝对时空观）的三维空间，从数学上说，这是一个三维的欧几里德空间，我们先不管那么多，先看看我们熟悉的这样一个空间有些什么最基本的特点。

仔细想想我们就会知道，这个三维的空间：1.由很多（实际上是无穷多个）位置点组成；2. 这些点之间存在相对的关系；3. 可以在空间中定义长度、角度；4.这个空间可以容纳运动，这里我们所说的运动是从一个点到另一个点的移动（变换），而不是微积分意义上的“连续”性的运动，上面的这些性质中，最最关键的是第4条。

第1、2条只能说是空间的基础，不算是空间特有的性质，凡是讨论数学问题，都得有一个集合，大多数还得在这个集合上定义一些结构（关系），并不是说有了这些就算是空间。

而第3条太特殊，其他的空间不需要具备，更不是关键的性质。

只有第4条是空间的本质，也就是说，容纳运动是空间的本质特征。

认识到了这些，我们就可以把我们关于三维空间的认识扩展到其他的空间。