矩阵函数和函数矩阵
- 格式:pdf
- 大小:141.68 KB
- 文档页数:6
1. 矩阵的构造与操作zeros 生成元素全为0的矩阵ones 生成元素全为1的矩阵eye 生成单位矩阵rand 生成随机矩阵randn 生成正态分布随机矩阵sparse 生成稀疏矩阵full 将稀疏矩阵化为普通矩阵diag 对角矩阵tril 矩阵的下三角部分triu 矩阵的上三角部分flipud 矩阵上下翻转fliplr 矩阵左右翻转MATLAB还能够构造一些常用的特殊矩阵2. 矩阵运算函数norm 矩阵或向量范数normest 稀疏矩阵(或大规模矩阵)的2-范数估计rank 矩阵的秩det 方阵的行列式trace 方阵的迹null 求基础解系(矩阵的零空间)orth 正交规范化rref 矩阵的行最简形(初等行变换求解线性方程组)subspace 计算两个子空间的夹角3. 与线性方程有关的矩阵运算函数inv 方阵的逆cond 方阵的条件数condest 稀疏矩阵1-范数的条件数估计chol 矩阵的Cholesky分解(矩阵的平方根分解)cholinc 稀疏矩阵的不完全Cholesky分解linsolve 矩阵方程组的求解lu 矩阵的LU分解ilu 稀疏矩阵的不完全LU分解luinc 稀疏矩阵的不完全LU分解qr 矩阵的正交三角分解pinv 矩阵的广义逆4. 与特征值或奇异值有关的矩阵函数eig 方阵的特征值与特征向量svd 矩阵的奇异值分解eigs 稀疏矩阵的一些(默认6个)最大特征值与特征向量svds 矩阵的一些(默认6个)最大奇异值与向量hess 方阵的Hessenberg形式分解schur 方阵的Schur分解。
矩阵论第七章函数矩阵与矩阵微分方程北京理工大学高数教研室* 第一章第一节函数第七章函数矩阵与矩阵微分方程函数矩阵定义: 以实变量的函数为元素的矩阵称为函数矩阵, 其中所有的元素都是定义在闭区间上的实函数。
函数矩阵与数字矩阵一样也有加法, 数乘, 乘法, 转置等几种运算, 并且运算法则完全相同。
例:已知计算定义:设为一个阶函数矩阵, 如果存在阶函数矩阵使得对于任何都有那么我们称在区间是可逆的。
称是的逆矩阵, 一般记为例 :已知那么在区间上是可逆的, 其逆为函数矩阵可逆的充分必要条件定理 : 阶矩阵在区间上可逆的充分必要条件是在上处处不为零, 并且其中为矩阵的伴随矩阵。
定义:区间上的型矩阵函数不恒等于零的子式的最高阶数称为的秩。
特别地, 设为区间上的阶矩阵函数, 如果的秩为 , 则称一个满秩矩阵。
注意:对于阶矩阵函数而言, 满秩与可逆不是等价的。
即:可逆的一定是满秩的, 但是满秩的却不一定是可逆的。
例 :已知那么。
于是在任何区间上的秩都是2。
即是满秩的。
但是在上是否可逆, 完全依赖于的取值。
当区间包含有原点时, 在上有零点, 从而是不可逆的。
函数矩阵对纯量的导数和积分定义:如果的所有各元素在处有极限, 即其中为固定常数。
则称在处有极限, 且记为其中如果的各元素在处连续, 即则称在处连续, 且记为其中容易验证下面的等式是成立的: 设则定义:如果的所有各元素在点处(或在区间上)可导, 便称此函数矩阵在点处(或在区间上)可导, 并且记为函数矩阵的导数运算有下列性质: 是常数矩阵的充分必要条件是设均可导, 则设是的纯量函数, 是函数矩阵,与均可导, 则特别地, 当是常数时有 (4) 设均可导, 且与是可乘的, 则因为矩阵没有交换律,所以 (5) 如果与均可导, 则 (6) 设为矩阵函数, 是的纯量函数, 与均可导, 则定义: 如果函数矩阵的所有各元素在上可积, 则称在上可积, 且函数矩阵的定积分具有如下性质: 例1 :已知函数矩阵试计算证明: 由于 , 所以下面求。
第七章 矩阵函数在定义了矩阵范数之后,便可以度量线性空间中矩阵的大小和矩阵间的接近程度,进而引入极限的概念,并基于此建立矩阵分析理论。
本章将介绍矩阵序列和矩阵级数的定义和收敛性判断,并给出矩阵函数的定义和计算方法。
§7.1 矩阵序列与极限本章中数域F 均指R (或C ),所讨论矩阵均为方阵,非方阵的情况按照相应的范数也可类似定义。
我们把n n ⨯阶矩阵序列12k ,,,,A A A ,简记为{}k A ,其中()()()11121()()()21222()()()12=k k k nk k k n k k k k n n nn a a a a a a a a a ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦A ,1,2,k = 显然,一个n n ⨯阶矩阵序列{}k A ()n n k ⨯∈A C 中各矩阵的所有对应位置构成n n⨯个数列{}()k ij a ,其中()(,1,2,,)k ij a C i j n ∈= 。
定义1 设矩阵序列{}k A (1,2,...k =),其中()()C k n n k ij a ⨯=∈A ,若n n ⨯个数列(){}(,1,2,...,)k ij a i j n =都收敛,即存在数ij a ∈C ,使得()lim ,,1,2,...,k ij ij k a a i j n →∞== 则称矩阵序列{}k A 是收敛的,并把矩阵()C n n ij a ⨯=∈A 称为{}k A 的极限,或称矩阵序列{}k A 收敛于A ,简记为lim k k →∞=A A 或()k k →→∞A A若这n n ⨯个数列(){}(,1,2,...,)k ij a i j n =中至少有一个不收敛,则称矩阵序列{}k A 是发散的。
例1 讨论22⨯阶矩阵序列{}k A 和{}k B 的敛散性,其中1sin (1)(1)1k k kk k kk⎡⎤+⎢⎥=⎢⎥-⎢⎥⎢⎥⎣⎦A ,1(0.5)2+1021k k k k k e k ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣-⎦B 1,2,k = 。
第七讲 矩阵级数与矩阵函数一、 矩阵序列1. 定义: 设有矩阵序列{}()k A , 其中()()()k k ij A a =, 且当k →∞时()k ij ij a a →, 则称{}()k A 收敛, 并把()ijA a =叫做{}()k A 的极限, 或称{}()k A 收敛于A , 记为()lim k k A A →∝= 或 ()k k A A →∝→不收敛的矩阵序列则称为发散的,其中又分为有界和无界的情况.2. 收敛矩阵序列的性质:设{}()k A ,{}()k B 分别收敛于A ,B 则(1) ()()k k k A B A B αβαβ→∝+→+(2) ()()k k k A B AB →∝→(3) ()11()k k A A --→∝→,若()11(),k A A --存在(4) ()k k PA Q PAQ →∝→3 收敛矩阵: 设A 为方阵,且当k →∝时0k A →, 则称A 为收敛矩阵.[定理] 方阵A 为收敛矩阵的充要条件是A 的所有特征值的模值均小于1.证明: 对任何方阵A ,均存在可逆矩阵P , 使得 1A PJP -= 其中J 为A 的Jordan 标准形12s J J J J ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦, 1010i iii J λλλ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦1112k kk k k s J J A PJ P P P J --⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦11!...(1)!(1)!,i k m kk i i i i i ki k k m k m J λλλ-+-⎡⎤⎢⎥--+⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦当i k m > 0k A →就等价于0(1,2,...,)k i J i s →=, 等价于0(1,2,...,)k i i s λ→=,而这只有1i λ<才可能也必能.[得证]二、 矩阵级数1.定义: 矩阵序列{}()k A 的无穷和(1)(2)()k A A A ++++叫做矩阵级数, 而()()1NN k k SA ==∑称为其部分和, 若矩阵序列{}()N S 收敛,且有极限S , 则称该级数收敛,且有和S . 记为()1k k A S ∝==∑ 不收敛的级数必为发散的.若矩阵级数()1k k A∝=∑的所有元素()1k ij k a ∝=∑均绝对收敛,则称该级数为绝对收敛.2. 绝对收敛矩阵级数的性质(1)绝对收敛级数一定收敛,且任意调换它的项所得的级数仍收敛,并具有相同的和.(2) ()1k k A ∝=∑绝对收敛,则()1k k PA Q ∝=∑也绝对收敛且等于()1k k P A Q ∝=∑(3) ()1k k A ∝=∑, ()1k k B ∝=∑均绝对收敛,且和分别为12,S S 则()(1)1211()ki k i k i AB S S ∝+-===∑∑三、 方阵的幂级数A 为方阵, 0,()kk k c A A I ∝==∑称为A 的幂级数. 0k k A ∝=∑称为A 的Neumann 级数.1. Neumann 级数收敛的充要条件[定理] Neumann 级数收敛的充要条件是A 为收敛矩阵,且在收敛时其和为1()I A --. 证明: [必要性]级数0k k A ∝=∑收敛, 其元素为23()()()ij ij ij ij A A A δ++++显然也是收敛的. 作为数项级数, 其通项趋于零是级数收敛的必要条件. 故()0k ij k A →∝→,即0k k A →∝→也就是说A 为收敛矩阵. [充分性]:A 为收敛矩阵, 则其特征值的模值均小于1. 设A 的特征值为λ, ()I A -的特征值为μ. 则由det(())det((1))(1)det((1))n I I A I A I A μμμ--=-+=---可见11μλμλ-=→=-故020μμ<<→≠, ()I A -的行列式不为零,1()I A --存在. 而21(...)()k k I A A A I A I A +++++-=- 右乘1()I A --得211...()()k k I A A A I A I A +-++++=--当k →∝时, 10k A +→, 故11()0k A I A +--→. 所以10lim ()kii k i i AA I A ∝-→∝====-∑∑即Neumann 级数收敛于1()I A --.2. 收敛圆[定理] 若矩阵A 的特征值全部落在幂级数0()k k k z c z ϕ∝==∑的收敛圆内, 则矩阵幂级数00(),()k k k A c A A I ϕ∝===∑是绝对收敛的. 反之, 若A 存在落在()z ϕ的收敛圆外的特征值, 则()A ϕ是发散的. 证明略.[推论] 若幂级数在整个复平面上收敛, 则对任何的方阵A , ()A ϕ均收敛.四、 矩阵函数 如: A e , sin A , cos A以矩阵为自变量的“函数”(实际上是“函矩阵”)我们知道, 201112!!znn e z z z n ∝==+++=∑210(1)sin()(21)!n n n z z n ∝+=-=+∑20(1)cos()(2)!n nn z z n ∝=-=∑均为整个复平面上收敛的级数, 故对任何的方阵A01!Ann e A n ∝==∑210(1)sin()(21)!nn n A A n ∝+=-=+∑20(1)cos()(2)!n nn A A n ∝=-=∑均绝对收敛. 三者分别称为矩阵指数函数、矩阵正弦函数、矩阵余弦函数。
矩阵函数知识点总结
一、矩阵函数的概念
矩阵函数指的是以矩阵为自变量的函数。
在矩阵函数中,矩阵被视为一个整体,即矩阵的元素相对整体而言是自变量,而不是单独的变量。
矩阵函数可以使用不同的方法来进行计算,比如按照矩阵的规定进行运算或者使用矩阵分解等方法。
矩阵函数在很多领域都有着广泛的应用,比如线性代数、微分方程、概率统计、物理学等等。
二、矩阵函数的性质
矩阵函数的性质包括可加性、齐性、乘积法则等。
其中可加性指的是如果一个函数的自变量是两个矩阵的和,那么函数值就等于这两个矩阵各自作为自变量的函数值的和;齐性指的是函数值的倍数等于自变量的倍数与函数值的积;乘积法则指的是函数值乘以一个矩阵的乘积等于矩阵乘积分别作为函数值的乘积。
三、求导、积分和极限
对于矩阵函数的求导、积分和极限等运算,在矩阵分析中都有着一些特殊的方法和规则。
比如对于矩阵函数的求导,使用分量法则可以将矩阵函数的求导规则推广到矩阵函数的情况;对于矩阵函数的积分,可以使用行列式和矩阵的性质来进行计算;而对于矩阵函数的极限,需要根据矩阵函数的性质和定义来进行推导和计算。
总之,矩阵函数是一种以矩阵为自变量的函数,它具有可加性、齐性、乘积法则等性质,并且在求导、积分和极限等运算中有着一些特殊的方法和规则。
矩阵函数在数学和实际问题中都有着广泛的应用,在线性代数、微分方程、概率统计、物理学等领域都有着重要的地位。
希望通过这篇文章的介绍,读者能够对矩阵函数有更深的理解,并且能够应用到实际问题中去。
1.1.1 矩阵函数的定义定义1.1 设幂级数za kk k ∑+∞=0的r,且当∣z ∣<r 时,该幂级数收敛于f(z),即 f(z)=za kk k∑+∞=0,∣z ∣<r.如果A ∈cnn ⨯满足p(A)<r,则矩阵幂级数A a k k k∑+∞=0是绝对收敛的,其和称为矩阵函数,记为f(A),即f(A)= A a kk k∑+∞=0最常用的函数的幂级数展开有:∑∞+==!k kzk ze(+∞=r )z sin =z k k kk 120)!12()1(+∞+=∑-+(+∞=r )z cos =z kk kk 20!21-∑∞+=)()( (+∞=r ) ∑-+∞=-=1)1(k kz z (r=1)㏑(1+z)=z k k kk 10)1()1(+∞+=∑-+(r=1)根据定义1.1,它们所对应的矩阵函数为:∑∞+==0!k kAk Ae (c nn A ⨯∈∀)sin=Ak k kk 120)!12()1(+∞+=∑-+(cnn A ⨯∈∀)A cos=A kk kk 20!21-∑∞+=)()((c nn A ⨯∈∀) ∑-+∞=-=1)1(k kA A (p(A)<1)㏑(I+A)=Ak k kk 1)1()1(+∞+=∑-+( p(A)<1)(其中e A称为矩阵指数函数,sinA 称为矩阵正弦函数,cosA 称为矩阵余弦函数)定理1.1 假设∈A cnn ⨯,则有:(1) )sin(A -=-A sin ,A A cos )cos(=- (2) A i A e iAsin cos +=,A cos =21(ee iAiA -+),A sin =i21 (ee iAiA --).证明:(1)因为A sin =Ak k kk 120)!12()1(+∞+=∑-+,所以)sin(A -=)(A k k kk -)1(120)!12(+∞+=∑-+=Ak k kk 120)!12(-)1(+∞+=∑-+=A sin -,又因为A c o s =A kk kk 20!21-∑∞+=)()(,所以)(A -cos =)()()(A kk k k -1-20!2∑∞+==A kk kk 20!21-∑∞+=)()(=A cos ,因此证得。
请特别注意红色字体的命令eye 单位矩阵zeros 全零矩阵ones 全1矩阵rand 均匀分布随机阵genmarkov 生成随机Markov矩阵linspace 线性等分向量logspace 对数等分向量logm 矩阵对数运算cumprod 矩阵元素累计乘cumsum 矩阵元素累计和toeplitz Toeplitz矩阵disp 显示矩阵和文字内容length 确定向量的长度size 确定矩阵的维数diag 创建对角矩阵或抽取对角向量find 找出非零元素1的下标matrix 矩阵变维rot90 矩阵逆时针旋转90度sub2ind 全下标转换为单下标tril 抽取下三角阵triu 抽取上三角阵conj 共轭矩阵companion 伴随矩阵det 行列式的值norm 矩阵或向量范数nnz 矩阵中非零元素的个数null 清空向量或矩阵中的某个元素orth 正交基rank 矩阵秩trace 矩阵迹cond 矩阵条件数inv 矩阵的逆rref 求矩阵的行阶梯形rcond 逆矩阵条件数lu LU分解或高斯消元法pinv 伪逆qr QR分解givens Givens变换linsolve 求解线性方程lyap Lyapunov方程hess Hessenberg矩阵poly 特征多项式schur Schur分解expm 矩阵指数expm1 矩阵指数的Pade逼近expm2 用泰勒级数求矩阵指数expm3 通过特征值和特征向量求矩阵指数funm 计算一般矩阵函数logm 矩阵对数sqrtm 矩阵平方根spec 矩阵特征值gspec 矩阵束特征值bdiag 块矩阵,广义特征向量eigenmar- 正则化Markov特征kov 向量pbig 特征空间投影svd 奇异值分解sva 奇异值分解近似cumprod 元素累计积cumsum 元素累计和hist 统计频数直方图max 最大值min 最小值mean 平均值median 中值prod 元素积sort 由大到小排序std 标准差sum 元素和trapz 梯形数值积分corr 求相关系数或方差sparse 稀疏矩阵adj2sp 邻接矩阵转换为稀疏矩阵full 稀疏矩阵转换为全矩阵mtlb_sparse 将scilab稀疏矩阵转换为matlab稀疏矩阵格式sp2adj 将稀疏矩阵转换为邻接矩阵speye 稀疏矩阵方式单位矩阵sprand 稀疏矩阵方式随机矩阵spzeros 稀疏矩阵方式全零阵lufact 稀疏矩阵LU分解lusolve 稀疏矩阵方程求解spchol 稀疏矩阵Cholesky分解1、将四个顶点的坐标写成如下形式:1 -1 -1 11 1 -1 -12、再写成齐次坐标形式,从而构成一个矩阵:A =1 -1 -1 11 1 -1 -11 1 1 13、向量缩放:采用数乘的方法,k = 0.8000各点齐次坐标为:A =0.8 -0.8 -0.8 0.80.8 0.8 -0.8 -0.80.8 0.8 0.8 0.84、旋转:采用如下的变换矩阵:X=[cos(fai) -sin(fai) 0sin(fai) cos(fai) 00 0 1]X*A即为旋转后的齐次坐标。
矩阵函数求导
首先要区分两个概念:矩阵函数和函数矩阵
(1) 函数矩阵,简单地说就是多个一般函数的阵列,包括单变量和多变量函数。
函数矩阵的求导和积分是作用在各个矩阵元素上,没有更多的规则。
单变量函数矩阵的微分与积分
考虑实变量t 的实函数矩阵
()()()ij m n X t x t ×=,所有分量函数()ij x t 定义域相同。
定义函数矩阵的微分与积分
0()(),()().t t ij ij t t d d X t x t X d x d dx dx ττττ⎛⎞⎛⎞⎟⎜⎟⎜⎟==⎜⎟⎜⎟⎟⎜⎜⎟⎝⎠⎝⎠∫∫ 函数矩阵的微分有以下性质:
(1) ()()()()()d d d X t Y t X t t dt dt dt
+=+; (2) ()()()()()()()d dX t dY t X t Y t t X t dt dt dt
=+; 特殊情形
(a ) 若K 是常数矩阵,则()()()d d KX t K X t dt dt
=; (b ) 若()X t 是方阵,则2()()()()()d dX t dX t X t X t X t dt dt dt
=+; (3) ()
111()()()()d dX t X t X t X t dt dt =----; (4) 对任意的方阵A 和时变量t ,恒有At At At d e Ae e A dt
==; (5) 若AB BA =,则A B B A A B e e e e e +==。
如果,A B 可交换,则许多三角不等
式可以推广到矩阵上。
如sin(),sin(2)A b A +等。
参考文献:余鄂西,矩阵论,高等教育出版社。
(2) 矩阵函数,就是自变量为矩阵的函数映射;根据函数的自变量和因变量的
形式可分为多种。
矩阵函数的导数
定义(向量导数):映射:n m f →\\,()()12(),(),,()
(), 1...T m i f f x f x f x f x i m ===",
定义映射的导数为一个m n ×的偏导数矩阵 (), 1..., 1...i ij j df x Df i m j n dx ⎡⎤===⎢⎥⎣⎦. 例如 dAx A dx
=, ⇒
()()()(),,D f x g x Df x Dg x αβαβαβ⎡⎤+=+∈∈⎢⎥⎣⎦\\
()()''()()()D f g x f g x g x ⎡⎤=⎢⎥⎣⎦
''()()()()()(),,T T T n m D f x g x g x f x f x g x f g ⎡⎤=+∈→⎢⎥⎣⎦
\\ ⇒
()()T T T T T dx Ax x A Ax x A A dx
=+=+
定义(矩阵导数):
()vec ()()vec()
d A X dA X dX d X 有
符号说明
•d/dx (y)是一个向量,其第(i)个元素是dy(i)/dx
•d/d x (y) 是一个向量,其第(i)个元素是dy/dx(i)
•d/d x (y T) 是一个矩阵,其第(i,j)个元素是dy(j)/dx(i)•d/dx (Y) 是一个矩阵,其第(i,j)个元素是dy(i,j)/dx •d/d X (y) 是一个矩阵,其第(i,j)个元素是dy/dx(i,j)
注意 Hermitian 转置不能应用,因为复共轭不可解析,x,y是向量,X,Y是矩阵,x,y是标量。
在下面的表达中 A, B, C 是不依赖于 X的矩阵,a,b是不依赖于x的向量, 线性积
•d/dx (AYB) =A * d/dx (Y) * B
o d/dx (Ay) =A * d/dx (y)
•d/d x(x T A) =A
o d/d x(x T) =I
o d/d x(x T a) = d/d x(a T x) = a
•d/d X(a T Xb) = ab T
o d/d X(a T Xa) = d/d X(a T X T a) = aa T
•d/d X(a T X T b) = ba T
•d/dx (YZ) =Y * d/dx (Z) + d/dx (Y) * Z
二次积
•d/d x (Ax+b)T C(D x+e) = A T C(Dx+e) + D T C T(Ax+b)
o d/d x (x T Cx) = (C+C T)x
[C: symmetric]: d/d x (x T Cx) = 2Cx
d/d x (x T x) = 2x
o d/d x (Ax+b)T (D x+e) = A T (Dx+e) + D T (Ax+b)
d/d x (Ax+b)T (A x+b) = 2A T (Ax+b)
o[C: symmetric]: d/d x (Ax+b)T C(A x+b) = 2A T C(Ax+b)
•d/d X(a T X T Xb) = X(ab T + ba T)
o d/d X(a T X T Xa) = 2Xaa T
•d/d X(a T X T CXb) = C T Xab T + CXba T
o d/d X(a T X T CXa) = (C + C T)Xaa T
o[C:Symmetric]d/d X(a T X T CXa) = 2CXaa T
•d/d X((Xa+b)T C(Xa+b)) = (C+C T)(Xa+b)a T
三次积
•d/d x(x T Axx T) = (A+A T)xx T+x T AxI
逆
•d/dx (Y-1) = -Y-1d/dx (Y)Y-1
迹
Note: matrix dimensions must result in an n*n argument for tr().
•d/d X(tr(X)) = I
•d/d X(tr(X k)) =k(X k-1)T
•d/d X(tr(AX k)) =SUM r=0:k-1(X r AX k-r-1)T
•d/d X(tr(AX-1B)) = -(X-1BAX-1)T
o d/d X(tr(AX-1)) =d/d X(tr(X-1A)) = -X-T A T X-T
•d/d X(tr(A T XB T)) = d/d X(tr(BX T A)) = AB
o d/d X(tr(XA T)) = d/d X(tr(A T X)) =d/d X(tr(X T A)) = d/d X(tr(AX T)) = A •d/d X(tr(AXBX T)) = A T XB T + AXB
o d/d X(tr(XAX T)) = X(A+A T)
o d/d X(tr(X T AX)) = X T(A+A T)
o d/d X(tr(AX T X)) = (A+A T)X
•d/d X(tr(AXBX)) = A T X T B T + B T X T A T
•
•[C:symmetric]d/d X(tr((X T CX)-1A) = d/d X(tr(A (X T CX)-1) =
-(CX(X T CX)-1)(A+A T)(X T CX)-1
•[B,C:symmetric]d/d X(tr((X T CX)-1(X T BX)) = d/d X(tr( (X T BX)(X T CX)-1) = -2(CX(X T CX)-1)X T BX(X T CX)-1 + 2BX(X T CX)-1
•
行列式
•d/d X(det(X)) = d/d X(det(X T)) = det(X)*X-T
o d/d X(det(AXB)) = det(AXB)*X-T
o d/d X(ln(det(AXB))) = X-T
•d/d X(det(X k)) = k*det(X k)*X-T
o d/d X(ln(det(X k))) = k X-T
•[Real] d/d X(det(X T CX)) = det(X T CX)*(C+C T)X(X T CX)-1
o[C: Real,Symmetric]d/d X(det(X T CX)) = 2det(X T CX)* CX(X T CX)-1•[C: Real,Symmetricc]d/d X(ln(det(X T CX))) = 2CX(X T CX)-1
Jacobian
如果y 是x的函数,则d y T/d x是y关于x的Jacobian 矩阵。
其行列式|d y T/d x|是表示了d y和d x的超体积比值. Jacobian行列式出现在变元积分中: Integral(f(y)d y)=Integral(f(y(x)) |d y T/d x| d x).
Hessian矩阵
如果f是x的函数,则对称矩阵d2f/d x2= d/d x T(df/d x)就是f(x)的Hessian 矩阵。
满足df/d x = 0 的x的值,当Hessian是正定、负定、不定时,就是相应的最小值、最大值、或者是鞍点。
•d2/d x2 (a T x) = 0
•d2/d x2 (Ax+b)T C(D x+e) = A T CD + D T C T A
o d2/d x2 (x T Cx) = C+C T
d2/d x2 (x T x) = 2I
o d2/d x2 (Ax+b)T (D x+e) = A T D + D T A
d2/d x2 (Ax+b)T (A x+b) = 2A T A
o[C: symmetric]: d2/d x2 (Ax+b)T C(A x+b) = 2A T CA。