=
1
exp
2 2
1
− 2
2
−
2
由精度参数化(Parametrized by precision):
; , −1
=
exp
2
1
−
2
−
2
高斯分布
多元高斯分布
由协方差矩阵参数化(Parametrized by covariance
matrix):
1
exp
(2) det(σ)
摩尔-彭若斯广义逆
+
=
• 方程组解的情况包括:
― 仅有一个解:此时摩尔-彭若斯广义逆矩阵与逆矩阵相
同
― 无解:此时会给出解的最小误差 −
― 多个解:此时会给出范数最小的解
2
迹(Trace)
= ,
矩阵的迹的性质:
+ = +
自信息:
= −log ()
信息熵:
H = ~
= ~ log ()
KL散度:
∥ = ~
= ~ − ()
KL散度是不对称的
∗ = ∥
∗ = ∥
1979 – deep neocognitron, convolution, Fukushima
1987 – autoencoder, Ballard
1989 – convolutional neural networks (CNN), Lecun
1991 – deep recurrent neural networks (RNN), Schmidhuber