基于线性投影结构的非负矩阵分解

格式：pdf
大小：4.18 MB
文档页数：17

下载文档原格式

/ 17

Python中的矩阵分解应用技巧

Python中的矩阵分解应用技巧矩阵分解是一种对矩阵进行分析和降维的有效算法。

随着大数据和机器学习的发展，矩阵分解在许多领域得到了广泛应用，例如推荐系统、图像处理、自然语言处理和社交网络分析等。

Python是一种流行的编程语言，拥有丰富的科学计算库和矩阵操作工具。

在Python环境中，进行矩阵分解可以使用各种库，例如NumPy、SciPy、Scikit-learn和TensorFlow等。

本文将探讨Python中的矩阵分解应用技巧，包括矩阵分解的概念、常用方法和实例应用。

1.矩阵分解的概念矩阵分解是一种将一个矩阵分解为多个较小矩阵的方法。

它可以用于降低矩阵的维度、简化数据结构和提取特征等。

在机器学习中，矩阵分解是一种实现数据降维的算法，它从高维数据中提取关键特征，使得数据可以更加有效地表示和处理。

矩阵分解的目标是将一个矩阵A分解为两个矩阵U和V的乘积。

其中，U是m×r的矩阵，V是r×n的矩阵，r是矩阵分解的秩。

因此，矩阵A的秩为r，且有A=UV。

在矩阵分解中，常用的方法有SVD（奇异值分解）、PCA（主成分分析）和NMF（非负矩阵分解）等。

下面将介绍这三种常用的矩阵分解方法以及它们的Python实现。

2.基于SVD的矩阵分解SVD是一种基于矩阵特征值和特征向量的分解算法。

它将一个矩阵分解为三个矩阵的乘积，即A=UΣV^T，其中U和V是正交矩阵，Σ是对角矩阵。

SVD的重要性在于它能够识别和提取矩阵的主成分，从而对矩阵进行降维和特征提取。

在Python中，使用NumPy库可以轻松地进行SVD。

例如，考虑以下代码：```import numpy as npA = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])U, S, Vt = np.linalg.svd(A)```该代码将矩阵A进行SVD分解，并返回分解后的矩阵U、S和Vt。

其中，S是矩阵A的奇异值，即矩阵Σ的对角线元素。

基于CVX和非负矩阵分解的图像融合研究

序变得简单易懂。利用非负矩阵分解算法得到的融合图像包含了源图像的整体特征，实验结
果表明，方法优于其它图像融合方法。该
关键词：图像融合；非负矩阵分解；凸线性规划；信息熵；交叉熵
０引言
图像融合是多传感器信息融合的一个重要分支，是指它
在解决最优化问题时，Ｖ规范比Ｍａａ函数更简单，ＣＸｔｂ的ｌ更紧凑，更具有可读性。也
综合两个或多个源图像的信息，分利用被融合图像包含的充
第２卷９
Ｖｏ．９１２
第２期０
Ｎｏ．０２
计算机工程与设计
ＣｏｐｔｒｇｎｅｉｇａｄＤｅｉｎｍｕｅＥｎｉｅｒｎｎｓｇ
２０年１月０８０
０ｃ．２０ｔ０８
基于ＣＸ和非负矩阵分解的图像融合研究Ｖ
ｃｎｉｓｈｔｒｔｅｎｏｍａｏｆｈｇａｉｇｓＴｅｈｏｙｆＭＦｎｎｎｇｔｅｔｘａｔｒａｏ）ｅｈｉｕｔｄｃｄｏｔｎｅｎｅａｉｆｒｔｎｔｅｒｉｌａｔｉｇｖｉｉｏｏｎｅ．ｈｔｅｒＮｉｍａｏ（ｏ —ｅａｖｒｃｉｔｎｔｎｑｅｓｎｒｕｅ，ｉｍａｉｆｏｚｉｃｉｉｏ
ｔｉｃｍｂｎｔｎｍａｅｈｒｇａｅｓｎｅｌｃｄＴｅｆｓｄｉｇｂａｎｄｂｅｈｓｏｉａｉｄｅｏｍａｙａｄｐｌｉ．ｏｔｐｒｕｈｅｕｍａｅｏｔｉｅｙｔｈＮＭＦａｇｒｔｍｏｔｉｅｌ￣ａｅｏｔｅｏｉｉａｌｏｉｈｃｎａｎｄａｌｍｒｆｈｒｇｎｌｉｇｓＥｐｒｍｅｔｈｗｓｈｔｈｔｏｒｐｓｄｐｒｏｍｓｅｔｒｈｎｏｈｒｔｏｓｍａｅ．ｘｅｉｎｏａｅｓｔｔｍｅｈｄｐｏｏｅｅｆｒｔａｔｅｈｄ．ｂｅｔｍｅＫｅｒｓｉｇｓｏ；ｎｎｎｇｔｅｍａｒｃｏｉａｉｎｙｗｏｄ：ｍａｅｆｉｎｕｏ — ｅａｉｔｉｆｔｒｚｔ；ｄｓｉｌｅｏｖｘｐｏｒｍｍｉｇｅｔｐｆｎｏｍａｉｎｃｏｓｎｒｐｖｘａｏｉｃｐｉｄｃｎｅｒｇａｎｎ；ｎｒｙｏｉｆｒｔ；ｒｓｔｙｏｏｅｏ

基于多核学习的投影非负矩阵分解算法

的实验结果表明，ＭＫＰＮＭＦ较已有的ＮＭＦ类方法具备明显的性能优势。关键词投影非负矩阵分解，核函数，多核学习
ＴＰ３９１文献标识码Ａ中图法分类号
Ｍｕｌｔｉ－ｋｅｒｎｅｌＰｒｏｊｅｃｔｉｖｅＮｏｎｎｅｇａｔｉｖｅＭａｔｒｉｘＦａｃｔｏｒｉｚａｔｉｏｎＡｌｇｏｒｉｔｈｍ
第４１卷
第２期
计
算机科学２０１４年２月
ＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ
Ｖｏ１．４１Ｎｏ．２Ｆｅｂ２０１４
基于多核学习的投影非负矩阵分解算法
李谦景丽萍。于剑
（北京交通大学计算机与信息技术学院数字出版技术国家重点实验室（筹）北京１０００４４）（北京交通大学计算机与信息技术学院北京１ＯＯＯ４４）。
摘要非负矩阵分解（ＮＭＦ）把给定的数据矩阵分解成低维的非负基矩阵和对应的系数矩阵，两者之间存在必然联系。为此，研究者将基矩阵转换为系数矩阵的投影，进一步提高分解效率。但是该方法无法处理非线性数据，核函数
的引入部分解决了此问题，却同时导致核函数参数选择的问题。基于多核学习理论，提出了一种多核学习的投影非负矩阵分解（ＭＫＰＮＭＦ）算法，该算法有效地避免了核函数参数选择的问题，同时提高了学习性能。在实际人脸数据上

基于非负矩阵分解的产品结构相似性判断及其应用

证,结果表明,该方法比目前的相似性判断方法更高效.
关键词:产品结构;非负矩阵分解;相似性;欧氏距离
中图分类号:
TP１４;TH１２８
DOI:
１０．
３９６９/
．
s
sn．
１００４

１３２X．
２０１６．
０８．
０１４
ji
S
imi
l
a
r
i
t
to
fPr
odu
c
tS
t
r
u
c
t
u
r
eBa
s
e
donNon

ne
t
i
v
eMa
(客户定制的产品结
构)
Tg,以及查询产品结构(企业产品库中的产品
()
实例或者模型)
Tqi (
i＝１,
２,,
n),分别构建邻接
从 m２维的空间映射到r 维空间中(
m２＜r),
S的
第i 列就是它在r 维空间中的向量坐标.
Ke
r
d
s:p
r
oduc
ts
t
ruc
t
u
r
e;
non
nega
t
i
vema
t
r
i
xf
a
c
t
o
r
i
z
a
t
i
on;
s
imi
l
a
r
i
t
Euc
l
i
de
and
i
s
t

非负矩阵分解算法综述

L
E U W#iHij . i= 1 此外, BNMF 常被有盲信号分离背景的学者解释为
含噪声项的产生式模型: V= WH+ E[10] , E 是 M @N 的噪声矩阵. 不同的 BNMF 算法也常可被解释为遵循了不同的 E分布假设下的最大似然算法.
根据需要, 可给上述模型中的 W和 H 施加更多的限制, 构成 INMF.
2 NMF 简介
定义对一个 M 维的随机向量 v 进行了 N 次的观测, 记这些观测为 vj , j = 1, 2, , , N , 取 V= [ V#1, V#2, , , V#N ] , 其中 V#j = vj, j = 1, 2, , , N, BNMF 要求发现非负的 M @L 的基矩阵 W= [ W#1, W#2, , , W#N ] 和 L @N 的系数矩阵 H = [ H#1, H#2, , , H#N ] , 使 V U WH[1] , 这也可以用向量标量积的形式更为直观地表示为 V#j
Ke y words: non2negative matrix factorization; multivariate data representation; feature extraction
1 引言
在信号处理、神经网络、模式识别、计算机视觉和图象工程的研究中, 如何构造一个能使多维观测数据被更好描述的变换方法始终是一个非常重要的问题. 通常, 一个好的变换方法应具备两个基本的特性: ( 1) 可使数据的某种潜在结构变得清晰; ( 2) 能使数据的维数得到一定程度的约减.
主分量分析、线性鉴别分析、投影寻踪、因子分析、
冗余归约和独立分量分析是一些最常用的变换方法. 它们因被施加的限制不同而有着本质的区别, 然而, 它们有两个共同的特点: ( 1) 允许负的分解量存在 ( 允许有减性的描述) ; ( 2) 实现线性的维数约减. 区别于它们, 一种新的变换方法 ) ) ) 非负矩阵分解( Nonnegative Matrix Factor, NMF) [1]由 Lee 和 Seung 在5Nature6 上提出, 它使分解后的所有分量均为非负值(要求纯加性的描述) , 并且同时实现非线性的维数约减. NMF 的心理学和生理学构造依据是对整体的感知由对组成整体的部分的感知构成的( 纯加性的 ) [2~ 6], 这也符合直观的理解: 整体是由部分组成的[1], 因此它在某种意义上抓住了智能数据描述的本质. 此外, 这种非负性的限制导致了相应描述在一定程度上的稀疏性[1], 稀疏性的表述已被证明是介于完全分布式的描述和单一活跃分量的描述 3 间的一

非负矩阵分解课件

Daniel D. Lee和H. Sebastian Seung 于1999年提出了非负矩阵分解算法（Algorithms for Non-negative Matrix Factorization, NMF），它是矩阵分解最基本的方法之一。
基本思想
r min(n, m)
V WH？ Yes
H a
Ha
(W TV )a (W TWH )a
Wia
Wia
(VH T )ia (WHH T )ia
定理 2 K-L散度D(V||WH)在如下的更新规则下非增
WiaVi / (WH )i
Ha Ha i
Wka
k
HaVi / (WH )i
Wia Wia
Wav
v
G(h, ht )
G(h, ht )min G(h, ht+1)
化简，得
dG(h, ht ) dha
i
vi
Wia hat Wib hbt
1 ha
i
Wia 0
b
ht 1 a
hat Wkb i

vi Wib hbt
Wia
b
b
转换W和H的角色，同理可得W的更新规则。
相关工作
NMF经过十多年的发展，已经成为了一个相对成熟的数据分析手段。其之所以得到研究人员的青睐，主要归功于其分解结果有较为明确的物理意义。
Algorithms for Non-negative Matrix Factorization 精读报告
Thank You!
不足之处，还请批评指正！
得到分解
No
因子
以乘法规则更新W（或H）
代价函数
使用某些测度方法来量化相似结果的质量

非负矩阵分解聚类

非负矩阵分解聚类摘要：一、非负矩阵分解聚类原理1.非负矩阵分解2.聚类方法3.非负矩阵分解聚类二、非负矩阵分解聚类应用优势1.数据降维2.图像处理3.生物信息学4.社交网络分析三、非负矩阵分解聚类局限性1.计算复杂度2.数据噪声敏感3.模型参数选择四、非负矩阵分解聚类未来发展趋势1.高维数据分析2.大规模数据处理3.结合深度学习方法正文：非负矩阵分解聚类（Non-negative Matrix Factorization Clustering,NMF-C）是一种将数据集分解成若干个非负矩阵的方法。

非负矩阵分解（Non-negative Matrix Factorization, NMF）是一种将一个非负矩阵分解成两个非负矩阵的乘积的方法，这两个矩阵分别表示数据的潜在结构和元素之间的关系。

聚类方法则是将数据集中的相似度较高的元素划分到同一个子集中。

非负矩阵分解聚类结合了这两种方法，可以将数据集中的相似度较高的元素划分到同一个子集中。

非负矩阵分解聚类在数据降维、图像处理、生物信息学和社交网络分析等领域具有广泛应用。

数据降维是非负矩阵分解聚类的常见应用之一，通过将高维数据映射到低维空间，可以减少数据规模，提高数据处理效率。

在图像处理领域，非负矩阵分解聚类可以用于图像分割和特征提取，提高图像识别的准确性。

在生物信息学领域，非负矩阵分解聚类可以用于基因表达数据的降维和聚类分析，发现具有相似功能的基因。

在社交网络分析领域，非负矩阵分解聚类可以用于社区发现，识别社交网络中的兴趣群体。

然而，非负矩阵分解聚类也存在一些局限性。

首先，非负矩阵分解聚类的计算复杂度较高，尤其是当数据规模较大时，计算时间会显著增加。

其次，非负矩阵分解聚类对数据噪声敏感，当数据中存在异常值或缺失值时，聚类结果可能受到影响。

此外，非负矩阵分解聚类中的模型参数选择也是一个挑战，不同的参数选择可能导致不同的聚类结果。

非负矩阵分解在图像分析中的应用

量)中包含大部分为0的系数，因此基图像矩阵牙和编码图像矩阵H是稀疏的(sParse)。

基图像的稀疏是因为它是非整体的而且包含多个版本的嘴、鼻子和其它面部元件，在这里各种版本的嘴、鼻子和其它面部元件是在不同的位置和处于不同的形式。

整张脸的多样性就是通过组合这些不同的部件所生成的。

尽管所有的部件至少被一张脸使用，但对于给定的脸并不一定同时使用所有的可用的部件。

这就导致了一个稀疏地分散的图像编码，与v Q的一元编码和P C A的全部分散的编码形成鲜明的对比。

N M F口」二叫叫l111l ll口L」乞_」卜尸叫叫卜一卜扁洲洲...l l习「二]]]l‘蓄日.l ll.l ll...「「]]]至习}}州州I11卜州卜了--.!!!...l一~门门一门门r一，「一几几鱼鱼匕列列「「」.!!!「翌r~~~~呈呈_」月匡匡{{{李一{{{江习l二月一一l r一-，厂气飞一1一T丁一疡一}}牲大1__里f户_」~__l l..!!里哩到「「工二)))钾一:片.r l‘r r一1:阅一宁一卞一二，二，户l l，、百..11.气馨。

书一各.本.4本4一一··1一f+于+卡一··上址全士上上福福~备牛4半4--p C A辍蟒矍黔鬓辍卜卜玺玺铆铆~呀，.曰卜，44r尹石畏‘‘‘气丁习巨蒸蒸俘砚勺勺爵自自酬酬爵圃令令麒圃麒麒肠肠翻嚷寥娜娜氢氢翩翩{密令润瞬绝翻眯眯之麟爵观胰爵广截截彝啊!!!版{{{嗽叫解解遗、髯摹!!!瓮髯酬111·惑一履图2.1N M F、V Q、P C A对人脸的表示N M F是对人脸的的基于部分的表达，而V Q和P C A是对人脸的基于整体的表达。

这三种分析方法都被应用到一个m=2429的人脸图像数据库中，每个图像由n=19xl9像素组成，最终形成一个n x m矩阵V。

这三种方法都是设法找到一种V的近似分解V二不朽叮，但是牙和H规定不同的约束条件。

非负矩阵分解（NMF）原理及算法实现

⾮负矩阵分解（NMF）原理及算法实现⼀、矩阵分解回想矩阵分解是指将⼀个矩阵分解成两个或者多个矩阵的乘积。

对于上述的⽤户-商品（评分矩阵），记为能够将其分解为两个或者多个矩阵的乘积，如果分解成两个矩阵和。

我们要使得矩阵和的乘积能够还原原始的矩阵当中，矩阵表⽰的是m个⽤户于k个主题之间的关系，⽽矩阵表⽰的是k个主题与n个商品之间的关系通常在⽤户对商品进⾏打分的过程中，打分是⾮负的，这就要求：这便是⾮负矩阵分解（NMF）的来源。

⼆、⾮负矩阵分解2.1、⾮负矩阵分解的形式化定义上⾯介绍了⾮负矩阵分解的基本含义。

简单来讲，⾮负矩阵分解是在矩阵分解的基础上对分解完毕的矩阵加上⾮负的限制条件。

即对于⽤户-商品矩阵找到两个矩阵和，使得：同⼀时候要求：2.2、损失函数为了能够定量的⽐较矩阵和的近似程度，提出了两种损失函数的定义⽅式：欧⼏⾥得距离：KL散度：在KL散度的定义中，。

当且仅当时取得等号。

当定义好损失函数后，须要求解的问题就变成了例如以下的形式，相应于不同的损失函数：求解例如以下的最⼩化问题：2.3、优化问题的求解乘法更新规则，详细操作例如以下：对于欧⼏⾥得距离的损失函数：对于KL散度的损失函数：上述的乘法规则主要是为了在计算的过程中保证⾮负，⽽基于梯度下降的⽅法中，加减运算⽆法保证⾮负。

事实上上述的惩罚更新规则与梯度下降的算法是等价的。

以下以平⽅距离为损失函数说明上述过程的等价性：平⽅损失函数能够写成：使⽤损失函数对求偏导数：依照梯度下降法的思路：即为：令，即能够得到上述的乘法更新规则的形式。

2.4、⾮负矩阵分解的实现1from numpy import *2from pylab import *3from numpy import *45def load_data(file_path):6 f = open(file_path)7 V = []8for line in f.readlines():9 lines = line.strip().split("\t")10 data = []11for x in lines:12 data.append(float(x))13 V.append(data)14return mat(V)1516def train(V, r, k, e):17 m, n = shape(V)18#先随机给定⼀个W、H，保证矩阵的⼤⼩19 W = mat(random.random((m, r)))20 H = mat(random.random((r, n)))21#K为迭代次数22for x in range(k):23#error24 V_pre = W * H25 E = V - V_pre26#print E27 err = 0.028for i in range(m):29for j in range(n):30 err += E[i,j] * E[i,j]31print(err)32 data.append(err)3334if err < e:35break36#权值更新37 a = W.T * V38 b = W.T * W * H39#c = V * H.T40#d = W * H * H.T41for i_1 in range(r):42for j_1 in range(n):43if b[i_1,j_1] != 0:44 H[i_1,j_1] = H[i_1,j_1] * a[i_1,j_1] / b[i_1,j_1]4546 c = V * H.T47 d = W * H * H.T48for i_2 in range(m):49for j_2 in range(r):50if d[i_2, j_2] != 0:51 W[i_2,j_2] = W[i_2,j_2] * c[i_2,j_2] / d[i_2, j_2]5253return W,H,data5455565758if__name__ == "__main__":59#file_path = "./data_nmf"60# file_path = "./data1"61 data = []62# V = load_data(file_path)63 V=[[5,3,2,1],[4,2,2,1,],[1,1,2,5],[1,2,2,4],[2,1,5,4]]64 W, H ,error= train(V, 2, 100, 1e-5 )65print (V)66print (W)67print (H)68print (W * H)69 n = len(error)70 x = range(n)71 plot(x, error, color='r', linewidth=3)72 plt.title('Convergence curve')73 plt.xlabel('generation')74 plt.ylabel('loss')75 show()这⾥需要注意训练时r值的选择：r可以表⽰和主题数或者你想要的到的特征数K值的选择：k表⽰训练的次数，设置的越⼤模型的拟合效果越好，但是具体设置多少，要根据性价⽐看，看误差曲线的变化。

非负矩阵分解用于实现语音分离

非负矩阵分解用于实现语音分离随着科技的不断发展，人们对于语音分离的需求也越来越大。

语音分离可以将混合在一起的多个人说话的语音信号分离出来，使得每个人的语音信号可以被单独处理和识别。

这在语音识别、音频编辑等领域具有广泛的应用前景。

非负矩阵分解作为一种有效的语音分离方法，被越来越多地研究和应用。

非负矩阵分解的原理非负矩阵分解是一种基于线性代数的数学方法。

它的核心原理是将一个矩阵分解为两个非负矩阵的乘积，即：A ≈ WH其中，A是一个m×n的非负矩阵，W和H是两个非负矩阵，分别表示矩阵A的行和列的非负系数。

在语音分离中，A通常表示混合在一起的多个人说话的语音信号，W表示每个人说话的语音信号的特征矩阵，H表示混合在一起的语音信号在每个人的特征矩阵中的系数。

非负矩阵分解的优势非负矩阵分解在语音分离领域中有着很多的优势。

首先，非负矩阵分解可以提取语音信号的高维结构特征，实现语音信号的有效分离。

其次，非负矩阵分解具有较好的鲁棒性和可靠性，能够在一定程度上处理语音信号中的噪声和干扰。

最后，非负矩阵分解算法的计算速度较快，对于大规模的语音数据分析也具有一定的优势。

非负矩阵分解的应用非负矩阵分解在语音分离领域中的应用已经被广泛研究和应用。

例如，在语音识别领域中，针对多个人说话的情况，非负矩阵分解可以实现多个人语音信号的分离和单独处理，从而提高语音识别的准确率和效率。

在音频编辑领域中，非负矩阵分解可以实现音频信号的去噪和降低噪音的影响，使得音频剪辑和混音更加准确和自然。

非负矩阵分解算法的改进尽管非负矩阵分解在语音分离领域中有着广泛的应用和优势，但是它也面临着复杂性和精度等方面的挑战。

一方面，非负矩阵分解的计算复杂度较高，需要耗费大量的计算资源和时间。

另一方面，非负矩阵分解的精度也仍然存在一定的缺陷，需要进一步提高。

因此，目前的研究重点在于对非负矩阵分解算法的改进和优化。

例如，研究人员可以通过引入先验知识、加入正则化项或者采用深度学习等方法，提高非负矩阵分解算法的准确性和效率，从而进一步发挥其在语音分离领域中的应用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

收稿日期 2008-09-17 录用日期 2009-05-06 Manuscript received September 17, 2008; in revised form May 6, 2009 国家自然科学基金 (60872084) 资助 Supported by National Natural Science Foundation of China (60872084) 1. 清华大学清华信息科学与技术国家实验室北京 100084 2. 清华大学电子工程系北京 100084 3. 中国电子信息产业发展研究院北京 100048 1. Tsinghua National Laboratory for Information Science and Technology, Tsinghua University, Beijing 100084 2. Department of Electronic Engineering, Tsinghua University, Beijing 100084 3. China Center for Information Industry Development, Beijing 100048
内容版权归作者所有
更多技术文章，论文请登录
24
自
动
化
学
报
36 卷
德距离平方的局部凸特性, 构造了以 “先求得无非负约束下的解析解 (定点算法的特点), 再通过做非线性投影满足非负性要求” 的方式完成交替优化的算法[7] , 此算法速度较快但可能发生震荡. 陈卫刚等构造了用可行方向法和模拟退火法结合来交替优化欧几里德距离平方的算法[9] , 它 (理论) 复杂度较高, 因为可行方向法中的一维搜索步骤以及模拟退火法都比较耗时. Li 等构造了利用抛物线原理交替优化欧几里德距离平方的单调定点算法, 此算法中的每次操作都使此刻对应优化问题的目标函数仅由这一次操作达到最小值, 因此效率远远超过其他算法[10] . 以上的 NMF 算法均是基于单一目标函数构造的, 还有另一类 NMF 算法, 它们是基于一组目标函数 (目标函数族) 构造的, 这包括 Compass 基于 β 散度的算法[11] 、 Cichocki 和 Zdunek 等基于 α 散度 [12−13] 的算法以及 Dhillon 等基于 Bregman 散度和对偶 Bregman 散度的算法[14] . 这类算法的共同特点是: 依目标函数族中的参数或自由设定函数的不同, 它们与一系列潜在产生式模型 (对应不同的概率分布假设) 下的似然函数一一对应, 因此它们的适用范围更广 (特别是对于盲分离问题[12] ), 但与此同时, 这些参数和自由设定函数的选择也对使用者提出了较高的要求. 有关上述算法的更细致研究评述以及 NMF 算法研究的其他成果可参见综述文章《非负矩阵分解 [15] 算法综述》 . 目前, NMF 已应用到文本分析[1] 与聚类[16] 、数字水印[17−18] 、人脸检测[19] 与识别[20] 、图像检索[21−22] 、图像复原[23] 、语言建模[24−25] 、声源分类[26] 、音乐信号分析[27] 与乐器识别[28] 、盲信号分离[12] 、网络安全[29] 、基因及细胞分析[30−31] 等方面的研究中. NMF 定义中采用的数学模型基于非线性投影结构构造, 这决定了 NMF 降维需借助计算量较大的迭代操作来实现, 因此, 其处理高维数据 (常见于计算机视觉、图像工程和机器学习等研究中) 时常遇到效率瓶颈. 此外, 由此模型提取的 NMF 特征常不稀疏, 这与 NMF 的设计期望 (提取稀疏和局部化的特征[1] ) 相差甚远. 目前的研究结果显示, NMF 还只是一个数据依赖的稀疏特征提取方法, 这限制了其应用范围, 增加了应用难度. 为一并解决以上两个问题, 本文提出了一个新的模型 — 基于线性投影结构的 NMF (Linear projection-based NMF, LPBNMF), 构造了一个单调的 LPBNMF 算法. 从数学的角度看, LPBNMF 是实现 NMF 的一种特殊方式. 本文以下各节安排为: 第 1 节介绍 NMF, 结合示例指出其存在的问题; 第 2 节定义 LPBNMF,
意义上抓住了智能化数据描述的本质. Lee 和 Seung 提出 NMF 时, 在泊松产生模型的假设下用最大似然估计的思路构造了第一个 NMF 算法[1] . 随后, Lee 和 Seung 采用类似于 EM (Expectation maximization) 算法中使用的优化策略对广义 Kullback-Leibler 散度和欧几里德距离的平方 (它们用来度量被处理数据和 NMF 结果间的差异, 本文后面提到的被优化函数也均作此用) 分别做交替优化得到了两个迄今最为经典和使用最广的单调算法[5] . Wild 等考虑了利用球面 K 均值聚类作为上述基于欧几里德距离平方算法的初始化步骤, 这样做的好处是能使算法效率有所提高, 但这以收敛到相对不好的局部解为代价[6] . Cichocki 等构造了利用指数梯度下降原则交替优化对偶的广义 Kullback-Leibler 散度的算法[7] . Heiler 等考虑了欧几里德距离平方的展开形式, 把对 NMF 的优化求解归结为一组交替进行的经典凸二次规划问题, 构造了单调下降的算法[8] . Cichocki 等利用了欧几里
非负矩阵分解 (Non-negative matrix factorization, NMF)[1] 由 Lee 和 Seung 于 1999 年在 Nature 上提出, 它使分解后的所有分量均为非负值 (寻求纯加性的描述). NMF 的心理学和生理学构造依据是对整体的感知由对组成整体的部分的感知构成 (感知是纯加性的生理机能)[2−4] , 这也符合直观的理解: 整体是由部分组成的[1] , 因此它在某种
分析 LPBNMF 的性质; 第 3 节构造 LPBNMF 算法, 证明此算法的稳定性和收敛性; 第 4 节分析 LPBNMF 的一个相关 (相关指两方法同以线性变换实现降维) 方法 — 投影非负矩阵分解 (Projective NMF, P-NMF), 分析 LPBNMF 与 P-NMF 在构造目的、模型、算法以及算法特性上的本质区别, 指出 LPBNMF 相比 P-NMF 的优越性; 第 5 节用大量的比较实验验证 LPBNMF 比 NMF 降维效率高且特征稀疏, 揭示基于 LPBNMF 的方法较常用方法更适于解决有遮挡人脸识别问题; 第 6 节总结全文.
DOIBiblioteka 非负矩阵分解, 基于线性投影结构的非负矩阵分解, 特征提取, 数据描述, 降维效率, 稀疏特征, 有遮挡人脸识别
10.3724/SP.J.1004.2010.00023
Linear Projection-based Non-negative Matrix Factorization
LI Le1, 2, 3 ZHANG Yu-Jin1, 2 Abstract Non-negative matrix factorization (NMF) is a newly popular method for non-negative dimensionality reduction, feature extraction, data mining, etc. The mathematical model in NMF deﬁnition is based on nonlinear projection, therefore dimension reduction by NMF is implemented by iterative updates which lead to high computational load. Additionally, NMF features extracted by this model are usually not very sparse, and this fails to meet the expectation of designing NMF. To simultaneously resolve the above two problems, this paper proposes a new model, linear projectionbased NMF (LPBNMF), and designs an monotonic algorithm for it. From mathematical point of view, LPBNMF is a special mode for implementing NMF, which linearly implements dimension reduction. The high sparseness of LPBNMF features is assured by the inherent characteristics of its mathematic model. The comparison experiments validate that dimension reduction by LPBNMF is much more eﬃcient than that by NMF, and that LPBNMF features are much more sparse and localized than NMF ones. Finally, experiments based on AR face database indicate that LPBNMF features are more suitable for nearest neighbor classiﬁcation-based occluded face recognition than NMF, LDA, and PCA ones. Key words Non-negative matrix factorization (NMF), linear projection-based NMF (LPBNMF), feature extraction, data representation, eﬃciency of dimensionality reduction, sparse feature, occluded face recognition