基于线性投影结构的非负矩阵分解

格式：pdf
大小：4.15 MB
文档页数：17

下载文档原格式

/ 17

非负矩阵分解算法

非负矩阵分解算法
1 非负矩阵分解
非负矩阵分解（Non-Negative Matrix Factorization，NMF）是
一种特殊的矩阵分解，它采用的分解维度包含非负的值。

NMF的定义是这样的：给定一个m阶n列非负矩阵A，有k非负数，将其分解成两个
m阶n列非负矩阵W和H，使得：A = WH.NMF可以应用于许多不同领域，包括信号处理、数据挖掘、图像处理、信息检索、自然语言处理等领域。

2 优点
非负矩阵分解具有许多优点：首先，非负矩阵分解有着很明显的
几何解释，可以用于多维数据挖掘，聚类和可视化。

其次，它的算法
本身不需要依赖于边界条件和/或初始条件，算法具有高度稳定性，用
于提取潜在信息特征，例如隐藏结构、主题、技能、现象等。

此外，
非负矩阵分解可以用较少的计算消耗从较大的数据集中提取有用的特征，从而降低空间需求并提高运行效率。

3 应用
非负矩阵分解的应用较广泛，在数据挖掘领域可用于高维数据降维、高维数据可视化、文本挖掘、模式挖掘以及聚集分析等方面。

在
信号处理方面，NMF可以用来提取信号中的有效信息，从而获得必要信息。

此外，NMF也可以用于表示图像并对其进行分类。

在自然语言处
理（Natural Language Processing）领域，NMF可以把文本表示成主题，以帮助文本分类、信息检索和在线推荐等任务。

4 结论
可以看出，非负矩阵分解在数据挖掘和信号处理等多领域具有重要的应用价值，特别是其几何解释、算法稳定性以及计算代价等众多优势的共同作用。

然而，NMF的应用还有待更多的研究，才能令它登上数据挖掘技术的高峰，为社会带来更多的发展。

基于多核学习的投影非负矩阵分解算法

的实验结果表明，ＭＫＰＮＭＦ较已有的ＮＭＦ类方法具备明显的性能优势。关键词投影非负矩阵分解，核函数，多核学习
ＴＰ３９１文献标识码Ａ中图法分类号
Ｍｕｌｔｉ－ｋｅｒｎｅｌＰｒｏｊｅｃｔｉｖｅＮｏｎｎｅｇａｔｉｖｅＭａｔｒｉｘＦａｃｔｏｒｉｚａｔｉｏｎＡｌｇｏｒｉｔｈｍ
第４１卷
第２期
计
算机科学２０１４年２月
ＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ
Ｖｏ１．４１Ｎｏ．２Ｆｅｂ２０１４
基于多核学习的投影非负矩阵分解算法
李谦景丽萍。于剑
（北京交通大学计算机与信息技术学院数字出版技术国家重点实验室（筹）北京１０００４４）（北京交通大学计算机与信息技术学院北京１ＯＯＯ４４）。
摘要非负矩阵分解（ＮＭＦ）把给定的数据矩阵分解成低维的非负基矩阵和对应的系数矩阵，两者之间存在必然联系。为此，研究者将基矩阵转换为系数矩阵的投影，进一步提高分解效率。但是该方法无法处理非线性数据，核函数
的引入部分解决了此问题，却同时导致核函数参数选择的问题。基于多核学习理论，提出了一种多核学习的投影非负矩阵分解（ＭＫＰＮＭＦ）算法，该算法有效地避免了核函数参数选择的问题，同时提高了学习性能。在实际人脸数据上

采用改进投影梯度非负矩阵分解和非采样Contourlet变换的图像融合方法

采用改进投影梯度非负矩阵分解和非采样Ｃｎｏｒｅ变换的图像融合方法ｏｔｕｌｔ
杨粤涛，明，朱贺柏根，文。高
（．１中国科学院长春光学精密机械与物理研究所，吉林长春１０３；３０３２中国科学院研究生院，．北京１０３）００９
ｔｏｉｅｃｍｐｅｉｉｎｔｏｌｘｔｍｙ，ａｍａｅｆｓｏｌｏｉｈｂｏｉｇｔｅＩｐｏｅｎｉｇｕｉｎａｇｒｔｍｙｃｍｂｎｈｍｒｖｄＰＧＮＭＦ（ＰＩＧＮＭＦ）ａｄｎＮｏｓｂａｌｄＣｏｔｕｌｔＴｒｎｆｒ（ＣＴ）ｉｐｏｏｅｎｔｉａｅ．Ｆｒｔｙｈｅｉｔｒｄｏｉ — ｎｕｓｍｐｅｎｏｒｅａｓｏｍＮＳｓｒｐｓｄｉｈｓｐｐｒｉｓｌ，ｔｅｒｇｓｅｅｒｇ
第１９卷
第５期
光学精密工程
ＯｐｉｓａｄＰｅｉｉｎＥｎｉｅｒｎｔｎｒｃｓｏｇｎｅｉｇｃ
Ｖｏ＿９Ｎｏ５ｌ１．
Ｍａ０１ｖ２１
２１０１年５月
文章编号
１０ — ２Ｘ（０１０ — １３００４９４２１）５１４ —８
７、．０、．２和２７９、．０、．４。０９１３１Ｏ１．６２２３１０９
关键词：图像融合；负矩阵分解；影梯度；采样Ｃｎｏｒｔ非投非ｏｔｕｌ变换ｅ中图分类号：Ｐ９．Ｔ３１４文献标识码：Ａｄｉ１．７８ＯＥ２１１０．４ｏ：０３８／Ｐ．０１９ｉｒｖｄｐｏｔｄｕｉｎａｇｒｔｂｓｄｏｍｐｏｅｒｊｃｅｈｅ

非负矩阵分解算法综述

L
E U W#iHij . i= 1 此外, BNMF 常被有盲信号分离背景的学者解释为
含噪声项的产生式模型: V= WH+ E[10] , E 是 M @N 的噪声矩阵. 不同的 BNMF 算法也常可被解释为遵循了不同的 E分布假设下的最大似然算法.
根据需要, 可给上述模型中的 W和 H 施加更多的限制, 构成 INMF.
2 NMF 简介
定义对一个 M 维的随机向量 v 进行了 N 次的观测, 记这些观测为 vj , j = 1, 2, , , N , 取 V= [ V#1, V#2, , , V#N ] , 其中 V#j = vj, j = 1, 2, , , N, BNMF 要求发现非负的 M @L 的基矩阵 W= [ W#1, W#2, , , W#N ] 和 L @N 的系数矩阵 H = [ H#1, H#2, , , H#N ] , 使 V U WH[1] , 这也可以用向量标量积的形式更为直观地表示为 V#j
Ke y words: non2negative matrix factorization; multivariate data representation; feature extraction
1 引言
在信号处理、神经网络、模式识别、计算机视觉和图象工程的研究中, 如何构造一个能使多维观测数据被更好描述的变换方法始终是一个非常重要的问题. 通常, 一个好的变换方法应具备两个基本的特性: ( 1) 可使数据的某种潜在结构变得清晰; ( 2) 能使数据的维数得到一定程度的约减.
主分量分析、线性鉴别分析、投影寻踪、因子分析、
冗余归约和独立分量分析是一些最常用的变换方法. 它们因被施加的限制不同而有着本质的区别, 然而, 它们有两个共同的特点: ( 1) 允许负的分解量存在 ( 允许有减性的描述) ; ( 2) 实现线性的维数约减. 区别于它们, 一种新的变换方法 ) ) ) 非负矩阵分解( Nonnegative Matrix Factor, NMF) [1]由 Lee 和 Seung 在5Nature6 上提出, 它使分解后的所有分量均为非负值(要求纯加性的描述) , 并且同时实现非线性的维数约减. NMF 的心理学和生理学构造依据是对整体的感知由对组成整体的部分的感知构成的( 纯加性的 ) [2~ 6], 这也符合直观的理解: 整体是由部分组成的[1], 因此它在某种意义上抓住了智能数据描述的本质. 此外, 这种非负性的限制导致了相应描述在一定程度上的稀疏性[1], 稀疏性的表述已被证明是介于完全分布式的描述和单一活跃分量的描述 3 间的一

非负矩阵分解课件

Daniel D. Lee和H. Sebastian Seung 于1999年提出了非负矩阵分解算法（Algorithms for Non-negative Matrix Factorization, NMF），它是矩阵分解最基本的方法之一。
基本思想
r min(n, m)
V WH？ Yes
H a
Ha
(W TV )a (W TWH )a
Wia
Wia
(VH T )ia (WHH T )ia
定理 2 K-L散度D(V||WH)在如下的更新规则下非增
WiaVi / (WH )i
Ha Ha i
Wka
k
HaVi / (WH )i
Wia Wia
Wav
v
G(h, ht )
G(h, ht )min G(h, ht+1)
化简，得
dG(h, ht ) dha
i
vi
Wia hat Wib hbt
1 ha
i
Wia 0
b
ht 1 a
hat Wkb i

vi Wib hbt
Wia
b
b
转换W和H的角色，同理可得W的更新规则。
相关工作
NMF经过十多年的发展，已经成为了一个相对成熟的数据分析手段。其之所以得到研究人员的青睐，主要归功于其分解结果有较为明确的物理意义。
Algorithms for Non-negative Matrix Factorization 精读报告
Thank You!
不足之处，还请批评指正！
得到分解
No
因子
以乘法规则更新W（或H）
代价函数
使用某些测度方法来量化相似结果的质量

非负矩阵分解在图像分析中的应用

量)中包含大部分为0的系数，因此基图像矩阵牙和编码图像矩阵H是稀疏的(sParse)。

基图像的稀疏是因为它是非整体的而且包含多个版本的嘴、鼻子和其它面部元件，在这里各种版本的嘴、鼻子和其它面部元件是在不同的位置和处于不同的形式。

整张脸的多样性就是通过组合这些不同的部件所生成的。

尽管所有的部件至少被一张脸使用，但对于给定的脸并不一定同时使用所有的可用的部件。

这就导致了一个稀疏地分散的图像编码，与v Q的一元编码和P C A的全部分散的编码形成鲜明的对比。

N M F口」二叫叫l111l ll口L」乞_」卜尸叫叫卜一卜扁洲洲...l l习「二]]]l‘蓄日.l ll.l ll...「「]]]至习}}州州I11卜州卜了--.!!!...l一~门门一门门r一，「一几几鱼鱼匕列列「「」.!!!「翌r~~~~呈呈_」月匡匡{{{李一{{{江习l二月一一l r一-，厂气飞一1一T丁一疡一}}牲大1__里f户_」~__l l..!!里哩到「「工二)))钾一:片.r l‘r r一1:阅一宁一卞一二，二，户l l，、百..11.气馨。

书一各.本.4本4一一··1一f+于+卡一··上址全士上上福福~备牛4半4--p C A辍蟒矍黔鬓辍卜卜玺玺铆铆~呀，.曰卜，44r尹石畏‘‘‘气丁习巨蒸蒸俘砚勺勺爵自自酬酬爵圃令令麒圃麒麒肠肠翻嚷寥娜娜氢氢翩翩{密令润瞬绝翻眯眯之麟爵观胰爵广截截彝啊!!!版{{{嗽叫解解遗、髯摹!!!瓮髯酬111·惑一履图2.1N M F、V Q、P C A对人脸的表示N M F是对人脸的的基于部分的表达，而V Q和P C A是对人脸的基于整体的表达。

这三种分析方法都被应用到一个m=2429的人脸图像数据库中，每个图像由n=19xl9像素组成，最终形成一个n x m矩阵V。

这三种方法都是设法找到一种V的近似分解V二不朽叮，但是牙和H规定不同的约束条件。

非负矩阵分解（NMF）原理及算法实现

⾮负矩阵分解（NMF）原理及算法实现⼀、矩阵分解回想矩阵分解是指将⼀个矩阵分解成两个或者多个矩阵的乘积。

对于上述的⽤户-商品（评分矩阵），记为能够将其分解为两个或者多个矩阵的乘积，如果分解成两个矩阵和。

我们要使得矩阵和的乘积能够还原原始的矩阵当中，矩阵表⽰的是m个⽤户于k个主题之间的关系，⽽矩阵表⽰的是k个主题与n个商品之间的关系通常在⽤户对商品进⾏打分的过程中，打分是⾮负的，这就要求：这便是⾮负矩阵分解（NMF）的来源。

⼆、⾮负矩阵分解2.1、⾮负矩阵分解的形式化定义上⾯介绍了⾮负矩阵分解的基本含义。

简单来讲，⾮负矩阵分解是在矩阵分解的基础上对分解完毕的矩阵加上⾮负的限制条件。

即对于⽤户-商品矩阵找到两个矩阵和，使得：同⼀时候要求：2.2、损失函数为了能够定量的⽐较矩阵和的近似程度，提出了两种损失函数的定义⽅式：欧⼏⾥得距离：KL散度：在KL散度的定义中，。

当且仅当时取得等号。

当定义好损失函数后，须要求解的问题就变成了例如以下的形式，相应于不同的损失函数：求解例如以下的最⼩化问题：2.3、优化问题的求解乘法更新规则，详细操作例如以下：对于欧⼏⾥得距离的损失函数：对于KL散度的损失函数：上述的乘法规则主要是为了在计算的过程中保证⾮负，⽽基于梯度下降的⽅法中，加减运算⽆法保证⾮负。

事实上上述的惩罚更新规则与梯度下降的算法是等价的。

以下以平⽅距离为损失函数说明上述过程的等价性：平⽅损失函数能够写成：使⽤损失函数对求偏导数：依照梯度下降法的思路：即为：令，即能够得到上述的乘法更新规则的形式。

2.4、⾮负矩阵分解的实现1from numpy import *2from pylab import *3from numpy import *45def load_data(file_path):6 f = open(file_path)7 V = []8for line in f.readlines():9 lines = line.strip().split("\t")10 data = []11for x in lines:12 data.append(float(x))13 V.append(data)14return mat(V)1516def train(V, r, k, e):17 m, n = shape(V)18#先随机给定⼀个W、H，保证矩阵的⼤⼩19 W = mat(random.random((m, r)))20 H = mat(random.random((r, n)))21#K为迭代次数22for x in range(k):23#error24 V_pre = W * H25 E = V - V_pre26#print E27 err = 0.028for i in range(m):29for j in range(n):30 err += E[i,j] * E[i,j]31print(err)32 data.append(err)3334if err < e:35break36#权值更新37 a = W.T * V38 b = W.T * W * H39#c = V * H.T40#d = W * H * H.T41for i_1 in range(r):42for j_1 in range(n):43if b[i_1,j_1] != 0:44 H[i_1,j_1] = H[i_1,j_1] * a[i_1,j_1] / b[i_1,j_1]4546 c = V * H.T47 d = W * H * H.T48for i_2 in range(m):49for j_2 in range(r):50if d[i_2, j_2] != 0:51 W[i_2,j_2] = W[i_2,j_2] * c[i_2,j_2] / d[i_2, j_2]5253return W,H,data5455565758if__name__ == "__main__":59#file_path = "./data_nmf"60# file_path = "./data1"61 data = []62# V = load_data(file_path)63 V=[[5,3,2,1],[4,2,2,1,],[1,1,2,5],[1,2,2,4],[2,1,5,4]]64 W, H ,error= train(V, 2, 100, 1e-5 )65print (V)66print (W)67print (H)68print (W * H)69 n = len(error)70 x = range(n)71 plot(x, error, color='r', linewidth=3)72 plt.title('Convergence curve')73 plt.xlabel('generation')74 plt.ylabel('loss')75 show()这⾥需要注意训练时r值的选择：r可以表⽰和主题数或者你想要的到的特征数K值的选择：k表⽰训练的次数，设置的越⼤模型的拟合效果越好，但是具体设置多少，要根据性价⽐看，看误差曲线的变化。

非负矩阵分解

非负矩阵分解
非负矩阵分解（Non-Negative Matrix Factorization， NMF）是一种机器学习技术，用于将数据重新表示成低维空间中的基本因素。

其基本概念是将原始数据表
示为两个非负矩阵的乘积。

非负矩阵分解的主要用途是文本挖掘，特别是分析大量文档，确定文档主题或概念关系。

此外，它也被用于图像和声音分析和表示。

非负矩阵分解确保数据表示形式中所有项均为非负值，这可以将分析从基于复数值的空间中转移到基于实数值的空间中，从而显著的改善了复杂度。

此外，由
于它是一种无监督学习算法，它不需要用户指定的方向，因此可以发现未知的模式，并检查任何特定的特性的关联。

非负矩阵分解是一种迭代过程，它将原始数据分解为两个数据矩阵，第一个矩阵描述数据中各个元素的组成，第二个矩阵表示数据中各个元素的重要性。

这两个矩阵相乘可以重新组合成原始数据，并提供有用的信息。

总之，非负矩阵分解是一种强大的工具，可用于分析和提取数据中的有用信息，并使复杂计算更容易实现。

它可以帮助用户更好地理解大量总体数据，提取其中的模式和特征，并在今后的分析过程中进行发现。

基于近邻保留PNMF特征提取的高光谱图像分类

温金环，田铮，林伟，周敏，延伟东
７０７）１０２
（西北工业大学应用数学系，陕西西安
摘
要：通过对投影非负矩阵分解（Ｎ）ＰＭＦ增加近邻保留假设，出了一种新的高光谱图像线性特征提
提取方法—— 近邻保留投影非负矩阵分解（ＰＮＦ。ＮＰＭＦ保留了高光谱数据在低维特征空间ＮＰＭ）ＰＮ
（ｒｃａｃｍｏｅｔｎｌｓ，Ｃ和分段主成分变ｐｎｉｌｏｐｎｎａｉＰＡ）ｉｐａｙｓ
换（ｓｇｅｔｄｒｃｐｌｏｐｎｎｓｒｎｆｒｌｅｍｎｅｐｎｉａｉｃｍｏｅｔａｓｉ，ｔｏｌ
于线性投影结构的非负矩阵分解（ｎａｐ￣ｃｏ — １ｅｒｒｅｆｎｉｉ
ｂｓｄｎｎｅａｖｔｘｆｃｒａｏ，ＰＮ）这ａｅｏｎｇｔｅｍａａｔｉｔｎＬＢＭＦ，ｉｉｒｏｚｉ
两个方法均属于投影非负矩阵分解（ｒＰＭＦ）及其改进方法。ａｅｏｎｇｔｅｍｔ，ＮｉｉｒＰＭＦ实际上是ＮＮＭＦ的线性化方法，过投影非负通矩阵分解学习到的变换矩阵，仅可以直接求得新不
用潜力。
关
键
词：高光谱图像分类，特征提取，降维，影非负矩阵分解，邻保留投近文献标识码：Ａ文章编号：００２５（０２０－１８０１０－７８２１）１０３－７新加测试采样的系数编码矩阵，样不能保证ｈ这的非负性，背了原非负分解的假设 ¨ 违。为了克服此问题，ｉ和ＬＬ提出了投影非负图嵌入ＬｕｌＬｉ１

非负矩阵分解及其应用现状分析

杨轩 [ 13 ]提出了一种基于 gamm a分布的 NM F算法 ( GNM F) ,在此算法的基础上构建特征子空间 ,采用最小距离分类法对 ORL 人脸库中的部分图像进行识别. 实验表明 ,以 GNM F 为基础的人脸识别方法识别率较高.
欧阳怡彪等 [ 14 ]提出了基于小波和非负稀疏矩
阵分解的人脸识别方法. 该方法利用小波变换 (W T) 、非负稀疏矩阵分解 (NM Fs)和 Fisher线性判别法 ( FLD )来进行人脸识别. 实验表明 ,此法对人脸表情、光照变化和部分遮挡不敏感 ,具有非常好的健壮性和较高的识别率.
此外 ,许多国外学者也致力于将 NM F用于人脸识别方面的研究 ,并取得了显著的成果. Ioan Buciu 等将 [ 15 ] LNM F用于人脸表情的识别 ,并在两种不同的分类器下说明了 LNM F 分类表现好于传统 NM F方法. X. Chen等 [ 16 ]将 LNM F成功用于人脸检测. S. Zafeiriou 等 [ 17 ] 提出 NM Fface 法 , 该方法在人脸识别效果上优于 Fisherfaces和 Eigenfaces方法.
Xu L 等 [ 19 ] 提出了基于图像块的 NM F 融合方法. 该方法首先将原始图像分块并对其进行 NM F, 根据 NM F权重系数和最小的规则选择出最清晰的图像分块 ,最后将其按原始图像中的像素位置组合从而得到融合图像. 此法缺点是 : 图像分块算法复杂、选取规则单一.
张素文等 [ 20 ]提出了基于非负矩阵分解和红外特征的图像融合方法 ,实现了原始图像的目标区域和背景区域的分别融合. 该方法不但简单易行 ,而且也提高了图像的可判读性.
武汉工业学院学报 Journal of W uhan Polytechnic University

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

收稿日期 2008-09-17 录用日期 2009-05-06 Manuscript received September 17, 2008; in revised form May 6, 2009 国家自然科学基金 (60872084) 资助 Supported by National Natural Science Foundation of China (60872084) 1. 清华大学清华信息科学与技术国家实验室北京 100084 2. 清华大学电子工程系北京 100084 3. 中国电子信息产业发展研究院北京 100048 1. Tsinghua National Laboratory for Information Science and Technology, Tsinghua University, Beijing 100084 2. Department of Electronic Engineering, Tsinghua University, Beijing 100084 3. China Center for Information Industry Development, Beijing 100048
非负矩阵分解 (Non-negative matrix factorization, NMF)[1] 由 Lee 和 Seung 于 1999 年在 Nature 上提出, 它使分解后的所有分量均为非负值 (寻求纯加性的描述). NMF 的心理学和生理学构造依据是对整体的感知由对组成整体的部分的感知构成 (感知是纯加性的生理机能)[2−4] , 这也符合直观的理解: 整体是由部分组成的[1] , 因此它在某种
意义上抓住了智能化数据描述的本质. Lee 和 Seung 提出 NMF 时, 在泊松产生模型的假设下用最大似然估计的思路构造了第一个 NMF 算法[1] . 随后, Lee 和 Seung 采用类似于 EM (Expectation maximization) 算法中使用的优化策略对广义 Kullback-Leibler 散度和欧几里德距离的平方 (它们用来度量被处理数据和 NMF 结果间的差异, 本文后面提到的被优化函数也均作此用) 分别做交替优化得到了两个迄今最为经典和使用最广的单调算法[5] . Wild 等考虑了利用球面 K 均值聚类作为上述基于欧几里德距离平方算法的初始化步骤, 这样做的好处是能使算法效率有所提高, 但这以收敛到相对不好的局部解为代价[6] . Cichocki 等构造了利用指数梯度下降原则交替优化对偶的广义 Kullback-Leibler 散度的算法[7] . Heiler 等考虑了欧几里德距离平方的展开形式, 把对 NMF 的优化求解归结为一组交替进行的经典凸二次规划问题, 构造了单调下降的算法[8] . Cichocki 等利用了欧几里
24
自
动
化
学
报
36 卷
德距离平方的局部凸特性, 构造了以 “先求得无非负约束下的解析解 (定点算法的特点), 再通过做非线性投影满足非负性要求” 的方式完成交替优化的算法[7] , 此算法速度较快但可能发生震荡. 陈卫刚等构造了用可行方向法和模拟退火法结合来交替优化欧几里德距离平方的算法[9] , 它 (理论) 复杂度较高, 因为可行方向法中的一维搜索步骤以及模拟退火法都比较耗时. Li 等构造了利用抛物线原理交替优化欧几里德距离平方的单调定点算法, 此算法中的每次操作都使此刻对应优化问题的目标函数仅由这一次操作达到最小值, 因此效率远远超过其他算法[10] . 以上的 NMF 算法均是基于单一目标函数构造的, 还有另一类 NMF 算法, 它们是基于一组目标函数 (目标函数族) 构造的, 这包括 Compass 基于 β 散度的算法[11] 、 Cichocki 和 Zdunek 等基于 α 散度 [12−13] 的算法以及 Dhillon 等基于 Bregman 散度和对偶 Bregman 散度的算法[14] . 这类算法的共同特点是: 依目标函数族中的参数或自由设定函数的不同, 它们与一系列潜在产生式模型 (对应不同的概率分布假设) 下的似然函数一一对应, 因此它们的适用范围更广 (特别是对于盲分离问题[12] ), 但与此同时, 这些参数和自由设定函数的选择也对使用者提出了较高的要求. 有关上述算法的更细致研究评述以及 NMF 算法研究的其他成果可参见综述文章《非负矩阵分解 [15] 算法综述》 . 目前, NMF 已应用到文本分析[1] 与聚类[16] 、数字水印[17−18] 、人脸检测[19] 与识别[20] 、图像检索[21−22] 、图像复原[23] 、语言建模[24−25] 、声源分类[26] 、音乐信号分析[27] 与乐器识别[28] 、盲信号分离[12] 、网络安全[29] 、基因及细胞分析[30−31] 等方面的研究中. NMF 定义中采用的数学模型基于非线性投影结构构造, 这决定了 NMF 降维需借助计算量较大的迭代操作来实现, 因此, 其处理高维数据 (常见于计算机视觉、图像工程和机器学习等研究中) 时常遇到效率瓶颈. 此外, 由此模型提取的 NMF 特征常不稀疏, 这与 NMF 的设计期望 (提取稀疏和局部化的特征[1] ) 相差甚远. 目前的研究结果显示, NMF 还只是一个数据依赖的稀疏特征提取方法, 这限制了其应用范围, 增加了应用难度. 为一并解决以上两个问题, 本文提出了一个新的模型 — 基于线性投影结构的 NMF (Linear projection-based NMF, LPBNMF), 构造了一个单调的 LPBNMF 算法. 从数学的角度看, LPBNMF 是实现 NMF 的一种特殊方式. 本文以下各节安排为: 第 1 节介绍 NMF, 结合示例指出其存在的问题; 第 2 节定义 LPBNMF,
第 36 卷第 1 期
2010 年 1 月
自动化学报
ACTA AUTOMATICA SINICA
Vol. 36, No. 1 January, 2010
基于线性投影结构的非负矩阵分解
李乐 1, 2, 3 章毓晋 1, 2
摘要非负矩阵分解 (Non-negative matrix factorization, NMF) 是一个近年来非常流行的非负数据处理方法, 它常用于维数约减、特征提取和数据挖掘等. NMF 定义中采用的数学模型基于非线性投影结构构造, 这决定了 NMF 降维需借助计算量很大的迭代操作来实现. 此外, 由此模型提取的 NMF 特征常不稀疏, 这与 NMF 的设计期望相差甚远. 为一并解决上述两个问题, 本文提出了一个新的模型 — 基于线性投影结构的 NMF (Linear projection-based NMF, LPBNMF), 并构造了一个单调的 LPBNMF 算法. 从数学的角度看, LPBNMF 可理解为实现 NMF 的一种特殊方式. LPBNMF 降维通过线性变换来完成, 它所采用的数学模型的自身结构特点决定了由其得到的特征一定非常稀疏. 大量的比较实验表明, LPBNMF 的降维效率显著高于 NMF, LPBNMF 特征明显比 NMF 特征更稀疏和局部化. 最后, 基于 AR 人脸数据库的实验揭示, LPBNMF 特征比 NMF、 LDA 以及 PCA 等特征更适合于用最近邻分类法处理有遮挡人脸识别问题影结构的非负矩阵分解, 特征提取, 数据描述, 降维效率, 稀疏特征, 有遮挡人脸识别
10.3724/SP.J.1004.2010.00023
Linear Projection-based Non-negative Matrix Factorization
LI Le1, 2, 3 ZHANG Yu-Jin1, 2 Abstract Non-negative matrix factorization (NMF) is a newly popular method for non-negative dimensionality reduction, feature extraction, data mining, etc. The mathematical model in NMF deﬁnition is based on nonlinear projection, therefore dimension reduction by NMF is implemented by iterative updates which lead to high computational load. Additionally, NMF features extracted by this model are usually not very sparse, and this fails to meet the expectation of designing NMF. To simultaneously resolve the above two problems, this paper proposes a new model, linear projectionbased NMF (LPBNMF), and designs an monotonic algorithm for it. From mathematical point of view, LPBNMF is a special mode for implementing NMF, which linearly implements dimension reduction. The high sparseness of LPBNMF features is assured by the inherent characteristics of its mathematic model. The comparison experiments validate that dimension reduction by LPBNMF is much more eﬃcient than that by NMF, and that LPBNMF features are much more sparse and localized than NMF ones. Finally, experiments based on AR face database indicate that LPBNMF features are more suitable for nearest neighbor classiﬁcation-based occluded face recognition than NMF, LDA, and PCA ones. Key words Non-negative matrix factorization (NMF), linear projection-based NMF (LPBNMF), feature extraction, data representation, eﬃciency of dimensionality reduction, sparse feature, occluded face recognition