基于线性投影结构的非负矩阵分解

合集下载

非负矩阵分解算法

非负矩阵分解算法

非负矩阵分解算法
1 非负矩阵分解
非负矩阵分解(Non-Negative Matrix Factorization,NMF)是
一种特殊的矩阵分解,它采用的分解维度包含非负的值。

NMF的定义是这样的:给定一个m阶n列非负矩阵A,有k非负数,将其分解成两个
m阶n列非负矩阵W和H,使得:A = WH.NMF可以应用于许多不同领域,包括信号处理、数据挖掘、图像处理、信息检索、自然语言处理等领域。

2 优点
非负矩阵分解具有许多优点:首先,非负矩阵分解有着很明显的
几何解释,可以用于多维数据挖掘,聚类和可视化。

其次,它的算法
本身不需要依赖于边界条件和/或初始条件,算法具有高度稳定性,用
于提取潜在信息特征,例如隐藏结构、主题、技能、现象等。

此外,
非负矩阵分解可以用较少的计算消耗从较大的数据集中提取有用的特征,从而降低空间需求并提高运行效率。

3 应用
非负矩阵分解的应用较广泛,在数据挖掘领域可用于高维数据降维、高维数据可视化、文本挖掘、模式挖掘以及聚集分析等方面。


信号处理方面,NMF可以用来提取信号中的有效信息,从而获得必要信息。

此外,NMF也可以用于表示图像并对其进行分类。

在自然语言处
理(Natural Language Processing)领域,NMF可以把文本表示成主题,以帮助文本分类、信息检索和在线推荐等任务。

4 结论
可以看出,非负矩阵分解在数据挖掘和信号处理等多领域具有重要的应用价值,特别是其几何解释、算法稳定性以及计算代价等众多优势的共同作用。

然而,NMF的应用还有待更多的研究,才能令它登上数据挖掘技术的高峰,为社会带来更多的发展。

基于多核学习的投影非负矩阵分解算法

基于多核学习的投影非负矩阵分解算法
的实验 结果表 明 , MKP NMF较 已有的 NMF类方 法具备 明显 的性 能优 势。 关键词 投 影非 负矩 阵分解 , 核 函数 , 多核学 习
TP 3 9 1 文献标识码 A 中 图法 分 类 号
Mu l t i - k e r n e l P r o j e c t i v e N o n n e g a t i v e Ma t r i x F a c t o r i z a t i o n A l g o r i t h m
第4 1 卷
第2 期

算机科学 2 0 1 4年 2月
Co mp u t e r S c i e n c e
Vo 1 . 4 1 No . 2 Fe b 2 0 1 4
基 于 多核 学 习的投 影 非 负 矩 阵 分 解 算 法
李 谦 景丽萍 。 于 剑
( 北 京交通 大 学计算 机 与信 息技术 学 院数 字 出版 技 术 国家重 点实验 室( 筹) 北京 1 0 0 0 4 4 ) ( 北京 交通 大 学计算机 与信息 技术 学 院 北 京 1 O O O 4 4 ) 。
摘 要 非 负矩 阵分解( NMF ) 把给定的数据矩 阵分解成低 维的非 负基 矩阵和对应的 系数 矩阵 , 两者之 间存在 必然联 系。为此 , 研 究者将 基矩阵转换为 系数矩阵 的投影 , 进 一步提 高分解效 率。但 是该方 法无法处理 非线性数 据 , 核 函数
的 引入部分 解决 了此问题 , 却 同时导致核 函数 参数 选择 的问题 。基于 多核学 习理论 , 提 出了一种 多核学 习的投影非 负 矩 阵分 解( MKP NMF ) 算 法, 该 算法有效地避免 了核 函数参数 选择 的 问题 , 同时提 高了学 习性能 。在 实际人脸 数据 上

采用改进投影梯度非负矩阵分解和非采样Contourlet变换的图像融合方法

采用改进投影梯度非负矩阵分解和非采样Contourlet变换的图像融合方法

采 用 改进 投影 梯 度 非 负矩 阵分 解 和 非 采 样 C no re 变 换 的 图像 融 合 方 法 o tu lt
杨粤涛 , 明 , 朱 贺柏根 , 文 。 高
(. 1 中国科学院 长春光学精密机械与物理研究所 , 吉林 长春 103 ; 303 2 中国科学院 研究生院 , . 北京 103) 009
to i e c m p e i in t o lx t m y,a m a e f so l o ih b o i g t e I p o e n i g u i n a g rt m y c mb n h m r v d PGNM F( P I GNM F) a d n No s b a l d Co t u l tTr n f r ( CT)i p o o e n t i a e .F r ty h e it r d o i — n u s mp e n o re a s o m NS s r p s d i h sp p r i s l ,t e r g s e e rg
第 1 9卷
第 5期
光 学 精 密 工 程
Op is a d P e iin En i e rn t n r cso g n e i g c
Vo _ 9 No 5 l 1 .
M a 01 v2 1
21 0 1年 5月
文章编号
1 0 — 2 X( 0 1 0 — 1 30 0 49 4 2 1 ) 514 —8
7 、 . 0 、 . 2 和 2 7 9 、 . 0 、 . 4 。 0 9 1 3 1 O1 . 6 2 23 10 9
关 键 词 : 图像 融 合 ; 负矩 阵 分 解 ; 影 梯 度 ; 采 样 C no r t 非 投 非 o tul 变换 e 中 图分 类 号 : P 9 . T 3 14 文献标识码 : A d i1 . 7 8 O E 2 1 1 0 . 4 o:0 38 / P .0 19 i rv dp o td u in ag rt b sdo mp o e rjce h e

非负矩阵分解算法综述

非负矩阵分解算法综述
L
E U W#iHij . i= 1 此外, BNMF 常被有盲信号 分离背景 的学者 解释为
含噪声项的产生式模型: V= WH+ E[10] , E 是 M @N 的 噪声矩阵. 不同的 BNMF 算法也常可被解释为 遵循了不 同的 E分布假设下的最大似然算法.
根据需要, 可给上述模型 中的 W和 H 施加 更多的 限制, 构成 INMF.
2 NMF 简介
定义 对一个 M 维的随机向量 v 进行了 N 次的观 测, 记这些 观测 为 vj , j = 1, 2, , , N , 取 V= [ V#1, V#2, , , V#N ] , 其中 V#j = vj, j = 1, 2, , , N, BNMF 要求发现非 负的 M @L 的基矩阵 W= [ W#1, W#2, , , W#N ] 和 L @N 的系数矩阵 H = [ H#1, H#2, , , H#N ] , 使 V U WH[1] , 这 也可 以 用 向 量 标 量 积 的 形 式 更 为 直 观 地 表 示 为 V#j
Ke y words: non2negative matrix factorization; multivariate data representation; feature extraction
1 引言
在信号处理、神经网络、模式识别、计算机视觉和图 象工程的研究中, 如何构造一个能使多维观测数据被更 好描述的变换方法始终是 一个非 常重要 的问 题. 通常, 一个好的变换方法应具备 两个基 本的特 性: ( 1) 可 使数 据的某种潜在结构变得清晰; ( 2) 能使数据的 维数得到 一定程度的约减.
主分量分析、线 性鉴别 分析、投影寻 踪、因 子分析、
冗余归约和独立分量分析是一些最常用的变换方法. 它 们因被施加的限制不同而有着本质的区别, 然而, 它们 有两个共同 的特 点: ( 1) 允 许负的 分解量 存在 ( 允 许有 减性的描述) ; ( 2) 实现线性的维数约减. 区别于它们, 一 种新 的变 换方 法 ) ) ) 非负 矩 阵分 解( Nonnegative Matrix Factor, NMF) [1]由 Lee 和 Seung 在5Nature6 上提出, 它使分 解后的所有分量均为非负值(要求纯加性的描述) , 并且 同时实现非 线性 的维 数 约减. NMF 的 心理 学和 生 理学 构造依据是对整体 的感知 由对组成 整体的 部分的 感知 构成的( 纯 加性的 ) [2~ 6], 这也 符合直 观的理 解: 整 体是 由部分组成的[1], 因此它在某种意义上抓住了智能数据 描述的本质. 此外, 这 种非负 性的限 制导致 了相应 描述 在一定程度上的稀疏性[1], 稀疏性的表述已被证明是介 于完全分布式的描 述和单 一活跃 分量 的描述 3 间 的一

非负矩阵分解课件

非负矩阵分解课件

Daniel D. Lee和H. Sebastian Seung 于1999年提出了非负矩阵分解算法(Algorithms for Non-negative Matrix Factorization, NMF),它是矩阵分解最基本 的方法之一。
基本思想
r min(n, m)
V WH? Yes
H a
Ha
(W TV )a (W TWH )a
Wia
Wia
(VH T )ia (WHH T )ia
定理 2 K-L散度D(V||WH)在如下的更新规则下非增
WiaVi / (WH )i
Ha Ha i
Wka
k
HaVi / (WH )i
Wia Wia
Wav
v
G(h, ht )
G(h, ht )min G(h, ht+1)
化简,得
dG(h, ht ) dha
i
vi
Wia hat Wib hbt
1 ha
i
Wia 0
b
ht 1 a
hat Wkb i

vi Wib hbt
Wia
b
b
转换W和H的角色,同理可得W的更新规则。
相关工作
NMF经过十多年的发展, 已经成为了一个相对成熟的 数据分析手段。其之所以得 到研究人员的青睐,主要归 功于其分解结果有较为明确 的物理意义。
Algorithms for Non-negative Matrix Factorization 精读报告
Thank You!
不足之处,还请批评指正!
得到分解
No
因子
以乘法规则 更新W(或H)
代价函数
使用某些测度方法来量化相似结果的质量

非负矩阵分解在图像分析中的应用

非负矩阵分解在图像分析中的应用

量)中包含大部分为0的系数,因此基图像矩阵牙和编码图像矩阵H是稀疏的(sParse)。

基图像的稀疏是因为它是非整体的而且包含多个版本的嘴、鼻子和其它面部元件,在这里各种版本的嘴、鼻子和其它面部元件是在不同的位置和处于不同的形式。

整张脸的多样性就是通过组合这些不同的部件所生成的。

尽管所有的部件至少被一张脸使用,但对于给定的脸并不一定同时使用所有的可用的部件。

这就导致了一个稀疏地分散的图像编码,与v Q的一元编码和P C A的全部分散的编码形成鲜明的对比。

N M F口」二叫叫l111l ll口L」乞_」卜尸叫叫卜一卜扁洲洲...l l习「二]]]l‘蓄日.l ll.l ll...「「]]]至习}}州州I11卜州卜了--.!!!...l一~门门一门门r一,「一几几鱼鱼匕列列「「」.!!!「翌r~~~~呈呈_」月匡匡{{{李一{{{江习l二月一一l r一-,厂气飞一1一T丁一疡一}}牲大1__里f户_」~__l l..!!里哩到「「工二)))钾一:片.r l‘r r一1:阅一宁一卞一二,二,户l l,、百..11.气馨。

书一各.本.4本4一一··1一f+于+卡一··上址全士上上福福~备牛4半4--p C A辍蟒矍黔鬓辍卜卜玺玺铆铆~呀,.曰卜,44r尹石畏‘‘‘气丁习巨蒸蒸俘砚勺勺爵自自酬酬爵圃令令麒圃麒麒肠肠翻嚷寥娜娜氢氢翩翩{密令润瞬绝翻眯眯之麟爵观胰爵广截截彝啊!!!版{{{嗽叫解解遗、髯摹!!!瓮髯酬111·惑一履图2.1N M F、V Q、P C A对人脸的表示N M F是对人脸的的基于部分的表达,而V Q和P C A是对人脸的基于整体的表达。

这三种分析方法都被应用到一个m=2429的人脸图像数据库中,每个图像由n=19xl9像素组成,最终形成一个n x m矩阵V。

这三种方法都是设法找到一种V的近似分解V二不朽叮,但是牙和H规定不同的约束条件。

非负矩阵分解(NMF)原理及算法实现

⾮负矩阵分解(NMF)原理及算法实现⼀、矩阵分解回想矩阵分解是指将⼀个矩阵分解成两个或者多个矩阵的乘积。

对于上述的⽤户-商品(评分矩阵),记为能够将其分解为两个或者多个矩阵的乘积,如果分解成两个矩阵和。

我们要使得矩阵和的乘积能够还原原始的矩阵当中,矩阵表⽰的是m个⽤户于k个主题之间的关系,⽽矩阵表⽰的是k个主题与n个商品之间的关系通常在⽤户对商品进⾏打分的过程中,打分是⾮负的,这就要求:这便是⾮负矩阵分解(NMF)的来源。

⼆、⾮负矩阵分解2.1、⾮负矩阵分解的形式化定义上⾯介绍了⾮负矩阵分解的基本含义。

简单来讲,⾮负矩阵分解是在矩阵分解的基础上对分解完毕的矩阵加上⾮负的限制条件。

即对于⽤户-商品矩阵找到两个矩阵和,使得:同⼀时候要求:2.2、损失函数为了能够定量的⽐较矩阵和的近似程度,提出了两种损失函数的定义⽅式:欧⼏⾥得距离:KL散度:在KL散度的定义中,。

当且仅当时取得等号。

当定义好损失函数后,须要求解的问题就变成了例如以下的形式,相应于不同的损失函数:求解例如以下的最⼩化问题:2.3、优化问题的求解乘法更新规则,详细操作例如以下:对于欧⼏⾥得距离的损失函数:对于KL散度的损失函数:上述的乘法规则主要是为了在计算的过程中保证⾮负,⽽基于梯度下降的⽅法中,加减运算⽆法保证⾮负。

事实上上述的惩罚更新规则与梯度下降的算法是等价的。

以下以平⽅距离为损失函数说明上述过程的等价性:平⽅损失函数能够写成:使⽤损失函数对求偏导数:依照梯度下降法的思路:即为:令,即能够得到上述的乘法更新规则的形式。

2.4、⾮负矩阵分解的实现1from numpy import *2from pylab import *3from numpy import *45def load_data(file_path):6 f = open(file_path)7 V = []8for line in f.readlines():9 lines = line.strip().split("\t")10 data = []11for x in lines:12 data.append(float(x))13 V.append(data)14return mat(V)1516def train(V, r, k, e):17 m, n = shape(V)18#先随机给定⼀个W、H,保证矩阵的⼤⼩19 W = mat(random.random((m, r)))20 H = mat(random.random((r, n)))21#K为迭代次数22for x in range(k):23#error24 V_pre = W * H25 E = V - V_pre26#print E27 err = 0.028for i in range(m):29for j in range(n):30 err += E[i,j] * E[i,j]31print(err)32 data.append(err)3334if err < e:35break36#权值更新37 a = W.T * V38 b = W.T * W * H39#c = V * H.T40#d = W * H * H.T41for i_1 in range(r):42for j_1 in range(n):43if b[i_1,j_1] != 0:44 H[i_1,j_1] = H[i_1,j_1] * a[i_1,j_1] / b[i_1,j_1]4546 c = V * H.T47 d = W * H * H.T48for i_2 in range(m):49for j_2 in range(r):50if d[i_2, j_2] != 0:51 W[i_2,j_2] = W[i_2,j_2] * c[i_2,j_2] / d[i_2, j_2]5253return W,H,data5455565758if__name__ == "__main__":59#file_path = "./data_nmf"60# file_path = "./data1"61 data = []62# V = load_data(file_path)63 V=[[5,3,2,1],[4,2,2,1,],[1,1,2,5],[1,2,2,4],[2,1,5,4]]64 W, H ,error= train(V, 2, 100, 1e-5 )65print (V)66print (W)67print (H)68print (W * H)69 n = len(error)70 x = range(n)71 plot(x, error, color='r', linewidth=3)72 plt.title('Convergence curve')73 plt.xlabel('generation')74 plt.ylabel('loss')75 show()这⾥需要注意训练时r值的选择:r可以表⽰和主题数或者你想要的到的特征数K值的选择:k表⽰训练的次数,设置的越⼤模型的拟合效果越好,但是具体设置多少,要根据性价⽐看,看误差曲线的变化。

非负矩阵分解

非负矩阵分解
非负矩阵分解(Non-Negative Matrix Factorization, NMF)是一种机器学习技术,用于将数据重新表示成低维空间中的基本因素。

其基本概念是将原始数据表
示为两个非负矩阵的乘积。

非负矩阵分解的主要用途是文本挖掘,特别是分析大量文档,确定文档主题或概念关系。

此外,它也被用于图像和声音分析和表示。

非负矩阵分解确保数据表示形式中所有项均为非负值,这可以将分析从基于复数值的空间中转移到基于实数值的空间中,从而显著的改善了复杂度。

此外,由
于它是一种无监督学习算法,它不需要用户指定的方向,因此可以发现未知的模式,并检查任何特定的特性的关联。

非负矩阵分解是一种迭代过程,它将原始数据分解为两个数据矩阵,第一个矩阵描述数据中各个元素的组成,第二个矩阵表示数据中各个元素的重要性。

这两个矩阵相乘可以重新组合成原始数据,并提供有用的信息。

总之,非负矩阵分解是一种强大的工具,可用于分析和提取数据中的有用信息,并使复杂计算更容易实现。

它可以帮助用户更好地理解大量总体数据,提取其中的模式和特征,并在今后的分析过程中进行发现。

基于近邻保留PNMF特征提取的高光谱图像分类

温金环 ,田 铮 , 林 伟, 周 敏 , 延伟 东
707 ) 10 2
( 西北工业大学 应用数学 系 , 陕西 西安

要: 通过 对投 影 非 负矩 阵分 解( N ) P MF 增加近邻 保 留假 设 , 出 了一种 新 的 高光谱 图像 线性特 征 提
提取 方法—— 近邻 保 留投影 非 负矩 阵分解 ( P N F 。N P MF保 留 了高光谱 数 据在低 维特征 空 间 N P M ) PN
( r c a cm oe t nls , C 和分段 主成 分 变 p n i l o p n n a i P A) i p a ys
换 (sg e td r cpl o p n ns rnfrl em ne p n ia i cm oe t a s i , t o l
于线性投影结构 的非 负矩 阵分解 ( na p ̄ co — 1 er ref n i i
b sdn n ea v tx fc r a o , P N ) 这 ae o ngt ema at i t n L B MF , i i r ozi
两个 方 法 均 属 于 投 影 非 负 矩 阵 分 解 ( r P MF)及 其 改 进 方 法 。 ae ongt e m t , N i i r P MF实 际上是 N N MF的线 性 化 方 法 , 过 投 影 非 负 通 矩阵 分解 学 习到 的 变换 矩 阵 , 仅 可 以 直接 求 得新 不
用潜力 。


词: 高光谱 图像 分 类 , 特征 提取 , 降维 , 影 非 负矩 阵分 解 , 邻保 留 投 近 文 献标 识 码 : A 文 章编 号 :0025 (0 2 0 -180 10 -7 8 2 1 ) 103 -7 新 加测 试 采样 的系 数 编码 矩 阵 , 样 不 能保 证 h 这 的非 负性 , 背 了原 非 负分 解 的假 设 ¨ 违 。为 了 克服 此 问 题 , i 和 LL 提 出 了 投 影 非 负 图 嵌 入 Lul L i 1

非负矩阵分解及其应用现状分析

杨轩 [ 13 ]提出了一种基于 gamm a分布的 NM F算 法 ( GNM F) ,在此算法的基础上构建特征子空间 ,采 用最小距离分类法对 ORL 人脸库中的部分图像进 行识别. 实验表明 ,以 GNM F 为基础的人脸识别方 法识别率较高.
欧阳怡彪等 [ 14 ]提出了基于小波和非负稀疏矩
阵分解的人脸识别方法. 该方法利用小波变换 (W T) 、非负稀疏矩阵分解 (NM Fs)和 Fisher线性判 别法 ( FLD )来进行人脸识别. 实验表明 ,此法对人脸 表情 、光照变化和部分遮挡不敏感 ,具有非常好的健 壮性和较高的识别率.
此外 ,许多国外学者也致力于将 NM F用于人脸 识别方面的研究 ,并取得了显著的成果. Ioan Buciu 等 将 [ 15 ] LNM F用于人脸表情的识别 ,并在两种不 同的分 类 器 下 说 明 了 LNM F 分 类 表 现 好 于 传 统 NM F方法. X. Chen等 [ 16 ]将 LNM F成功用于人脸检 测. S. Zafeiriou 等 [ 17 ] 提出 NM Fface 法 , 该方法在人 脸识别效果上优于 Fisherfaces和 Eigenfaces方法.
Xu L 等 [ 19 ] 提出了基于图像块的 NM F 融合方 法. 该方法首先将原始图像分块并对其进行 NM F, 根据 NM F权重系数和最小的规则选择出最清晰的 图像分块 ,最后将其按原始图像中的像素位置组合 从而得到融合图像. 此法缺点是 : 图像分块算法复 杂 、选取规则单一.
张素文等 [ 20 ]提出了基于非负矩阵分解和红外 特征的图像融合方法 ,实现了原始图像的目标区域 和背景区域的分别融合. 该方法不但简单易行 ,而且 也提高了图像的可判读性.
武 汉 工 业 学 院 学 报 Journal of W uhan Polytechnic University
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期 2008-09-17 录用日期 2009-05-06 Manuscript received September 17, 2008; in revised form May 6, 2009 国家自然科学基金 (60872084) 资助 Supported by National Natural Science Foundation of China (60872084) 1. 清华大学清华信息科学与技术国家实验室 北京 100084 2. 清华 大学电子工程系 北京 100084 3. 中国电子信息产业发展研究院 北京 100048 1. Tsinghua National Laboratory for Information Science and Technology, Tsinghua University, Beijing 100084 2. Department of Electronic Engineering, Tsinghua University, Beijing 100084 3. China Center for Information Industry Development, Beijing 100048
非负矩阵分解 (Non-negative matrix factorization, NMF)[1] 由 Lee 和 Seung 于 1999 年 在 Nature 上提出, 它使分解后的所有分量均为非负 值 (寻求纯加性的描述). NMF 的心理学和生理学 构造依据是对整体的感知由对组成整体的部分的感 知构成 (感知是纯加性的生理机能)[2−4] , 这也符合 直观的理解: 整体是由部分组成的[1] , 因此它在某种
意义上抓住了智能化数据描述的本质. Lee 和 Seung 提出 NMF 时, 在泊松产生模 型的假设下用最大似然估计的思路构造了第一个 NMF 算法[1] . 随后, Lee 和 Seung 采用类似于 EM (Expectation maximization) 算法中使用的优化策 略对广义 Kullback-Leibler 散度和欧几里德距离的 平方 (它们用来度量被处理数据和 NMF 结果间的 差异, 本文后面提到的被优化函数也均作此用) 分 别做交替优化得到了两个迄今最为经典和使用最广 的单调算法[5] . Wild 等考虑了利用球面 K 均值聚 类作为上述基于欧几里德距离平方算法的初始化步 骤, 这样做的好处是能使算法效率有所提高, 但这 以收敛到相对不好的局部解为代价[6] . Cichocki 等 构造了利用指数梯度下降原则交替优化对偶的广义 Kullback-Leibler 散度的算法[7] . Heiler 等考虑了欧 几里德距离平方的展开形式, 把对 NMF 的优化求 解归结为一组交替进行的经典凸二次规划问题, 构 造了单调下降的算法[8] . Cichocki 等利用了欧几里
24





36 卷
德距离平方的局部凸特性, 构造了以 “先求得无非负 约束下的解析解 (定点算法的特点), 再通过做非线 性投影满足非负性要求” 的方式完成交替优化的算 法[7] , 此算法速度较快但可能发生震荡. 陈卫刚等构 造了用可行方向法和模拟退火法结合来交替优化欧 几里德距离平方的算法[9] , 它 (理论) 复杂度较高, 因 为可行方向法中的一维搜索步骤以及模拟退火法都 比较耗时. Li 等构造了利用抛物线原理交替优化欧 几里德距离平方的单调定点算法, 此算法中的每次 操作都使此刻对应优化问题的目标函数仅由这一次 操作达到最小值, 因此效率远远超过其他算法[10] . 以上的 NMF 算法均是基于单一目标函数构造 的, 还有另一类 NMF 算法, 它们是基于一组目标函 数 (目标函数族) 构造的, 这包括 Compass 基于 β 散度的算法[11] 、 Cichocki 和 Zdunek 等基于 α 散度 [12−13] 的算法 以及 Dhillon 等基于 Bregman 散度和 对偶 Bregman 散度的算法[14] . 这类算法的共同特 点是: 依目标函数族中的参数或自由设定函数的不 同, 它们与一系列潜在产生式模型 (对应不同的概率 分布假设) 下的似然函数一一对应, 因此它们的适用 范围更广 (特别是对于盲分离问题[12] ), 但与此同时, 这些参数和自由设定函数的选择也对使用者提出了 较高的要求. 有关上述算法的更细致研究评述以及 NMF 算 法研究的其他成果可参见综述文章《非负矩阵分解 [15] 算法综述》 . 目前, NMF 已应用到文本分析[1] 与聚类[16] 、 数字水印[17−18] 、人脸检测[19] 与识别[20] 、图像检 索[21−22] 、图 像 复 原[23] 、语 言 建 模[24−25] 、声 源 分 类[26] 、音乐信号分析[27] 与乐器识别[28] 、盲信号分 离[12] 、网络安全[29] 、基因及细胞分析[30−31] 等方面 的研究中. NMF 定义中采用的数学模型基于非线性投影 结构构造, 这决定了 NMF 降维需借助计算量较大 的迭代操作来实现, 因此, 其处理高维数据 (常见于 计算机视觉、图像工程和机器学习等研究中) 时常 遇到效率瓶颈. 此外, 由此模型提取的 NMF 特征 常不稀疏, 这与 NMF 的设计期望 (提取稀疏和局部 化的特征[1] ) 相差甚远. 目前的研究结果显示, NMF 还只是一个数据依赖的稀疏特征提取方法, 这限制 了其应用范围, 增加了应用难度. 为 一 并 解决 以 上 两 个 问 题, 本 文 提 出 了 一 个 新的模型 — 基于线性投影结构的 NMF (Linear projection-based NMF, LPBNMF), 构造了一个单 调的 LPBNMF 算法. 从数学的角度看, LPBNMF 是实现 NMF 的一种特殊方式. 本文以下各节安排为: 第 1 节介绍 NMF, 结 合示例指出其存在的问题; 第 2 节定义 LPBNMF,
第 36 卷 第 1 期
2010 年 1 月
自 动 化 学 报
ACTA AUTOMATICA SINICA
Vol. 36, No. 1 January, 2010
基于线性投影结构的非负矩阵分解
李 乐 1, 2, 3 章毓晋 1, 2
摘 要 非负矩阵分解 (Non-negative matrix factorization, NMF) 是一个近年来非常流行的非负数据处理方法, 它常用于 维数约减、特征提取和数据挖掘等. NMF 定义中采用的数学模型基于非线性投影结构构造, 这决定了 NMF 降维需借助计算 量很大的迭代操作来实现. 此外, 由此模型提取的 NMF 特征常不稀疏, 这与 NMF 的设计期望相差甚远. 为一并解决上述两 个问题, 本文提出了一个新的模型 — 基于线性投影结构的 NMF (Linear projection-based NMF, LPBNMF), 并构造了一个 单调的 LPBNMF 算法. 从数学的角度看, LPBNMF 可理解为实现 NMF 的一种特殊方式. LPBNMF 降维通过线性变换来 完成, 它所采用的数学模型的自身结构特点决定了由其得到的特征一定非常稀疏. 大量的比较实验表明, LPBNMF 的降维效 率显著高于 NMF, LPBNMF 特征明显比 NMF 特征更稀疏和局部化. 最后, 基于 AR 人脸数据库的实验揭示, LPBNMF 特 征比 NMF、 LDA 以及 PCA 等特征更适合于用最近邻分类法处理有遮挡人脸识别问题影结构的非负矩阵分解, 特征提取, 数据描述, 降维效率, 稀疏特征, 有遮挡人脸识别
10.3724/SP.J.1004.2010.00023
Linear Projection-based Non-negative Matrix Factorization
LI Le1, 2, 3 ZHANG Yu-Jin1, 2 Abstract Non-negative matrix factorization (NMF) is a newly popular method for non-negative dimensionality reduction, feature extraction, data mining, etc. The mathematical model in NMF definition is based on nonlinear projection, therefore dimension reduction by NMF is implemented by iterative updates which lead to high computational load. Additionally, NMF features extracted by this model are usually not very sparse, and this fails to meet the expectation of designing NMF. To simultaneously resolve the above two problems, this paper proposes a new model, linear projectionbased NMF (LPBNMF), and designs an monotonic algorithm for it. From mathematical point of view, LPBNMF is a special mode for implementing NMF, which linearly implements dimension reduction. The high sparseness of LPBNMF features is assured by the inherent characteristics of its mathematic model. The comparison experiments validate that dimension reduction by LPBNMF is much more efficient than that by NMF, and that LPBNMF features are much more sparse and localized than NMF ones. Finally, experiments based on AR face database indicate that LPBNMF features are more suitable for nearest neighbor classification-based occluded face recognition than NMF, LDA, and PCA ones. Key words Non-negative matrix factorization (NMF), linear projection-based NMF (LPBNMF), feature extraction, data representation, efficiency of dimensionality reduction, sparse feature, occluded face recognition
相关文档
最新文档