基于 建模的稳健稀疏 低秩矩阵分解

合集下载

低秩矩阵分解与逼近

低秩矩阵分解与逼近

机器学习10.低秩矩阵分解主要内容低秩矩阵分解问题L2VS L1主要问题:缺失+噪音 CWMMoG主要内容低秩矩阵分解问题L2VS L1主要问题:缺失+噪音 CWMMoG已知数据:计算两个低秩矩阵目标:使低秩矩阵乘积尽可能重目标使低秩矩阵乘积尽可能重建原矩阵大量应用:运动中的结构检测社交网络/推荐系统(E.g.,Eriksson and Hengel ,2010)人脸建模信息提取(E.g.,Cheng et al., 2012)(E.g., Candes et al.,2012)(E.g. Deerwester et al. 1990)关键问题:☐如何度量原数据与重建数据偏差?性能?最常见误差函数选择:最常见误差函数选择主要内容低秩矩阵分解问题 L2VS L1主要问题:缺失+噪音 CWMMoG各自优劣?L2模型的解为?加正交约束有无影响?L2范数模型L1 范数模型 SVDY oung diagram (CVPR, 2008)T orre&Black (ICCV , 2001) R1PCA (ICML, 2006) L2 Wiberg (IJCV , 2007)LM_S/LM_M (IJCV , 2008)SALS (CVIU, 2010)LRSDP (NIPS, 2010)PCAL1 (PAMI, 2008) ALP/AQP (CVPR, 2005) L1Wiberg (CVPR, 2010, best paper award) RegL1ALM (CVPR, 2012) Damped Wiberg (ICCV , 2011)Weighted SVD (T echnometrics, 1979) WLRA (ICML, 2003)Damped Newton (CVPR, 2005) CWM (AAAI, 2013)Reg-ALM-L1 (CVPR, 2013)L2范数模型L1 范数模型SVDY oung diagram (CVPR, 2008) T orre&Black (ICCV , 2001) R1PCA (ICML, 2006) L2 Wiberg (IJCV , 2007) LM_S/LM_M (IJCV , 2008) SALS (CVIU, 2010) LRSDP (NIPS, 2010)PCAL1 (PAMI, 2008) ALP/AQP (CVPR, 2005)L1Wiberg (CVPR, 2010, best paper award) RegL1ALM (CVPR, 2012)Damped Wiberg (ICCV , 2011)Weighted SVD (T echnometrics, 1979) WLRA (ICML, 2003)Damped Newton (CVPR, 2005) CWM (AAAI, 2013)Reg-ALM-L1 (CVPR, 2013)L2范数模型L1 范数模型优点: 光滑模型优点: 对极端异常点表现稳健算法速度快在无缺失前提下有全局极优缺点: 对异常点与强噪音点表现不稳缺点: 非光滑模型算法速度慢健在高斯噪音下表现不佳R b t P bl 为什么?!Robust Problem为什么对于大误差点的惩罚Mean vs Median 误差分布假设主要内容低秩矩阵分解问题 L2VS L1主要问题:缺失+噪音 CWM MoG数据缺失强噪音{01}⨯d n ,{0,1},∈∈ij W R w 为Hardamard 乘积算子L1低秩矩阵分解模型对异常点与强噪音表现稳健!✓Ke and Kanade, CVPR, 2005✓Eriksson and van den Hengel, CVPR, 2010✓Kwak TPAMI 2008Kwak, TPAMI, 2008✓Wright et al., NIPS, 2009✓Zheng et al., CVPR, 2012✓…L1 Low-Ranki i iMatrix Factorization典型方法:✓ALP: Ke and Kanade, CVPR. 2005Wib L1E ik d d H l CVPR2010✓WibergL1: Eriksson and van den Hengel, CVPR. 2010.✓PCAL1: Kwak, TPAMI. 2008.✓Robust PCA: Wright et al., NIPS. 2009.✓RegL1ALM: Zheng et al., CVPR. 2012✓…优点✓对异常点表现稳健缺点✓非光滑非凸模型✓算法速度慢主要内容低秩矩阵分解问题 L2VS L1主要问题:缺失+噪音 CWM MoGCWMCoordinate D t动机在很多其它机器学习问题中坐标下降算法Descent : 在很多其它机器学习问题中,坐标下降算法已经成为非常有效的计算方法之一LassoRidge RegressionElastic Net. (Friedman et al., 2007; 2010)坐标下降:将原问题分解为针对每个变量元素优化的子问题,然后顺序求解,对L1 LRMF 问题而言:每个子问题均是凸的每个子问题均可通过加权均值滤子快速准确求解算法复杂度与数据大小与维度呈近似线性增长Cyclic Weighted MedianW X UVT()L1难点?CWML1 LRMF 模型可按如下两种方式进行分解11()()-=-∑TTj j j L L W X UV W X u v 11()()=-=-∑Ti i i i j ji L L jW E u v w e u ij v 11()()-=-∑Ti j ji L L W X UV we v ij u jT i j j j i E X u v ≠=-∑, j w 与 j w分别为W 的第j 列和行, i j e 与i j e 分别为i E 的第j 列和行,ij u 与ij v 分别为i u 与i v 的第j 个元素.Cyclic Weighted Median-TW X UV 1()L VSVS.1()-i j ji L w e u ij v 1-i j jj i L w e w u ijv ()-i j ji w e v ij u -i j jj i w e w v ij u 1L 1LCyclic Weighted MedianL1 LRMF 关于U,V的子关于每个变量元素的子问题问题Cyclic Weighted Median每个子问题转换为一个标准的加权均值问题!Cyclic Weighted MedianL1 LRMF 目标函数在迭代过程中单调递减!Cyclic Weighted Median计算复杂度:稠密数据:O(d logd)稀疏数据:O(s logs)稠密数据:O(n logn)稀疏数据:O(s logs)s 为数据矩阵每列/行的本质稀疏度当数据矩阵高度稀疏时, CWM 计算复杂度仅为O((n+d)s), 少于现有最快的算法复杂度O(dn).O((+d)) O(d)Cyclic Weighted Median人工: 100个矩阵,每个大小为7×12,秩为3.Cyclic Weighted Median人脸数据人脸数据:Yale B dataset✓Facedata1 & Facedata2:每组包含64张脸,每个脸大小包含一定程度的缺失与24×21,包含定程度的缺失与椒盐噪声点。

稀疏表示与低秩矩阵分解方法在图像重建中的应用

稀疏表示与低秩矩阵分解方法在图像重建中的应用

稀疏表示与低秩矩阵分解方法在图像重建中的应用近年来,随着科学技术的不断发展,图像处理技术已经得到了广泛的发展和应用。

在图像处理过程中,图像重建是其中十分重要的一个过程,它可以使图像更加清晰,具有更高的质量,并且使人们更加方便地进行图像处理和分析。

这篇文章将主要讨论稀疏表示和低秩矩阵分解方法在图像重建中的应用。

一、稀疏表示在图像重建中的应用稀疏表示是一种数字信号处理中的一个重要方法,它已经被广泛应用于图像处理领域。

稀疏表示的主要思想是将一个向量(或矩阵)表示成若干个基向量的线性组合,其中只有很少的基向量参与了该向量的表示。

稀疏表示的优点在于它可以使高维度的数据变得更加简单和易于处理。

在图像重建中,稀疏表示可以用于处理采样不足或失真严重的图像。

具体的处理方法是利用图像的稀疏性质,将一个稀疏的信号进行压缩表示,然后在原有采样信号的基础上,加上这个压缩信号,从而得到一个更加清晰的图像。

当然,在使用稀疏表示进行图像重建时,我们需要选取合适的基向量,以使得稀疏表示的过程能够更加准确和高效。

二、低秩矩阵分解在图像重建中的应用低秩矩阵分解,也称为矩阵分解低秩近似,是另一种在图像处理中广泛应用的方法。

其主要思想是将一个任意大小的矩阵表示为两个低秩矩阵之和,其中一个矩阵代表该矩阵的平均值,称为秩为1的矩阵,另一个矩阵代表该矩阵的扰动项,通常有较低的秩,也称为低秩矩阵。

相比于稀疏表示方法,低秩矩阵分解方法更加注重矩阵的结构和局部特征的处理,所以在处理图像时起到了较好的效果。

低秩矩阵分解常常用于图像去噪、图像填补和图像重构等方面的处理。

它能够有效地减小噪声和伪像的干扰,同时也能保留图像的细节和轮廓信息。

三、稀疏表示与低秩矩阵分解的结合应用稀疏表示与低秩矩阵分解的组合成了一种新的图像重建方法——稀疏表示与低秩矩阵分解联合重建方法。

该方法主要是将两种基于矩阵结构特点处理的方法结合到一起,以充分利用它们在图像重建中的优势。

具体而言,该方法首先利用稀疏表示方法处理图像的高边缘和高频部分,然后再利用低秩矩阵分解方法对图像的低频和低边缘部分进行处理。

稀疏优化与低秩矩阵优化

稀疏优化与低秩矩阵优化
【2】S.L. Zhou, L.C. Kong, Z.Y. Luo, N.H. Xiu, New RIC Bounds via Lq-minimization with 0 < q<= 1 in Compressed Sensing, 2013.
【3】Z.Y. Luo, L.Y. Qin, L.C. Kong, N.H. Xiu, The Nonnegative Zero Norm Minimization under Generalized Z-matrix Measurement, JOTA, 2013.
问题: min rank(Y )
(7)
s.t. (Y ) D2 ,Ye 0,Y 0.
这里,是一个特定的线性算子.
三、应用实例
例6、Sparse-Viso CT CT是医学诊断的主要工具之一,其成像的数学原理是
Ax=b,其中x是一个未知向量,表示人体待检查部位的图像, 维数512*512代表像素个数,b是一个测量值,其维数为 1160*672代表射线的条数(1160代表圆周划分的角度),A是 (1160*672,512*512)阶矩阵,由物理规律得到.由于其行 数大于列数,一般情况下该方程无解.更为可怕的是行数多意 味着“吃线”多,对人的身体危害极大.期望:“吃线少、时 间短、图像清晰”.现在,假设人体待检查部位的图像稀疏, 那么应用稀疏优化理论和算法,可以进行研究。
这是一个矩阵秩极小问题.
三、应用实例
例4(上)、Netflix Prize 2006年10月Netflix电影公司为了有效发展自己的推荐系
统而发起的长达5年的竞赛,要求参赛者根据48万余用户对1 万7千部电影的不完全评分记录推测出另外近300万条电影评 分记录的数值.任何组织或个人只要能提交比Netflix现有电 影推荐系统Cinematch效果好10%的新方法,就可以获得诱人 的7位数奖金.不仅如此,每年它还会为此提供5万美元的年度 进步奖.

基于低秩矩阵分解的光场稀疏采样及重构

基于低秩矩阵分解的光场稀疏采样及重构

基于低秩矩阵分解的光场稀疏采样及重构覃亚丽;张晓帅;余临倩【期刊名称】《光学精密工程》【年(卷),期】2017(025)005【摘要】光场成像技术中光场的采集和数据的压缩处理是亟待解决的问题.为了实现光场的稀疏采样和恢复,建立了基于光场低秩结构的压缩采样相机系统,研究了光场矩阵的结构特征及压缩采样下光场图像的重构问题.根据静态光场各视点图像之间的内容相似性,将这些图像向量化并按列组合成一个二维矩阵,该矩阵呈现出低秩或近似低秩的状态.对光场图像矩阵进行低秩分解,结果表明偏离低秩的部分呈现出很强的稀疏性性质,低秩和稀疏各自表征不同的数据冗余度.然后,对基于掩膜的相机采样系统进行随机Noiselets变换测量,鉴于重构过程是一个低秩稀疏相关性约束下的优化求解问题,采用贪婪迭代求解分别重构出光场矩阵的低秩部分和稀疏部分.仿真结果表明,重构图像的PSNR维持在25 dB以上,且保留了光场视点间的视差信息,能够满足稀疏采样中对光场图像的要求.【总页数】7页(P1171-1177)【作者】覃亚丽;张晓帅;余临倩【作者单位】浙江工业大学信息工程学院,浙江杭州 310023;浙江工业大学信息工程学院,浙江杭州 310023;浙江工业大学信息工程学院,浙江杭州 310023【正文语种】中文【中图分类】TN911.74;TP391.41【相关文献】1.基于稀疏与低秩矩阵分解的视频背景建模 [J], 周密;宋占杰2.基于低秩矩阵分解和稀疏表达的人脸识别方法 [J], 谭群超3.基于低秩稀疏矩阵分解的非接触心率估计 [J], 黄继风; 白国臣; 熊乃学; 魏建国4.基于低秩稀疏矩阵分解的非接触心率估计 [J], 黄继风; 白国臣; 熊乃学; 魏建国5.基于稀疏和低秩Hankel矩阵分解的SAR图像相干斑抑制 [J], 蔡金萍;赵曜因版权原因,仅展示原文概要,查看原文内容请购买。

低秩与稀疏正则化在图像去噪与分割中的建模研究

低秩与稀疏正则化在图像去噪与分割中的建模研究

低秩与稀疏正则化在图像去噪与分割中的建模研究低秩与稀疏正则化在图像去噪与分割中的建模研究摘要:图像去噪与分割是图像处理领域的重要问题。

为了提高图像去噪与分割的效果,近年来研究者们提出了许多基于低秩和稀疏正则化的方法。

本文将重点探讨低秩和稀疏正则化在图像去噪与分割中的建模研究。

首先介绍了低秩和稀疏正则化的基本原理和数学模型,然后详细讨论了低秩和稀疏正则化在图像去噪和分割中的应用方法,并通过实际案例进行验证。

最后,并对未来低秩和稀疏正则化在图像去噪与分割中的研究方向进行了展望。

1. 引言图像去噪与分割是图像处理领域的重要问题,广泛应用于计算机视觉、人工智能等领域。

图像去噪是指在有噪声的图像中恢复原始图像,而图像分割则是将图像划分为不同的区域,以实现目标检测、目标追踪等应用。

然而,由于各种因素的影响,图像往往存在各种不同类型的噪声,如高斯噪声、椒盐噪声等,这会影响到图像去噪与分割的效果。

2. 低秩与稀疏正则化的基本原理与模型2.1 低秩正则化低秩正则化是一种通过对图像矩阵进行降秩处理来恢复真实图像信息的方法。

低秩正则化的基本思想是,真实图像往往具有较低的秩,即具有较少的独立信息,而噪声和干扰会导致图像矩阵的秩升高。

因此,通过对图像矩阵进行低秩正则化处理,可以去除图像中的噪声和干扰,从而恢复原始图像。

2.2 稀疏正则化稀疏正则化是一种通过对图像进行稀疏表示处理来去噪和分割的方法。

稀疏正则化的基本思想是,真实图像在某种表示下可以被稀疏表示,即可以用较少的非零系数表示图像。

而噪声和干扰会导致图像在稀疏表示下的系数变得更加密集,因此通过对图像进行稀疏正则化处理,可以去除图像中的噪声和干扰,实现去噪和分割的效果。

3. 低秩与稀疏正则化在图像去噪中的研究与应用3.1 基于低秩正则化的图像去噪方法基于低秩正则化的图像去噪方法主要包括基于低秩矩阵分解的方法和基于低秩约束的方法。

低秩矩阵分解方法通过对图像矩阵进行SVD分解,将低秩约束转化为对特征值的约束,从而实现去噪的效果。

稀疏优化与低秩矩阵优化演示文稿

稀疏优化与低秩矩阵优化演示文稿

条件
.从而得到稀疏优化模型: x k
0பைடு நூலகம்
min xTVx
s.t. Ax b,
x 0,
(3)
|| x ||0 k.
第10页,共23页。
三、应用实例
例2、互补问题的稀疏解
众说周知,二人矩阵博弈模型、具有生产和投资的经济均衡模型、交
通流均衡模型等,都可以转化为互补问题.如果这个互补问题有多个解 ,则在这个解集中寻找一个最为稀疏的解:
第16页,共23页。
三、应用实例
例6、Sparse-Viso CT CT是医学诊断的主要工具之一,其成像的数学原理是Ax=b,其中
x是一个未知向量,表示人体待检查部位的图像,维数512*512代表像素个
数,b是一个测量值,其维数为1160*672代表射线的条数(1160代表 圆周划分的角度),A是(1160*672,512*512)阶矩阵,由物理规律 得到.由于其行数大于列数,一般情况下该方程无解.更为可怕的是行 数多意味着“吃线”多,对人的身体危害极大.期望:“吃线少、时 间短、图像清晰”.现在,假设人体待检查部位的图像稀疏,那么应用稀
矩阵秩极小(或低秩矩阵恢复)问题是指在某种线性约束条件下,求一个
决策矩阵使其秩达到极小.它的基本数学模型是:
min rank( X ) s.t. A( X ) b, (2) 其中 A是从 Rm到n 的Rd线性变换,b 是一个 d 维向量.
第3页,共23页。
一、模型与基本概念
【注】
1、模型(2)是模型(1)的一个推广; 2、可以把零范数和秩函数放在约束中,变成 非凸 约束
疏优化理论和算法,可以进行研究。
第17页,共23页。
四、理论与算法
凸松弛理论和算法

低秩矩阵与稀疏表示

低秩矩阵与稀疏表示

低秩矩阵与稀疏表示1. 概述低秩矩阵和稀疏表示是两个相关的数学概念,在许多领域都有着广泛的应用。

低秩矩阵是指秩较低的矩阵,而稀疏矩阵是指包含大量零元素的矩阵。

稀疏表示是指使用一组有限的基向量来表示一个信号或数据。

2. 低秩矩阵低秩矩阵在许多领域都有着广泛的应用,例如:图像处理:图像通常可以表示为低秩矩阵,因此可以通过低秩矩阵分解来进行图像压缩、降噪和去模糊等操作。

自然语言处理:文本数据通常也可以表示为低秩矩阵,因此可以通过低秩矩阵分解来进行文本分类、文档聚类和信息检索等操作。

推荐系统:推荐系统通常需要对用户和物品之间的数据进行建模,而低秩矩阵分解可以用来构建用户-物品矩阵,从而实现个性化推荐。

3. 稀疏表示稀疏表示在许多领域也有着广泛的应用,例如:信号处理:信号通常可以表示为稀疏向量,因此可以通过稀疏表示来进行信号压缩、降噪和去噪等操作。

图像处理:图像通常也可以表示为稀疏矩阵,因此可以通过稀疏表示来进行图像压缩、降噪和去模糊等操作。

机器学习:机器学习算法通常需要对数据进行建模,而稀疏表示可以用来构建稀疏模型,从而提高模型的性能。

4. 低秩矩阵与稀疏表示的关系低秩矩阵和稀疏表示之间存在着密切的关系。

一方面,低秩矩阵通常可以表示为稀疏矩阵,另一方面,稀疏矩阵通常也可以表示为低秩矩阵。

因此,低秩矩阵分解和稀疏表示可以相互转化。

5. 低秩矩阵与稀疏表示的应用低秩矩阵和稀疏表示在许多领域都有着广泛的应用,例如:图像处理:图像通常可以表示为低秩矩阵或稀疏矩阵,因此可以通过低秩矩阵分解或稀疏表示来进行图像压缩、降噪和去模糊等操作。

自然语言处理:文本数据通常也可以表示为低秩矩阵或稀疏矩阵,因此可以通过低秩矩阵分解或稀疏表示来进行文本分类、文档聚类和信息检索等操作。

推荐系统:推荐系统通常需要对用户和物品之间的数据进行建模,而低秩矩阵分解或稀疏表示可以用来构建用户-物品矩阵,从而实现个性化推荐。

信号处理:信号通常可以表示为稀疏向量,因此可以通过稀疏表示来进行信号压缩、降噪和去噪等操作。

基于矩阵低秩稀疏分解的图像去噪算法

基于矩阵低秩稀疏分解的图像去噪算法

基于矩阵低秩稀疏分解的图像去噪算法王雪; 靳伍银【期刊名称】《《计算机工程与设计》》【年(卷),期】2019(040)010【总页数】5页(P2955-2958,3048)【关键词】图像去噪; 低秩矩阵恢复; 优化; 正则; 非精确增广拉格朗日乘子法【作者】王雪; 靳伍银【作者单位】兰州理工大学机电工程学院甘肃兰州730050【正文语种】中文【中图分类】TP391.410 引言作为图像处理领域研究多年的经典问题,诸多图像去噪算法不断被提出,典型的有滤波器[1]、非局部去噪[2]、变换域去噪[3]和基于字典学习的图像去噪算法[4]。

这些图像去噪算法及其改进算法在一定程度上提高了图像的质量,但目前仍然没有最佳方法可以完全解决噪声问题。

并且,在考虑去噪算法优劣的评判标准中,其运行时间的快慢和效果的好坏存在冲突,去噪算法的优化问题实则还是寻求最优解的问题。

近几年,随着压缩感知理论在图像处理领域的成功应用,研究者们将向量的稀疏表示推广到矩阵的恢复,得到了低秩矩阵恢复(low-rank matrix recovery,LRMR)及其相关理论[5]。

该理论能够很好实现高维数据的降维,可以用于诸多工程领域,包括人脸识别、背景建模、图像处理和雷达信号处理等。

矩阵低秩稀疏分解算法应用数据矩阵各行列间的冗余性,逼近原始数据,找出其内部结构,主要由鲁棒主成分分析(robust principal component analysis,RPCA)、低秩表示和矩阵补全3部分表示[6]。

RPCA法成功地应用到了机器视觉领域。

Cao等提出一种总变分正则化RPCA模型并将其应用于动态背景下的运动目标检测,取得了很好的效果[7]。

Mattei等提出了一种移动主成分分析法,该算法将点云建模为重叠的两维子空间的集合很好实现了点云去噪[8]。

本文针对低秩恢复去噪对于高斯噪声约束的不足,提出了一种块正则的模型,采用非精确的拉格朗日乘子法对该模型进行求解,通过对比发现该模型与传统算法相比能获得更高的主观与客观质量。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

摘要 为实现稳健的稀疏-低秩矩阵分解,本文首次引入矩阵的S 1/2 范数以诱 导矩阵的低秩性来构建新模型,并在ADMM算法框架下设计了高效的交替阈值迭 代算法。该算法采用增广拉格朗日乘子技术,在迭代过程中交替更新低秩矩阵和 稀疏矩阵。由于这两个矩阵的最优更新具有显式形式,算法整体的计算精度和时 间代价得以控制。 大量的数值模拟实验说明:相较于目前最好的不精确ALM算法, 交替阈值迭代算法的迭代次数与时间代价大幅降低,对噪声更为稳健,分解出的 低秩矩阵的秩与稀疏矩阵的稀疏度更接近于真实值。 在对监控视频进行背景建模 这一实际问题中, 交替阈值迭代算法得到的背景矩阵更为低秩, 更符合问题先验, 且时间代价相较于不精确ALM算法降幅高达一个数量级,这说明新模型与算法能 有效解决相关实际问题。
考虑到S 1/2 模型的目标函数与约束条件关于稀疏矩阵与低秩矩阵是可分的, 本文基于ADMM[12] 算 法思想提出交替阈值迭代算法。 该算法利用增广拉格朗日乘子技术, 在迭代过程中采用交替投影的思 想逐个更新低秩矩阵、 稀疏矩阵和拉格朗日乘子。 低秩矩阵与稀疏矩阵的更新需要求解两个非线性非
2
中国科学 : 信息数学 第 40 卷 第 1 期
A,E ∈Rm×n
min
A

+λ E
l1 F
(3) δ
s.t.
D−A−E
为求解优化问题(2)与(3) ,文献[6]基于目标函数的一阶信息提出了阈值迭代框架,但算法的 收敛速度很慢, 且每次迭代都要进行一次奇异值分解, 无法快速求解大型实际问题。此后, 文献[8]提 出了直接求解原始问题的APG算法和求解相应对偶问题的梯度上升算法,并通过实验说明这两种算 法在处理1000 × 1000的矩阵时相较于阈值迭代算法加速了50倍。 进一步地, 文献[9]基于拉格朗日乘子 技术提出了不精确ALM算法(简称为ALM算法) ,在显著提高计算精度的同时其计算速度是APG算法 的5倍, 这是目前已知的求解大规模问题的最好算法。 稀疏-低秩矩阵分解问题可理解成从稀疏矩阵与低秩矩阵组成的过完备字典中寻找矩阵D的(近 似)最简单表示A + E ,其中稀疏矩阵E 的简单程度用其非零元素的个数即矩阵的l0 范数来刻画,可视 为矩阵在一维意义下的稀疏度,低秩矩阵A的简单程度则用矩阵秩即非零奇异值的个数来刻画,可视 为矩阵在二维意义下的稀疏性。PCP与SPCP受到广泛关注的原因就在于:用矩阵的l1 范数代替l0 范数 来刻画矩阵的一维稀疏度,用核范数即奇异值向量的l1 范数代替矩阵秩来刻画矩阵的二维稀疏度,从 而得到原始组合优化问题(1)的最紧凸松弛形式。 近年来已发展成熟的l1/2 正则化理论[10,11] 则说明: 相较于常用的l1 范数, l1/2 范数可进一步诱导向量 的稀疏性, 在稀疏信号重建中对噪声具有更强的稳健性。 为得到矩阵D更为简单的 (近似) 表示, 本文 将向量的l1/2 范数推广到矩阵, 分别用S 1/2 范数和l1/2 范数来刻画矩阵二维与一维稀疏度, 提出如下实现 (近似)稀疏-低秩矩阵分解的S 1/2 模型:
A,E ∈Rm×n
Байду номын сангаас
min
A
1/2 S 1/2
+λ E
a la F
(4) δ
s.t.
2
D−A−E
1/2 r 其中 A S 1/2 = ( r ) 表示矩阵A所有奇异值{σi }ii= 对应于S chatten p 范数 p = 1 i=1 σi =1 构成向量的l1/2 范数, 2的 m n a 1/a a 情形, 本文简记为S 1/2 范数。 E la = ( i=1 j=1 |Ei j | ) 表示矩阵E 拉直向量的la 范数, 参数a的选取可采 用如下启发式的方法:δ > 0表示在有噪声情况下对矩阵D进行近似分解,取a = 1即用l1 范数刻画矩阵 1 的一维稀疏性; δ = 0表示对矩阵D进行准确分解, 取a = 2 即用l1/2 范数进一步诱导矩阵的一维稀疏性。
k+1 k k +1 k+1
上述交替阈值迭代算法的关键是在每次迭代中交替更新低秩矩阵、 稀疏矩阵和拉格朗日乘子, 直 到满足预先设定的收敛条件。因此,算法整体的计算精度与时间代价在很大程度上取决于(10)中两 个子问题的求解。
2.2 两个子问题的显式最优解
(10)中更新稀疏矩阵和低秩矩阵所需要求解的两个子问题可分别简化成如下形式:
A,E ∈Rm×n
min rank(A) + λ E s.t. D= A+E
l0
(1)
其中rank(A)表示矩阵A的秩, E l0 表示矩阵E 的非零元个数即l0 范数, 参数λ则用于平衡矩阵A的低秩程 度和矩阵E 的稀疏程度。 显然,稀疏-低秩矩阵分解问题通常是病态的 (NP-hard) 。受压缩感知与统计领域相关研究工 作[1,2] 的启发,文献[3]基于“秩-稀疏不相关性”(rank-sparsity incoherence)给出了问题可解的条件,
min X − W
X 2 F 2 F
+λ X
a la 1/2 S 1 /2
(11) (12)
min X − W
X
+λ X
问题(11) 的求解比较简单, 文献[9]已证明a = 1时的最优解为S T λ/2 (W ), 即以 λ 2 为阈值对矩阵W 的 [12] 每个元素进行Soft阈值收缩, 相应的Soft阈值算子 定义为: x − sgn( x)λ, | x| > λ (13) S T λ ( x) = 0, 其它 其中 sgn(·)是符号函数。
1 引言
论 文
基于S 1/2建模的稳健稀疏-低秩矩阵分解
饶过x , 彭毅x , 徐宗本x ∗
x 西安交通大学信息与系统科学研究所, 西安710049 *通信作者E-mail: raoguo2010@, weichiche@, zbxu@ 2012–xx–xx 2012–xx–xx 国家自然科学基金(批准号: 61075054,60975036,11171272)资助项目
凸优化问题, 本文通过将作用于向量的Soft[13] 与Half[10] 阈值算子推广到矩阵情形以给出其最优解的显 式形式, 这从很大程度上保证了所设计算法的高精度与低时间代价特性。 与目前最好的ALM算法相比,大量的模拟实验说明本文所提出的交替阈值迭代算法具有以下优 点: 达到收敛所需迭代次数与时间代价大幅降低, 对噪声有更强的稳健性, 分解出的低秩矩阵的秩更 接近于真实值, 同时算法的可靠性对矩阵A的低秩程度依赖更少。 另外, 在监控视频背景建模[4] 这一实 际应用中, 交替阈值迭代算法能得到更为低秩的背景矩阵, 这一现象更符合建模时利用的先验, 且时 间代价相较于ALM算法降幅高达一个数量级, 这对实际中海量视频数据的快速处理具有重要意义。
关键词
S 1/2 范数,稀疏-低 秩矩阵分解,快速 稳健,交替阈值迭 代
1 引言
在工程应用中,许多复杂的系统通常是由多个简单的系统组成。为更好的理解复杂系统的行为 与性质, 人们往往利用复杂系统的可分解性将其分解成若干简单系统来进行研究。特别地, 当复杂系 统的矩阵表示是一个稀疏矩阵与一个低秩矩阵之和时,分解该复杂系统可描述成稀疏-低秩矩阵分解 问题:已知矩阵D可表示成低秩矩阵A与稀疏矩阵E 之和,A的秩信息与E 的稀疏结构信息未知,如何 由D准确地分解出矩阵A与E?该问题的数学模型如下:
min f ( x) + g(z)
x,z
(5)
s.t. Mx + Nz = c
其中 x ∈ Rn , z ∈ Rm ,M ∈ R p×n ,N ∈ R p×m ,f 、 g为凸函数。 考虑问题的增广拉格朗日乘子形式:
1 Lµ ( x, z, y) = f ( x) + g(z) + y ( Mx + Nz − c) + µ Mx + Nz − c 2 (6) 2 2 其中y表示线性等式约束的乘子,µ > 0表示对不满足线性等式约束的惩罚因子,也称为增广拉格朗日
(7)
显然, ADMM与对偶上升法和乘子法非常相似, 由 x极小化、 z极小化和对偶变量y更新组成, 且对偶变 量的更新步长与乘子法一样取为µ。 虽然ADMM的收敛性理论建立在目标函数 f (·)和g(·)为凸函数的基础上, 但其思想可推广到非凸优 化问题的求解, 本文正是基于这样的推广来设计求解新模型 (4) 的交替阈值迭代算法。 我们先考虑新 模型的增广拉格朗日乘子形式: 1 1/2 2 Lµ (A, E , Y ) = A S +λ E a (8) la + < Y, D − A − E > + µ D − A − E F 1/2 2 其中Y ∈ Rm×n 是线性约束乘子, µ > 0表示对不满足等式约束D = A + E 的惩罚因子, 其取值依赖于模型 (4)中正参数δ, 特别地, 当δ = 0时µ = ∞。为极小化Lµ (A, E , Y ), 我们通过迭代求解如下三个子问题: Ak+1 = arg min Lµ (A, Ek , Yk ) A (9) Ek+1 = arg min Lµ (Ak+1 , E , Yk ) E Yk+1 = Yk + µ(D − Ak+1 − Ek+1 )
饶过等: 基于S 1/2 建模的稳健稀疏-低秩矩阵分解
文献[4,5,6]则提出通过求解如下凸优化问题实现主成分追踪(Principle Component Pursuit,PCP) ,以准 确分解出稀疏与低秩矩阵:
A,E ∈Rm×n
min
A

+λ E
l1
(2)
s .t .
D= A+E
l1 表示矩阵所有元素绝对值之和。
相关文档
最新文档