RPCA图像处理中的矩阵重建的算法与实现
图像编码中的矩阵变换方法解析(六)

图像编码是将图像数据压缩以便于存储和传输的过程。
在图像编码中,矩阵变换方法是一种常用的技术,它可以通过将图像数据进行变换,使得编码后的数据具有更好的压缩性能和重构质量。
本文将对图像编码中的矩阵变换方法进行解析。
一、离散余弦变换(DCT)离散余弦变换(DCT)是一种常用的矩阵变换方法,被广泛应用于图像和视频编码中。
DCT可以将原始图像数据转换为频域信号,通过挑选高能量系数进行编码,从而实现图像数据的压缩。
DCT通过将图像数据分块进行变换来实现图像压缩。
首先,将图像分割为若干个大小相等的块,一般为8×8或16×16。
对于每一个块,DCT将其转换为频域信号,这意味着图像中每个像素的数值将被重新表示为一系列频率分量。
频率分量通常通过对块中的像素值进行加权求和得到,而权重则与变换核有关。
之后,DCT将频率分量按能量大小进行排序,并选择能量较高的分量进行编码。
由于图像的能量往往集中在低频分量上,因此编码器只需要保留低频分量就可以实现较好的压缩效果。
最后,通过逆DCT将编码后的频域信号重构为原始图像。
二、小波变换小波变换是另一种常用的矩阵变换方法,也广泛应用于图像编码和压缩中。
与DCT相比,小波变换更适用于对图像中的局部结构和纹理进行编码。
小波变换使用一系列基函数(小波函数)来表示图像信号,这些基函数具有时空局部性。
通过对图像数据进行小波变换,可以将图像分解为不同尺度和方向上的频域分量,从而允许对不同频率分量进行不同的编码处理。
小波变换的编码过程与DCT类似,都是将图像数据分块进行变换,排序并选择高能量系数进行编码。
但不同的是,小波变换将图像分解为不同尺度和方向上的频域分量,使得图像编码更加灵活,可以针对不同频率分量的特性进行优化。
三、其他矩阵变换方法除了DCT和小波变换,还有许多其他的矩阵变换方法被应用于图像编码中。
例如,离散傅里叶变换(DFT)和正交变换等。
离散傅里叶变换(DFT)可以将图像数据分解为频域信号,但它不如DCT和小波变换在图像编码中应用广泛。
求解矩阵补全问题的三分解方法

求解矩阵补全问题的三分解方法常彩霞;王永丽【摘要】在机器学习、图像处理等研究领域,矩阵补全主要用于恢复一个完整的低秩矩阵.考虑到计算迭代过程中,每一步均需要进行奇异值分解,若矩阵维数过大.则计算复杂度非常高.为降低计算复杂度,本文将矩阵三分解方法应用到鲁棒矩阵补全问题中,并应用交替方向乘子法对其进行求解.最后利用人脸识别的实际数据,通过数值实验验证了方法的有效性.【期刊名称】《山东科技大学学报(自然科学版)》【年(卷),期】2018(037)004【总页数】6页(P77-82)【关键词】矩阵补全;三分解方法;交替方向乘子法;人脸识别【作者】常彩霞;王永丽【作者单位】山东科技大学数学与系统科学学院,山东青岛266590;山东科技大学数学与系统科学学院,山东青岛266590【正文语种】中文【中图分类】TN957.52近年来,矩阵补全问题广泛应用于图像处理、计算机视觉、数据挖掘、模式识别和机器学习等领域。
作为信号与图像处理技术的一个强大的新兴分支,矩阵补全已成为继压缩感知之后的又一种重要的信号获取工具[1]。
一般来说,要根据信号的部分采样元素来精确地恢复出所有元素是非常困难甚至是不可能的。
但是当信号在一组基下是稀疏的且满足一定条件时,压缩感知理论证实了可以通过求解l1最小化问题来精确地恢复所有元素[2]。
类似的,当信号用矩阵形式表示时,要根据其部分元素来恢复所有丢失元素也是很困难的。
针对这一问题,Candès等[3]证明了当矩阵的奇异值具有稀疏性且采样数目满足一定条件时,大多数矩阵可以通过求解核范数最小化问题来精确地恢复所有元素。
由矩阵的部分元素恢复所有元素这一问题称为矩阵补全问题,著名的Netflix问题便是一个典型的矩阵补全问题[4]。
给定不完整的低秩缺失矩阵W∈Rm×n,矩阵补全问题可以描述为如下优化问题:(1)其中A∈Rm×n为待补全的矩阵,Ω是A的p个已知元素的指标集。
基于低秩矩阵恢复与协同表征的人脸识别算法

基于低秩矩阵恢复与协同表征的人脸识别算法作者:何林知赵建民朱信忠吴建斌杨凡郑忠龙来源:《计算机应用》2015年第03期摘要针对人脸图像不完备的问题和人脸图像在不同视角、光照和噪声下所造成训练样本污损的问题,提出了一种快速的人脸识别算法——RPCA_CRC。
首先,将人脸训练样本对应的矩阵D0分解为类间低秩矩阵D 和稀疏误差矩阵E ;其次,以低秩矩阵D 为基础,得到测试样本的协同表征;最后,通过重构误差进行分类。
相对于基于稀疏表征的分类(SRC方法,所提算法运行速度平均提高25倍;且在训练样本数不完备的情况下,识别率平均提升30%。
实验证明该算法快速有效,识别率高。
关键词低秩;稀疏;人脸识别;协同表征;误差矩阵中图分类号 TP391.4; TP18文献标志码 A0引言人脸识别技术作为生物识别技术的一个重要领域,近年来取得了显著发展,已广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域,具有巨大的潜在应用前景。
现实自然图像能被大量冗余的结构元素所稀疏编码[1],由于l0范数和l1范数理论的发展[2-4],稀疏编码和稀疏表征成为解决各类图像恢复及有关逆问题的有效工具之一[5-6]。
2009年,Wright等发表一项引人注目的工作,将稀疏表征应用于人脸识别领域(Sparse Representation based Classification, SRC[7],并取得了极大成功。
该方法具有良好的鲁棒性,即使人脸图像被噪声和误差干扰,也能获得良好的效果。
但由于SRC本身算法的限制,使得其计算开销过大;同时SRC算法用于稀疏表征的训练字典中的观测样本随着视角不同、光照强弱、噪声干扰和数量限制,使得训练字典类间特征模糊且不完备。
Yang等[8]结合稀疏编码和线性空间金字塔匹配技术,应用于人脸识别领域。
Gao等[9]提出核稀疏表征,Yang等[10]提出Gabor特性来减少SRC的计算开销。
另一些关于稀疏表征的应用也应运而生[11]。
图像编码中的矩阵变换方法解析(二)

图像编码是数字图像处理中的重要内容,它涉及到如何将图像的信息以最小的存储空间进行传输和存储。
在图像编码中,矩阵变换方法是一种常用的技术,它通过对图像的像素值进行变换,实现降低图像冗余、提高编码效率的目的。
本文将从图像编码的基本原理入手,分析矩阵变换方法的实现及其优缺点。
1. 图像编码基本原理图像编码的核心思想是利用图像中存在的冗余性,将图像信息转换为一组更加紧凑的数据表示。
冗余分为三类:空间冗余、光谱冗余和心理冗余。
空间冗余是指图像中邻近像素的相关性,光谱冗余是指彩色图像中不同色彩分量的相关性,心理冗余是指由于人类视觉系统的特性而引入的冗余。
矩阵变换方法就是基于这些冗余性质,对图像进行变换,进而提取并压缩图像信息。
2. 矩阵变换方法的实现矩阵变换方法中最典型的是离散余弦变换(Discrete Cosine Transform,DCT)。
DCT将图像划分为多个块,并对每个块进行频域变换。
通过将主要能量集中在低频部分,可以有效地减少高频噪声的影响,并实现对图像信息的压缩。
除了DCT,还有其他矩阵变换方法,如离散小波变换(Discrete Wavelet Transform,DWT)、离散傅里叶变换(Discrete Fourier Transform,DFT)等。
这些方法基于不同的数学基础和变换方式,可以选择最适合特定应用场景的矩阵变换方法。
3. 矩阵变换方法的优缺点矩阵变换方法在图像编码中具有以下优点:(1) 压缩效率高:矩阵变换方法能实现对图像信息的高效压缩,减少存储空间和传输带宽的占用。
(2) 抗噪性好:由于矩阵变换方法将主要能量集中在低频部分,可以有效地降低高频噪声对图像质量的影响。
(3) 适应性强:采用不同的矩阵变换方法可以适应不同类型的图像,实现更好的编码效果。
然而,矩阵变换方法也存在一些缺点:(1) 计算复杂度高:由于需要对图像的每一个块进行变换,矩阵变换方法的计算复杂度较高,在实时编码和解码中可能存在困难。
图像编码中的矩阵变换方法解析(五)

图像编码是指将图像数据转换为可以传输、存储或显示的数字形式。
其中,矩阵变换方法是一种常用的图像编码技术。
在本文中,我们将对图像编码中的矩阵变换方法进行解析,并讨论其原理、应用以及发展趋势。
一、矩阵变换方法的原理矩阵变换方法是图像编码中常用的一种技术,其原理是通过将图像数据转换为一个矩阵,并通过对矩阵进行变换来实现图像的编码和解码。
在矩阵变换方法中,最常见的是离散余弦变换(Discrete Cosine Transformation,DCT)以及离散小波变换(DiscreteWavelet Transformation,DWT)。
离散余弦变换是一种将一维或二维序列转换为频域表示的技术。
它利用余弦函数的周期性和奇偶性质,通过将输入序列与一组基函数进行加权相加,得到频域表示。
离散余弦变换在JPEG(Joint Photographic Experts Group)等图像压缩标准中广泛应用,其通过将图像分割为8x8的块,并对每个块进行离散余弦变换,将高频信息转换为低频信息,从而实现图像的压缩。
离散小波变换是一种将一维或二维信号转换为时频域表示的技术。
它利用小波函数的多尺度分析性质,通过将输入信号与一组基函数进行内积计算,得到时频域表示。
离散小波变换在图像压缩、去噪以及图像增强等方面具有广泛的应用。
相比于离散余弦变换,离散小波变换能够更好地捕捉图像的局部特征,因此在某些应用中具有更好的性能。
二、矩阵变换方法的应用矩阵变换方法在图像编码中具有广泛的应用。
首先,矩阵变换方法可以实现图像的压缩。
通过对图像进行变换,可以将冗余的信息转换为较少的非零系数,从而实现图像的压缩。
其次,矩阵变换方法可以实现图像的增强。
通过对图像进行变换,可以将图像中的低频信息和高频信息分离出来,并对其进行增强处理,从而提高图像的质量和清晰度。
此外,矩阵变换方法还可以用于图像的去噪、特征提取等方面。
三、矩阵变换方法的发展趋势随着科技的不断进步,矩阵变换方法在图像编码中的应用也在不断发展。
基于RPCA的局部运动模糊图像的复原

基于RPCA的局部运动模糊图像的复原作者:朱加豪唐岚瘳若冰来源:《软件》2017年第08期摘要:针对视频中局部运动模糊图像复原问题,首先运用RPCA将运动物体从图像中分离出来,用傅里叶变换得到其频谱图,对频谱图进行边缘检测和Hough Trans form,估算出PSF 值,然后用维纳滤波进行图像恢复并合成到背景中。
从实验结果可以看出,该方法能够很好地分离图像的前景和背景,并将恢复后的前景图像融合到背景中,没有振铃效应产生,取得了很好的复原效果。
关键词:前背景分离;傅里叶频谱;Hough Trans form;点扩散函数估计;维纳滤波中图分类号:TP391文献标识码:ADOI:10.3969/j.issn.l003-6970.2017.08.010本文著录格式:朱加豪,唐岚,廖若冰.基于RPCA的局部运动模糊图像的复原[J].软件,2017,38(8):54-58引言图像复原是数字图像处理中的一个重要分支,也一直是图像处理中的一个难点。
视频里常见的局部运动模糊图像,运动模糊图像是由于摄像设备和对象之间在曝光瞬间的相对运动造成的。
如果采用全局模糊恢复算法进行恢复,会使得恢复图像的背景产生较大的振铃效应,这个时候就需要恢复局部模糊的区域,并将恢复后的区域融合到背景中,因此,需要研究局部运动模糊图像的复原。
目前,恢复局部运动模糊图像的算法包括:维纳滤波法、逆率波法和Richardson-Lucy算法等。
这些恢复算法在计算过程中都需要得到运动物体PSF(即点扩散函数,用该指标来衡量重建后的图像的分辨率)的值,而PSF常常是未知量,所以本文针对这个问题,将运动物体与静止背景进行分离,先对PSF进行估计[KM1],再利用经典的算法进行恢复。
以往采用的局部模糊区域分割的方法,提取出的是包含运动物体的矩形区域,融合后必然造成图像分层现象[15~16]。
本文利用RPCA低秩矩阵恢复的方法,能够很好地分离前景和背景,融合后将得到更好的恢复图像。
基于低秩矩阵恢复交通视频背景重建性能评价

基于低秩矩阵恢复交通视频背景重建性能评价陈川;纪晓佳;陈柘【摘要】For evaluating the performance of low-rank matrixrecovery(LRMR) algorithms in the background reconstruction of traffic video, a series of tests were performed on matrix completion(MC), robust principal component analysis(RPCA) and low-rank representation(LRR) to recover the traffic video background.These algorithms were compared with some traditional background recovery methods including weighted moving average, adaptive background learning and Gaussian mixture model.In the experiments, three situations were taken into account,i.e.illumination changing, different traffic flow and shadow.A group of metrics recommended by SBMI2015 was adopted as evaluation criterions, as well as the common algorithm performance metrics, such as CPU time and algorithm efficiency.Experimental results show that for the slow change traffic scene, LRMR algorithms outperform the traditional methods in overcoming difficult environmental conditions.In overall, RPCA has the best performance among LRMR algorithms in traffic video background reconstruction.%为分析低秩矩阵恢复算法在交通视频背景重建中的性能,分别对基于矩阵补全、鲁棒主成分分析和低秩表示3种低秩恢复方法做交通视频背景重建实验.分别针对环境光照变化、不同车流量、阴影等场景进行测试.为客观评价算法性能,使用SBMI2015推荐的评测指标,结合算法复杂度和执行效率说明算法性能优劣.与目前常用的加权移动平均法、自适应背景学习算法和高斯混合模型法进行对比.实验结果表明,对于缓变交通场景,低秩矩阵恢复算法在处理环境光照变化、较大车流量和克服阴影等不利因素时,较传统背景重建算法有突出优势.综合指标表明,鲁棒主成分分析方法在交通场景背景视频重建中的性能优于其它方法.【期刊名称】《计算机工程与设计》【年(卷),期】2017(038)005【总页数】7页(P1301-1306,1318)【关键词】低秩矩阵恢复;背景建模;矩阵补全;鲁棒主成分分析;低秩表达【作者】陈川;纪晓佳;陈柘【作者单位】海军航空工程学院青岛校区,山东青岛 266041;海军航空工程学院青岛校区,山东青岛 266041;长安大学信息工程学院,陕西西安 710064【正文语种】中文【中图分类】TP391在交通视频目标提取与跟踪算法中,基于背景减法的算法因其简单、运算量小以及便于实时实现等优点获得了广泛的使用,但应用这种算法的前提条件是能够准确地从视频中将场景背景重建出来。
RPCA图像处理中的矩阵重建的算法与实现

矩阵填充的一个著名应用是Netflix推荐系统[4]。Netflix是世界上最大的在线影片租 赁服务商,从2006年10月份开始举办Netflix大奖赛。它公开了大约一亿个1~5级的匿名 电影评级, 来自大约48万个客户对1.8万部电影的评价, 所有个人信息都被从评级数据里 面删除,所以数据集仅包含了影片名称、评价星级和评价日期,没有任何的文本评价内 容。比赛要求参赛者预测Netflix客户分别喜欢什么影片,要把预测的效率相对原推荐系 统Cinematch提高10%以上。这是一个典型的矩阵填充问题,即矩阵的每一行对应某个 用户对电影的评级, 每一列表示某电影在所有用户中的评级, 但是每个用户只可能对一 部分电影进行评价, 所以我们可以通过矩阵填充得出用户对每部电影的喜好程度。 矩阵填充在图像和视频处理中也有重要应用,如视频去噪[25]。由于同一视频中各 帧之间非常相似, 同一帧中的不同图像区域之间也有很大的相似程度, 我们很自然地可 以假定由这些图像块排列而成的矩阵是低秩的, 而根据某一像素值是否背离同一位置处 所有像素的 “均值” 判定该点是否可靠, 进而用矩阵填充来得到那些被噪声污染的像素。 图1.1为[25]中的去噪效果。
subject to Ax = y.
David Donoho、Emmanuel Candes、Justin Romberg和陶哲轩等人最近几年的工作(可 以参见文章[46][7][13][12][10][11])使这个领域有了长足的发展。他们的理论告诉我们: 当感兴趣的信号是可压缩的或者可稀疏表示的, 那么我们可以通过极少的采样精确地获 得该信号。压缩感知中,信号的获取并不是直接测量信号本身,而是采样测量信号与一 个感知矩阵相乘后的信号。而矩阵重建研究的则是在一个矩阵可压缩或可稀疏表示时, 通过观测矩阵的某种线性或非线性运算后的元素, 来精确地重建出该矩阵。通常假定待 1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 其中 X
∗
引言
=
n k=1
σk (X ),σk (X )表示矩阵的第k 大的奇异值。核范数对应于矩阵奇异值
组成的向量的1范数,而秩对应于该向量的0范数,它们之间的不同在于核范数是凸的而 零范数并非数学意义上的范数。于是原来的问题就转化为一个凸优化问题, 但它仍然是 一个比较难计算的问题, 可以考虑通过各种迭代法, 尤其是梯度法进行求解。 1.2.2 矩阵填充的应用举例
后, 如何找到高效的算法是一个非常关键的问题。我们考虑的主要就是解决矩阵重建中 的计算问题。本文的主要贡献体现在以下几个方面: (1)针对计算中的关键问题, 设计和实现了一种收敛速度极快的算法, 称为非精确 的增广拉格朗日乘子法,它是拉格朗日乘子法的一个变种。此算法较以往算法提速明 显,并且具有极好的扩展性,可以应用于矩阵重建的一系列变种,对于实际应用有重要 意义。 (2)对于矩阵重建中涉及到的子问题, 即消耗大部分计算时间的奇异值分解, 本文 亦给出了一种改进的计算部分奇异值分解的算法, 使其能够在矩阵重建算法中很好地工 作。同时给出一套雅可比奇异值分解算法的改进的预处理和优化方案, 使其速度有所提 高。 (3)设计和实现了奇异值分解和矩阵恢复算法的GPU并行版本,使得处理速度得 到进一步的提升。针对处理大规模矩阵的问题,参与设计和实现了矩阵恢复的集群版 本, 使得能处理的矩阵规模不再受到单机内存的限制。
(1.6)
这也是一个凸优化问题, 但由于变量数目众多, 所以如何有效地求解是一个很有意义的
[8]中,John Wright等人展示了矩阵恢复在背景建模、人脸图像处理等问题中的应 用。其中,背景建模利用图片帧与帧之间的相似性,将每帧作为一列排列成一个矩阵, 该矩阵理应具备相对较低的秩。 于是利用稀疏与低秩矩阵分解技术可以将每帧中间相似 的部分和特有的部分分开, 即将背景与前景分离, 见图1.2。同一个人脸的多幅图片排列 而成的矩阵也理应具有较低的秩。利用这一性质,矩阵恢复可以将人脸中的阴影、高光 或被损坏的部分去除,见图1.3。另外, [39]中Yigang Peng等人还将矩阵恢复技术应用到 图片对齐。
其中目标函数为矩阵A的秩以及噪声矩阵E 的零范数,即E 的非零元素的个数,λ表明噪 声所占的权重。同样,这是一个NP-Hard问题,没有有效的算法。于是可以用矩阵的核 范数近似秩, 矩阵的1范数(本文定义为所有元素绝对值的和)来近似零范数, 转化为如 下问题: min A
∗
+ λ E 1,
subject to A + E = D. 问题。 1.3.2 矩阵恢复的应用举例
矩阵填充(Matrix Completion)考虑的是这样一个问题,对于某个矩阵,我们只能 采样得到矩阵的一部分元素, 其它一部分或者大部分元素由于各种原因丢失了或无法得 到,如何将这些空缺的元素合理准确地填充。解决任何问题都是有一定条件的,矩阵填 充也类似, 不可能任何矩阵都可以填充。为解决这个问题我们往往假设这个矩阵是有信 息冗余的,比如是低秩的,也就是说其数据分布在一个低维的线性子空间上。于是可以 通过如下优化问题来实现矩阵填充: min rank(X ), (1.3)
关键词:矩阵重建 矩阵填充 矩阵恢复 奇异值分解 压缩感知
I
第一章
1.1 矩阵重建简介
引言
随着计算机科学与技术在人们生活中的不断普及和发挥日益重要的作用, 人工智能 成为人们越来越关注的问题,它是计算机科学与技术的终极目标。总的来说,人工智能 分为强人工智能与弱人工智能。 强人工智能观点认为有可能制造出真正能推理和解决问 题的智能机器,并且这些机器将被认为是有知觉的、有自我意识的。弱人工智能观点认 为不可能制造出能真正地推理和解决问题的智能机器, 这些机器只不过是智能的, 但是 并不真正拥有智能,也不会有自主意识。强人工智能的研究目前处于停滞不前的状态, 而研究者却已大量制造出看起来像是智能的机器,取得了丰硕的理论和实践上的成果。 这方面的研究先后经历了博弈时期、自然语言理解、知识工程等阶段,目前的研究热点 是机器学习。 机器学习是人工智能最重要的分支之一, 它主要关注于开发一些让计算机可以自动 学习的技术。更具体说,机器学习是一种用于创建数据集分析程序的方法。机器学习跟 统计学有着重要的关系,因为它也是研究数据分析,但是又不像统计学,机器学习关注 的是计算实现的算法复杂度。很多推理问题属于无程序可循难度, 所以部分的机器学习 研究是在开发容易处理的近似算法。机器学习已经有了十分广泛的应用, 如生物特征识 别、 搜索引擎、 医学诊断、 检测信用卡欺诈、 证券市场分析、 DNA序列测序、 语音和手写 识别、计算机视觉、战略游戏和机器人应用等。机器学习中现有的一些关键技术包括人 工神经网络、决策树、线性判别分析、支持向量机等等。最近两年,基于凸优化的矩阵 重建技术作为一种有效的数据分析工具, 在机器学习中扮演着重要的角色。 讲到矩阵重建,不得不提到压缩感知,它们之间有着很大的关联。压缩感知已经存 在了四十年, 是一种利用稀疏或可压缩的信号进行信号重建的技术。它是解如下优化问 题: min x 1, (1.1)
subject to Ax = y.
David Donoho、Emmanuel Candes、Justin Romberg和陶哲轩等人最近几年的工作(可 以参见文章[46][7][13][12][10][11])使这个领域有了长足的发展。他们的理论告诉我们: 当感兴趣的信号是可压缩的或者可稀疏表示的, 那么我们可以通过极少的采样精确地获 得该信号。压缩感知中,信号的获取并不是直接测量信号本身,而是采样测量信号与一 个感知矩阵相乘后的信号。而矩阵重建研究的则是在一个矩阵可压缩或可稀疏表示时, 通过观测矩阵的某种线性或非线性运算后的元素, 来精确地重建出该矩阵。通常假定待 1
中国科学院硕士学位论文—— 矩阵重建的算法与实现 恢复的矩阵是低秩的, 通过以下优化问题求解 min rank(X ), (1.2)
subject to A(X ) = b.
本质上来讲,低秩和稀疏都说明信号可由更精简的形式来表达。在这种情况下,用很少 的采样就可以完成信号的重建。 在很多的具体问题中,信号或者数据往往可以用矩阵来表示,使得对数据的理解、 建模、 处理和分析更为方便。然而这些数据经常面临缺失、 损坏、 受噪声污染等等问题。 如何在各种情况下得到干净、 准确、 结构性良好的数据, 就是矩阵重建所要解决的问题。 大致来讲, 矩阵重建分为矩阵填充 (Matrix Completion) 和矩阵恢复 (Matrix Recovery) 两大类。前者主要研究如何在数据不完整的情况下将缺失数据进行填充, 后者主要研究 在某些数据受到严重损坏的情况下恢复出准确的矩阵。无论是这个问题本身, 还是其应 用, 都是最近的研究热点。最近的研究主要集中在矩阵重建在何种情况下可以准确地实 现[8][9]、 有没有快速的算法解决矩阵重建问题[6][42]和矩阵重建的应用[39][25][40]。 接下来我们具体介绍什么是矩阵填充,什么是矩阵恢复,以及它们各自有哪些应 用。 1.2 1.2.1 矩阵填充 矩阵声污染前的图片, 中间为被噪声污染 后的图片, 右图为通过矩阵填充去噪后的图片
1.3 1.3.1
矩阵恢复 矩阵恢复的定义
矩阵恢复,最早由John Wright等人提出[43],又称为Robust PCA 或者稀疏与低秩 矩阵分解,是指当矩阵的某些元素被严重破坏后,自动识别出被破坏的元素,恢复出原 3
矩阵填充的一个著名应用是Netflix推荐系统[4]。Netflix是世界上最大的在线影片租 赁服务商,从2006年10月份开始举办Netflix大奖赛。它公开了大约一亿个1~5级的匿名 电影评级, 来自大约48万个客户对1.8万部电影的评价, 所有个人信息都被从评级数据里 面删除,所以数据集仅包含了影片名称、评价星级和评价日期,没有任何的文本评价内 容。比赛要求参赛者预测Netflix客户分别喜欢什么影片,要把预测的效率相对原推荐系 统Cinematch提高10%以上。这是一个典型的矩阵填充问题,即矩阵的每一行对应某个 用户对电影的评级, 每一列表示某电影在所有用户中的评级, 但是每个用户只可能对一 部分电影进行评价, 所以我们可以通过矩阵填充得出用户对每部电影的喜好程度。 矩阵填充在图像和视频处理中也有重要应用,如视频去噪[25]。由于同一视频中各 帧之间非常相似, 同一帧中的不同图像区域之间也有很大的相似程度, 我们很自然地可 以假定由这些图像块排列而成的矩阵是低秩的, 而根据某一像素值是否背离同一位置处 所有像素的 “均值” 判定该点是否可靠, 进而用矩阵填充来得到那些被噪声污染的像素。 图1.1为[25]中的去噪效果。
中国科学院硕士学位论文—— 矩阵重建的算法与实现 矩阵。 同样, 假定原矩阵有非常良好的结构, 即是低秩的; 另外, 假定只有很少一部分元 素被严重破坏, 即噪声是稀疏的但大小可以任意。于是矩阵恢复可用如下优化问题来描 述: min rank(A) + λ E 0 , subject to A + E = D, (1.5)
图 1.2: 背景建模 左图为视频中的某一帧, 中图为通过矩阵恢复 得到的背景, 右图为通过矩阵恢复得到的前景
1.4
本文的贡献 前面简单介绍了矩阵填充和矩阵恢复的具体问题,将矩阵重建建模成凸优化问题 4
第一章
引言
图 1.3: 人脸处理 左图为人脸图片, 中图为通过矩阵恢复处理 后的人脸, 右图为通过矩阵恢复得出的噪声
subject to Xij = Mij , (i, j ) ∈ Ω,
其中Ω是已知元素下标的集合。这个模型的意义是说,将空缺的元素填充之后使得矩阵 的结构尽可能好,即秩尽可能低。然而不幸的是,这是一个NP-Hard的问题,在理论和 实践中, 均只存在指数复杂度 (相对于矩阵维数n) 的算法。 我们知道, 一个矩阵的秩r与 它的非零奇异值的个数相同。于是有一个选择是用矩阵的奇异值的和,即核范数,来近 似地替代矩阵的秩: min X ∗, subject to Xij = Mij , (i, j ) ∈ Ω, 2 (1.4)