稀疏表示的字典_文献翻译

合集下载

2019年托福高频词汇表:sparse什么意思(附翻译及例句).doc

2019年托福高频词汇表:sparse什么意思(附翻译及例句).doc

2019 年托福高频词汇表: sparse什么意思(附翻译及例句 )sparse 英[sp ɑ:s]美[spɑ:rs]adj. 稀疏的 ; 稀少的稀疏的 ; 稀疏 ; 稀少的 ; 成员稀少疏落词形变化:比较级: sparser比较级:sparsest派生词: sparsely sparseness sparsity双语例句1 . He was a tubby little man in his fifties, with sparsehair.他 50 来岁,头发稀疏,身材矮胖。

来自柯林斯例句2 . Many slopes are rock fields with sparse vegetation.很多山坡都是石头地,植被稀疏。

来自柯林斯例句3 . The sparse line of spectators noticed nothing unusual.那一排稀稀落落的观众没留意到任何不寻常之处。

来自柯林斯例句4 . Traffic was sparse on the highway.公路上车流稀少。

来自柯林斯例句5 . the sparse population of the islands那些岛上零星的人口来自《词典》网络释义-sparse1.稀疏的rebuff 断然拒绝 sparseadj.稀少的;稀疏的spar水疗2.稀疏...索引4.3获取相关矩阵的信息 4.4 改变矩阵的大小和形状 4.5 矩阵元素的移位和排序 4.6 对角矩阵 4.7 空矩阵,标量和向量 4.8 完全矩阵和稀疏 (sparse) 矩阵 4.9 多维数组第 5 章 M文件程序设计第 6 章程序调试和优化第7 章错误处理第8 章数据输入和输出第9 章使用数据工具箱函数第 10 章.3.稀少的rebuff 断然拒绝 sparseadj.稀少的;稀疏的spar水疗4 .成员稀少疏落名字释义—耿希炯...假借为“稀”。

稀少〖rare;scarce〗稀疏,成员稀少疏落。

浅析稀疏表示

浅析稀疏表示

2、设计与构建有效的图像稀疏表示字典
最佳方向法(Method of Optional Directions, MOD):找到一个字 典D和稀疏表示矩阵A使得目标函数的误差最小,如下式:
ai—稀疏系数矩阵A的第i列。 优化的过程包括稀疏系数的更新和字典更新两个阶段。稀疏系数更 新时,对每一个向量xi,用任一匹配追踪算法求解其稀疏系数,字典更 新时考虑信号的表示误差:
x di ai Da s.t. min||a||0 (1)
i 1
L
(2)
(3) 公式(3)本质上式组合优化问题。
1、获取稀疏的分解系数方法
对于组合优化的问题,很难求出来,所以公式(3)要转化为公式(4),对其 进行求解: (3) (4)
目前有很多方法对公式(4)进行求解: 贪婪算法:匹配追踪(Matching Pursuit,MP) 正交匹配追踪(Orthogonal Matching Pursuit,OMP) 子空间追踪(Subspace Pursuit,SP) 松弛算法:最小绝对收缩和选择操作算法(Least Absolute Shrinkage And Selection Operator,LASSO) 最小角回归算法(Least Angle Regression,LAR) 非凸算法:迭代重新加权算法 Beyesian算法
2、设计与构建有效的图像稀疏表示字典
图像信号自身在空间域通常是不稀疏的,但在特定的字典下,其分解系数可 能会变得稀疏,因此字典的设计也是稀疏表示中的一个重要问题。当前构造字典 的方式有以下几种: (1)直接使用现有的正交基作为稀疏表示字典,如,离散的DCT字典,小波 字典等,这类字典能够实现快速变化但是不能充分地对信号进行稀疏分解。 (2)将正交基,紧框架系统之间进行组合,从而能够反映图像中不同的几何 结构,可以形成更稀疏的表示。 (3)通过学习的方法获得稀疏字典。其基本思想是由一些训练样本通过机器 学习得到特定的稀疏表示字典。常用的方法有最佳方向法(Method of Optional Directions, MOD),K-SVD法,以及在线学习算法(Online Learning)等。

稀疏表示

稀疏表示
2 2 2 x k y x g K ( ) exp( ) cos(2 ) 2 2
( x x0 ) cos ( y y0 ) sin x
( x x0 ) sin ( y y0 ) cos y
Gabor函数
1、对X基于字典D稀疏表示结果α进行一些处理: 空间金字塔的引入&最大池输出方法
2、加入监督学习的字典训练
这里的字典学习的目的是为了分类,已知一组训练样本, 其label也人工给定,首先我们需要训练字典。在基于学习 的方法中我们给定了一个目标函数:
min || D - X || || ||1
3、1996年,B.A.Olshausen和D.J.Field在Nature上发表了一篇 题为“Emergence of simple-cell receptive field properties by learning a sparse code for nature images”的重要论文,他们的 实验结果表示人类视觉系统只997年,这两位又提出了超完备基的 稀疏编码算法。
基于参数化的方法,介绍怎么样利用Gabor函数来生成 原子构成字典: 人类的视觉系统能够自适应于自然环境中输入刺激的统 计特性,视觉皮层中的大部分神经元只对特定的刺激才具有 最优响应,通过视觉皮层中不同感受野的神经元的层次处理 实现了对于自然图像的稀疏编码。人类神经元对于外部刺激 的响应特性如下图:
在上面的Gabor函数中有七个参数,根据参数化的方法来 构造字典。
尺度不变,方向改变
方 向 不 变, 尺 度 改 变
上面的那张图,只是涉及到尺度和方向的变化,在 Gabor函数中是有7个参数的,对这7个参数在一定参数范 围内进行冗余采样,这样就会生成一地数量的原子构成冗 余的Gabor字典。 字典构造完成,接下来进行稀疏分解。贪婪算法中的 MP是一种迭代的递归算法,每一步从字典D中选择一个 与残差信号 r (初始为原始图像)最匹配的原子,每一步 都使得信号的逼近更为优化。

Matlab中的稀疏表示和字典学习技巧

Matlab中的稀疏表示和字典学习技巧

Matlab中的稀疏表示和字典学习技巧引言稀疏表示和字典学习技巧是图像处理和机器学习领域中经常使用的重要技术。

在Matlab中,有着丰富的工具箱和函数可以实现稀疏表示和字典学习,为我们提供了强大的能力来处理高维数据。

本文将介绍Matlab中的稀疏表示和字典学习技巧,并通过一些实例来说明它们的应用。

一、稀疏表示技术稀疏表示是指通过一组基向量的线性组合来表示数据的一种方法。

在Matlab中,我们可以使用字典工具箱(Dictionary Toolbox)来实现稀疏表示。

稀疏表示可以应用于各种领域,如图像处理、信号处理和数据压缩等。

在图像处理中,稀疏表示可以用于图像压缩和图像恢复等任务。

通过选择合适的字典和优化算法,我们可以将一张高分辨率图像表示为一组稀疏的线性组合。

在Matlab中,我们可以使用稀疏编码函数(sparse coding function)来实现这个过程。

具体步骤包括:选择字典、计算稀疏系数和重构图像。

通过调整字典的大小和优化算法的参数,我们可以得到不同精度的稀疏表示结果。

在信号处理中,稀疏表示可以用于信号降噪和信号恢复等任务。

通过将信号表示为一组稀疏的基向量的线性组合,我们可以有效地提取信号的特征和重建信号。

在Matlab中,我们可以使用稀疏表示工具箱(Sparse Representation Toolbox)来实现这个过程。

具体步骤包括:选择字典、计算稀疏系数和重构信号。

通过调整字典的大小和优化算法的参数,我们可以得到更准确和稳定的信号表示结果。

二、字典学习技巧字典学习是指通过训练数据来学习最优的字典的一种方法。

在Matlab中,我们可以使用字典学习工具箱(Dictionary Learning Toolbox)来实现字典学习。

字典学习可以应用于各种领域,如图像处理、文本处理和语音处理等。

在图像处理中,字典学习可以用于图像分类和图像重构等任务。

通过学习最优的字典,我们可以得到更好的特征提取和重构结果。

第12章 稀疏表示及其应用

第12章 稀疏表示及其应用
• 当构造图像的稀疏表示时需要用到比基更大的字典,通过 这种冗余字典来实现信号的稀疏表示
典型的分析式字典分类
• 非自适应的框架字典 – DCT基、短时傅里叶时频框架字典、离散小波时频框 架字典、小波包字典、具有几何不变性的小波字典、 方向小波字典、curvelet、wedgelet、ridgelet和 contourlet
S f
,u f , g k n
k ,un k ,nZ
信号f 完全和稳定的表示?
gk,n t g t nu0 eik0t
Daubechies给出了窗函数取高斯函数 g(t) e 1/4 t2/2 时(
此时 u0 = 0 )的主要结论:
离散小波时频框架字典
– 线性变换
f ,
是稀疏的

– f在基字典下有稀疏的合成,具体地,取M项绝对值最
大的系数,相应M个原子的线性组合构成信号f的M-逼

fM fT
f ,
T
T = : f , T
超完备字典
学习式字典
• 1996年Olshausen与Field在Nature杂志上发表的论文是字 典学习领域的奠基性工作。
则方向平移不变族就构成框架。
二维 Gabor 滤波器(函数)
G x, y
1
1

x2

y2

e e 2

2 x

2 y

i0xv0 y
2 x y
• 在一定的约束条件下[110],上述二维Gabor小波族可以通
过对如下母Gabor小波旋转和伸缩得到:

x, y
压缩传感(Compressed Sensing, CS)理论

稀疏表示的字典_文献翻译.docx

稀疏表示的字典_文献翻译.docx

从统计学的观点来看, 这个过程把数据当作服从低维高斯分布来建模,因此对于 高斯数据最有效。 与傅里叶变换相比,KLT 在表示效率上更优。然而,这个优势是用非结构性 和明显更复杂的转换换来的。 我们将会看到,这种在效率与自适应性之间的折衷 在现代字典设计方法学中仍扮演着重要的角色。 B. 非线性变革与现代字典设计元素 19 世纪 80 年代,统计学的研究领域出现的新的有力方法,即稳健统计。稳 健统计提倡将稀疏作为大范围的复原与分析任务的关键。 这种理念来源于经典物 理学,发展于近年的信息论,在指导现象描述上提升了简易性与简明性。在这种 理念的影响下,80 年代与 90 年代以搜寻更稀疏的表示和更高效的变换为特征。 增强稀疏性需要偏离线性模式,朝更灵活的非线性规划发展。在非线性的实 例中,每个信号都可以使用同一字典中一组不同的原子,以此实现最佳近似。因 此,近似过程变为
其中������������ (������)是分别适用于每个信号的索引集。 非线性观点为设计更新,更有效的变换铺平了道路。在这个过程中,许多指
导现代字典设计的基本概念形成了。我们将沿着历史的时间线,回溯许多最重要 的现代字典设计概念的出现。大部分概念是在 20 世纪的最后 20 年间形成的。
定位:为了实现稀疏性,变换需要更好的定位。受到集中支撑的原子能基于
其中w(∙)是一个定位在 0 处的低通窗口函数, 且α 和β 控制变换的时间和频率分 解。这种变换的很多数学基础都由 Daubechies,Grossman 和 Meyer 在 19 世纪 80 年代提出。他们从框架理论的角度研究该变换。Feichtinger 和 Grochenig 也是 Gabor 变换数学基础的建立者,他们提出了广义的群理论观点。离散形式变 换的研究及其数值实现紧接着在 19 世纪 90 年代早期开始进行。Wexler,Raz, Qian 和 Chen 对该研究做出了重要贡献。 在更高的维度下, 更复杂的 Gabor 结构被研究出来。这些结构通过改变正弦 波的朝向增加了方向性。 这种结构在 Daugman 的工作中得到了大力支持。他在视 觉皮质的简单细胞接受域中发现了方向性的类 Gabor 模式。 这些结果在 Daugman, Porat 和 Zeevi 的工作的引导下促进了图像处理任务中变换的调度。 现在, Gabor 变换的实际应用主要在于分析和探测方面,表现为一些方向滤波器的集合。

浅析稀疏表示分析解析

浅析稀疏表示分析解析

3、稀疏表示的应用 系数表示在图像处理的反问题中,主要有三种应用: 1、图像去噪:主要适用于加性噪声 2、图像超分辨率的重建:训练高低分辨率图像的两个字 典(有的文章给出两个字典之间的关系系数)。 3、图像修复:利用待修复图像内的有效信息,采用K-SVD 算法对所有不重叠取块后的图像块进行训练,得到与待修复图 像相适应的新字典,求出稀疏系数,更新图像块,修复受损图像。
Original clean image
Noisy image, 20.1578dB Clean Image by Adaptive dictionary, 29.6051dB
3、稀疏表示的应用(稀疏去噪)
原始图像
JPEG失真图像 psnr=21.6077
用ksvd训练出的字 典处理后的图像 psnr=22.1077
i 1
L
x N×1
D N×L a L×1
其中:D—过完备字典, di—原子, a—稀疏表示的系数, a只有有限个(k个)非零元素,则称a是 k稀疏的。
1、获取稀疏的分解系数方法
已知信号x和字典D求解稀疏系数a是求解欠定方程组的问题,可以得到无数多 个解,在这些解构成的解空间中求最稀疏的解,就是要求的系数向量a中的非零向 量最少,稀疏问题就可以表示为求解公式(2),在实际中,我们还要将公式(2) 转换成公式(3)的形式,转化为稀疏逼近问题来求近似解。
式中 K —字典的原子总数; k —要更新的原子索引。
从Ek中除去没有用到原子dk(J-1)的列得到EkR,对EkR进行SVD分解从而更新 dk(J-1),同时更新aRk。
2、设计与构建有效的图像稀疏表示字典
DCT方法训练字典
MOD方法训练字典
K-SVD方法训练字典

基于自编码器和稀疏表示的单样本人脸识别

基于自编码器和稀疏表示的单样本人脸识别

在许多现实的人脸识别场景,比如护照验证和登机口身份识别,通常很少甚至只有一个训练图像,而测试样本可能包含各种剧烈的脸部变化如光照、表情和遮挡,这就是所谓的单样本人脸识别问题。

如何在含有剧烈类内变化的人脸识别场景中取得较好的识别效果,成为当前许多人脸识别工作研究的重点问题。

针对这个问题,研究者们提出了许多单样本人脸识别的解决方案。

受到稀疏表示的启发,Wright等[1]首次将基于稀疏表示的分类方法(Sparse Representation Classification,SRC)用于人脸识别中并取得了很好的效果。

基于SRC的人脸识别方法背后的基本假设是待分类的人脸基于自编码器和稀疏表示的单样本人脸识别王钰1,2,刘凡1,2,王菲1,21.河海大学海岸灾害及防护教育部重点实验室,南京2100982.河海大学计算机与信息学院,南京210098摘要:单样本人脸识别因其在现实生活中的广泛应用而成为人脸识别领域的热门话题。

单张训练样本条件下训练样本的缺少和复杂的类内人脸表情、光照、遮挡变化给单样本人脸识别研究带来困难。

传统的基于稀疏表示的人脸识别方法需要大量的训练样本构成过完备的字典,因而在单样本条件下识别效果明显下滑。

针对这一问题,提出一种基于有监督自编码器的带变化人脸样本生成方法,在保留身份信息的同时自动生成带变化的人脸图像用于单样本条件下的字典扩充,一定程度上缓解了单样本条件下的欠采样问题,弥补了训练集和测试集间的人脸变化信息差异,使得传统的稀疏表示方法能够适用于单样本人脸识别问题。

在公共数据库上的实验结果不仅证明了该方法的有效性,而且对测试集中不同的人脸变化也展现出了较强的鲁棒性。

关键词:单样本人脸识别;有监督自编码器;稀疏表示;字典学习文献标志码:A中图分类号:TP399doi:10.3778/j.issn.1002-8331.2007-0312Autoencoder Based Sparse Representation for Single Sample Face RecognitionWANG Yu1,2,LIU Fan1,2,WANG Fei1,21.Key Laboratory of Ministry of Education for Coastal Disaster and Protection,College of Computer Information,HohaiUniversity,Nianjing210098,China2.College of Computer and Information,Hohai University,Nanjing210098,ChinaAbstract:Single sample face recognition has become a hot topic in the field of face recognition since its wide application in real life.The lack of training samples and the dramatic inter-class variations of facial expression,illumination,and occlusion make it difficult to study.The traditional face recognition method based on sparse representation needs a large number of training samples to construct an over-complete dictionary,so the recognition accuracy is significantly dropped under the single sample condition.To solve this problem,a supervised autoencoder based method is proposed to generate faces with variations,which can automatically generate face images with variations while preserving identity information for dictionary expansion under the condition of a single sample.To a certain extent,this method can alleviate the problem of under sampling under the condition of a single sample,and make up for the difference of face variance information between the training set and test set,making the traditional sparse representation method suitable for single sample face recognition.Experimental results on public databases not only prove the effectiveness of the method but also show strong robustness to different face variations in the test set.Key words:single sample face recognition;supervised auto-encoder;sparse representation;dictionary learning基金项目:江苏省自然科学基金(BK20191298);河海大学海岸灾害及防护教育部重点实验室开放基金(201905)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

稀疏表示建模的字典设计摘要:数据的稀疏和冗余表示建模可以将信号描述为预先规定的字典中的少数原子的线性组合。

其中,字典的选取对于信号的建模是至关重要的。

通常可采用两种方法选取一个合适的字典:i)基于数据的数学模型建立稀疏字典,ii)选择在训练集上有最佳表现的学习字典。

在此论文中,我们将描述这两种范例的演变。

作为第一种方法的例证,我们将涉及小波、小波包、轮廓波以及曲线波等分析方法。

所有方法都致力于为信号与图像设计能建立有效字典1-D和2-D的数学模型。

字典学习采用了另一种路线,将字典与一系列需表示的示例相关联。

1.引言自然信号的数字化采样过程将它表示为一系列空间或时间中的脉冲函数的和。

这种表示虽然在显示或重放时提供了方便,却不利于我们进行分析。

信号处理技术通常需要更有意义的表示方法,以抓住需识别信号的有用特征—用于识别时,表示方法应该突出被处理信号的特征;用于降噪时,表示方法应该有效地分离信号和噪声;用于压缩时,表示方法应该只用很少的系数来捕捉大部分的信号。

有趣的是,在很多案例中这些看似不同的目标达到了一致,都以简化作为核心要求。

信号的表示牵涉到字典的选取。

字典是一组用于分解信号的基本信号或原子。

每个信号都可以被独一无二地表示为字典原子的线性组合。

在最简单的实例中,字典是正交的,且表示系数可以用信号和原子的内积来计算;在不正交的时,系数是信号和字典的逆的内积,这种字典也被表述为双正交基字典。

许多年来,正交基与双正交基字典由于它们在数学上的简易性而占有主导地位。

然而,这些字典的弱点,也即它们有限的表达能力,最终覆盖了其简易性的优势。

这促进了更新的过完备字典的发展。

过完备字典的原子多于信号的维度,因此能表示更宽范围的信号现象。

为了减小失去正交基变换提供的优良性能带来的损失,过完备字典的发展是谨慎的。

很多字典形成了紧框架,确保了将信号表示为原子的线性组合的表示过程仍能被确定为信号和字典的内积。

另一种方法称为最优基算法。

它使用一个特定的字典结构,使字典可以成为这样的原子集合--从中可以高效地选取正交子字典。

有关通用过完备字典的研究主要开始于过去的十年中,且仍在紧张地进行中。

这样的字典在信号的表示定义中引进了一种有趣的不确定性。

我们设字典,其中的列构成了字典的原子,且。

用字典表示一个的信号有两种途径,一种是分析途径,信号用它自身与原子的乘积来表示,, (1)另一种是综合途径,信号被表示为原子的线性组合,. (2)这两种定义在完备情况时是完全一致的,这时分析字典和综合字典是双正交的。

然而在通常情况下,这两种字典是显著不同的。

分析字典方法提出了另一个有趣的问题:当D过完备时,满足(2)的表示的族实际上是无限大的,它的自由度与D的零空间的维数相同。

这允许我们参考价值函数,来寻找信息量最大的信号表示方法:满足 . (3)实用的的选取提高了表示的稀疏性,意味着我们希望选取的系数能快速衰减。

问题(3)常被称为稀疏编码。

我们可以通过在鲁棒补偿函数中选择,我们将这种函数宽松地定义为对大系数宽容而对小的非零系数极其不利的函数。

相关的例子有Huber函数以及各种成本函数,其中0。

这三种问题,尤其是(3)问题,在过去的几年中都被广泛地研究。

这也反过来促进了新的使用通用过完备变换的信号处理算法的发展。

然而,在从理论到实践的过程中,要面对为给定任务选择合适字典的挑战。

早前的工作利用了传统的字典,如傅里叶字典和小波字典。

它们用于处理1维信号简单实用。

然而,这些字典不足以表示更复杂的自然高维信号数据。

所以人们开始寻找新的改进字典。

在不断上升的需求下,各种字典被研究出来。

这些字典从两种来源中产生。

一种是数据的数学模型,另一种是一组数据的实现。

第一种字典以分析公式和快速的隐式实现为其特征。

第二种字典实现了增强的灵活性以及适应特定信号数据的能力。

最近,对于居于两种字典之间的字典的研究逐渐兴起。

这种新的字典集合了前两种字典的优点。

这种结构刚刚开始出现,相关的研究还在进行中。

在这篇论文中,我们将介绍指导现代字典设计的基本概念。

在第二部分中,我们将以历史的观点,追溯字典设计方法学从19世纪60年代到19世纪90年代的演变,主要介绍概念上的进展。

在第三部分和第四部分我们会综述分析字典与训练字典的先进技术。

我们会在第五部分作总结并得出结论。

2.变换设计的历史A.信号变换:线性时代信号变换随着信号处理的实施而出现。

在19世纪60年代,早期信号处理的研究者们重点关注了线性时不变运算符,它们是操作模拟与数字信号的简易且直观的工具。

在这种环境下,傅里叶变换自然地作为对角线化这些运算符的基础而出现了,并立即成为了分析和设计这些运算符的主要工具。

随着1965年Cooley和Tukey将快速傅里叶变换引入,这种变换获得极大的推广。

傅里叶基在全局频率组成方面描述一个信号。

它将信号描述为正交波形的结合。

信号通过投影到K最低频率的原子上的方法来近似到这个基上。

这种方法具有很强的平滑和降噪效果。

因此傅里叶基能高效地描述一致平滑信号。

然而,定位能力的不足使它表示断点时较困难,在所有频率上产生大数值的系数。

因此傅里叶变换通常产生在实际应用中过于平滑的结果。

对于有限信号,傅里叶变换隐式地信号的周期延拓,这在信号的边界处导致了不连续性。

离散余弦变换(DCT)是假定信号反对称延拓的结果,这会导致连续的边界,因此产生一个更有效的近似。

DCT由于有产生非复杂系数这个额外的优点,在实际应用中通常是首选。

在傅里叶基上的信号近似很快被认为是线性近似的特定实例:假设在上有一个基,信号通过投影到一个确定的子集,即的基元素上进行线性近似。

, (4)其中通常是双正交基(在标准正交的情况下)。

这个过程是一个未完成的的线性变换。

且在正确选择了基的情况下,可以实现压缩,即仅用很少系数捕捉信号的有效部分的能力。

事实上,压缩的概念将被稀疏代替,虽然这两者是密切相关的。

压缩优化是更有效的表示方法持续发展的主要推动力。

在19世纪70年代和80年代,一个新的极具吸引力的压缩资源被发现:数据本身。

关注集中于在前半个世纪被发展出来的一组统计工具。

它们被称为Karhunen-Lo ève变换(KLT),或主分量分析(PCA)。

KLT是一种线性变换,它可以适用于表示服从已知的确定分布的信号。

适用过程适合低维的子空间中,最小化逼近误差的数据。

具体地,给定数据协方差矩阵Σ(已知的或经验上的),KLT 原子是Σ的本征值分解的前K个特征向量,从统计学的观点来看,这个过程把数据当作服从低维高斯分布来建模,因此对于高斯数据最有效。

与傅里叶变换相比,KLT在表示效率上更优。

然而,这个优势是用非结构性和明显更复杂的转换换来的。

我们将会看到,这种在效率与自适应性之间的折衷在现代字典设计方法学中仍扮演着重要的角色。

B.非线性变革与现代字典设计元素19世纪80年代,统计学的研究领域出现的新的有力方法,即稳健统计。

稳健统计提倡将稀疏作为大范围的复原与分析任务的关键。

这种理念来源于经典物理学,发展于近年的信息论,在指导现象描述上提升了简易性与简明性。

在这种理念的影响下,80年代与90年代以搜寻更稀疏的表示和更高效的变换为特征。

增强稀疏性需要偏离线性模式,朝更灵活的非线性规划发展。

在非线性的实例中,每个信号都可以使用同一字典中一组不同的原子,以此实现最佳近似。

因此,近似过程变为其中是分别适用于每个信号的索引集。

非线性观点为设计更新,更有效的变换铺平了道路。

在这个过程中,许多指导现代字典设计的基本概念形成了。

我们将沿着历史的时间线,回溯许多最重要的现代字典设计概念的出现。

大部分概念是在20世纪的最后20年间形成的。

定位:为了实现稀疏性,变换需要更好的定位。

受到集中支撑的原子能基于本地信号的特征提供更灵活的表示,并限制不规则的效应。

观察发现这种效应是大系数的主要来源。

本着这种精神,一种首先被采用的结构是短时傅里叶变换(STFT),它作为傅里叶变换的自然延伸出现。

在STFT中,傅里叶变换被局部(可能重叠)地应用于信号的某些部分,从而展示出信号的时间-频率(或空间-频率)描述。

JPEG图像压缩算法就是STFT的一个例子。

在19世纪80年代与90年代,STFT被广泛地研究与推广,被更多地称作Gabor变换,为表示对在1946年最先建议时间-频率分解Dennis Gabor 的敬意。

Gabor的工作在19世纪80年代被Bastiaans和Janssen各自独立地重新发现,他们当时在研究扩展的基本性质。

一种1维的Gabor字典由一组被加窗的波形构成。

其中是一个定位在0处的低通窗口函数,且α和β控制变换的时间和频率分解。

这种变换的很多数学基础都由Daubechies,Grossman和Meyer 在19世纪80年代提出。

他们从框架理论的角度研究该变换。

Feichtinger 和Grochenig也是Gabor变换数学基础的建立者,他们提出了广义的群理论观点。

离散形式变换的研究及其数值实现紧接着在19世纪90年代早期开始进行。

Wexler,Raz, Qian和Chen对该研究做出了重要贡献。

在更高的维度下,更复杂的Gabor结构被研究出来。

这些结构通过改变正弦波的朝向增加了方向性。

这种结构在Daugman的工作中得到了大力支持。

他在视觉皮质的简单细胞接受域中发现了方向性的类Gabor模式。

这些结果在Daugman,Porat和Zeevi的工作的引导下促进了图像处理任务中变换的调度。

现在,Gabor变换的实际应用主要在于分析和探测方面,表现为一些方向滤波器的集合。

多分辨率:19世纪80年代最重大的概念上的进展是多尺度分析的出现。

人们注意到自然信号,尤其是图像信号,在各种不同规模下均呈现出有意义的结构,并且可以通过多分辨率重建被极有效地分析和描述。

一种最简单与最著名的多尺度结构是在1984年由Burt和Adelson提出的拉普拉斯金字塔。

拉普拉斯金字塔将一幅图像由一系列不同的图像表示,其中每一幅都有不同的大小和大致不同的频带。

然而,在19世纪80年代的后半期,信号处理领域因为一种新的有力工具而格外兴奋。

这种工具叫做小波分析。

1984年,在一份具有开创性的工作中,Grossman和Morlet提出了在一个单一基本函数的基础上进行一系列翻译和扩张,并在这样形成的序列的基础上进行信号扩张,具有如下形式:这个简单的想法使信号处理与谐波分析领域着迷。

在Meyer, Daubechies, Mallat及其他人的一系列极有影响力的工作下,广泛的小波理论成型了。

该理论在连续与离散域上均被阐述,都有完整的数学框架。

1985年Meyer 的工作带来了重大突破。

他发现不像Gabor变换(且与普遍的观念相反),小波变换可以在被设计为正交的的情况下保持稳定性。

相关文档
最新文档