稀疏表示的说明
生物医学信号处理中的稀疏表示与压缩方法研究

生物医学信号处理中的稀疏表示与压缩方法研究一、引言近年来,生物医学信号处理中的稀疏表示与压缩方法成为了一个热门的研究领域,其应用涉及生物医学工程、电子工程、计算机科学等多个领域。
稀疏表示与压缩方法的研究旨在通过降低信号的冗余度,减少信号传输和保存所需的存储空间,从而提高信号处理的效率和准确性。
本文将从稀疏表示和压缩方法两方面探讨生物医学信号处理中的研究现状、应用场景以及未来发展趋势。
二、生物医学信号处理中的稀疏表示稀疏表示是指通过使用尽可能少数量的基向量来表示信号,以达到降低信号冗余、节省存储空间和提高信号处理速度的目的。
稀疏性表示方法在生物医学信号处理中得到了广泛应用,其中最常用的是基于小波变换的稀疏表示方法。
小波变换是一种多分辨率分析方法,将信号分解为不同频率的子带,使得高频细节和低频趋势可以分开处理。
在小波变换中,离散小波变换(DWT)和连续小波变换(CWT)是两种常用的变换形式。
离散小波变换通过一系列的卷积和下采样操作,将信号分解为不同的频带。
离散小波变换可以通过选取不同的小波基函数来实现不同的分解效果,例如Haar小波、Daubechies小波、Symlet小波等。
连续小波变换通过对信号进行连续的卷积和下采样操作,将信号分解为不同的频带。
连续小波变换主要有基于Morlet小波和基于Mexican hat小波的两种形式。
基于小波变换的稀疏表示方法广泛应用于生物医学信号处理中,如心电信号、脑电信号、语音信号等。
稀疏表示方法可用于信号的去噪、信号的高频补偿、信号的特征提取等方面,具有较好的效果和广泛的应用前景。
三、生物医学信号处理中的压缩方法压缩方法是指通过对信号进行编码压缩,以降低信号保存和传输所需的存储空间和带宽。
在生物医学信号处理中,压缩方法主要应用于图像和视频数据的压缩,例如医学影像数据、生物实验视频等。
基于压缩感知理论的压缩方法是当前比较流行的压缩方法之一。
压缩感知理论通过研究信号的稀疏表示,提出了一种数据压缩和重构的方法。
稀疏深度学习理论与应用

稀疏深度学习理论与应用稀疏深度学习理论与应用简述:稀疏深度学习是深度学习的一个重要分支,研究的是如何通过限制网络的连接性和权重值,在保持模型性能的同时减少参数数量,从而提高计算效率和模型的可解释性。
本文将介绍稀疏深度学习的基本原理和常见算法,并探讨其在不同领域的应用。
一、稀疏深度学习的原理1. 稀疏表示原理稀疏深度学习的基石是稀疏表示原理。
稀疏表示原理认为,任意样本都可以由少量基向量线性组合表示。
在深度学习中,这些基向量对应于网络的隐藏层节点。
通过限制节点的活跃性,可以实现稀疏表示。
2. 稀疏编码稀疏编码是一种常用的稀疏表示方法,其目标是通过最小化样本与稀疏基向量的重构误差,来获取稀疏表示。
稀疏编码可以通过优化方法如坐标下降、梯度下降等实现。
通过限制编码矩阵的稀疏度,可以得到稀疏表示的网络。
3. 稀疏自编码器稀疏自编码器是一种常用的稀疏深度学习模型。
它通过将输入数据重构为自身的目标,利用编码层的稀疏性来学习有用的特征表示。
稀疏自编码器可以通过增加稀疏约束项来实现,如L1正则化。
二、稀疏深度学习算法1. L1正则化L1正则化是稀疏深度学习中常用的一种方法。
通过在目标函数中添加L1正则项,可以使得模型的权重值更趋于零,从而实现参数的稀疏性。
L1正则化可以通过坐标下降、梯度下降等优化方法实现。
2. 稀疏组合算法稀疏组合算法是一种常用的稀疏深度学习方法,用于选择网络中的有用节点。
该算法通过求解一个组合优化问题,将问题转化为一个0-1整数规划问题,从而选择最优的节点组合。
3. 稀疏卷积神经网络稀疏卷积神经网络是一种应用广泛的稀疏深度学习模型。
它通过限制卷积核的稀疏性,减少卷积层的参数数量,从而提高网络的计算效率。
稀疏卷积神经网络在图像处理、目标检测等领域得到了广泛应用。
三、稀疏深度学习的应用案例1. 图像处理稀疏深度学习在图像处理领域有着广泛的应用。
例如,可以通过稀疏自编码器学习图像的稀疏表示,从而实现图像去噪、压缩等任务。
第12章 稀疏表示及其应用

典型的分析式字典分类
• 非自适应的框架字典 – DCT基、短时傅里叶时频框架字典、离散小波时频框 架字典、小波包字典、具有几何不变性的小波字典、 方向小波字典、curvelet、wedgelet、ridgelet和 contourlet
S f
,u f , g k n
k ,un k ,nZ
信号f 完全和稳定的表示?
gk,n t g t nu0 eik0t
Daubechies给出了窗函数取高斯函数 g(t) e 1/4 t2/2 时(
此时 u0 = 0 )的主要结论:
离散小波时频框架字典
– 线性变换
f ,
是稀疏的
– f在基字典下有稀疏的合成,具体地,取M项绝对值最
大的系数,相应M个原子的线性组合构成信号f的M-逼
近
fM fT
f ,
T
T = : f , T
超完备字典
学习式字典
• 1996年Olshausen与Field在Nature杂志上发表的论文是字 典学习领域的奠基性工作。
则方向平移不变族就构成框架。
二维 Gabor 滤波器(函数)
G x, y
1
1
x2
y2
e e 2
2 x
2 y
i0xv0 y
2 x y
• 在一定的约束条件下[110],上述二维Gabor小波族可以通
过对如下母Gabor小波旋转和伸缩得到:
记
x, y
压缩传感(Compressed Sensing, CS)理论
环境目标稀疏建模-概述说明以及解释

环境目标稀疏建模-概述说明以及解释1.引言1.1 概述环境目标稀疏建模是指在环境科学和生态学领域中,通过采集和分析大量的环境数据,利用稀疏建模的方法来揭示环境系统中的目标规律和特征。
随着环境问题的日益突出和环境数据的不断积累,环境目标稀疏建模成为了一种重要的研究方法和工具。
稀疏建模是一种以稀疏性为基础的信号处理和数据分析技术,它通过对大规模数据进行处理和分析,将数据中的冗余和噪音信息去除,从而提取出数据的稀疏表示和潜在结构。
在环境科学和生态学领域,环境目标的特征和规律往往表现为一些稀疏的模式或者隐含的重要因素,这些因素对于环境问题的诊断和预测具有重要意义。
环境目标稀疏建模的研究目的主要包括两个方面。
首先,通过建立环境目标的稀疏模型,可以揭示出环境要素之间的相互关系和作用机制。
这有助于我们深入了解环境系统的结构和功能,并为环境保护和资源管理的决策提供科学依据。
其次,环境目标稀疏建模可以帮助我们从大量的环境数据中提取有用的信息和知识,挖掘出环境系统中的隐含特征和规律。
这有助于我们预测环境变化、评估环境风险以及探索环境问题的解决途径。
总之,环境目标稀疏建模是一种重要的研究方法和工具,它通过利用稀疏建模的方法来揭示环境系统中的目标规律和特征。
通过建立环境目标的稀疏模型,我们可以深入了解环境的结构和功能,为环境保护和资源管理提供科学依据。
同时,环境目标稀疏建模也可以帮助我们从大量的环境数据中提取有用的信息和知识,预测环境变化、评估环境风险,并为解决环境问题提供参考。
文章结构部分的内容可以按照以下方式编写:1.2 文章结构本文共包含三个主要部分:引言、正文和结论。
在引言部分,将介绍本文的背景和重要性。
首先,概述环境目标稀疏建模的定义和概念,并强调其在解决环境问题中的研究意义。
接着,详细说明文章的结构和各个部分的内容。
最后,明确阐述本文的目的和意义,为后续内容铺垫。
正文部分将分为两个小节,具体讨论环境目标的重要性和稀疏建模的概念和方法。
机器学习中的稀疏表示方法研究

机器学习中的稀疏表示方法研究机器学习是近年来备受关注的领域,其应用范围涉及人工智能、自然语言处理、图像识别等众多领域。
稀疏表示方法作为机器学习中的一种重要技术,在这些应用中发挥着越来越大的作用。
稀疏表示方法是将数据表示为一组稀疏系数的方法。
所谓“稀疏”,就是指这些系数中只有少数值不为零。
使用这些稀疏系数,我们可以对原始数据进行降维、特征提取、分类等操作,并在一定程度上提高模型的准确性和效率。
稀疏表示方法有很多种,比较常用的有L1正则化、L2正则化、奇异值分解等。
L1正则化是指在目标函数中加入一个惩罚项,这个惩罚项是系数向量的L1范数。
这种方法可以压缩数据并保留原始数据中的重要特征,适合于特征选择和分类问题。
但L1正则化的缺点是不适用于具有高度相关性的变量。
L2正则化是指在目标函数中加入一个惩罚项,这个惩罚项是系数向量的L2范数。
这种方法可以将数据映射到更高的维度,减少特征之间的相关性,并适用于回归问题。
奇异值分解是一种矩阵分解的方法,可以将原始数据矩阵分解为三个部分:左奇异矩阵、右奇异矩阵和对角矩阵。
这种方法可以保留原始数据中的主要特征,并压缩数据量,适用于特征提取和图像处理问题。
稀疏表示方法在实际应用中有很多优点。
首先,稀疏表示方法可以减少数据的维度,提高数据处理和计算效率。
其次,稀疏表示方法可以保留原始数据中的重要特征,提高模型的准确性和鲁棒性。
此外,稀疏表示方法还可以应用于无监督学习、半监督学习等领域,并在生物信息学、机器视觉、自然语言处理等应用中取得了巨大成功。
然而,稀疏表示方法也存在一定的局限性。
首先,稀疏表示方法的求解过程比较复杂,需要计算大量的矩阵和向量运算,因此需要消耗大量的计算资源。
其次,稀疏表示方法需要大量的训练数据支撑,否则无法准确表征数据的特征和分布。
此外,稀疏表示方法对数据的稳定性和噪声敏感度较高,需要进行合理的预处理和优化。
总之,稀疏表示方法是机器学习中的一种重要技术,具有很多优点和应用场景。
稀疏表示在图像恢复中的应用研究

稀疏表示在图像恢复中的应用研究稀疏表示是一种流行的数学理论,在信号处理和计算机视觉等领域得到广泛的应用。
它的基本思想是利用信号或图像的稀疏性来减少数据的冗余性,从而简化数据处理的过程。
在图像恢复领域,稀疏表示已成为一种强有力的工具,许多算法都采用了它来恢复损坏的图像。
本文将介绍稀疏表示在图像恢复中的应用研究。
一、稀疏表示理论稀疏表示理论起源于压缩感知领域,它利用信号具有较少的非零系数来设计现代的数据压缩算法。
具体来说,在信号处理中,如果信号的维度很高,每个采样都是不必要的,因为信号的潜在稀疏性意味着它可以用较少的非零系数来重构。
稀疏表示的方法是,将原始信号表示为一组基向量的线性组合,这些基向量构成一个称为字典的集合。
然后,通过选择一些与信号具有稀疏性的基向量,可以得到一个表示信号的稀疏系数矩阵。
在恢复信号时,可以通过稀疏系数矩阵和字典来计算原始信号。
二、稀疏表示在图像恢复中的应用在图像恢复领域,稀疏表示已成为一种强有力的工具,它能够处理图像降噪、压缩、超分辨率和图像恢复等任务。
一些常见的算法使用的包括:1. Compressive Sensing (压缩传感)Compressive Sensing是利用稀疏性在重构信号时减少采样的实践。
在图像降噪任务中,可以使用压缩感知算法来从加性高斯噪声中恢复图像,这通常被称为稀疏编码。
2. K-SVD (基于稀疏字典的图像处理)K-SVD是一种基于稀疏编码的图像处理算法,它能够从噪声干扰和可能的损坏中恢复图像。
K-SVD通过构建一个原子组成的字典,利用稀疏性来寻找重构图像的基向量,从而计算其稀疏系数。
3. Dictionary Learning Algorithm (字典学习算法)字典学习算法旨在学习合适的字典,以将信号表示为具有最小重构误差的稀疏字典。
这类算法包括稀疏表示算法、K-SVD算法等,对于从大量观察中学习低维表示的任务非常有效。
三、总结稀疏表示已被广泛应用于图像恢复领域。
强化学习算法中的稀疏表示学习方法详解(五)

强化学习算法中的稀疏表示学习方法详解强化学习(Reinforcement Learning, RL)是一种机器学习方法,其目标是使智能体(agent)通过与环境的交互,学习到如何在未知环境中做出最优的决策。
在强化学习中,智能体通过观察环境的状态和采取行动来获取奖励,从而不断优化自己的策略。
稀疏表示学习(Sparse Representation Learning)则是一种用于特征提取和数据降维的方法,通过学习数据的稀疏表达形式,可以更好地捕捉数据的潜在结构和特征。
本文将详细探讨强化学习算法中的稀疏表示学习方法及其应用。
一、稀疏表示学习的基本原理稀疏表示学习的基本原理是利用线性组合来表示数据,同时尽可能使用少量的基函数。
对于给定的数据集,稀疏表示学习旨在找到一组稀疏系数,使得数据能够被这组稀疏系数线性表示。
在强化学习中,稀疏表示学习可以用于提取环境的特征,从而帮助智能体更好地理解环境和做出决策。
二、稀疏表示学习在强化学习中的应用在强化学习中,智能体需要不断地观察环境的状态并做出决策。
然而,由于环境的复杂性和高维度特征的存在,传统的特征提取方法往往难以满足需求。
稀疏表示学习可以通过学习数据的稀疏表示,更好地捕捉环境的特征,从而帮助智能体更好地理解环境和做出决策。
例如,在深度强化学习中,智能体通常使用神经网络来近似值函数或策略函数。
稀疏表示学习可以用于特征提取,从而帮助神经网络更好地学习环境的特征。
通过学习数据的稀疏表示,可以更好地捕捉环境的潜在结构和特征,从而提高智能体的决策能力。
三、稀疏表示学习方法在强化学习中,常用的稀疏表示学习方法包括字典学习、压缩感知和稀疏自编码器等。
这些方法都可以用于学习数据的稀疏表示,从而帮助智能体更好地理解环境和做出决策。
1. 字典学习字典学习是一种常用的稀疏表示学习方法,其目标是学习一组基函数(字典),使得数据能够被这组基函数线性表示。
在强化学习中,可以使用字典学习来提取环境的特征,从而帮助智能体更好地理解环境和做出决策。
面向音频信号处理的稀疏表示方法研究

面向音频信号处理的稀疏表示方法研究随着数字信号处理技术的不断发展,人们逐渐意识到了稀疏表示方法在音频信号处理领域的重要性。
稀疏表示方法是一种基于压缩感知理论的信号处理方法,通过引入稀疏性先验知识,可以实现对信号的高效处理。
本文将介绍稀疏表示方法在音频信号处理中的应用及其研究现状。
一、稀疏表示方法简介稀疏表示方法是一种基于压缩感知理论的信号处理方法,通过引入稀疏性先验知识,对信号进行高效处理。
其基本思想是:信号在某个基下可以用较少的基向量线性组合得到,即所谓的“稀疏表示”。
因此,稀疏表示方法的关键在于选择合适的基,并通过表示系数的稀疏性实现信号的高效表示和处理。
常用的稀疏表示方法有以下几种:1. 基变换:将信号用一组新的基向量表示,使得表示系数具有一定的稀疏性。
2. 压缩感知:利用少量的测量数据重构信号,并通过信号稀疏性减小重构误差。
3. 字典学习:通过学习一组适合于信号的基,使得信号的稀疏度更高。
二、音频信号处理中的稀疏表示方法对于音频信号处理,稀疏表示方法可以应用于以下几个方面:1. 去噪处理音频信号中常常存在各种各样的噪声,如高斯噪声、周期性噪声等。
利用稀疏表示方法,可以把信号的稀疏性先验做为先验信息,通过选取适当的基(如小波基),将信号噪声和原信号分离,从而实现去噪处理。
2. 声音识别在语音识别中,通常需要对语音信号进行特征提取,后续再用分类器进行声音识别。
针对语音信号的特征提取方法多种多样,其中基于稀疏表示的方法最为常用,如小波系数、稀疏自编码器等。
3. 音频合成音频合成是指将各种乐器的音调和节奏组合在一起,产生出具有和谐感的乐曲。
通过稀疏表示方法,可以将多声道信号进行分离,从而实现各种声音的合成。
三、稀疏表示方法在音频信号处理中的研究现状稀疏表示方法在音频信号处理领域的应用已经得到了广泛的关注和研究。
以下是该领域近年来的研究现状:1. 压缩感知算法压缩感知技术的研究焦点在于从更少的测量中高精度地恢复信号。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘 要 高光谱成像( HSI)的光谱特征包含显著结构,如果得到适当的特点,可以实现更高效的数据采集和提高数据分析。 因为大多数像素包含少数材料反射率,我们建议稀疏编码模型是能够很好的与HAI数据相匹配的。 稀疏模式把每个像素认为是一种元素的结合,而这种元素来自更大的字典,并且在大范围的应用中,这种方法已经被证明是高效的。此外,先前的工作表明,最优的稀疏编码字典可以从没有其它先验信息的数据集(在对比许多HSI“端元”的发现算法即假设纯光谱或侧面信息的存在)中学习到。我们修改现有的无监督学习方法,并把它应用到HSI数据(带有显著地面真实标签)来学习一个最佳稀疏编码字典。使用这种训练字典,我们证明三个主要结论:1)稀疏编码模型学习材料光谱特征并且为每个单独材料逼近非线性流行;2)本词典以非常高的精确度去推断HSI分辨率数据,在多光谱级分辨率采集模拟图像;3)本训练词典提高了监督分类算法的运行效果,无论是在分类器复杂性方面还是在总结小训练数据。
关键词:去模糊 字典学习 高光谱成像( HSI) 反问题 材料分类 多光谱影像 遥感 稀疏编码 (一) 引 言 高光谱成像( HSI)是一种光谱成像方式,包含环境及地域信息,这些信息是由信息星载平台或机载拍摄地面位置。而多光谱影像器( MSI )通过一些不规则空间光谱谱带获得数据(如3-10 ),HSI通常使用数以百计的连续光谱带,这些光谱带规律的按照红外到紫外的空间排布。例如,世界观II微星卫星[1]采用八条光谱带代表波长从0.435微米到1.328微米, 在同样的范围内,典型的HSI大约采用60条光谱带除了许多更多的光谱带在更高的波长。 由于空间分辨率低至1米,HSI增长频谱分辨率意味着估计地面反射率数据可用于确定场景可一本文中的人物或多个颜色版本在线 在http://ieeexplore.ieee.org 。 数字对象标识符10.1109/JSTSP.2011.2149497 )的属性,包括材料分类,地质特征的识别和环境监测。HSI的一个很好的概述和相关的传感器可以在[ 36 ]中找到。 利用HSI往往是困难的,由于遥感环境特定的挑战。例如,即使单一材料组成的“纯”像素将具有反射率谱,其沿着非线性流行由于变化的光照,视觉角度,材料的异质性,本地场景的几何形状,并存在水分的射散[5],[36]。此外,纯粹的像素本质上是不可能在实际地观察到,由于材料在相邻区域的像素和散射的混合[36]。其中最常见的方法是来确定材料中存在的给定像素x(称为“光谱分离” [37] )使用线性混合模型,比如:
1Mkkkx (1)
其中{k}是一个字典里近似的元素,{k}是分解系数,并且是加性噪声。需要注意的是,,,NkxR,其中N是光谱带的数目,向量是通过(这是抑制我们的符号)进行索引。 当这个字典代表不同材料组成的光谱特征出现在场景,它们通常被叫做“端元”,以及所得的系数(假定是一对一)代表在每个像素材料的丰富度。该端元矢量概念化为形成有关HSI数据的凸包(例如,见红向量如图.1)。这种分解通常被用于检测场景中出现的材料或对呈现在一个像素的材料进行分类。许多方法已被提出确定端元,包括算法,这些算法基于像素纯度的量度从数据中选择端元[48]或由此产生的凸锥的质量[53],有助于从数据中手动选择端元的工具[9],优化端元线性滤波算法[12],求解凸锥的主要方法是成分分析(PCA )或独立分量分析(ICA)的分解[21],[24],[27],[32],迭代统计方法优化所得凸锥[10],迭代测量去选择潜力较大的最优端元集[50]。然而,这些算法要么依靠假设候选端元组进行初始化[ 50] ,要么假设存在纯像素在场景中[48],[53],试图用一个圆锥包含数据,而不是直接代表数据的变化[9],[10],[32],使用正交线性过滤器试图分离出高度非正交谱[12],或试图从分解的光谱统计在空间维度而不是频谱维度确定光谱数据,[21] ,[24]。这些方法没有哪一个试图直接学习频谱数据,一个低维,固有非线性光谱变化的很好的代表,在HIS中。
图1.1 典型端元分析使用向量,这些向量组成了围绕数据的一个凸包。在这种程式化的说明,用虚线表示数据流形和红色矢量表示这些端元。与此相反,一个稀疏编码的学习字典尝试直接学习非线性数据特征的一个局部逼近。 除了确定HSI数据集基本组成光谱的困难,还由于数据的高维数所造成的很多资源成本(即,时间,金钱,计算,传感器平台的可用性)。在数据采集时,HSI数据的高分辨率是以复杂的传感器为代价,传感器需要相对长的扫描时间以得到有用的信噪比。数据采集后, 显而易见的是,获得数据利用价值的同时降低维数能够节省计算和存储资源。如果HSI数据中的高阶统计可被运用,该信息可用于执行已存高维数据的降维和从低分辨率数据推断高分辨率(无论是从便宜的MSI传感器或修改HSI传感器测量粗糙的光谱分辨率,从而降低扫描时间) 。一种常见的降维方法是PCA ,然而,在相关的高斯模型下,PCA意味着它只能在数据中捕获两两相关系数,而不是较高阶(和非高斯)统计数。 伴随着计算神经科学社区的发展,信号处理领域近年来采用基于稀疏概念的信号模型去特性化高阶统计依赖关系和产生最先进的成果在许多信号和图像处理算法[20]方面。具体而言,这种方法以嘈杂的测量矢量x为模型,x由字典k的一些元素的直线结合所生成。这和(1)是相同的模型,但其中的系数是尽可能少的非零元素。很像PCA,稀疏编码可以被看作是一种维数减约的类型,当一个高维数据集在活性系数的低维空间表示时。但是, PCA只是计算几个主成分,并运用它们去代表每一个像素,稀疏编码模型通常采用较大的字典,但是只使用少数这些元素来表示每一个像素。当以一个概率模型为例时,这种稀疏性约束对应于先验非高斯,使该模型在数据中获取更高阶次统计。 由于现代HSI传感器的高空间分辨率(导致,在一个像素里有很少占主导地位的材料),稀疏模型似乎尤其适用于这种传感方式。事实上,最初在HSI数据集上对稀疏模式混合像元分解的研究已经显示出可喜的结果[29],[33]。但是稀疏分解可以被估计为任何字典,先前研究[43]表明,无监督学习技术可以用一个例子的数据集结合使用迭代学习字典,这个字典可以优化稀疏系数 (无需数据集包含任何“纯” 对应于单个字典元件信号)。这些方法利用本实例数据集的特定的高阶统计以找到相关低维度结构,这是最有效的表示数据方法。 与上面描述的典型的端元模型相反,稀疏编码模型并不假定数据包含在字典的凸包里。取而代之的是,这个训练稀疏编码字典元素看起来像基本光谱特性,包括现场(早期令人鼓舞的光谱特征,这方面的证据可以在[ 28 ] )。事实上,稀疏编码模型可以真正学到一些字典元素来表示某些类型的材料,特别是当该材料光谱表明现场的高度非线性变化。由于稀疏性约束,人们会期望这些训练字典来反映HIS数据的特定的统计,这些HSI数据由本地近似非线性数据流行[45](如图1中所示,与包含数据的凸包的典型端元模型相反)。 我们已经修改所描述的无监督学习方法,具体描述在[43],并把它应用到HSI数据去学习词典,这是优化稀疏编码。重要的是,运用在研究中的HSI数据集具有显著地面实况标签,使得能够检查与数据有关的训练字典的特征。使用这种训练字典,我们做出三个主要贡献。首先,我们证明该稀疏编码模型学习有意义的字典,这些字典对应于已知的光谱特征;他们局部逼近非线性数据流形的单个材料,并且他们传达有关环境属性,例如,作为一个区域中的水分含量,的信息。第二,我们在微星级别分辨率产生模拟图像,并且显示训练的HSI字典,稀疏编码模型可有效地用于准确地推测HIS分辨率数据(即使同一地点的数据在不同季节收集)。最后,我们利用HSI数据的地面实测标签去说明,一种稀疏编码的出现提高了监督分类算法的运行效能,无论是在分类器的复杂性方面(即,分类时间),还是从分类器概括非常小的训练集来的能力方面。 ( 查尔斯等:学习的稀疏代码恒指965 ) (二)背景及相关工作 A.方法 给定一个像素NxR和一个固定字典k,其中NkR,[1,...,M]k,稀疏编码的目标是找到一组代表数据的系数,这些系数尽可能多是零元素。写作数学形式,我们的目标是最小化带着数据保真度和稀疏诱导处罚的目标函数。一个常见的选择是使用一个正规化最小二乘目标函数,例如
2112,{},{}MMkkkkkkkJxx (2)
均方误差作为数据保真项,1的范数(系数大小的总和)作为诱导稀疏性,是一个标量,主要是在数据保真度和诱导稀疏性之间平衡[19]。当字典是固定的时,这个目标是凸的系数,这意味着解决{}{}argmin,{},{}kkkkJx是一个易处理的优化问题。求解器最近已经取得了显著进步,这个求解器专门求解这个特定的优化方案,并且运行较通用的算法要快[15],[22],[30],[38]。这一般的做法是直接运用于HIS并做一个小小的修改:我们限制系数是非负的,以保证系数和出现在场景中的材料的相对丰富度之间存在物理对应关系。由于其在社区的广泛运用,在没有一对一的限制下,它也有能力实现正系数,并且能够建立快速收敛性的称誉,我们专门优化包,具体描述见[38],来解决这个约束优化和计算稀疏系数的问题。而其它的求解器也已经运用在HSI这个特殊的领域,具体描述见[11],[46],在一些假设在,可能会更快,许多HSI特定求解器包括额外增加制约因素,就是我们不采用的(例如,1kk )。对于具体的求解器,我们在这里所呈现的框架在很大程度上是不可知的,只要它能够返回准确的解决方案,所以其他的选择可以被取代,如果对于一个给定的运用,它是有优点的话。优化(2)的各种在HIS不混溶的上下文中详细分析算法在[33]给出。 对(2)的成本函数的另一种解释是考虑问题如贝叶斯推断。其中是高斯白噪声分布,|kpx的概论密度分布也是高斯分布,对系数k的先验概率分布假设为拉