08高光谱特征选择

合集下载

高光谱图像分类算法中的特征选择方法

高光谱图像分类算法中的特征选择方法

高光谱图像分类算法中的特征选择方法随着遥感技术的发展,高光谱图像在地质勘探、农业、城市规划等领域得到了广泛的应用。

为了有效利用高光谱图像数据,研究人员一直在探索合适的特征选择方法,以提高图像分类的准确性和效率。

本文将介绍几种常用的特征选择方法,并对它们在高光谱图像分类算法中的应用进行讨论。

一、相关性分析法相关性分析法是最常用的特征选择方法之一。

它基于特征与目标变量之间的相关性,通过计算它们之间的统计指标(如相关系数)来选择最相关的特征。

在高光谱图像分类中,可以使用相关性分析法来确定哪些波段与分类任务最相关,并在分类模型中仅使用这些波段的信息。

通过减少特征维度,可以提高分类算法的效率,并降低过拟合的风险。

二、信息增益法信息增益法是一种基于信息论的特征选择方法。

它通过计算每个特征对于分类任务的信息增益,确定其重要性。

信息增益是指特征引入后对系统整体不确定度的减少程度。

在高光谱图像分类中,信息增益法可以用于选择那些在分类过程中能提供更多信息的特征。

通过选择具有较高信息增益的特征,可以提高分类算法的准确性。

三、最大信息系数法最大信息系数法是一种非参数的特征选择方法。

它可以测量两个变量之间的相关性,并通过计算它们的最大信息系数来选择最相关的特征。

在高光谱图像分类中,最大信息系数法可以用于筛选那些在分类任务中与目标变量相关性最强的特征。

对于高光谱图像来说,不同波段之间可能存在较强的相关性,因此使用最大信息系数法可以帮助排除冗余的特征,提高分类算法的效果。

四、L1范数稀疏化方法L1范数稀疏化方法是一种基于稀疏表示的特征选择方法。

它通过最小化特征向量的稀疏性度量,实现特征的选择与分类同时进行。

在高光谱图像分类中,L1范数稀疏化方法可以帮助选择那些对分类任务最重要的特征。

与其他方法相比,L1范数稀疏化方法具有较好的鲁棒性和稳定性,对于高光谱图像分类任务具有一定的优势。

五、主成分分析法主成分分析法是一种常用的特征选择方法。

高光谱数据波段选择方法研究

高光谱数据波段选择方法研究

高光谱数据波段选择方法研究高光谱数据波段选择方法研究摘要高光谱遥感技术在农业、环境监测和地质勘探等领域有着广泛的应用。

高光谱数据的特点是具有大量的波段,因此在处理和分析过程中需要进行波段选择。

本文综述了高光谱数据波段选择方法的研究进展,包括传统的统计方法和基于特征选择的方法。

本文还针对不同应用场景提出了一些波段选择的建议,并举例说明了波段选择方法在环境监测中的应用。

1. 引言高光谱遥感技术是一种能够获取物体光谱信息的重要手段,它可以获取超过几十个波段的光谱数据。

然而,这也带来了处理和分析的挑战。

因为高光谱数据的波段数量庞大,如何选择合适的波段用于特定的应用成为一个重要问题。

波段选择方法的好坏直接影响到高光谱数据的处理和分析效果,因此对波段选择方法进行研究具有重要的理论和应用价值。

2. 高光谱数据波段选择方法的研究进展2.1 传统的统计方法传统的统计方法是对高光谱数据进行统计分析,通过计算波段之间的相关性、方差等指标来筛选重要的波段。

常用的统计方法包括相关系数分析、方差分析和主成分分析等。

这些方法在波段选择中能够取得一定的效果,但是忽略了波段间的非线性关系和互信息等因素,因此在某些特定应用场景下可能不适用。

2.2 基于特征选择的方法基于特征选择的方法是通过选择一组最具有代表性的特征波段来表达整个高光谱数据集,以达到简化数据和提高分类效果的目的。

常用的特征选择方法包括相关性分析、信息熵、L1范数和Wrapper等。

这些方法能够根据具体的应用要求选择最具有代表性的波段,提高数据处理和分析的效率。

3. 不同应用场景下的波段选择建议在农业领域,根据不同作物的生长需要和养分吸收特性,可以选择与作物生长和养分相关的波段进行监测和分析。

例如,可通过选择近红外波段来监测作物叶绿素含量和生长状况。

在环境监测中,可以选择与大气污染物、水质和土壤有关的波段来进行监测和评估。

例如,可选择能够反映水体浑浊度和有机质含量的波段进行水质监测。

高光谱遥感的发展

高光谱遥感的发展

2021/8/24
27
高光谱的应用
(1)海洋遥感方面。 由于中分辨率成像光谱仪具有光谱覆盖范围广、分辨
率高和波段多等许多优点,因此已成为海洋水色、水 温的有效探测工具。它不仅可用于海水中叶绿素浓度、 悬浮泥沙含量、某些污染物和表层水温探测,也可用 于海冰、海岸带等的探测。
2021/8/24
28
(2)植被研究方面。
在此后,许多国家先后研制了多种类型的航空成像光谱仪。如加 拿大的FLI、CASI,德国的ROSIS,澳大利亚的HyMap等。
2021/8/24
12
国外星载:
在经过航空试验和成功运行应用之后,90年代末期终于迎来了高 光谱遥感的航天发展。
全球第一个星载高光谱成像器于1997年在NASA随着Lewis卫星发射 升空,它包含了384个波段涵盖了400-2500nm波段,不幸的是这颗 卫星控制出现问题,失去了动力,升空一个月后就偏离了轨道。
2007年10月24日我国发射的“嫦娥-1”探月卫星上,成像光谱仪也作 为一种主要载荷进入月球轨道。这是我国的第一台基于富里叶变换的 航天干涉成像光谱仪,它具有光谱分辨率高的特点。
2008年发射的环境与减灾小卫星(HJ-1)星座中,也搭载一台工作在 可见光—近红外光谱区(0.45—0.95μm)、具有128个波段、光谱分辨 率优于5nm的高光谱成像仪。它将对广大陆地及海洋环境和灾害进行 不间断的业务性观测。
1999年美国地球观测计划(EOS)的Terra综合平台上的中分辨率 成像光谱仪(MODIS),欧洲环境卫星(ENVISAT)上的MERIS, 以及欧洲的CHRIS卫星相继升空,宣告了航天高光谱时代的来临。
2021/8/24
13
2021/8/24

高光谱影像特征选择与提取

高光谱影像特征选择与提取

高光谱影像特征选择与提取高光谱遥感影像是指通过遥感技术获取的光谱波段范围较宽的遥感影像,相比于普通遥感影像,具有更多的光谱信息。

高光谱影像的特征选择与提取是指从大量的光谱波段中选择出最能表达影像特征的波段,并对这些波段进行特征提取,以达到降维、去冗余和突出关键信息的目的。

本文将介绍高光谱影像特征选择与提取的方法和应用。

高光谱影像特征选择主要有两个目标:一是减少维度,将原始光谱数据降维为较低维度的特征向量,以方便后续处理;二是挖掘出与分类或回归任务相关的关键特征波段,以提高分类或回归的准确性。

常用的特征选择方法包括相关系数法、信息增益法、主成分分析法等。

相关系数法通过计算每个波段与所研究对象的相关程度,选择与目标变量相关性较强的波段作为特征波段。

信息增益法则根据每个波段对目标变量的贡献度选择特征波段,贡献度高的波段被认为是最有价值的特征波段。

主成分分析法则通过对原始光谱数据进行线性变换,将原始变量转换成一组互不相关的主成分,从而实现降维的目的。

在特征选择的基础上,还需要进行特征提取,以提取出更具有鉴别能力的特征。

常用的特征提取方法包括谱角法、植被指数法、特征空间法等。

谱角法是基于波段直接组合获取鉴别能力强的特征,通过计算不同波段之间的角度,来提取出能够鉴别不同地物的特征。

植被指数法是基于植被光谱反射率特点的一种特征提取方法,通过计算植被指数,如归一化植被指数(NDVI)、差值植被指数(DVI)等,来提取出与植被相关的特征。

特征空间法是基于光谱波段组合的一种特征提取方法,通过对多个波段进行线性或非线性组合,生成新的特征空间,从而提取出不同地物的特征。

除了上述方法,还可以通过机器学习算法,如支持向量机、决策树等,来进行特征选择与提取。

这些算法能够在训练模型的过程中自动选择最具有鉴别能力的特征,并对其进行提取。

高光谱影像特征选择与提取在农业、环境监测、地质勘探等领域有着广泛的应用。

例如,在农业领域,可以通过对农作物的高光谱影像进行特征选择与提取,来实现病虫害的自动检测与预警;在环境监测领域,可以通过高光谱影像进行景观类型分类与变化监测;在地质勘探领域,可以通过高光谱影像提取地质矿产信息,实现资源勘探与开发。

光谱特征选择方法

光谱特征选择方法

特征是对象所表现出来的各种属性与特点。

在遥感图像分析中特征提取可以从两个意义上来实施:一种是按照一定的准则直接从原始空间中选出一个子集(即子空间),实践中的波段选择即属于此类;另一类是在原始特征空间和新特征空间之间找到某种映射关系P,P:x→y,将原始特征空间x={x1,x2…,xn}映射到维数降低了的特征空间y中去,y={y1,y2…,ym},m<n。

对于用于分类目的的特征提取,好的特征提取方法能使同类物质样本的分布具有密集性,而不同类物质的样本在特征空间中能够隔离分布,为进一步分类打下良好基础。

因为高光谱数据具有波段多、波段间相关性高及数据冗余度高等特点,所以对高光谱遥感数据的特征提取具有特殊意义。

遥感图像特征提取包含的内容非常广泛,提取方法也很多,光谱维特征提取和空间维特征提取是表现图像特征提取的两种主要方法。

这里主要介绍适用高光谱数据的一些光谱维特征提取方法,主要涉及主成分分析法,典范变量分析法及改进的CA方法。

主成分分析是一种把原来多个指标化为少数几个相互独立的综合指标的一种分析技术。

对波段间高度相关的数据非常有效(Cloutis,1996)。

PCA技术已被用在不同的地质遥感项目,包括宽波段和高光谱数据(Lee等,1990;Resmini 等,1997,Fujimura &Kiyasu,1994)。

由于高光谱数据波段间的相关性、高冗余度,直接利用所有的原始波段作分类或特征提取显得很不经济。

因此先对原始数据作PCA变换,然后对少数几个综合指标(成分)分析将会收到事半功倍的效果。

在高光谱数据分析中,PCA技术可将总体大部分方差集中在前面少数几个主成分中。

于是,人们利用这少数几个主成分做一些地质分析,如利用前3个主成分的假彩色合成图判读地质矿物信息,进而成图。

但在主成分合成图上的彩色在不同的图像上是变化的,并不代表一定的地质矿物成分,除非有相似的地质露头和覆盖,更困难的是,我们不能根据岩石、土壤和矿物等反射光谱作指示来判读主成分合成图上的彩色。

特征选择

特征选择
是十分必要的。

高维的数据集中包含了大量的特征(属性)。比如一个文本数据集中,
每一个文本都可以用一个向量来表示,向量中的每一个元素就是每
一个词在该文本中出现的频率。在这种情况下,这个数据集中就存 在着成千上万的特征。这种高维的数据给数据挖掘带来了“维灾 难”(The Curse of Dimensionality)问题。
2017/10/16 数据挖掘中的特征选择 2
特征选择方法的模型

一般地,特征选择方法可以分为三种模型,分别是:过
滤模型、包裹模型和嵌入模型。
2017/10/16
数据挖掘中的特征选择
3
过滤模型

根据训练集进行特征选择,在特征选择的过程中并不涉
及任何学习算法。即特征子集在学习算法运行之前就被
单独选定。但学习算法用于测试最终特征子集的性能。
2017/10/16
数据挖掘中的特征选择
7
12.
2017/10/16
数据挖掘中的特征选择
8
L为相似度矩阵对应的拉普拉斯矩阵
2017/10/16
数据挖掘中的特征选择
9
数据挖掘中的特征选择
6
L1范数美名又约Lasso Regularization,指的是向量 中每个元素的绝对值之和,这样在优化目标函数的过程中, 就会使得w尽可能地小,在一定程度上起到了防止过拟合 的作用,同时与L2范数(Ridge Regularization ) 不同的是,L1范数会使得部分w变为0, 从而达到了特 征选择的效果。

过滤模型简单且效率很高。由于过滤模型中的特征选择 过程独立于学习算法,这就容易与后面的学习算法产生 偏差,因此为了克服这个缺点提出了包裹模型。

高光谱整理

高光谱整理

1.遥感图像的最基本单元是像元,每个像元具有空间特征和属性特征。

空间特征:是用X值和Y值来表示;(纹理,形状,大小,方位)属性特征:常用亮度值表示。

(灰度值,亮度值)2.遥感图像特征(②,③遥感成像技术发展的方向)①时间分辨率:对同一地点进行遥感采样的时间间隔,集采样的时间频率。

也称重访周期。

②空间分辨率:像素所代表的地面范围的大小,或地面物体能分辨的最小单元;③光谱分辨率:传感器在接收目标辐射的光谱时能分辨的最小波长间隔;④辐射分辨率:指传感器接收波谱信号时,能分辨的最小辐射度差;3.高光谱遥感基本概念:①多光谱遥感(Multirspectral Remote Sensing),光谱分辨率在波长的1/10数量级范围内(几十个至几百个nm)的遥感;②高光谱遥感(Hyperspectral Remote Sensing),光谱分辨率在波长的1/100数量级范围内(几个nm)的遥感;③超光谱遥感(Ultraspectral Remote Sensing),光谱分辨率在波长的1/1000数量级范围内(0.2-1nm)的遥感。

4.高光谱遥感与常规多光谱遥感的比较:①高光谱遥感:即高光谱分辨率成像光谱遥感,幅宽小,成像范围小,其细微的波段可进行地物成分的识别,风度估计(精细识别)。

②常规多光谱遥感:幅宽大,成像范围宽,可进行宏观地物影像分析,不可被高光谱遥感完全取代(宏观变化趋势)。

研究宏观的变化情况则必须用多光谱成像仪。

5.高光谱遥感发展概况:高光谱遥感的基础是光谱学(spectroscopy).①光谱学:实验室分析地物光谱特征(获得谱信息)②成像技术:把遥感传感器放置航空或航天平台(获得地物的图像信息)③成像光谱学:把实验室仪器放置航空或航天平台(获得地物的图和谱信息)注:光学遥感的发展——空间、光谱分辨率的不断提高:①全色Panchromatic:主要通过形状(空间信息)识别地物。

②彩色color photography:增加了颜色的感知,加强型的颜色感知。

第4章-3 高光谱特征提取

第4章-3 高光谱特征提取
武汉大学 龚龑
《高光谱遥感》
二、基于可分性准则的特征提取原理
2.3定义特征映射形式
m1
y A x
nm
T
n1
m n
降维后的特征
即,准则函数
映射矩阵 原始光谱特征 类间散布矩阵
类内散布矩阵
12
希望在m维的Y 空间里,类别可分性最好
1 J1 Tr[ S yw S yb ]
在Y 空间达到最大
BT S yb B
BT S yw B I
B是一个m m的非奇异方阵
17
武汉大学 龚龑
《高光谱遥感》
二、基于可分性准则的特征提取原理
2.4求解映射矩阵
(S S ) A A(S S yb )
分析公式:
BT S yb B BT S yw B I
1 xw xb
1 yw
代入
《高光谱遥感》
一、高光谱特征提取概念 二、基于可分性准则的特征提取原理 三、高光谱特征提取主要方法 四、高光谱特征提取新方法及实例
8
武汉大学 龚龑
《高光谱遥感》
二、基于可分性准则的特征提取原理
2.1基于可分性准则的特征提取基本思想 基本思想:以类别可分性作为特征提取的准则, 要求提取的新特征所构成的特征空间具备最佳 的类别区分能力。 有样本支持
T
13
武汉大学 龚龑
《高光谱遥感》
二、基于可分性准则的特征提取原理
2.4求解映射矩阵 因此,变换后的Y空间里的可分性准则函数:
S yw A S xw A
T
S yb AT S xb A
J1 Tr[ S S yb ] = Tr[( A S xw A) ( A S xb A)]
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

08高光谱特征选择
高光谱特征选择是指根据光谱数据中的特征,将其中的关键特征挑选出来。

由于高光谱数据中有上千个波段,而每个波段具有很高的相关性,因此需要选择出最具代表性的特征,以降低数据维度和提高特征的可解释性。

下面将介绍几种经典的高光谱特征选择方法。

首先,基于统计方法的特征选择是最常见的方法之一、该方法通过计算各个特征与目标变量之间的关联度,来选择最具相关性的特征。

其中常见的方法包括皮尔逊相关系数、互信息和卡方检验等。

皮尔逊相关系数衡量了变量之间的线性相关性,互信息用于衡量变量之间的非线性相关性,而卡方检验则用于衡量分类变量之间的相关性。

其次,基于模型的特征选择是一种更加复杂的方法。

该方法通过建立预测模型,利用模型的反馈选择出最具有预测能力的特征。

常见的方法包括决策树、随机森林和支持向量机等。

决策树是一种简单而有效的分类工具,它可以通过计算各个特征的信息增益或基尼系数来选择最佳特征。

随机森林是一种基于决策树的集成学习方法,它可以通过计算各个特征的重要性指标来选择关键特征。

支持向量机是一种经典的机器学习方法,它利用核函数将数据映射到高维空间,并通过最大化间隔来选择最佳特征。

另外,基于降维的特征选择方法也是常见的方法之一、该方法通过降低数据的维度,将高维数据转化为低维数据,并选择其中具有代表性的特征。

常见的降维方法包括主成分分析和线性判别分析等。

主成分分析通过计算数据的协方差矩阵,得到最具代表性的主成分,从而实现降维和特征选择。

线性判别分析是一种有监督的降维方法,它通过计算数据的类别内散度矩阵和类别间散度矩阵,选择最佳的投影矩阵来实现特征选择。

最后,基于深度学习的特征选择方法是近年来兴起的一种方法。

该方法利用深度神经网络对高光谱数据进行训练,学习到最具代表性的特征。

常见的方法包括卷积神经网络和自编码器等。

卷积神经网络通过卷积和池化操作,提取图像中的空间特征,并结合全连接层进行特征选择。

自编码器则通过训练一个自动编码器来学习到数据的低维表示,从而实现特征选择。

总的来说,高光谱特征选择是一项重要的任务,它可以提高数据的可解释性和预测能力。

根据不同的数据特点和需求,可以选择不同的特征选择方法。

这些方法可以帮助我们从海量的光谱数据中选择出最具代表性的特征,进而为各种应用提供有价值的信息。

相关文档
最新文档