遥感影像识别-第三章 聚类分析 Part Ⅰ

合集下载

遥感影像识别-第三章 聚类分析 Part Ⅱ要点

遥感影像识别-第三章 聚类分析 Part Ⅱ要点

1.C-均值聚类算法(即:K-均值聚类算法) 2.ISODATA聚类算法

算法要解决的关键问题: ① 首先选择有代表性的点作为起始聚合中心。若 类型数目已知,则选择代表点的数目等于类型数 目;若未知,那么聚类过程要形成的类型数目, 就是一个值得研究的问题。 ② 代表点选择好之后,如何把所有样本区分到 以代表点为初始聚合中心的范围内,形成初始划 分,是算法的另一个关键问题。
1.C-均值聚类算法

C- 均值聚类算法使用的聚类准则函数是误差平方 和准则 : Jc
J c || xk m j ||
j 1 k 1
c
nj
2
为了使聚类结果优化,应该使准则 最小化。
Jc
(1)C-均值算法(一)
(1)C-均值算法(一)
(1)C-均值算法(一)
(1)C-均值算法(一)
聚类分析符合“物以类聚,人以群分“的原 则,它把相似性大的样本聚集为一个类型, 在特征空间里占据着一个局部区域。每个局 部区域都形成一个聚合中心,聚合中心代表 相应类型。 相似性准则:包括距离相似性度量和角度相似 性度量。 距离相似性度量:欧氏距离、马氏距离、明 氏距离。
De ( x, y) || x y ||
x2
Z1
D21
③按照某种聚类准则考察聚类结果,若不满意,则 重新选取距离阈值 、第一个聚合中心 ,返回 T ②,直到满意,算法结束。 Z1 在样本分布一定时,该算法的结果在很大程度上取 决于第一个聚合中心的选取和距离阈值的大小。♀ p66 该算法的优点是简单,如果有样本分布的先验知识 用于指导阈值和起始点的选取,则可较快得到合理 结果。对于高维的样本集来说,则只有经过多次试 探,并对聚类结果进行验算,从而选择最优的聚类 结果。

第三讲 遥感影像分类

第三讲 遥感影像分类

第三讲监督非监督分类本专题用到的数据:几何纠正、大气纠正后的影像;分类体系:水体、林地、草地、人工建筑、裸露地表、耕地本实习完成的内容:1、采用监督分类中的一种方法完成研究区的分类;2、分类后处理;3、分类精度统计(采用混淆矩阵表示);4、类别统计;一、分类的理论基础:1.目的:通过对图像中各类地物的光谱信息和空间信息进行分析,选择特征参数,并用一定手段将特征空间划分为互不重叠的子空间,然后将图像中的各个像元划归到各个子空间去的复杂过程。

2.理论依据:遥感图像中的同类地物在相同的条件下(纹理、地形、光照以及植被覆盖等等),应具有相同或相似的光谱信息特征和空间信息特征,从而表现出同类地物的某种内在的相似性,即同类地物像元的特征向量将集群在同一特征空间区域;而不同的地物其光谱信息特征或空间信息特征不同,将集群在不同的特征空间区域。

二、基本方法1. 非监督分类也称为聚类分析或点群分析,即在图像中搜寻、定义其自然相似光谱集群组的过程。

其完全按照像元的光谱特征进行统计分类,常常用于对分类区没有太多了解情况下。

这种方法人为干预较少,自动化程度较高。

该种分类方法的前提是假定遥感影像上同类物体在同样条件下具有相同的光谱信息特征。

Envi中非监督分类的两种算法:a.K-均值算法:通过迭代,逐次移动各类的中心,直到最好的聚类结果为止。

该法使用了聚类分析方法,它需要分析员在数据中选定所需的分类个数,随机地查找聚类簇的中心位置,然后迭代地重新配置它们,直到达到最优化的波谱分类。

b.ISODATA算法(Iterative Self-Organizing Data Analysis Techniques Algorithm)亦称迭代自组织数据分析算法,基于最小光谱距离公式,完全按照像元的光谱特性进行统计分类。

迭代:不断重复分类过程,并且重新计算统计值。

自组织:最少的用户输入即可进行类型的确定。

聚类过程始于任意聚类平均值或一个已有分类模板的平均值;用最小光谱距离把每一候选象元赋予一个类别;聚类每重复一次,聚类的平均值就更新一次,新聚类的均值再用于下次聚类循环。

遥感影像处理中的分类与目标提取方法

遥感影像处理中的分类与目标提取方法

遥感影像处理中的分类与目标提取方法遥感影像处理是利用遥感技术获取的遥感影像数据进行分析、处理和应用的过程。

在遥感影像处理中,分类和目标提取是非常重要的步骤。

分类是将遥感影像中的像素或区域划分到不同的类别中,而目标提取则是从遥感影像中提取出感兴趣的目标对象。

一、分类方法1.1 基于像素的分类方法基于像素的分类方法是将遥感影像中的每一个像素点都进行分类,常见的分类方法包括最大似然分类、支持向量机和随机森林等。

这些方法通过对每个像素的特征进行分析,将其划分到最适合的类别中。

1.2 基于目标的分类方法与基于像素的分类方法不同,基于目标的分类方法将遥感影像中的目标对象作为分类的基本单元。

例如,在城市遥感影像中,目标可以是建筑物、道路或植被等。

这种方法首先对目标进行提取,然后通过对提取的目标进行特征分析和分类。

二、目标提取方法2.1 基于形状特征的目标提取方法基于形状特征的目标提取方法主要是通过对目标的形状进行分析和比较来提取目标。

例如,可以使用边缘检测算法来提取目标的轮廓,然后通过对轮廓的形状进行分析和比较。

这种方法适用于目标具有明显边界和规则形状的情况,如建筑物和道路等。

2.2 基于纹理特征的目标提取方法基于纹理特征的目标提取方法通过对目标的表面纹理进行分析和比较来提取目标。

例如,可以使用纹理特征提取算法来提取目标的纹理特征,然后通过对纹理特征的分析和比较来判断目标。

这种方法适用于目标具有特殊的纹理特征的情况,如森林和农田等。

2.3 基于深度学习的目标提取方法近年来,随着深度学习的发展,基于深度学习的目标提取方法在遥感影像处理中得到了广泛的应用。

深度学习通过构建深度神经网络模型,可以从遥感影像中学习到更高级别的特征表示,从而实现更准确的目标提取。

例如,可以使用卷积神经网络来提取目标的特征,然后通过对特征进行分类或分割来提取目标。

三、遥感影像处理中的挑战在分类和目标提取的过程中,遥感影像处理面临着一些挑战。

如何进行遥感影像的目标识别与分类

如何进行遥感影像的目标识别与分类

如何进行遥感影像的目标识别与分类遥感影像的目标识别与分类在现代科技发展中扮演着重要的角色。

利用遥感技术,我们能够获取到大规模的影像数据,这些数据可以用来进行目标识别与分类,以支持各种应用领域,如环境监测、城市规划、农业管理等。

本文将探讨如何进行遥感影像的目标识别与分类。

一、遥感影像的目标识别遥感影像的目标识别是指从遥感影像中提取出特定目标的过程。

目标可以是建筑物、道路、农田等。

在进行目标识别之前,我们需要处理原始影像数据,进行预处理。

预处理包括辐射校正、几何校正等步骤,以确保影像数据的准确性和一致性。

接下来的关键步骤是特征提取。

特征提取是将影像数据转化为可量化的特征向量的过程。

常用的特征包括颜色、纹理、形状等。

在选择特征时,需要考虑目标的特点和任务需求。

例如,如果要进行建筑物的识别,可以考虑使用建筑物的形状和纹理作为特征。

特征提取后,我们可以使用机器学习算法进行目标的分类。

常用的机器学习算法包括支持向量机、随机森林、神经网络等。

这些算法可以根据提取的特征向量进行学习,构建分类模型,并对新的影像数据进行分类。

二、遥感影像的目标分类目标分类是将遥感影像中的特定目标分为不同的类别的过程。

例如,将影像中的土地分类为农田、水域、城市等。

目标分类与目标识别紧密相关,但目标分类更加注重对整个影像场景的分类。

对于目标分类,我们可以采用监督学习和无监督学习两种方法。

监督学习是指利用有标记的训练样本进行学习和分类。

在进行监督学习时,我们需要手动标记一部分影像数据,给出它们所属的类别。

然后,使用这些标记好的数据进行模型训练,构建分类器。

最后,使用分类器对未标记的数据进行分类。

无监督学习是指在没有标记的训练样本的情况下进行学习和分类。

该方法通常使用聚类算法,将影像数据分为不同的簇。

聚类算法通过计算数据点之间的相似性来划分簇,以实现目标分类。

除了监督学习和无监督学习,我们还可以采用半监督学习和深度学习等方法进行目标分类。

遥感影像分类方法

遥感影像分类方法

遥感影像分类方法1. 引言遥感影像分类是遥感技术的重要应用之一,它通过对遥感影像中的地物进行自动识别和分类,为地理信息系统、城市规划、农业等领域提供了重要数据支持。

本文将介绍遥感影像分类的基本概念和方法,并对常用的分类算法进行详细讨论。

2. 遥感影像分类概述遥感影像分类是指将遥感图像中的每个像素点或图像区域分配到预先定义的类别中。

这些类别通常代表不同的地物类型,如建筑物、水体、森林等。

遥感影像分类可以根据不同的目标进行不同尺度和精度的划分,从而满足不同应用需求。

3. 遥感影像分类方法3.1 监督学习方法监督学习是一种常用的遥感影像分类方法,它需要使用已标记好类别的样本数据作为训练集,并通过机器学习算法来构建分类模型。

常见的监督学习算法包括支持向量机(SVM)、随机森林(Random Forest)和深度学习等。

3.1.1 支持向量机(SVM)支持向量机是一种二分类模型,它基于统计学习理论和结构风险最小化原则进行模型训练。

在遥感影像分类中,支持向量机可以通过寻找最优的超平面来实现不同类别的分离。

3.1.2 随机森林(Random Forest)随机森林是一种集成学习方法,它通过构建多个决策树并进行投票来进行分类。

在遥感影像分类中,随机森林可以通过对决策树进行训练和组合来实现高精度的分类结果。

3.1.3 深度学习深度学习是一种基于神经网络的机器学习方法,它通过多层次的神经元网络结构来提取遥感影像中的特征,并进行分类。

深度学习在遥感影像分类中具有较好的性能,并且能够自动提取特征,无需手动设计特征。

3.2 无监督学习方法无监督学习是另一种常用的遥感影像分类方法,它不需要使用已标记好类别的样本数据进行训练。

无监督学习算法通常通过对图像进行聚类来实现分类,常见的算法包括K均值聚类和谱聚类等。

3.2.1 K均值聚类K均值聚类是一种简单且高效的无监督学习算法,它将遥感影像中的像素点划分为K个不同的类别。

K均值聚类通过迭代计算每个像素点与各个类别的距离,并将其划分到距离最近的类别中。

遥感影像处理与分析

遥感影像处理与分析

遥感影像处理与分析一、引言遥感影像处理与分析是一项用于获取和处理地球表面信息的技术,它对于了解自然环境变化、资源利用和环境保护方面提供了很多帮助,也对城市规划、农业生产、林业管理等方面起到支持作用。

在本文章中,我们将探讨遥感影像处理的方法、数据预处理、遥感影像分类、遥感影像变化检测等方面。

二、遥感影像处理的方法遥感影像处理的目的是将像元的属性信息转换为可视化的图片,以便人类观察和分析。

这种转换通常通过应用数字信号处理、图像处理和处理算法来完成。

常见的遥感影像处理方法包括:1. 图像增强:图像增强是使图像更清晰、更具对比度或缩放的过程。

增强可以使遥感图像适宜于不同的应用,如地貌分析和水文学。

2. 图像融合:图像融合是逐像素将多个源图像组合成单个输出图像的过程。

这种方法可以将不同传感器获得的多光谱或高光谱数据融合在一起,从而增加了遥感数据的可用性和可视化效果。

3. 估计:在一些应用场景下,需要从遥感数据中提取信息。

这需要估计各种地形和地貌信息,并将其处理成可视化的形式。

这种方法通常使用分类算法、回归方法或者机器学习技术来实现。

4. 遥感影像分割:遥感影像分割是将遥感影像分成不同的区域或对象。

这种方法通常使用基于像素的聚类或者基于拓扑的分割算法来实现。

三、数据预处理在进行遥感影像分析之前,需要对遥感数据进行预处理。

数据预处理过程通常包括数据预处理、噪声去除、解译标记和掩模制作。

1. 数据预处理:数据预处理通常包括校正、去噪和增强。

影像校正可以纠正遥感数据的几何校正和辐射校正,以减小图像中的拍摄偏差、纠正图片扭曲、消除不同地物物理反射和透射过程引起的影响,提高影像的精度和质量。

同时去噪和增强能使得仪器噪声降低,避免图像中的伪迹和干扰,在自然场景和高噪声环境中处理时具有显著的效果提升。

2. 噪声去除:噪声在遥感影像中是不可避免的,特别是图像的边缘部分容易被噪声干扰。

因此,必须使用合适的滤波器来去除噪声。

滤波技术可以分为线性和非线性滤波器两种,其中,线性滤波器采用加权平均法,非线性滤波器则更加注重对待图像中不同噪声的特殊处理,如中位数滤波、均值滤波等。

遥感影像解译中的目标识别与分类研究

遥感影像解译中的目标识别与分类研究

遥感影像解译中的目标识别与分类研究遥感影像解译是利用遥感技术获取的图像数据进行分析和解释,以获取地表目标的信息和特征。

在遥感影像解译的过程中,目标识别与分类是关键步骤之一,它涉及到对图像中的目标进行准确的分辨和分类。

本文将对遥感影像解译中的目标识别与分类研究进行探讨。

遥感影像解译中的目标识别与分类首先需要进行目标的识别。

目标识别是指在遥感影像中找到感兴趣的地物目标,如建筑物、道路、水体等,并将其从背景中准确地分离出来。

目标识别通常采用人工解译、机器学习等方法。

在人工解译中,解译员根据自己的经验和专业知识,通过观察和判断来辨别目标。

而机器学习方法则是通过训练算法将模式和特征提取与分类相结合,从而实现自动化的目标识别。

常用的机器学习方法包括支持向量机、决策树、随机森林等。

目标识别的准确性和效率是进行进一步研究的重要方向。

目标识别之后是目标的分类。

目标分类是指将识别出的目标根据其属性和特征进行归类,以实现对遥感影像中不同目标的准确分类。

目标分类的方法主要分为基于特征的分类和基于深度学习的分类。

基于特征的分类是利用目标的统计特征、形状特征和纹理特征等进行分类,常用的特征包括颜色直方图、纹理矩阵、小波变换等。

而基于深度学习的分类则是利用深度神经网络对目标进行特征学习和分类,深度学习方法如卷积神经网络、循环神经网络等。

目标分类的准确性和鲁棒性是研究的重点。

在遥感影像解译中,目标识别与分类的研究面临一些挑战。

首先,遥感影像具有较高的空间分辨率和光谱分辨率,其中包含大量的信息。

如何提取和选择有效的特征是目标识别与分类的关键。

其次,遥感影像中的目标通常存在着遮挡、光照变化和噪声等干扰因素,这对算法的鲁棒性提出了更高的要求。

此外,遥感影像的地理背景和尺度差异也会对目标识别与分类带来一定的挑战。

为了提高目标识别与分类的效果,可以采用以下方法。

首先,融合多尺度和多光谱的遥感数据,以获取更全面和准确的目标信息。

其次,引入上下文信息和空间约束,利用目标周围的背景信息和几何关系来辅助识别和分类。

如何进行遥感影像的解译与分析

如何进行遥感影像的解译与分析

如何进行遥感影像的解译与分析遥感影像解译与分析是一项重要的技术,广泛应用于地理信息系统、环境监测和资源调查等领域。

本文将探讨遥感影像的解译与分析方法,包括图像预处理、分类与识别、变化检测和空间分析等方面。

通过了解这些方法和技巧,我们可以更好地利用遥感影像来服务于社会发展和环境保护。

一、图像预处理图像预处理是遥感影像解译与分析的第一步,它的目的是提取和增强图像中的信息。

预处理包括辐射校正、几何校正、数据重采样和噪声滤波等环节。

其中,辐射校正是将影像数字化的原始值转换为可比较的、物理可解释的辐射亮度值。

几何校正则是将影像的位置和形状与地面真实情况相匹配。

数据重采样是通过插值算法调整影像的分辨率,以适应特定的应用需求。

噪声滤波可以消除图像中的杂乱噪声,提高图像的质量。

二、分类与识别分类与识别是遥感影像解译与分析的核心内容。

通过对影像进行分类与识别,可以将其划分为不同的地物类别,为后续的分析工作提供基础数据。

在分类与识别过程中,常用的方法有基于统计的分类方法、基于神经网络的分类方法和基于支持向量机的分类方法等。

这些方法主要依靠对样本数据进行训练,通过计算样本的特征向量和分类器的决策函数来判断图像中的地物类别。

三、变化检测随着时间的推移,地球表面上的地物会发生变化,例如城市扩张、植被生长和自然灾害等。

变化检测是遥感影像解译与分析的重要任务之一,其目的是通过比较同一地区在不同时间的影像数据,识别出发生变化的地物。

变化检测可以利用多期遥感影像的时序信息,通过计算像元值的差异或采用基于统计学的方法来进行。

同时,变化检测还可以基于阈值法、差异图像法和分类器等进行。

四、空间分析空间分析是遥感影像解译与分析的高级应用之一,其目的是揭示地表地貌与地物分布的空间关系。

空间分析主要侧重于地物的空间分布、空间特征和空间模式的研究,例如地物聚类分析、空间挖掘和空间插值等。

通过空间分析,可以深入了解地表的空间特征和地物之间的相互关系,为地理信息系统的建设和土地利用规划提供支持。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2)马氏(Mahalanobis)距离

定义:马氏距离的平方
2 ( x )T 1 ( x )
马氏距离排除了不同特征之间相关性的影响, 其关键在于协方差矩阵的计算。当∑为对角阵时 ,各特征之间才完全独立;当∑为单位矩阵时, 马氏距离等于欧氏距离。 马氏距离 比较适用于对样本已有初步分类的 情况,做进一步考核、修正。
从上图看出,(b)、(c)特征空间划分是不同的。 (b)中 x1 , x2 为一类,x3 , x4 为另一类,(c) 中 x1, x3 为一类,x2 , x4 为另一类。



欧氏距离具有旋转不变的特性,但对于一般的线性变换 不是不变的,此时要对数据进行标准化(欧氏距离使用 时,注意量纲,量纲不同聚类结果不同,克服这一缺点 ,要使特征数据标准化使之与量纲无关)。 另外,使用欧氏距离度量时,还要注意模式样本测量值 的选取,应该是有效反映类别属性特征(各类属性的代 表应均衡)。但马氏距离可解决不均衡(一个多,一个 少)的问题。 例如,取5个样本,其中有4个反映对分类有意义的特征 A,只有1个对分类有意义的特征B,欧氏距离的计算结 果,则主要体现特征A。

当预先不知道类型数目,或者用参数估计和非 参数估计难以确定不同类型的类概率密度函数 时,为了确定分类器的性能,可以利用聚类分 析的方法。 聚类分析无训练过程,训练与识别混合在一起 。

§ 3-1 相似性准则
xn} 设有样本集 X {x1, x2 ,...., ,要求按某种相似性把 X 分类,怎样实现?

1
2
n
1
2
c
c
J c || xk m j ||2
j 1 k 1
c
nj
式中
m j为类型
w j 中样本的均值: m j 1 nj
x
j 1
nj
j
j 1,2,....,c

m j是 c 个集合的中心,可以用来代表 c 个类型


是样本和集合中心的函数。在样本集X给定 J c 的取值取决于c个集合中心。 的情况下, J n 个试验样本聚合成 c 个类型时,所产生的 描述 J 总误差平方和。 越小越好。
Jc
c
c
最小方差划分:寻找 J c 最小的聚类结果,也就 是在误差平方和准则下的最优结果。

误差平方和准则适用于各类样本比较密集且样 本数目悬殊不大的样本分布。例如:

上图的样本分布,共有3个类型,各个类型的样本数目 相差不多( 10 个左右)。类内较密集,误差平方和很 小,类别之间距离远。

注意:如果不同类型的样本数目相差很大,采 用误差平方和准则,有可能把样本数目多的类 型分开,以便达到总的 J c 最小。
① 若模式样本的第i维特征取值为1,则该样本占有 第i维特征。 ② 若模式样本的第i维特征取值为0,则该样本无此 维特征。

此时, xT y 等于x与y两个向量中,共有的特征数目。
|| x || || y || ( xT x)( y T y )
为x占有的特征数目与y占有的特征数目的几何平均。

利用参数估计或非参数估计的方法,在混合密 度的局部极大值区域对应着一个类型,但是这 个方法需要大量的样本。况且,有时混合训练 样本集X的数据结构具有相同的统计特征,它们 都包含着不同数目的类型。 如下图所示,表示具有相同的试验平均值和样 本协方差矩阵的三个数据集。


在上述图中, (a) 具有一个类型, (b) 、(c) 各有两个 类型。此时,无论是参数估计,还是非参数估计, 都无法取得合理的结果,必须采用聚类分析的方法 进行分类。

1. 误差平方和准则(最常用的)
x} 假定有混合样本 X {x , x ,......,,采用某种相似性度量 , X 被聚合成 c 个分离开的子集,每个子集是一 n 个类型,它们分别包含 n , n ,......, 个样本。 为了衡量聚类的质量,采用误差平方和 J 聚类 准则函数,定义为:
课后思考
线性判别函数的适用性? 聚类分析的优缺点?
ERDAS image Model 工具如何实现聚类?

谢!

聚类分析符合“物以类聚,人以群分“的原则, 它把相似性大的样本聚集为一个类型,在特征空间 里占据着一个局部区域。每个局部区域都形成一个 聚合中心,聚合中心代表相应类型。如上图中,(a) 有一个聚合中心,(b)、(c)有两个。

聚类分析避免了估计类概率密度的困难,对每个 聚合中心来说都是局部密度极大值位置,其附近密 度高,距离越远密度越小。因此,聚类分析方法与 估计密度函数的方法还是一致的,只是采用了不同 的技术途径。

聚类分析的关键问题:如何在聚类过程中自动地确定类型 数目c。 实际工作中,也可以给定c值作为算法终止的条件。 聚类分析的结果与特征的选取有很大的关系。不同的特征 ,分类的结果不同。 因此,如何衡量样本相似性,对聚类有直接影响。
1. 距离相似性度量
一个模式样本,对应特征空间里的一个点。如 果模式的特征是适当选择的,也就是各维特征 对于分类来说都是有效的,那么同类样本就会 密集地分布在一个区域里,不同类的模式样本 就会远离。 因此,点间距离远近反映了相应模式样本所属 类型有无差异,可以作为样本相似性度量。距 离越近,相似性越大,属于一个类型。 聚类分析中,最常用的就是距离相似性。

(1)欧氏距离

欧氏距离简称距离,模式样本向量 x 与 y 之间的 欧氏距离定义为:
De ( x, y) || x y || | xi yi |2 i 1 这里, d为特征空间的维数。
d

当 较小时,表示x和y在一个类型区域, 反之,则不在一个类型区域。 De ( x, y)
这里有一个门限
中的样本个数 n j , X j 中的样本两两组 n ( n 1) 合共有 2 种。 || x x || 表示所有样本之间距离之和。 Pj 为 w j 类的先验概率 ,可以用样本数目 n j 和样本总数目n来估计。

j
j j
X
'
2
x X
j
x X
j
Pj
nj n
j 1,2,....,c
j 1 c

式中, m j 为
w j类型的样本均值向量:
1 mj nj
x
j 1
nj
j
j 1,2,...c

m为全部样本的均值向量:
1 n m xk n k 1

Pj 为
w j类型的先验概率,可以用
nj n
来估计


对于两类问题 w1 / w2,类间距离常用下试计算。
Jb (m1 m2 ) (m1 m2 )
2. 角度相似性度量

样本 x 与 y 之间的角度相似性度量定义为它们之 间夹角的余弦,即:
xT y S ( x, y) cos || x || || y || 也是单位向量之间的点积(内积)。 越大,x、y越相似。常用于情报检索、植 S ( x, y ) 物分类、疾病分类。

s
d 的选择问题。 s
若 d 选择过大,则全部样本被视作一个唯一类 型;若 选取过小,则可能造成每个样本都单 d 独构成一个类型。
s

必须正确选择门限值以保证正确分类。 另外,模式特征坐标单位的选取也会强烈地影 响聚类结果。
例如:一个二维模式,一个特征是长度,另一 个特征是压力。


当长度由厘米变为米,在 De ( x, y) 中长度特征的比重会下 降,同样,若把比重单位由毫米汞柱高度变成厘米汞柱 高度,De ( x, y) 值中压力特征的影响也会下降。 可以用图表示上述情况:
遥感影像识别
第三章: 聚类分析
Part Ⅰ
主要内容
§ 3-1 § 3-2 § 3-3 § 3-4 相似性准则 聚类准则函数 两种简单的聚类算法 动态聚类算法
上一章针对确定性的模式分类方法进行了讨论 ,所谓确定性的模式是指:如果试验对象和测 量条件相同,所有的测量具有重复性,即在多 次的测量中,它们的结果不变,这样获得的模 式,简称确定性的模式。 与之相对应的,测量结果是随机的,这样的模 式称为随机模式。随机模式可以采用基于 Bayes 理论的分类方法进行分类,其前提是各类别总 体的概率分布已知,要决策的分类的类别数一 定。 对于确定性的模式,如果类别已知(训练样本 属性也已知),则可以通过上一章介绍的方法 进行分类。
T

' b
两类问题的加权类间距离和:
1 2 1 T J n j (m j m)T (m j m) (n1 m1T m1 n1 mT m1 n2 m2 m2 n2 mT m2 n j 1 n

将 n m n1 m1 n2 m 代入上式,有: 2

因此,二元取值情况下, 反映x与y共有的特征数目的 S ( x, y ) 相似性度量。 显然, 越大,共有特征数目越多,相似性越高。
S ( x, y )
除上述相似性度量外,还有许多相似性度量,如 “样本与核的相似性度量”,“近邻函数值相等 ”相似性度量,这些都是为解决某一特殊问题的 相似性度量,都是从上述相似性度量派生出来的 。 样本相似性度量是聚类分析的基础,针对具体问 题,选择适当的相似性度量是保证聚类质量的重 要问题。但有了相似性度量还不够,还必须有适 当的聚类准则函数。聚类准则函数对聚类质量也 有重大影响。 ♂相似性度量 → 集合与集合的相似性。 ♂相似性准则 → 分类效果好坏的评价准则。
如下图所示:
2. 加权平均平方距离和准则

定义:加权平均平方距离和准则
相关文档
最新文档