利用主题模型的遥感图像场景分类
遥感图像的分类与解译方法

遥感图像的分类与解译方法遥感技术是指通过探测和记录地物表面的电磁辐射信息,利用飞机、卫星等传感器进行观测与测量,然后通过数字图像处理和分析来获取地表无法直接人工观测的地理信息的一种技术。
遥感图像分类与解译方法是在遥感图像处理的基础上对图像进行分类和解释的方法,是遥感技术的重要应用之一。
本文将主要介绍遥感图像的分类与解译方法的基本原理、常用算法以及发展趋势。
遥感图像分类是将遥感图像中的像素分成若干类别的操作,常见的分类结果有植被、裸地、水体等。
图像分类的目的是根据特定的应用需求,将图像中的地物或地物类别进行自动分辨并标定,从而为地理信息系统的应用提供数据支持。
图像分类分为监督分类和非监督分类两种方法。
监督分类是基于已知样本的分类方法,通过将一部分像素样本标注为目标类别,利用这些已知的样本建立分类模型,然后通过该模型对整幅遥感图像进行分类。
常见的监督分类方法有最大似然分类、支持向量机、决策树等。
其中,最大似然分类是一种统计学方法,利用样本的统计分布特征对像素进行分类,可以对不同类别进行有效区分。
支持向量机是一种基于统计学习理论的二分类算法,其原理是将样本空间映射到一个高维特征空间,通过构建一个最优分离超平面来进行分类。
决策树是一种基于树形结构的分类方法,通过一系列特征值的比较来决定最终的分类结果。
非监督分类是基于图像的统计特性进行分类的一种方法,该方法不依靠任何已知样本,而是根据图像本身的空间、光谱、纹理等信息对图像进行聚类。
常见的非监督分类方法有K-means聚类、ISODATA聚类等。
K-means聚类是一种基于聚类中心的方法,采用逐次迭代的方式将图像像素划分为不同的簇,直到达到预定的聚类数。
ISODATA聚类是一种自适应聚类算法,通过设定阈值标准和最小类别数来控制聚类的结果,最终得到稳定的分类结果。
遥感图像解译是指对遥感图像中的地物及其属性进行解释和分析的过程,通过对图像中的地物进行判读,提取出有价值的地理信息。
使用遥感图像分类进行土地利用类型划分的方法

使用遥感图像分类进行土地利用类型划分的方法引言:近年来,随着遥感技术的快速发展和应用的广泛性,遥感图像分类在土地利用类型划分中起到了重要的作用。
通过遥感图像分类,可以快速、准确地获取大量土地利用信息,为城市规划、环境保护、农业生产等提供可靠的数据支持。
本文将介绍一种常用的遥感图像分类方法,并结合实际案例,探讨其应用效果和可行性。
一、遥感图像分类的基本原理遥感图像分类是指根据遥感图像中的光谱、几何、纹理等特征,将图像中的对象分为不同的类别。
一般而言,遥感图像分类可以分为有监督和无监督两种方法。
1.有监督分类方法有监督分类方法是指在分类过程中,需要事先提供样本数据集,并根据这些样本进行训练和分类。
常用的有监督分类方法有最大似然法、支持向量机、人工神经网络等。
2.无监督分类方法无监督分类方法是指在分类过程中,不需要提供样本数据集,系统通过数据的统计特性和聚类分析方法自动对图像进行分类。
常用的无监督分类方法有K-means 聚类、ISODATA聚类等。
二、实例分析:基于遥感图像分类的土地利用类型划分以某市区为例,使用高分辨率遥感图像进行土地利用类型的划分。
在进行分类前,首先对图像进行预处理,包括辐射校正、几何校正、大气校正等,以确保获取准确的数据。
然后,选择合适的特征提取方法,例如基于像素、对象、纹理等特征,将图像中的各类信息提取出来。
接下来,根据提取到的特征,使用有监督或无监督分类方法对图像进行分类。
在本例中,我们采用了最大似然法作为有监督分类方法。
首先,我们利用已知的样本数据对分类器进行训练,使其能够准确地区分不同的土地利用类型。
然后,使用分类器对整幅遥感图像进行分类,将其划分为不同的类别,如农田、居民区、工业区等。
在分类结果的基础上,我们可以进行后续的空间分析和统计分析。
例如,可以计算各类别的面积、周长和形状指数,进一步了解土地利用类型的分布和特征。
同时,还可以与地理信息系统(GIS)数据进行叠加分析,获得更全面和准确的土地利用信息。
遥感图像分类方法及应用示例

遥感图像分类方法及应用示例遥感技术是通过卫星、飞机等远距离传感器获取地表信息的一种技术手段。
遥感图像分类是遥感技术中的一项重要任务,它可以将遥感图像中的像素按照其特征进行分类,并生成分类结果。
本文将介绍遥感图像分类的方法,并给出一些应用示例。
一、遥感图像分类方法1. 基于像元的分类方法基于像元的分类方法是将遥感图像中的每个像素点看作一个样本进行分类,通过像素点的光谱特征来确定其所属类别。
常见的方法有最大似然法、支持向量机等。
最大似然法是一种基于统计学原理的分类方法,它通过求解样本的概率密度函数来确定像素点的类别。
支持向量机是一种基于样本间距离的分类方法,它通过构建超平面将不同类别的样本分开。
2. 基于对象的分类方法基于对象的分类方法是将遥感图像中的像素组成的对象进行分类,通过对象的形状、纹理等特征来确定其所属类别。
常见的方法有基于区域的分割和基于对象的分类。
基于区域的分割将遥感图像中的像素按照相似性进行分组,形成具有相同特征的区域。
基于对象的分类是在分割得到的区域基础上,通过提取区域的特征来确定其所属类别。
3. 基于深度学习的分类方法随着深度学习技术的发展,基于深度学习的分类方法在遥感图像分类中得到了广泛应用。
深度学习通过构建深层神经网络模型,可以自动学习遥感图像中的特征表示。
常见的方法有卷积神经网络(CNN)、循环神经网络(RNN)等。
卷积神经网络可以有效地提取图像的空间特征,循环神经网络可以捕捉图像序列的时序特征。
二、遥感图像分类的应用示例1. 农作物类型分类农作物类型分类是农业生产中的重要任务,可以帮助农民了解农田的分布情况和种植结构,指导农作物管理和精细化农业。
通过遥感图像分类方法,可以将农田遥感图像中的不同农作物进行分类,比如小麦、玉米、水稻等。
这样可以帮助农民进行农作物识别和农田监测,提高农业效益。
2. 土地利用分类土地利用分类是城市规划和土地资源管理中的重要任务,可以帮助决策者了解土地利用的分布情况和变化趋势,指导城市规划和土地资源开发。
如何使用遥感图像进行土地利用和覆盖分类

如何使用遥感图像进行土地利用和覆盖分类遥感图像是指利用航空或卫星等远距离的遥感技术获取的地球表面的图像数据。
利用遥感图像进行土地利用和覆盖分类是一项重要的研究内容,对于地理环境、生态保护以及城市规划等方面都具有重要意义。
本文将探讨如何利用遥感图像进行土地利用和覆盖分类。
首先,了解土地利用和覆盖的概念是非常重要的。
土地利用主要指人类在地表上对土地进行的各种利用活动,包括农业、建筑、交通、工业等。
而土地覆盖是指地表被植被、水体、裸土等覆盖的情况。
正确认识土地利用和覆盖的概念是进行分类的基础。
其次,选择合适的遥感图像是进行分类的关键。
遥感图像的选择应根据研究对象和需要进行合理的选取。
在土地利用和覆盖分类中,常用的遥感图像包括卫星影像、航空影像以及无人机影像等。
其中,卫星影像覆盖面广,数据多源,适用于大范围的研究;而航空影像和无人机影像在空间分辨率方面具有优势,适用于小范围的高精度分类。
第三,对遥感图像进行预处理是进行分类的前提。
预处理工作包括几何校正、辐射校正、大气校正等。
几何校正是将遥感图像与地理坐标系统对应,使其与地球表面地理位置一一对应;辐射校正是消除图像中的辐射扰动,使其更贴近真实的地表反射率;大气校正是校正图像中的大气扰动,以提高图像的质量和准确性。
接下来,进行土地利用和覆盖分类的方法有很多种。
常用的方法包括基于像元的分类、基于目标的分类以及基于深度学习的分类等。
基于像元的分类是将图像像元按照其统计特征进行分组,根据统计特征进行判别,从而进行分类;基于目标的分类是将图像中的目标提取出来,对目标进行形态分析,根据形态特征进行分类;而基于深度学习的分类是近年来兴起的一种新方法,通过构建深度神经网络模型,根据图像的高级特征进行分类。
选择合适的分类方法需要结合研究对象和需要进行权衡。
最后,进行分类结果的验证和精度评价是非常重要的。
分类结果的验证和精度评价是判断分类方法好坏以及可靠性的指标。
常用的验证和评价方法包括混淆矩阵、准确度评价、Kappa系数等。
遥感图像分类的流程及相关算法

遥感图像分类的流程及相关算法在遥感应用领域,遥感图像分类是一项重要的任务,它可以帮助我们理解地表覆盖的类型和分布情况,为环境监测、土地利用规划、资源管理等提供基础数据支持。
本文将介绍遥感图像分类的流程以及一些常用的分类算法。
一、遥感图像分类的流程遥感图像分类的流程通常包括以下几个步骤:数据收集、数据预处理、特征提取、分类算法选择、分类模型训练和评估等。
首先,数据收集是遥感图像分类的前提,可以通过卫星采集或航空摄影等方式获取图像数据。
接下来,需要对原始数据进行预处理,包括大气校正、辐射定标、几何校正等,以确保数据的准确性和可比性。
然后,特征提取是图像分类的关键步骤,它可以帮助我们从图像中提取出能够反映地物类别的特征信息。
特征可以基于像素级别或对象级别进行提取,常用的特征包括光谱特征、纹理特征、形状特征等。
此外,可以利用主成分分析、小波变换等方法对特征进行降维处理,以减少计算量并提高分类效果。
在选择分类算法时,需要根据具体任务和数据特点进行合理选择。
常见的分类算法包括支持向量机、随机森林、神经网络等,每个算法都有其优缺点和适用场景。
在选择算法时应考虑分类准确性、计算效率、参数设置等因素。
分类模型训练是通过使用标记好的样本数据对分类算法进行训练,建立分类模型。
样本数据的标记可以通过人工的方式获取,也可以利用无标签数据和半监督学习等方法进行获得。
在训练过程中,需要合理划分训练集和验证集,并进行交叉验证以评估模型的性能。
最后,需要对分类模型进行评估,以评估分类结果的准确性和可靠性。
常用的评估指标包括准确率、召回率、F1值等,通过比较不同算法的评估结果,可以选择最佳的分类模型。
二、常用的遥感图像分类算法1. 支持向量机(Support Vector Machine,SVM):SVM是一种常用的分类方法,它能够有效地处理高维数据,具有较好的泛化能力。
SVM通过找到一个最优的超平面,将不同类别的数据分开。
2. 随机森林(Random Forest):随机森林是一种集成学习算法,由多个决策树组成。
利用遥感图像进行地物分类的步骤与要点

利用遥感图像进行地物分类的步骤与要点遥感技术是一种通过卫星或飞机搭载的传感器获取地球表面信息的方法。
利用遥感图像进行地物分类是遥感技术的重要应用之一,可以帮助我们更好地理解和管理地球。
本文将介绍利用遥感图像进行地物分类的步骤与要点。
第一步是获取遥感图像。
遥感图像可以通过卫星或飞机拍摄获得。
选择适当的遥感图像对于地物分类非常重要,因为不同传感器、不同波段的图像对地物分类的能力是不同的。
此外,图像的分辨率也是一个考虑因素。
高分辨率的图像可以提供更详细的地物特征,但可能需要更大的计算量和存储空间。
第二步是预处理。
预处理包括图像增强、辐射矫正和大气校正等过程。
图像增强可以改善图像的视觉效果,使地物特征更容易识别。
辐射矫正可以消除图像中由于传感器和大气散射引起的辐射畸变。
大气校正可以校正图像中由于大气散射引起的亮度变化,使地物的光谱特征更准确。
第三步是特征提取。
特征提取是从遥感图像中获取地物信息的关键步骤。
常用的特征包括光谱特征和空间特征。
光谱特征是指不同波段的反射率或辐射亮度,在遥感图像中表现为像素的灰度值。
空间特征是指地物在图像中的空间分布和几何形状,可以通过纹理、形状和结构等特征来描述。
第四步是训练样本标注。
训练样本是已知类别的地物样本,在地物分类中用于训练分类器。
标注样本需要专业人员根据地面调查或其他参考数据确定地物类别。
样本的数量和质量对于地物分类的准确性和可靠性至关重要。
通常,样本应该覆盖所有类别,并且应该有足够的样本数量来代表每个类别的特征。
第五步是选择分类算法。
分类算法是地物分类的核心。
常用的分类算法包括最大似然分类、支持向量机、人工神经网络等。
这些算法基于统计学和机器学习的原理,可以根据训练样本的特征来自动划分图像中的地物类别。
选择合适的分类算法需要考虑图像的特征、可用的训练样本和分类的准确性要求等因素。
第六步是进行分类。
在分类之前,需要将图像中的每个像素与训练样本进行比较,提取与样本相似的特征。
遥感图像场景分类综述

遥感图像场景分类综述遥感图像场景分类是指通过对遥感图像进行分析和解读,将图像中的不同场景进行分类和识别。
随着技术的不断进步和应用领域的拓展,遥感图像场景分类在农业、城市规划、环境监测、资源调查等领域具有广泛的应用前景和重要的研究价值。
本文将综述遥感图像场景分类的研究进展、常用的分类方法以及挑战和未来发展方向。
一、研究进展1.1 图像特征提取方法在遥感图像场景分类中,图像特征提取是关键的步骤之一。
传统的特征提取方法包括颜色直方图、纹理特征、形状特征等。
然而,随着深度学习技术的快速发展,基于卷积神经网络(CNN)的特征提取方法在遥感图像场景分类中取得了显著的性能提升。
1.2 分类器设计和优化分类器的设计和优化对于遥感图像场景分类的准确性和稳定性具有重要影响。
常见的分类器包括支持向量机(SVM)、决策树(DT)和随机森林(RF)等。
此外,研究人员还提出了一系列改进的分类器结构,如卷积神经网络(CNN)和循环神经网络(RNN),用于提高分类精度和处理复杂场景。
二、常用的分类方法2.1 基于传统机器学习的方法传统机器学习方法在遥感图像场景分类中被广泛应用。
这些方法通过提取图像的统计特征,如颜色、纹理和形状等,然后使用分类器对特征进行训练和分类。
这些方法的优点是计算效率高、模型可解释性强,但在复杂场景和大规模数据集上的表现有限。
2.2 基于深度学习的方法深度学习方法近年来在图像分类领域取得了巨大的成功,并在遥感图像场景分类中得到了广泛应用。
这些方法利用深度神经网络对图像进行特征学习和分类。
其中,卷积神经网络(CNN)是最常用的深度学习模型之一,通过采用多层卷积和池化操作,实现对图像特征的有效提取和表示。
三、挑战和未来发展方向3.1 多样性的地物类型和场景遥感图像中存在着多样性的地物类型和场景,如农田、森林、建筑物等。
不同地物类型的特征差异较大,因此如何从复杂的遥感图像中准确地提取并表示不同地物的特征仍然是一个挑战。
遥感图像中的场景分类与识别

遥感图像中的场景分类与识别第一章导论1.1 研究背景遥感图像是通过遥感技术获取的地球表面景物信息的图像。
随着遥感技术的发展,获取的遥感图像数量越来越多,其对场景分类与识别的需求也越来越迫切。
场景分类与识别是指对遥感图像中的不同景物进行分类和识别,并根据其特征对其进行进一步的分析与应用。
1.2 研究意义遥感图像的场景分类与识别在许多领域具有重要的应用价值。
例如,农业领域可以通过遥感图像对农作物进行分类与识别,实现精准农业管理;城市规划可以利用遥感图像对城市建筑进行分类与识别,提供决策支持;环境监测可以通过遥感图像对森林、湖泊、河流等进行分类与识别,帮助保护生态环境。
1.3 研究内容本文将从遥感图像中的场景分类与识别的基本原理、方法和应用展开研究,重点包括遥感图像特征提取、分类算法和应用案例分析等内容。
第二章遥感图像特征提取2.1 传统特征提取方法传统的特征提取方法主要包括颜色、纹理和形状等方面的特征。
颜色特征通过提取图像中像素的颜色信息来进行分类与识别;纹理特征通过提取图像中像素间的空间关系来进行分类与识别;形状特征通过提取图像中物体的边缘信息来进行分类与识别。
这些传统特征提取方法简单直观,但对于复杂的场景分类与识别任务来说,效果不够理想。
2.2 基于深度学习的特征提取方法近年来,深度学习在图像分类与识别领域取得了显著的进展。
基于深度学习的特征提取方法主要包括卷积神经网络(CNN)和循环神经网络(RNN)等。
利用CNN可以自动从遥感图像中学习到更高层次的抽象特征,提高场景分类与识别的准确度;利用RNN可以捕捉遥感图像中的时序信息,提高场景分类与识别的时序性能。
基于深度学习的特征提取方法具有极强的表达能力和泛化能力,逐渐成为场景分类与识别的主流方法。
第三章场景分类与识别算法3.1 传统分类算法传统的场景分类与识别算法主要包括K近邻算法(KNN)、支持向量机(SVM)和决策树等。
KNN算法通过计算样本间的距离进行分类与识别;SVM算法通过构建超平面进行分类与识别;决策树算法通过构建决策规则进行分类与识别。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第36卷第5期2011年5月武汉大学学报#信息科学版Geo matics and Informat ion Science of W uhan U niver sity V ol.36N o.5M ay 2011收稿日期:2011-03-15。
项目来源:国家自然科学基金资助项目(40801183,60890074)。
文章编号:1671-8860(2011)05-0540-04文献标志码:A利用主题模型的遥感图像场景分类徐 侃1 杨 文1 陈丽君1 孙 洪1(1 武汉大学电子信息学院,武汉市珞喻路129号,430079)摘 要:提出了一种基于主题模型与特征组合相结合的遥感图像分类方法。
该方法首先对图像进行尺度不变特征变换(SIF T )、几何模糊特征(G B)和颜色直方图特征(CH )提取,接着利用潜在概率语义分析(pL SA )模型分别对所得到的图像特征进行潜在主题的挖掘,然后对所得到的主题概率特征进行组合,最后利用支持向量机(SV M )分类器进行场景分类。
实验表明,与传统分类方法相比,主题模型更具优势;与使用单特征相比,特征组合具有更高的分类准确率。
关键词:场景分类;特征组合;pL SA 模型;支持向量机中图法分类号:P237.4近年来,为了跨越底层视觉特征与高层语义之间的障碍,使用中间语义来对场景进行分类的方法受到了广泛的关注。
然而,中间语义的生成通常需要大量的人工标注样本。
为了克服这一困难,一些文本主题模型的方法被应用到图像场景分类之中[1-4],这些方法可以将高维度的特征向量变换到低维度的潜在语义空间之上。
但是,由于主题分析模型是根据图像中视觉词汇出现的总体情况来进行分析的,所以这种方法并没有考虑到视觉词汇在空间的分布特点,同时图像特征的使用也仅限于单一的特征。
对于数量及分辨率都迅速增长的遥感图像而言,相对应的场景与地物类别也与日俱增,这使得人们对分类方法有了更高的要求[5-8]。
本文提出了一种将主题模型与特征组合相结合的遥感图像分类方法。
1 图像特征目前用于图像分类的特征主要包括纹理、颜色、形状、空间位置以及上下文先验信息特征等,这些特征在对图像进行表达时都有各自的侧重点。
本文实验中主要使用三种特征的互补性分别对图像的结构、颜色和边缘进行描述,并将它们组合之后用于图像分类。
¹尺度不变特征变换(scale -inv ariant feature transform,SIFT )[5]。
构造SIFT 描述算子时,以关键点为中心选取一个16@16的像素区域,将其划分为4@4个子块,分别在每个子块上计算8个方向的梯度直方图,最后产生的SIFT 特征向量就有16@8=128维。
º颜色直方图(colorhist,CH )。
基于不同的颜色空间,可统计出不同的颜色直方图。
本文采用RGB 颜色空间,其中各通道上的直方图维数为40,然后将所得直方图串联,最终形成120维的颜色直方图特征。
»几何模糊特征(g eo metr ic blur,GB)[9]。
本文先对图像进行边缘提取,得到稀疏信号,然后分别在三个通道上利用高斯核函数与图像卷积计算GB 描述子。
各通道上的维数均为68,将其串联得到204维的GB 特征。
2 语义模型由于计算机与人对图像信息的理解存在着客观区别,因而语义提取的有效性从很大程度上影响了图像分类的准确性,因此,越来越多的语义模型被引入到图像分类中来。
目前被广泛使用的两种语义模型pLSA (pr obabilistic latent semantic analysis)和LDA (latent dirichlet analy sis)都属于将特征向量降维到潜在语义空间上的生成模型。
在降维之前,实验中所使用的三种特征组合起来共有128+120+204=452维。
而在经过语第36卷第5期徐 侃等:利用主题模型的遥感图像场景分类义模型降维处理后,三种特征都映射到潜在语义空间上(潜在主题个数设为25),再进行组合便只有25+25+25=75维。
根据文献[10-12]的研究,当训练样本数量较小时,LDA 具有较明显的优势;而当训练样本数量偏大时,二者的性能则比较接近;在参数估计方面,由于pLSA 使用期望值最大化算法(EM ),而LDA 采用变分推理或吉布斯采样,在计算速度上前者要比后者更快,因此,本文实验采用pLSA 模型。
设一个文档集合(图像集)为D ={d 1,d 2,,,d N },一个视觉词汇集合为W ={w 1,w 2,,,w V },相应地,便会有一个V @N 维的/文档-词汇0共现频率矩阵N ij =n(w i ,d j ),这里n(w i ,d j )代表词汇w i 在文档d j 中出现的频率。
在pLSA 中,分析模型假设/文档-词汇0之间条件独立,令Z ={z 1,z 2,,,z k }表示潜在语义的集合,则在上面的假设前提下,/文档-词汇0的条件概率可表示为:P (d i ,w j )=P(d i )EKk=1P(w j |z k )P (z k |d i )(1)式中,P(w |z )表示潜在语义在词汇上的分布概率;P (z |d)表示文档中的潜在语义分布概率。
pLSA 利用极大似然估计,通过求解对数函数E d I D Ew I Wn(d i ,w j )lg P (d i ,w j )的极大值来计算pLSA 的参数。
在带有隐含变量的模型中,极大似然估计的标准过程是EM 算法:¹E 步,利用当前估计的参数值来计算隐含变量的后验概率:P (z |d,w )=P(z )P(z |d )P(w |z )Ez cP (z c )P(z c |d)P (w |z c )(2)ºM 步,利用上一步所得的期望值来最大化当前的参数估计:P(w |z )=E dn (d,w )P(z |d,w )E d ,w cn (d,w c )P (z |d,w c )(3)P(z |d )=E wn(d,w )P (z |d,w )Ez c ,w n(d,w )P (z c |d ,w )(4)P(z )=Ed,wn(d,w )P (z |d,w )Ed ,wn(d,w )(5)在EM 算法中,E 步和M 步相互迭代,直至最后参数收敛。
相对于潜在语义分析中的奇异值分解,EM 算法具有线性的收敛速度,而且较易于实现,能够使似然函数达到局部最优。
3 实验结果3.1 实验数据集本文所选择的数据集来源于Go ogle Earth,共包括12类场景的遥感图像:飞机场、桥梁、商业区、森林、工业区、牧场、停车场、池塘、港口、住宅区、河流及高架桥,其中每一类场景含有50幅图像,每幅图像的大小均为600像素@600像素,空间分辨率约为1m 。
基于特征的采样方法一般分为兴趣点采样、随机采样以及网格密集采样,文献[9]的研究表明,基于网格密集采样在分类结果上要优于基于兴趣点或区域检索,因此,本文采用网格密集采样来对整幅图像进行特征提取。
3.2 分类器实验中通过Liblinear 和LibSVM 软件包来实现正则化逻辑回归和SV M 分类器。
其中,正则化逻辑回归通过解决优化问题min w 12w T w +C E li =1N (w ;x i ,y i )(C >0)来实现分类功能,N (w ;x i ,y i )=lg (1+ex p (-y i w T x i ))是损失函数;C 是惩罚因子。
SVM 通过解二次优化问题m in 12+w +2+C E ni =1F i 得到最优超平面,约束条件为:y i (wx i )+b \1-F i (i =1,2,,,l),F i \0(6)其中,F 为松弛变量,在实验中由交叉验证算法得到;其相应的分类函数为f (x )=E ni =1y i A i K (x ,x i )+b 。
实验中所使用的内积核函数K (x ,x i )为径向基函数ex p {-+x -x i +2/(2R 2)}。
3.3 实验流程本实验的流程如图1所示,其中,使用视觉词汇的数量为300(使用K -m eans 聚类),潜在语义的数量设为25,把各幅图像中视觉词汇的统计直方图作为输入语义模型的条件概率。
对于每一种类别的图像,分别选取5、10、15、20、25幅图像作为训练数据,其余的则作为测试数据。
在使用特征方面,首先对三种特征分别运用pLSA 模型进行实验,将所得到的潜语义概率输入到Liblinear 分类器。
在对组合特征进行分类时,先把三种特征分别经pLSA 模型分离,将所得到的潜语义概率分别输入到Liblinear 分类器当中,然后再将所得结果串联起来,作为新的特征输入到LibSVM541武汉大学学报#信息科学版2011年5月分类器中。
实验都是在随机抽取训练与测试图像集上进行的,计算每次实验中12个类别的平均分类准确率,每组实验重复5次,将所得的平均准确率与标准偏差作为最终结果。
图1 分类实验流程F ig.1 F lo w Chart o f the Classification3.4 分类结果表1分别给出了直接运用BOW (bag of w ords)各类单特征在KN N 分类器下所得的实验结果(本文选择K =1,即最近邻分类方法)(方案¹)、各类单特征在运用Liblinear 分类器所得的结果(方案º)以及各类单特征在经过pLSA 语义模型降维后再使用Liblinear 时的实验结果(方案»)。
通过比较可以看出,使用pLSA 模型进行分类所得的实验结果要明显优于传统的BOW 方法。
这是因为前者在对特征进行降维的同时,也对潜在语义主题及其之间的关系进行挖掘,使之具有更丰富的信息。
此外,在pLSA 模型下,分类精度随着训练数据数量的增加而上升。
在仅使用单特征条件下,SIFT 所对应的分类效果最佳,而颜色直方图的分类效果则相对较差。
表2则将特征组合在不同分类器下所得的结果进行了比较。
不难发现,在对特征进行组合之后,分类精度较之前仅使用单特征有了明显的提高,且运用两层分类器比仅使用单层分类器所得的分类精度要略高。
图2给出了在使用特征组合情况下所得到的混淆矩阵,混淆矩阵的横轴与纵轴分别代表场景类别,第i 行j 列的值表示第i 类图像被分为第j 类图像的比例,其对角线上元素的值代表每类场景的分类准确率。
表1 分类结果T ab.1 Classificatio n R esults方特案征训练图像数量/幅510152025SIFT 48.3?8.955.8?8.859.5?9.462.2?7.964.3?7.2¹CH 38.1?8.545.9?6.850.5?6.453.9?9.656.5?6.9GB 43.7?6.849.9?9.652.9?6.855.1?8.756.6?7.9SIFT 49.5?7.958.8?8.163.5?8.465.2?7.168.9?6.6ºCH 39.2?8.146.4?6.651.8?5.854.8?9.957.1?6.1GB 46.2?6.353.4?9.460.8.?5.862.6?8.365.3?7.7SIFT 52.4?7.960.7?8.268.6?8.969.8?6.972.9?6.5»CH 36.5?8.044.5?6.650.8?5.453.6?9.755.3?5.9GB 49.0?6.258.3?9.264.7?5.966.7?8.268.9?7.7表2 特征组合在不同分类器下所得的结果T ab.2 Classification Result of the CombinedFeatures with Different Classifier s分类算法训练图像数量/幅510152025LibSVM 58.9?7.569.2?7.272.4?7.274.7?5.778.9?5.7Li blinear+LibSVM60.5?7.570.3?7.277.5?7.279.2?5.779.8?4.7图2 特征组合所得到的分类混淆矩阵F ig.2 Confusion M atr ix of the Co mbined Features从图3中不难发现,在12类场景类别中,住宅区是最容易分错的类别,其次则是桥梁与商业区,尤其是住宅区有很大一部分被错分为商业区。