基于CART决策树方法的遥感影像分类

作者：齐乐，岳彩荣， QI Le， YUE Cai-rong

作者单位：西南林业大学资源学院,云南昆明,650224

刊名：

林业调查规划

英文刊名：FOREST INVENTORY AND PLANNING

年，卷(期)：2011,36(2)

参考文献(7条)

1.颜丹丹CART算法在电信业潜在客户识别中的应用研究 2007

2.张晓娟;杨英健;盖利亚基于CART决策树与最大似然法的植被分类方法研究 2000(02)

3.陈鑫基于决策树技术的遥感影像分类研究 2006

4.许漫坤基于特征的纹理特征提取、分类与检索方法研究 2003

5.谭莹翁源县基于纹理信息及CART决策树技术的遥感影像分类研究 2008

6.王占昌利用决策树对卫星遥感数据进行分类 2005(05)

7.陈云;戴锦芳;李俊杰基于影像多种特征的CART决策树分类方法及应用 2008(02)

本文链接：https://www.360docs.net/doc/ed18985958.html,/Periodical_lydcgh201102016.aspx

遥感图像几种分类方法的比较

摘要遥感图像分类一直是遥感研究领域的重要内容，如何解决多类别的图像的分类识别并满足一定的精度，是遥感图像研究中的一个关键问题，具有十分重要的意义。遥感图像的计算机分类是通过计算机对遥感图像像素进行数值处理，达到自动分类识别地物的目的。遥感图像分类主要有两类分类方法:一种是非监督分类方法，另一种是监督分类方法。非监督分类方法是一个聚类过程，而监督分类则是一个学习和训练的过程，需要一定的先验知识。非监督分类由十不能确定类别属性，因此直接利用的价值很小，研究应用也越来越少。而且监督分类随着新技术新方法的不断发展，分类方法也是层出不穷。从传统的基十贝叶斯的最大似然分类方法到现在普遍研究使用的决策树分类和人工神经网络分类方法，虽然这些方法很大程度改善了分类效果，提高了分类精度，增加了遥感的应用能力。但是不同的方法有其不同优缺点，分类效果也受很多因素的影响。本文在对国内外遥感图像分类方法研究的进展进行充分分析的基础上，应用最大似然分类法、决策树分类法对TM影像遥感图像进行了分类处理。在对分类实现中，首先对分类过程中必不可少的并影响分类效果的步骤也进行了详细地研究，分别是分类样本和分类特征；然后详细介绍两种方法的分类实验；最后分别分析分类结果图，采用混淆矩阵和kappa系数对两种方法的分类结果进行精度评价。关键词:TM遥感影像，图像分类，最大似然法，决策树题目：遥感图像几种分类方法的比较...................................... 错误！未定义书签。摘要.. (1) 第一章绪论 (3)

1.1遥感图像分类的实际应用及其意义 (4) 1.2我国遥感图像分类技术现状 (5) 1.3遥感图像应用于测量中的优势及存在的问题 (6) 1.3.1遥感影像在信息更新方面的优越性 (6) 1.3.2遥感影像在提取信息精度方面存在的问题 (6) 1.4研究内容及研究方法 (8) 1.4.1研究内容 (8) 1.4.2 研究方法 (8) 1.5 论文结构 (9) 第二章遥感图像的分类 (9) 2.1 监督分类 (9) 2.1.1 监督分类的步骤 (9) 2.1.2 最大似然法 (11) 2.1.3 平行多面体分类方法 (12) 2.1.4 最小距离分类方法 (13) 2.1.5监督分类的特点 (13) 2.2 非监督分类 (14) 2.2.1 K-means算法 (14) K-均值分类法也称为 (14) 2.2.2 ISODATA分类方法 (15) 2.2.3非监督分类的特点 (17) 2.4遥感图像分类新方法 (17) 2.4.1基于决策树的分类方法 (17) 2.4.2 人工神经网络方法 (19) 2.4.3 支撑向量机 (20) 2.4.4 专家系统知识 (21) 2.5 精度评估 (22) 第三章研究区典型地物类型样本的确定 (24) 3.1 样本确定的原则和方法 (24) 3.2 研究区地物类型的确定 (24) 3.3样本区提取方案 (25) 3.4 各个地物类型的样本的选取方法 (25) 3.4.1 建立目视解译标志 (25) 3.4.2 地面实地调查采集 (26) 3.4.3 利用ENVI遥感图像处理软件选取样本点 (26) 第四章遥感图像分类实验研究 (26) 4.1遥感影像适用性的判定 (26) 4.2分类前的预处理 (28) 4.2.1空间滤波的处理 (28) 4.2.2 频域滤波处理 (28) 4.3利用ENVI软件对影像按照不同的分类方法进行监督分类 (30) 4.3.1监督分类 (30) 4.3.2 决策树 (33) 4.4分类后的处理 (35)

决策树算法研究及应用概要

决策树算法研究及应用? 王桂芹黄道华东理工大学实验十五楼206室摘要:信息论是数据挖掘技术的重要指导理论之一,是决策树算法实现的理论依据。决策树算法是一种逼近离散值目标函数的方法,其实质是在学习的基础上,得到分类规则。本文简要介绍了信息论的基本原理,重点阐述基于信息论的决策树算法,分析了它们目前主要的代表理论以及存在的问题,并用具体的事例来验证。关键词:决策树算法分类应用 Study and Application in Decision Tree Algorithm WANG Guiqin HUANG Dao College of Information Science and Engineering, East China University of Science and Technology Abstract:The information theory is one of the basic theories of Data Mining,and also is the theoretical foundation of the Decision Tree Algorithm.Decision Tree Algorithm is a method to approach the discrete-valued objective function.The essential of the method is to obtain a clas-sification rule on the basis of example-based learning.An example is used to sustain the theory. Keywords:Decision Tree; Algorithm; Classification; Application 1 引言决策树分类算法起源于概念学习系统CLS(Concept Learning System,然后发展到ID3

遥感图像分类

实验四遥感图像分类一、背景知识图像分类就是基于图像像元的数据文件值，将像元归并成有限几种类型、等级或数据集的过程。常规计算机图像分类主要有两种方法：非监督分类与监督分类，本实验将依次介绍这两种分类方法。非监督分类运用ISODATA（Iterative Self-Organizing Data Analysis Technique)算法，完全按照像元的光谱特性进行统计分类，常常用于对分类区没有什么了解的情况。使用该方法时，原始图像的所有波段都参于分类运算，分类结果往往是各类像元数大体等比例。由于人为干预较少，非监督分类过程的自动化程度较高。非监督分类一般要经过以下几个步骤：初始分类、专题判别、分类合并、色彩确定、分类后处理、色彩重定义、栅格矢量转换、统计分析。监督分类比非监督分类更多地要用户来控制，常用于对研究区域比较了解的情况。在监督分类过程中，首先选择可以识别或者借助其它信息可以断定其类型的像元建立模板，然后基于该模板使计算机系统自动识别具有相同特性的像元。对分类结果进行评价后再对模板进行修改，多次反复后建立一个比较准确的模板，并在此基础上最终进行分类。监督分类一般要经过以下几个步骤：建立模板(训练样本)分类特征统计、栅格矢量转换、评价模板、确定初步分类图、检验分类结果、分类后处理。由于基本的非监督分类属于IMAGINE Essentials级产品功能，但在IMAGINE Professional级产品中有一定的功能扩展，非监督分类命令分别出现在Data Preparation菜单和Classification菜单中，而监督分类命令仅出现在Classification菜单中。二、实验目的理解并掌握图像分类的原理，学会图像分类的常用方法：人工分类（目视解译）、计算机分类（监督分类、非监督分类）。能够针对不同情况，区别使用监督分类、非监督分类。理解计算机分类的常用算法实现过程。熟练掌握遥感图像分类精度评价方法、评价指标、评价原理，并能对分类结果进行后期处理。三、实验内容（6课时） 1.非监督分类（Unsupervised Classification)； 2.监督分类（Supervised Classification)； 3.分类精度评价（evaluate classification）； 4.分类后处理（Post-Classification Process）；四、实验准备实验数据：非监督分类文件：germtm.img 监督分类文件：tm_860516.img 监督模板文件：tm_860516.sig 五、实验步骤、方法 1、非监督分类（Unsupervised Classification)

决策树算法介绍(DOC)

3.1 分类与决策树概述 3.1.1 分类与预测分类是一种应用非常广泛的数据挖掘技术，应用的例子也很多。例如，根据信用卡支付历史记录，来判断具备哪些特征的用户往往具有良好的信用；根据某种病症的诊断记录，来分析哪些药物组合可以带来良好的治疗效果。这些过程的一个共同特点是：根据数据的某些属性，来估计一个特定属性的值。例如在信用分析案例中，根据用户的“年龄”、“性别”、“收入水平”、“职业”等属性的值，来估计该用户“信用度”属性的值应该取“好”还是“差”，在这个例子中，所研究的属性“信用度”是一个离散属性，它的取值是一个类别值，这种问题在数据挖掘中被称为分类。还有一种问题，例如根据股市交易的历史数据估计下一个交易日的大盘指数，这里所研究的属性“大盘指数”是一个连续属性，它的取值是一个实数。那么这种问题在数据挖掘中被称为预测。总之，当估计的属性值是离散值时，这就是分类；当估计的属性值是连续值时，这就是预测。 3.1.2 决策树的基本原理 1.构建决策树通过一个实际的例子，来了解一些与决策树有关的基本概念。表3-1是一个数据库表，记载着某银行的客户信用记录，属性包括“姓名”、“年龄”、“职业”、“月薪”、......、“信用等级”，每一行是一个客户样本，每一列是一个属性（字段）。这里把这个表记做数据集D。银行需要解决的问题是，根据数据集D，建立一个信用等级分析模型，并根据这个模型，产生一系列规则。当银行在未来的某个时刻收到某个客户的贷款申请时，依据这些规则，可以根据该客户的年龄、职业、月薪等属性，来预测其信用等级，以确定是否提供贷款给该用户。这里的信用等级分析模型，就可以是一棵决策树。在这个案例中，研究的重点是“信用等级”这个属性。给定一个信用等级未知的客户，要根据他/她的其他属性来估计“信用等级”的值是“优”、“良”还是“差”，也就是说，要把这客户划分到信用等级为“优”、“良”、“差”这3个类别的某一类别中去。这里把“信用等级”这个属性称为“类标号属性”。数据集D中“信用等级”属性的全部取值就构成了类别集合：Class={“优”，

基于决策树的分类方法研究

南京师范大学硕士学位论文基于决策树的分类方法研究姓名：戴南申请学位级别：硕士专业：计算数学（计算机应用方向）指导教师：朱玉龙 2003.5.1

摘要厂｛数掘挖掘，又称数据库中的知识发现，是指从大型数据库或数据仓库中提取具有潜在应用价值的知识或模式。模式按其作用可分为两类：描述型模式和预测型模式。分类模式是一种重要的预测型模式。挖掘分娄模式的方法有多种，如决策树方法、贝叶斯网络、遗传算法、基于关联的分类方法、羊Ｈ糙集和ｋ一最临近方、／法等等。，／驴Ｉ本文研究如何用决策树方法进行分类模式挖掘。文中详细阐述了几种极具代表性的决策树算法：包括使用信息熵原理分割样本集的ＩＤ３算法；可以处理连续属性和属性值空缺样本的Ｃ４．５算法；依据ＧＩＮＩ系数寻找最佳分割并生成二叉决策树的ＣＡＲＴ算法；将树剪枝融入到建树过程中的ＰＵＢＬＩＣ算法：在决策树生成过程中加入人工智能和人为干预的基于人机交互的决策树生成方法；以及突破主存容量限制，具有良好的伸缩性和并行性的ＳＩ，ｌＱ和ＳＰＲＩＮＴ算法。对这些算法的特点作了详细的分析和比较，指出了它们各自的优势和不足。文中对分布式环境下的决策树分类方法进行了描述，提出了分布式ＩＤ３算法。该算法在传统的ＩＤ３算法的基础上引进了新的数掘结构：属性按类别分稚表，使得算法具有可伸缩性和并行性。最后着重介绍了作者独立完成的一个决策树分类器。它使用的核心算法为可伸缩的ＩＤ３算法，分类器使用ＭｉｃｒｏｓｏｆｔＶｉｓｕａｌｃ＋＋６．０开发。实验结果表明作者开发的分类器可以有效地生成决策树，建树时间随样本集个数呈线性增长，具有可伸缩性。。，，荡囊关键字：数据挖掘１分类规则，决策树，分布式数据挖掘

试述遥感图像分类的方法,并简单分析各种分类方法的优缺点。

遥感原理与应用 1.试述遥感图像分类的方法，并简单分析各种分类方法的优缺点。答：监督分类：1、最大似然法；2、平行多面体分类法:这种方法比较简单，计算速度比较快。主要问题是按照各个波段的均值为标准差划分的平行多面体与实际地物类别数据点分布的点群形态不一致，也就造成俩类的互相重叠，混淆不清的情况；3、最小距离分类法:原理简单，分类精度不高，但计算速度快，它可以在快速浏览分类概况中使用。通常使用马氏距离、欧氏距离、计程距离这三种判别函数。主要优点：可充分利用分类地区的先验知识，预先确定分类的类别；可控制训练样本的选择，并可通过反复检验训练样本，以提高分类精度（避免分类中的严重错误）；可避免非监督分类中对光谱集群组的重新归类。主要缺点：人为主观因素较强；训练样本的选取和评估需花费较多的人力、时间；只能识别训练样本中所定义的类别，对于因训练者不知或因数量太少未被定义的类别，监督分类不能识别，从而影响分结果（对土地覆盖类型复杂的地区需特别注意）。非监督分类：1、ISODATA； 2、K-Mean：这种方法的结果受到所选聚类中心的数目和其初始位置以及模式分布的几何性质和读入次序等因素的影响，并且在迭代的过程中又没有调整类别数的措施，因此不同的初始分类可能会得到不同的分类结果，这种分类方法的缺点。可以通过其它的简单的聚类中心试探方法来找出初始中心，提高分类结果；主要优点：无需对分类区域有广泛地了解，仅需一定的知识来解释分类出的集群组；人为误差的机会减少，需输入的初始参数较少（往往仅需给出所要分出的集群数量、计算迭代次数、分类误差的阈值等）；可以形成范围很小但具有独特光谱特征的集群，所分的类别比监督分类的类别更均质；独特的、覆盖量小的类别均能够被识别。主要缺点：对其结果需进行大量分析及后处理，才能得到可靠分类结果；分类出的集群与地类间，或对应、或不对应，加上普遍存在的“同物异谱”及“异物同谱”现象，使集群组与类别的匹配难度大；因各类别光谱特征随时间、地形等变化，则不同图像间的光谱集群组无法保持其连续性，难以对比。

遥感影像的分类处理

摘要在面向对象的影像分类方法中，首先需要将遥感影像分割成有意义的影像对象集合，进而在影像对象的基础上进行特征提取和分类。本文针对面向对象影像分类思想的关键环节展开讨论和研究，(1) 采用基于改进分水岭变换的多尺度分割算法对高分辨率遥感影像进行分割。构建了基于高斯尺度金字塔的多尺度视觉单词，并且通过实验证明其表达能力优于经典的词包表示。最后，在词包表示的基础上，利用概率潜在语义分析方法对同义词和多义词较强的鉴别能力对影像对象进行分析，找出其最可能属于的主题或类别，进而完成影像的分类。近些年来，随着航空航天平台与传感器技术的高速发展，获取的遥感影像的分辨率越来越高。高分辨率遥感影像在各行业部门的应用也越来越广泛，除了传统的国土资源、地质调查和测绘测量等部门，还涉及到城市规划、交通旅游和环境生态等领域，极大地拓展了遥感影像的应用范围。因此，对高分辨率遥感影像的处理分析成为备受关注的领域之一。高分辨率遥感影像包括以下三种形式：高空间分辨率（获取影像的空间分辨率从以前的几十米提高到1 至5 米，甚至更高）；高光谱分辨率（电磁波谱被不断细分，获取遥感数据的波段数从几十个到数百个）；高时间分辨率（遥感卫星的回访周期不断缩短，在部分区域甚至可以连续观测）。本文所要研究的高分辨率遥感影像均是指“高空间分辨率”影像。相对于中低分辨率的遥感数据，高空间分辨率遥感影像具有更加丰富的空间结构、几何纹理及拓扑关系等信息，对认知地物目标的属性特征更加方便，如光谱、形状、纹理、结构和层次等。另外，高分辨率遥感影像有效减弱了混合像元的影响，并且能够在较小的空间尺度下反映地物特征的细节变化，为实现更高精度的地物识别和分类提供了可能。然而，传统的遥感影像分析方法主要基于“像元”进行，它处于图像工程中的“图像处理”阶段（见图1-1），已然不能满足当今遥感数据发展的需求。基于“像元”的高分辨率遥感影像分类更多地依赖光谱特征，而忽视影像的纹理、形状、上下文和结构等重要的空间特征，因此，分类结果会产生很严重的“椒盐(salt and pepper)现象”，从而影响到分类的精度。虽然国内外的很多研究人员针对以上缺陷提出了很多新的方法，如支持向量机(Support Vector Machine，SVM) 、纹理聚类、分层聚类(Hierarchical Clustering) 、神经网络(Neural Network, NN)等，但仅依靠光谱特征的基于像元的方法很难取得更好的分类结果。基于“像元”的传统分类方法还有着另一个局限：无法很好的描述和应用地物目标的尺度特征，而多尺度特征正是遥感信息的基本属性之一。由于在不同的空间尺度上，同样的地表空间格局与过程会表现出明显的差异，因此，在单一尺度下对遥感影像进行分析和识别是不全面的。为了得到更好的分类结果，需要充分考虑多尺度特征。针对以上问题，面向对象的处理方法应运而生，并且逐渐成为高空间分辨率遥感影像分析和识别的新途径。所谓“面向对象”，即影像分析的最小单元不再是传统的单个像元，而是由特定像元组成的有意义的同质区域，也即“对象”；因此，在对影像分析和识别的过程

遥感图像分类后处理

遥感图像分类后处理一、实验目的与要求监督分类和决策树分类等分类方法得到的一般是初步结果，难于达到最终的应用目的。因此，需要对初步的分类结果进行一些处理，才能得到满足需求的分类结果，这些处理过程就通常称为分类后处理。常用分类后处理通常包括：更改分类颜色、分类统计分析、小斑点处理（类后处理）、栅矢转换等操作。本课程将以几种常见的分类后处理操作为例，学习分类后处理工具。二、实验内容与方法 1.实验内容 1.小斑块去除 ●Majority和Minority分析 ●聚类处理（Clump） ●过滤处理（Sieve） 2.分类统计 3.分类叠加 4.分类结果转矢量 5.ENVI Classic分类后处理 ●浏览结果 ●局部修改 ●更改类别颜色 6.精度评价 1.实验方法在ENVI 5.x中，分类后处理的工具主要位于Toolbox/Classification/Post Classification/；

三、实验设备与材料 1.实验设备装有ENVI 5.1的计算机 2.实验材料以ENVI自带数据"can_tmr.img"的分类结果"can_tmr_class.dat"为例。数据位于"...\13数据\"。其他数据描述： ?can_tmr.img ——原始数据 ?can_tmr_验证.roi ——精度评价时用到的验证ROI 四、实验步骤 1.小斑块去除应用监督分类或者非监督分类以及决策树分类，分类结果中不可避免地会产生一些面积很小的图斑。无论从专题制图的角度，还是从实际应用的角度，都有必要对这些小图斑进行剔除或重新分类，目前常用的方法有Majority/Minority分析、聚类处理（clump）和过滤处理（Sieve）。 1)Majority和Minority分析 Majority/Minority分析采用类似于卷积滤波的方法将较大类别中的虚假像元归到该类中，定义一个变换核尺寸，主要分析（Majority Analysis）用变换核中占主要地位（像元数最多）的像元类别代替中心像元的类别。如果使用次要分析（Minority Analysis），将用变换核中占次要地位的像元的类别代替中心像元的类别。下面介绍详细操作流程：（1）打开分类结果——"\12.分类后处理\数据\can_tmr_class.dat"；（2）打开Majority/Minority分析工具，路径为Toolbox /Classification/Post Classification/Majority/Minority Analysis，在弹出对话框中选择"can_tmr_class.dat"，点击OK；（3）在Majority/Minority Parameters面板中，点击Select All Items选中所有的类别，其他参数按照默认即可，如下图所示。然后点击Choose按钮设置输出路径，点击OK执行操作。

如何运用决策树进行分类分析

如何运用决策树进行分类分析前面我们讲到了聚类分析的基本方法，这次我们来讲讲分类分析的方法。所谓分类分析，就是基于响应，找出更好区分响应的识别模式。分类分析的方法很多，一般而言，当你的响应为分类变量时，我们就可以使用各种机器学习的方法来进行分类的模式识别工作，而决策树就是一类最为常见的机器学习的分类算法。决策树，顾名思义，是基于树结构来进行决策的，它采用自顶向下的贪婪算法，在每个结点选择分类的效果最好的属性对样本进行分类，然后继续这一过程，直到这棵树能准确地分类训练样本或所有的属性都已被使用过。建造好决策树以后，我们就可以使用决策树对新的事例进行分类。我们以一个生活小案例来说什么是决策树。例如，当一位女士来决定是否同男士进行约会的时候，她面临的问题是“什么样的男士是适合我的，是我值得花时间去见面再进行深入了解的？” 这个时候，我们找到了一些女生约会对象的相关属性信息，例如，年龄、长相、收入等等，然后通过构建决策树，层层分析，最终得到女士愿意去近一步约会的男士的标准。图：利用决策树确定约会对象的条件

接下来，我们来看看这个决策的过程什么样的。那么，问题来了，怎样才能产生一棵关于确定约会对象的决策树呢？在构造决策树的过程中，我们希望决策树的每一个分支结点所包含的样本尽可能属于同一类别，即结点的”纯度”（Purity ）越来越高。信息熵（Information Entropy ）是我们度量样本集合纯度的最常见指标，假定当前样本集合中第K 类样本所占的比例为P k ，则该样本集合的信息熵为： Ent (D )=?∑p k |y| k=1 log 2p k 有了这个结点的信息熵，我们接下来就要在这个结点上对决策树进行裁剪。当我们选择了某一个属性对该结点，使用该属性将这个结点分成了2类，此时裁剪出来的样本集为D 1和D 2，然后我们根据样本数量的大小，对这两个裁剪点赋予权重|D 1||D|?，|D 2||D|?，最后我们就可以得出在这个结点裁剪这个属性所获得的信息增益（Information Gain ） Gain(D ，a)=Ent (D )?∑|D V ||D |2 v=1Ent(D V ) 在一个结点的裁剪过程中，出现信息增益最大的属性就是最佳的裁剪点，因为在这个属性上，我们获得了最大的信息增益，即信息纯度提升的最大。其实，决策树不仅可以帮助我们提高生活的质量，更可以提高产品的质量。例如，我们下表是一组产品最终是否被质检接受的数据，这组数据共有90个样本量，数据的响应量为接受或拒绝，则|y|=2。在我们还没有对数据进行裁剪时，结点包含全部的样本量，其中接受占比为p 1= 7690，拒绝占比为p 2=1490，此时，该结点的信息熵为： Ent (D )=?∑p k |y|k=1log 2p k =-（7690log 27690+1490log 21490）=0.6235

遥感图像分类方法的国内外研究现状与发展趋势

遥感图像分类方法的研究现状与发展趋势摘要：遥感在中国已经取得了世界级的成果和发展，被广泛应用于国民经济发展的各个方面，如土地资源调查和管理、农作物估产、地质勘查、海洋环境监测、灾害监测、全球变化研究等，形成了适合中国国情的技术发展和应用推广模式。随着遥感数据获取手段的加强，需要处理的遥感信息量急剧增加。在这种情况下，如何满足应用人员对于大区域遥感资料进行快速处理与分析的要求，正成为遥感信息处理面临的一大难题。这里涉及二个方面，一是遥感图像处理本身技术的开发，二是遥感与地理信息系统的结合，归结起来，最迫切需要解决的问题是如何提高遥感图像分类精度，这是解决大区域资源环境遥感快速调查与制图的关键。关键词：遥感图像、发展、分类、计算机一、遥感技术的发展现状遥感技术正在进入一个能够快速准确地提供多种对地观测海量数据及应用研究的新阶段，它在近一二十年内得到了飞速发展，目前又将达到一个新的高潮。这种发展主要表现在以下4个方面： 1. 多分辨率多遥感平台并存。空间分辨率、时间分辨率及光谱分辨率普遍提高目前，国际上已拥有十几种不同用途的地球观测卫星系统，并拥有全色0．8～5m、多光谱3．3～30m的多种空间分辨率。遥感平台和传感器已从过去的单一型向多样化发展，并能在不同平台

上获得不同空间分辨率、时间分辨率和光谱分辨率的遥感影像。民用遥感影像的空间分辨率达到米级，光谱分辨率达到纳米级，波段数已增加到数十甚至数百个，重复周期达到几天甚至十几个小时。例如，美国的商业卫星ORBVIEW可获取lm空间分辨率的图像，通过任意方向旋转可获得同轨和异轨的高分辨率立体图像；美国EOS卫星上的MOiDIS-N传感器具有35个波段；美国NOAA的一颗卫星每天可对地面同一地区进行两次观测。随着遥感应用领域对高分辨率遥感数据需求的增加及高新技术自身不断的发展，各类遥感分辨率的提高成为普遍发展趋势。 2. 微波遥感、高光谱遥感迅速发展微波遥感技术是近十几年发展起来的具有良好应用前景的主动式探测方法。微波具有穿透性强、不受天气影响的特性，可全天时、全天候工作。微波遥感采用多极化、多波段及多工作模式，形成多级分辨率影像序列，以提供从粗到细的对地观测数据源。成像雷达、激光雷达等的发展，越来越引起人们的关注。例如，美国实施的航天飞机雷达地形测绘计划即采用雷达干涉测量技术，在一架航天飞机上安装了两个雷达天线，对同一地区一次获取两幅图像，然后通过影像精匹配、相位差解算、高程计算等步骤得到被观测地区的高程数据。高光谱遥感的出现和发展是遥感技术的一场革命。它使本来在宽波段遥感中不可探测的物质，在高光谱遥感中能被探测。高光谱遥感的发展，从研制第一代航空成像光谱仪算起已有二十多年的历史，并受到世界各国遥感科学家的普遍关注。但长期以来，高光谱遥感一直处在以航空为基础的研究发展阶段，且主要

利用决策树方法对数据进行分类挖掘毕业设计论文

目录摘要 (3) Abstract (iii) 第一章绪论 (1) 1.1 数据挖掘技术 (1) 1.1.1 数据挖掘技术的应用背景 (1) 1.1.2数据挖掘的定义及系统结构 (2) 1.1.3 数据挖掘的方法 (4) 1.1.4 数据挖掘系统的发展 (5) 1.1.5 数据挖掘的应用与面临的挑战 (6) 1.2 决策树分类算法及其研究现状 (8) 1.3数据挖掘分类算法的研究意义 (10) 1.4本文的主要内容 (11) 第二章决策树分类算法相关知识 (12) 2.1决策树方法介绍 (12) 2.1.1决策树的结构 (12) 2.1.2决策树的基本原理 (13) 2.1.3决策树的剪枝 (15) 2.1.4决策树的特性 (16) 2.1.5决策树的适用问题 (18) 2.2 ID3分类算法基本原理 (18) 2.3其它常见决策树算法 (20) 2.4决策树算法总结比较 (24) 2.5实现平台简介 (25) 2.6本章小结 (29) 第三章 ID3算法的具体分析 (30) 3.1 ID3算法分析 (30) 3.1.1 ID3算法流程 (30) 3.1.2 ID3算法评价 (33) 3.2决策树模型的建立 (34) 3.2.1 决策树的生成 (34) 3.2.2 分类规则的提取 (377) 3.2.3模型准确性评估 (388) 3.3 本章小结 (39)

第四章实验结果分析 (40) 4.1 实验结果分析 (40) 4.1.1生成的决策树 (40) 4.1.2 分类规则的提取 (40) 4.2 本章小结 (41) 第五章总结与展望 (42) 参考文献 (44) 致谢 (45) 附录 (46)

决策树分类-8页文档资料

基于专家知识的决策树分类概述基于知识的决策树分类是基于遥感影像数据及其他空间数据，通过专家经验总结、简单的数学统计和归纳方法等，获得分类规则并进行遥感分类。分类规则易于理解，分类过程也符合人的认知过程，最大的特点是利用的多源数据。如图1所示，影像+DEM就能区分缓坡和陡坡的植被信息，如果添加其他数据，如区域图、道路图土地利用图等，就能进一步划分出那些是自然生长的植被，那些是公园植被。图1.JPG 图1 专家知识决策树分类器说明图专家知识决策树分类的步骤大体上可分为四步：知识（规则）定义、规则输入、决策树运行和分类后处理。 1.知识（规则）定义规则的定义是讲知识用数学语言表达的过程，可以通过一些算法获取，也可以通过经验总结获得。 2.规则输入

将分类规则录入分类器中，不同的平台有着不同规则录入界面。 3.决策树运行运行分类器或者是算法程序。 4.分类后处理这步骤与监督/非监督分类的分类后处理类似。知识（规则）定义分类规则获取的途径比较灵活，如从经验中获得，坡度小于20度，就认为是缓坡，等等。也可以从样本中利用算法来获取，这里要讲述的就是C4.5算法。利用C4.5算法获取规则可分为以下几个步骤：（1）多元文件的的构建：遥感数据经过几何校正、辐射校正处理后，进行波段运算，得到一些植被指数，连同影像一起输入空间数据库；其他空间数据经过矢量化、格式转换、地理配准，组成一个或多个多波段文件。（2）提取样本，构建样本库：在遥感图像处理软件或者GIS软件支持下，选取合适的图层，采用计算机自动选点、人工解译影像选点等方法采集样本。（3）分类规则挖掘与评价：在样本库的基础上采用适当的数据挖掘方法挖掘分类规则，后基于评价样本集对分类规则进行评价，并对分类规则做出适当的调整和筛选。这里就是C4.5算法。 4.5算法的基本思路基于信息熵来“修枝剪叶”，基本思路如下：从树的根节点处的所有训练样本D0开始，离散化连续条件属性。计算增益比率，取GainRatio（C0）的最大值作为划分点V0，将样本分为两个部分D11和D12。对属性C0的每一个值产生一个分支，分支属性值的相应样本子集被移到新生成的子节点上，如果得到的样本都属于同一个类，那么直接得到叶子结点。相应地将此方法应用于每个子节点上，直到节点的所有样本都分区到某个类中。到达决策树的叶节点的每条路径表示一条分类规则，利用叶列表及指向父结点的指针就可以生成规则表。

遥感图像分类方法综述

遥感图像分类方法综述刘佳馨摘要：伴随着科学技术在我们的生活中不断发展，遥感技术便应运而生，而遥感图像因成为遥感技术分析中的不可缺少的依据，变得备受关注。在本文中，以遥感图像分类方法为研究中心，从传统分类方法、近代分类方法两个方面对分类方法进行了介绍，并以此为基础对分类思想及后续处理进行说明，进而展望了遥感图像分类的研究趋势和发展前景。关键词：遥感图像；图像分类；分类方法 1 引言遥感，作为采集地球数据及其变化信息的重要技术手段，在世界范围内的各个国家以及我国的许多部门、科研单位和公司等，例如地质、水体、植被、土壤等多个方面，得到广泛的应用，尤其在监视观测天气状况、探测自然灾害、环境污染甚至军事目标等方面有着广泛的应用前景。伴随研究的深入，获取遥感数据的方式逐渐具有可利用方法多、探测范围广、获取速度快、周期短、使用时受限条件少、获取信息量大等特点。遥感图像的分类就是对遥感图像上关于地球表面及其环境的信息进行识别后分类，来识别图像信息中所对应的实际地物，从而进一步达到提取所需地物信息的目的。 2 遥感图像分类基本原理遥感是一种应用探测仪器，在不与探测目标接触的情况下，从远处把目标的电磁波特性记录下来，并且通过各种方法的分析，揭示出物体的特征性质及其变化的综合性探测技术。图像分类的目的在于将图像中每个像元根据其不同波段的光谱亮度、空间结构特征或其他信息，按照某种规则或算法划分为不同的类别。而遥感图像分类则是利用计算机技术来模拟人类的识别功能，对地球表面及其环境在遥感图像上的信息进行属性的自动判别和分类，以达到提取所需地物信息的目的。 3 遥感图像传统分类方法遥感图像传统分类方法是目前应用较多，并且发展较为成熟的分类方法。从分类前是否需要获得训练样区类别这一角度进行划分，可将遥感图像传统分类方法分为两大类，即监督分类（supervised classification）和非监督分类(Unsupervised

决策树影像分析

决策树分类法概念：决策树(Decision Tree),也就是一个类似于流程图的树型结构。一个决策树由一个根节点(Rootnodes)、一系列内部节点(Internal nodes)和分支以及若干个叶节点(Terminal nodes)组成,每个内部节点只有一个父节点和两个或多个子节点,节点和子节点之间形成分支。其中树的每个内部节点代表一个决策过程中所要测试的属性;每个分支代表测试的一个结果,不同属性值形成不同分支;而每个叶节点就代表一个类别,即图像的分类结果。树的最高层节点称为根节点,是整个决策树的开始。图1就是一棵用于遥感影像分类的二叉决策分类器的简单示意图。从中可以看到决策树的基本组成部分:根节点、分支和叶节点[18，19]。决策树是一种直观的知识表示方法,同时也是高效的分类器。它以信息论为基础,将复杂的决策形成过程抽象成易于理解和表达的规则或判断。此方法利用信息论中的信息增益寻找示例数据库中具有最大信息量的属性字段,形成一条规则以此建立决策树的一个节点,依据这条规则对指定遥感图像进行运算,所产生逻(真或假)派生出两类结果,或根据属性的不同取值形成多个分支, 该过程可向下继续拓展,直至图像分出类别(叶节点)。这种以自顶向下递归的方式构造判定决策树的方法称之为“贪心算法”。树的质量取决于分类精度和树的大小。一般来说,决策树进行遥感图像分类主要有三个阶段组成:第一阶段为准备阶段,输入图像,确定地物类型,统计训练区内各地物类型的信息 (光谱和非光谱信息); 第二阶段为构造阶段,选取具有较大信息量的属性形成规则建立决策树的内部节点,直到每个叶节点包括相同的类别为止;第三阶段为调整阶段,检查分类结果是否能正确分出所需类别,如果不能,需要对决策树进行调整 (剪枝和增加节点)直到建立一棵正确的决策树。 1

决策树分类算法

决策树分类算法决策树是一种用来表示人们为了做出某个决策而进行的一系列判断过程的树形图。决策树方法的基本思想是：利用训练集数据自动地构造决策树，然后根据这个决策树对任意实例进行判定。 1．决策树的组成决策树的基本组成部分有：决策节点、分支和叶，树中每个内部节点表示一个属性上的测试，每个叶节点代表一个类。图1就是一棵典型的决策树。图1 决策树决策树的每个节点的子节点的个数与决策树所使用的算法有关。例如，CART算法得到的决策树每个节点有两个分支，这种树称为二叉树。允许节点含有多于两个子节点的树称为多叉树。下面介绍一个具体的构造决策树的过程，该方法

是以信息论原理为基础，利用信息论中信息增益寻找数据库中具有最大信息量的字段，建立决策树的一个节点，然后再根据字段的不同取值建立树的分支，在每个分支中重复建立树的下层节点和分支。 ID3算法的特点就是在对当前例子集中对象进行分类时，利用求最大熵的方法，找出例子集中信息量（熵）最大的对象属性，用该属性实现对节点的划分，从而构成一棵判定树。首先，假设训练集C 中含有P 类对象的数量为p ，N 类对象的数量为n ，则利用判定树分类训练集中的对象后，任何对象属于类P 的概率为p/(p+n)，属于类N 的概率为n/(p+n)。当用判定树进行分类时，作为消息源“P ”或“N ”有关的判定树，产生这些消息所需的期望信息为： n p n log n p n n p p log n p p )n ,p (I 22++-++- = 如果判定树根的属性A 具有m 个值｛A 1, A 2, …, A m ｝，它将训练集C 划分成｛C 1, C 2, …, C m ｝，其中A i 包括C 中属性A 的值为A i 的那些对象。设C i 包括p i 个类P 对象和n i 个类N 对象，子树C i 所需的期望信息是I(p i , n i )。以属性A 作为树根所要求的期望信息可以通过加权平均得到

决策树分类的定义以及优缺点 (1)

决策树分类决策树（Decision Tree）又称为判定树，是运用于分类的一种树结构。其中的每个内部结点（internal node）代表对某个属性的一次测试，每条边代表一个测试结果，叶结点（leaf）代表某个类（class）或者类的分布（class distribution），最上面的结点是根结点。决策树分为分类树和回归树两种，分类树对离散变量做决策树，回归树对连续变量做决策树。构造决策树是采用自上而下的递归构造方法。决策树构造的结果是一棵二叉或多叉树，它的输入是一组带有类别标记的训练数据。二叉树的内部结点（非叶结点）一般表示为一个逻辑判断，如形式为(a = b)的逻辑判断，其中a 是属性，b是该属性的某个属性值；树的边是逻辑判断的分支结果。多叉树（ID3）的内部结点是属性，边是该属性的所有取值，有几个属性值，就有几条边。树的叶结点都是类别标记。使用决策树进行分类分为两步：第1步：利用训练集建立并精化一棵决策树，建立决策树模型。这个过程实际上是一个从数据中获取知识，进行机器学习的过程。第2步：利用生成完毕的决策树对输入数据进行分类。对输入的记录，从根结点依次测试记录的属性值，直到到达某个叶结点，从而找到该记录所在的类。问题的关键是建立一棵决策树。这个过程通常分为两个阶段： (1) 建树（Tree Building）：决策树建树算法见下，可以看得出，这是一个递归的过程，最终将得到一棵树。 (2) 剪枝（Tree Pruning）：剪枝是目的是降低由于训练集存在噪声而产生的起伏。决策树方法的评价。优点与其他分类算法相比决策树有如下优点： (1) 速度快：计算量相对较小，且容易转化成分类规则。只要沿着树根向下一直走到叶，沿途的分裂条件就能够唯一确定一条分类的谓词。 (2) 准确性高：挖掘出的分类规则准确性高，便于理解，决策树可以清晰的显示哪些字段比较重要。缺点一般决策树的劣势： (1) 缺乏伸缩性：由于进行深度优先搜索，所以算法受内存大小限制，难于处理大训练集。一个例子：在Irvine机器学习知识库中，最大可以允许的数据集仅仅为700KB，2000条记录。而现代的数据仓库动辄存储几个G-Bytes的海量数据。用以前的方法是显然不行的。

遥感影像分类实验报告

面向对象分类实验报告姓名：学号：指导老师：地球科学与环境工程学院

一、实验目的面向对象法模拟人类大脑认知过程，将图像分割为不同均质的对象，充分利用对象所包含的信息，将知识库转换为规则特征，从而提取影像信息。因为分析的是对象而不是像元，因此我们可以利用对象丰富的语义信息，结合各种地学概念，如面积、距离、光谱、尺度、纹理等进行分析。面向对象的遥感影像分析方法与传统的面向像元的影像分析方法不同。首先我们要用一定方法对遥感影像进行分割，在提取分割单元（图像分割后所得到的内部属性相对一致或均质程度较高的图像区域）的各种特征后，在特征空间中进行对象识别和标识，从而最终完成信息的分类与提取。二、实验意义 1、使用eCognition进行面向对象的影像分类的流程； 2、体会面向对象思想的内涵，学会将大脑认知过程转变为机器语言；三、实验内容 3.1、影像的预处理利用ERDAS软件将所给的全色影像和多光谱遥感影像进行融合，达到既满足高空间分辨率，又保留光谱信息。Image interperter-> spatial enhancement-> resolution merge.输入融合前的两幅影像，完成影像的预处理过程。图 1 图像融合步骤

图 2 融合后的图像 3.2、使用eCongition 创建工程 a、使用规则集模式创建工程图 3 模式选择 b、file->new projection ，打开Create Project和Import Image Layers两个

对话框，将上面的实验数据导入。（注意，数据以及工程文件保存路径不要有中文）图 4 导入数据 c、选择数据修改波段名称,并设置Nodata选项。

遥感图像分类方法研究综述_李石华

第2期,总第64期国土资源遥感N o.2,2005 2005年6月15日RE MOTE SENSI N G FOR LAND&RESOURCES Jun.,2005 遥感图像分类方法研究综述李石华1,王金亮1,毕艳1,2,陈姚1,朱妙园1,杨帅3,朱佳1 (1.云南师范大学旅游与地理科学学院,昆明650092;2.云南省寄生虫病防治所,思茅665000; 3.云南开远市第一中学,开远661600) 摘要:综述了遥感图像监督分类和非监督分类中的各种方法,介绍了各种方法的优缺点、适用领域和应用情况,并作了简单评述,最后,展望了遥感图像分类方法研究发展方向和研究热点。关键词:遥感;图像分类;分类方法中图分类号:TP751文献标识码:A文章编号:1001-070X(2005)02-0001-06 0引言随着卫星遥感和航空遥感图像分辨率的不断提高,人们可以从遥感图像中获得更多有用的数据和信息。由于不同领域遥感图像的应用对遥感图像处理提出了不同的要求,所以图像处理中重要的环节)))图像分类也就显得尤为重要,经过多年的努力,形成了许多分类方法和算法。本文较全面地综述了这些分类方法和算法,为遥感图像分类提供理论指导。 1遥感图像分类研究现状在目前遥感分类应用中,用得较多的是传统的模式识别分类方法,诸如最小距离法、平行六面体法、最大似然法、等混合距离法(I SO M I X)、循环集群法(ISODATA)等监督与非监督分类法。其分类结果由于遥感图像本身的空间分辨率以及/同物异谱0、 /异物同谱0现象的存在,往往出现较多的错分、漏分现象,导致分类精度不高[1]。随着遥感应用技术的发展,傅肃性等对P.V.Ba lstad(1986)利用神经网络进行遥感影像分类的研究情况以及章杨清等在利用分维向量改进神经网络在遥感模式识别中的分类精度问题作了阐述[2],孙家对M.A.Fried l(1992)和 C.E.Brodley(1996)研究的大量适用于遥感图像分类的决策树结构作了阐述[3],尤其是近年来针对高光谱数据的广泛应用,各种新理论新方法相继涌现,对传统计算机分类方法提出了新的要求[4,5]。 2基于统计分析的遥感图像分类方法 2.1监督分类监督分类是一种常用的精度较高的统计判决分类,在已知类别的训练场地上提取各类训练样本,通过选择特征变量、确定判别函数或判别规则,从而把图像中的各个像元点划归到各个给定类的分类方法[2,3,6,7]。常用的监督分类方法有:K邻近法(K-N earest Ne i g hbor)、决策树法(Decisi o n Tree C lassif-i er)和贝叶斯分类法(Bayesian C lassifier)。主要步骤包括:1选择特征波段;o选择训练区;?选择或构造训练分类器;?对分类精度进行评价。最大似然分类法(MLC)是遥感分类的主要手段之一。其分类器被认为是一种稳定性、鲁棒性好的分类器[8]。但是,如果图像数据在特征空间中分布比较复杂、离散,或采集的训练样本不够充分、不具代表性,通过直接手段来估计最大似然函数的参数,就有可能造成与实际分布的较大偏差,导致分类结果精度下降。为此,不少学者提出了最大似然分类器和神经网络分类器。改进的最大似然分类器多采用Gauss光谱模型作为条件概率密度函数模型,其中最简单的是各类先验概率相等的分类器(即通常所说的最大似然分类器),复杂的有Ediri w ickre m a等提出的启发式像素分类估计先验概率法。M clachlang J 收稿日期:2004-11-23;修订日期:2005-03-15 基金项目:国家重点基础研究发展计划(973计划)项目(2003CB41505-11)、国家自然科学基金项目(40361007)和云南省自然科学基金项目(2002D0036M和2003C0030Q)资助。