12.基于专家知识决策树分类

合集下载

基于ENVI的遥感图像分类方法比较研究

基于ENVI的遥感图像分类方法比较研究

基于ENVI的遥感图像分类方法研究比较(聊城大学环境与规划学院GIS专业2010级4班学号:2010203***)摘要基于监督分类方法在遥感图像分类中已经普遍应用,本文将介绍了几种ENVI 提供的常用的监督分类方法和ENVI EX提供的面向对象的分类方法。

对同一遥感图像运用这几种方法进行分类,并对分类结果进行对比,从而分析这几种方法分类精度之间的差异。

关键词遥感图像分类平行六面体最小距离法最大似然法面向对象第一章绪论1.1、研究的背景和意义随着遥感技术的发展,遥感已逐步成为采集地球数据及其变化信息的重要技术手段和重要的信息来源,并在世界范围内以及我国的许多政府部门、科研单位和公司得到广泛的应用。

由于不同领域遥感图像的应用对遥感图像处理提出了不同的要求,所以图像处理中重要的环节——图像分类也就显得尤为重要。

遥感图像通过亮度值或像元值的高低差异( 反映地物的光谱信息) 及空间变化( 反映地物的空间信息) 来表示不同地物的差异。

这是区分不同图像地物的物理基础。

遥感图像分类就是利用计算机通过对遥感图像中各类地物的光谱信息和空间信息进行分析,选择特征,将图像中每个像元按照某种规则或算法划分为不同的类别,然后获得遥感图像中与实际地物的对应信息,从而实现遥感图像的分类。

目前随着各种新理论新方法的相继涌现,遥感图像存在多种分类方法,所以本文主要是选取几种常用的监督分类方法和ENVI EX提供的面向对象分类方法用实验结果表明它们之间存在的差异。

1.2、研究方法(1)、本文从遥感图像解译的基本原理出发,阐述了ENVI软件在遥感图像解译中使用的原理,并对其提供的方法进行了详细的解读。

(2)、详细叙述了ENVI EX提供的Feature Extraction工具即面向对象分类方法的使用。

(3)、根据得到的分类结果,采用混淆矩阵和kappa系数对分类结果进行精度评价。

从中得出一些结论,并对ENVI软件在遥感图像分类方法中提出可行性建议。

郭平--土地分类精度评价

郭平--土地分类精度评价
通过目视可分辨5类地物,本次分类分为居民点、水域、 林地、耕地、裸地
采用Landsat7北京市影像数据,裁剪后RGB(432)波段组合的研究区影 像
(2)训练样本的选取
选好训练样本后, 进行分离度检查,根据 分离性值的大小,从小 到大列出感兴趣区组合, 这两个参数的值为0~2.0 之间,大于1.9说明样本 之间可分离性好,属于 合格样本,小于1.8,需 要重新选择样本,小于1, 考虑将两类样本合并成 一类样本。
1. 遥感影像分类
遥感图像通过亮度值或像元值的高低差异及空间变 化来表示不同地物的差异,这是区分不同图像地物的物 理基础。遥感图像分类通过计算机手段,利用某种算法 进行分类,获取遥感图像中与实际地物的对应信息,从 而实现遥感图像的分类,一般分类方法有监督分类与非 监督分类[1]。
1.1 监督分类
监督分类,又称训练分类法,用被确认类别的样本像元去识 别其他未知类别像元的过程。它就是在分类之前通过目视判读和 野外调查,对遥感图像上某些样区中影像地物的类别属性有了先 验知识,对每一种类别选取一定数量的训练样本,计算机计算每 种训练样区的统计或其他信息,同时用这些种子类别对判决函数 进行训练,使其符合于对各种子类别分类的要求,随后用训练好 的判决函数去对其他待分数据进行分类。使每个像元和训练样本 作比较,按不同的规则将其划分到和其最相似的样本类,以此完 成对整个图像的分类。
(2)本次研究中的验证
常用的精度评价的方法有两种:一是混淆矩阵;二是ROC曲线。其 中,比较常用的为混淆矩阵,ROC曲线可以用图形的方式表达分类精 度,比较形象。
真实参考源可以使用两种方式:一是ห้องสมุดไป่ตู้准的分类图;二是选择的 感兴趣区(验证样本区)。
真实的感兴趣区验证样本的选择可以是在高分辨率影像上选择, 也可以是野外实地调查获取,原则是获取的类别参考源的真实性。由 于没有更高分辨率的数据源,本例中就把原分类的TM影像当作是高分 辨率影像,在上面进行目视解译得到真实参考源,并采用混淆矩阵的 地表真实感兴趣区进行精度验证。

遥感影像处理知识

遥感影像处理知识

1.几何校正:几何校正是利用地面控制点和几何校正数学模型来矫正非系统因素产生的误差,同时也是将图像投影到平面上,使其符合地图投影系统的过程。

2.图像镶嵌:指在一定的数学基础控制下,把多景相邻遥感影像拼接成一个大范围、无缝的图像的过程。

3.图像裁剪:图像裁剪的目的是将研究之外的区域去除。

常用方法是按照行政区划边界或自然区划边界进行图像裁剪。

在基础数据生产中,还经常要进行标准分幅裁剪。

按照ENVI 的图像裁剪过程,可分为规则裁剪和不规则裁剪。

4.图像分类:遥感图像分类也称为遥感图像计算机信息提取技术,是通过模式识别理论,分析图像中反映同类地物的光谱、空间相似性和异类地物的差异,进而将遥感图像自动分成若干地物类别。

5.正射校正:正射校正是对图像空间和几何畸变进行校正生成多中心投影平面正射图像的处理过程。

6.面向对象图像分类技术:是集合邻近像元为对象用来识别感兴趣的光谱要素,充分利用高分辨率的全色和多光谱数据的空间、纹理和光谱信息来分割和分类,以高精度的分类结果或者矢量输出。

7.DEM:数字高程模型是用一组有序数值阵列形式表示地面高程的一种实体地面模型。

8.立体像对:从两个不同位置对同一地区所摄取的一对相片。

9.遥感动态监测:从不同时间或在不同条件获取同一地区的遥感图像中,识别和量化地表变化的类型、空间分布情况和变化量,这一过程就是遥感动态监测过程。

10.高光谱分辨率遥感:是用很窄而连续的波谱通道对地物持续遥感成像的技术。

在可见光到短波红外波段,其波谱分辨率高达纳米数量级,通常具有波段多的特点,波谱通道多达数十甚至数百个,而且各波谱通道间往往是连续的,因此高光谱遥感又通常被称为"成像波谱遥感"。

11.端元波谱:端元波谱作为高光谱分类、地物识别和混合像元分解等过程中的参考波谱,与监督分类中的分类样本具有类似的作用,直接影响波谱识别与混合像元分解结果的精度。

12.可视域分析:可视域分析工具利用DEM数据,可以从一个或多个观察源来确定可见的地表范围,观测源可以是一个单点,线或多边形13.三维可视化:ENVI的三维可视化功能可以将DEM数据以网格结构、规则格网或点的形式显示出来或者将一幅图像叠加到DEM数据上。

基于遥感与GIS的城市绿地信息提取方法

基于遥感与GIS的城市绿地信息提取方法

基于遥感与GIS的城市绿地信息提取方法摘要:城市绿地是城市中唯一有生命的基础设施,必须客观、准确地掌握城市绿地信息及其变化情况。

遥感技术给城市绿地信息调查提供了更为有效而便捷的手段,植被有其特殊的光谱响应,使得其有别于其他物质。

城市绿地的遥感提取方法有监督分类、决策树分类、面向对象分类等方法,每一种方法都有它的适用条件。

利用GIS的空间叠加分析可以为遥感绿地信息的属性赋值,增强遥感绿地信息的可利用性。

关键字:城市绿地,遥感技术,高分辨率影像,ENVI,GISAbstract: The city green space is the only living infrastructure in the city, we must objectively and accurately grasp the city green land information and its changes. The remote sensing technology provides a more effective and convenient means for the city green land information investigation, the vegetation has its special spectral response, which is different from other substances. The remote sensing extraction method of the city green extraction is the supervised classification, decision tree classification and object-oriented classification method, and each method has its applicable conditions. Using the GIS spatial overlay analysis can assigns for the remote sensing vegetation information attribute, and enhance the remote sensing vegetation information availability. Keywords: city green space; remote sensing technology; high resolution images; ENVI; GIS0 引言城市绿地是城市中唯一有生命的基础设施,它在改善城市生态环境和人居环境起着积极的作用,城市绿地含量逐渐成为衡量城市生活质量的1个重要指标。

图像分类

图像分类

第六章图像分类遥感图像分类就是利用计算机对遥感图像中各类地物的光谱信息和空间信息进行分析,选择特征,将图像中每个像元按照某种规则或算法划分为不同的类别,然后获得客观的地物信息的过程。

一般的分类方法可分为两种:监督分类与非监督分类。

将多源数据应用于图像分类中,发展了基于专家知识的决策树分类。

4.1 非监督分类非监督分类是指人们事先对分类过程不施加任何的先验知识,而仅凭数据(遥感影像地物的光谱特征的分布规律),即自然聚类的特性,进行“盲目”的分类;其分类的结果只是对不同类别达到了区分,但并不能确定类别的属性。

其类别的属性是通过分类结束后目视判读或实地调查确定的。

主要有两方法:ISODATA分类与K-Means 分类。

4.1.1 ISODATA分类ISODATA是一种遥感图像非监督分类法。

全称“迭代自组织数据分析技术”(Iterative Self-Organizing Data Analysis Technique)。

ISODATA使用最小光谱距离方程产生聚类,此方法以随机的类中心作为初始类别的“种子”,依据某个判别规则进行自动迭代聚类的过程。

在两次迭代的之间对上一次迭代的聚类结果进行统计分析,根据统计参数对已有类别进行取消、分裂、合并处理,并继续进行下一次迭代,直至超过最大迭代次数或者满足分类参数(阈值),完成分类过程。

操作步骤如下:(1)在主菜单中,选择File→Open Image File,打开待分类图像;(2)在主菜单中,选择Classification→Unsupervised→ISOData;(3)在Classification Input File选择分类的图像文件;(4)在ISODATA Parameters窗口中设置分类参数以及输出路径和文件名(图4-1);图4-1 ISODATA分类参数设置Mumber of Classes:Min,max:类别数量范围,一般输入最小数量不能小于最终分类数量,最大数量为最终分类数量的23倍;Maximum Iterations:最大迭代次数,迭代次数越大,得到的结果越精确,运算时间也越长;Change Threshold:变换阈值,当每一类的变化像元小于阈值时,结束迭代过程;Minimun # Pixel in Class:一类所需的最小像元数,如果某一类中的像元数小于最少像元数,则将其中的像元归并到距离最近的类型中;Maximum Class Stdv:最大分类标准差,以像素值为单位,如果某一类的标准差比该阈值大,则将该类分成两类;Minimum Class Distance:类别均值之间的最小距离,以像素值为单位,如果类均值之间的距离小于该值,则类别将被合并;Maximum # Merge Pairs:最大的合并类别;Maximum Stdev From Mean:距离类别均值的最大标准差,为可选项。

数据挖掘知识点归纳

数据挖掘知识点归纳

知识点一数据仓库1.数据仓库是一个从多个数据源收集的信息存储库,存放在一致的模式下,并且通常驻留在单个站点上。

2.数据仓库通过数据清理、数据变换、数据集成、数据装入和定期数据刷新来构造。

3.数据仓库围绕主题组织4.数据仓库基于历史数据提供消息,是汇总的。

5.数据仓库用称作数据立方体的多维数据结构建模,每一个维对应于模式中的一个或者一组属性,每一个单元存放某种聚集的度量值6.数据立方体提供数据的多维视图,并允许预计算和快速访问汇总数据7.提供提供多维数据视图和汇总数据的预计算,数据仓库非常适合联机分析处理,允许在不同的抽象层提供数据,这种操作适合不同的用户角度8.OLAP例子包括下钻和上卷,允许用户在不同的汇总级别上观察数据9.多维数据挖掘又叫做探索式多维数据挖掘OLAP风格在多维空间进行数据挖掘,允许在各种粒度进行多维组合探查,因此更有可能代表知识的有趣模式。

知识点二可以挖掘什么数据1.大量的数据挖掘功能,包括特征化和区分、频繁模式、关联和相关性分析挖掘、分类和回归、聚类分析、离群点分析2.数据挖掘功能用于指定数据挖掘任务发现的模式,分为描述性和预测性3.描述性挖掘任务刻画目标数据中数据的一般性质4.预测性挖掘任务在当前数据上进行归纳,以便做出预测5.数据可以与类或概念相关联6.用汇总、简洁、精确的表达描述类和概念,称为类/概念描述7.描述的方法有数据特征化(针对目标类)、数据区分(针对对比类)、数据特征化和区分8.数据特征化用来查询用户指定的数据,上卷操作用来执行用户控制的、沿着指定维的数据汇总。

面向属性的归纳技术可以用来进行数据的泛化和特征化,而不必与用户交互。

形式有饼图、条图、曲线、多维数据立方体和包括交叉表在内的多维表。

结果描述可以用广义关系或者规则(也叫特征规则)提供。

9.用规则表示的区分描述叫做区分规则。

10.数据频繁出现的模式叫做频繁模式,类型包括频繁项集、频繁子项集(又叫频繁序列)、频繁子结构。

遥感数字图像处理实验课教案模板

遥感数字图像处理实验课教案模板

毕节学院教师教案(2012~2013学年第1学期)课程名称:遥感数字图像处理英文名称:Remote sensing digital image processing课程编号:2812230课程类别:专业方向选修课学分: 1总学时:34 理论学时:实验学时:34 授课班级:地理科学2010级任课教师:任金铜职称: 助教所在学院:地理与生命科学学院一、实验项目、内容及学时分配二使用教材及主要参考书目、参考文献等1、教材:邓书斌.ENVI遥感图像处理方法[M].北京:科学出版社,2010.062、主要参考书:[1]李小娟、刘晓萌等.ENVI遥感影像处理教程[M]. 北京:中国环境科学出版社,2007[2]赵文吉、段福州等.ENVI遥感影像处理专题与实践[M]. 北京:中国环境科学出版社,2007三成绩考核办法1、成绩考核采用百分制记分, 60分以上取得该实验课程的学分2、平时成绩70%(包括考勤、预习、实验操作、实验报告等)3、期终考核30%4、综合考核成绩=平时成绩×70%+学期考核×30%教学进度计划表实验一软件基础(一)(2学时)一、实验类型基础性二、实验目的1、了解遥感数字图像处理软件的背景、软件的功能及特点2、了解软件的文件系统和存储3、掌握软件常用系统配置三、实验原理ENVI作为遥感数字图像处理的主流软件之一,其软件处理技术覆盖了图像数据的输入/输出、定标、图像增强、纠正、正射校正、镶嵌、数据融合以及各种变换、信息提取、图像分类等。

ENVI栅格文件格式:ENVI使用的是通用栅格数据格式,包含一个简单的二进制文件和一个相关的ASCII的头文件。

常用系统配置包括常用参数的选择、用户自定义文件、默认文件目录的配置等。

这些配置可以方便用户对软件的定制,选择合适的配置适合用户的使用习惯。

四、实验仪器设备、实验材料及药品计算机、ENVI4.8软件五、实验重点软件的文件系统和存储;软件常用系统配置六、实验难点文件的存储及软件常用系统配置七、实验内容、方法及步骤1、实验内容:(1)遥感数字图像处理软件的背景、软件的功能及特点(2)遥感数字图像处理软件的文件系统和存储(3)遥感数字图像处理软件的软件常用系统配置2、实验方法讲授法、启发式教学法、多媒体演示教学法、实验法3、实验步骤(1)通过讲授法介绍遥感数字图像处理软件的背景、软件的功能及特点(2)通过讲授法、多媒体演示教学法引导学生学习遥感数字图像处理软件的文件系统和存储①主菜单界面主菜单——File——Save File As,将图像按照需要的格式进行存储,保存为原始数据,没有拉伸等增强处理②主图像窗口主菜单——File——Save Images As,将图像按照需要的格式进行存储,存储的图像是显示的图像样式。

决策树environment

决策树environment

决策树environment1. 概述基于知识的决策树分类是基于遥感影像数据及其他空间数据,通过专家经验总结、简单数学统计和归纳方法等,获得分类规则并进行遥感分类。

分类规则易于理解,分类过程也符合人的认知过程,最大的特点是利用多源数据。

专家知识决策树分类的步骤大体上可分为四步:知识(规则)定义、规则输入、决策树运行和分类后处理。

难点是规则的获取,可以来自经验总结,如坡度小于20度是缓坡等;也可以通过统计的方法从样本中获取规则,如C4.5算法、CART算法、S-PLUS算法等。

本课程以Landsat TM5影像和这个地区对应的DEM数据为例,学习基于专家知识决策树分类。

数据存放在“\12.基于专家知识决策树分类\数据”文件夹内,影像和DEM经过了精确配准。

2.数据本课程以Landsat TM5影像和这个地区对应的DEM数据为例。

3. 详细操作步骤3.1 规则获取根据经验和专家知识获取如下规则:● Class1(缓.植.):NDVI>0.3, slope<20● Class2(朝.陡.植.):NDVI>0.3, slope>=20, 90<=aspect<=270● Class3(朝.陡.植.):NDVI>0.3, slope>=20, , aspect<90 或aspect>270● Class4(.体):NDVI<=0.3, 0<b4<20● Class5(.地):NDVI<=0.3, b4>=20● Class6(.数.区,背.): NDVI<=0.3, b4=0注:其中,NDVI为归一化植被指数;slope为坡度;aspect为坡向;bN代表第N 个波段。

3.2 制作决策树(1)首先打开待分类数据及其他多源数据。

打开File > Open,选择“\12.基于专家知识决策树分类\数据”文件夹内的boulder_tm.dat和boulder_dem.dat;注:boulder_tm.dat为待分类图像,boulder_dem.dat为DEM数据。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于专家知识的决策树分类
技术支持邮箱:ENVI-IDL@ 技术支持热线:400-819-2881-7 官方技术博客:/enviidl 官方技术qq群:148564800
课程简介
- 专家知识的决策树分类基本原理
根据光谱特征、空间关系和其他上下文关系归类像元
规则描述——表达式与变量
变量 表达式 基本运 算符 三角函 数 部分可用函数 +、-、*、/ Sin、cos、tan asin、acos、atan Sinh、cosh、 tanh…. LT、LE、EQ…. and、or、not…. 最大值、最小值 slope aspect ndvi Tascap pc mnf lpc Stdev Mean 其他符 号 Min、max 其他 计算坡度 计算坡向 计算归一化植被指数 穗帽变换 主成分分析 最小噪声变换 局部主成分分析 标准差 平均值 最大、最小值 …… 作用
陡坡上的植被
+
+ +
DEM
缓坡上的植被
Road Map Zoning Coverage Landcover Classification
+
高山植被
公园用地
专家知识的决策树分类基本步骤
知识(规则)定义
规则输入
决策树运行
Hale Waihona Puke 分类后处理规则定义
• 规则获取:经验总结和样本总结 • 规则描述
– Class1(缓坡植被):NDVI>0.3, slope<20 – Class2(朝北陡坡植被):NDVI>0.3, slope>=20, 90<=aspect<=270 – Class3(朝南陡坡植被):NDVI>0.3, slope>=20, , aspect<90 or aspect>270 – Class4(水体):NDVI<=0.3, 0<b4<20 – Class5(裸地):NDVI<=0.3, b4>=20 – Class6(无数据区,背景): NDVI<=0.3, b4=0
关系/逻 辑
指数(^)、exp 对数alog 平方根(sqrt)、 绝对值(abs) ……
如:{ndvi} LT 0.3
练习:
• 数据
– \12.基于专家知识决策树分类\数据\boulder_tm.dat”
• 规则获取(经验总结和样本总结) • 构建执行决策树
本节收获
• 学习了ENVI下构建决策树的操作流程,并使用构建的 决策树进行图像分类。
相关文档
最新文档