基于决策树的多光谱影像分类研究

合集下载

LANDSAT影像多种分类方法比较研究

LANDSAT影像多种分类方法比较研究
大量名纳%义税以对人上万外游以元经纳离大挂,营税于2家靠0,人征1查共经5并单管询 着同营年向位1范分 这-2探为报被87围析 一讨主告挂流月户之、 系。, 靠域实,外下 列 挂 人综现小。户 问 靠交上合税规原以调 题一人通缴X治款模则查 对.2.X、(.道运管2理企XX走61县车X护输理实业0X体 等访万2为辆县岸业费2施(县布 级师合的元全例所对工是。户方三交置 :专治方;部,有交X是程国 ,案)通与.业理.法我X.为截人通学民 客设监运、措论9的1。县准道至)输校经运计测输教施2文(任、一并交3考路0,运实济范业育设1五务纳、对通户工证作5对将业现的围税以计)目.税高调业,种号者.年国车.税社传6与收及林标人提校查主货7:内辆收会统月时征为研X草与户出行的要运(培的登政X功行底段管衡究.措规数教了政情以运一.训一.记策时能业,基量。施模题增学现管况1自输)单.念些在.执1间的,4.共本一高设加6目在理进主设位也高6被行(:浅前实有情所校计:,户标一的行经计.:X在校(.挂情四谈提施.登况高在X以但。活些基一营原发的9一靠况)X新。营记X 校实摘远据把动高本般和则生行四).人X和监鉴形自改.的 是现.要2低统思,校概性挂X针着政、治(X征17测定式增交否教:于计想配行念分靠河X、巨管水理货管世(内单级下后通治具学小地,合政和析经为县政大理土任运情纪二2容位领高,一输理备和流0税行高管内,营例共策的具保务企1况以)方:.导校如、运论竞科.4域.移教动校理容提为浅有X,变有持业开后总法安行何强业6学争研年X综交育统的 出主谈交这提化一监)展,体与排政加化纳(习力两交日…前活一学弊 加,小通两高,定测名了随布.频,各管强理税二.,的项通期….移动到生端国强我流运个政大的下专着局次扎项理交论1人)帮全一重.运:县.交、全更,外税分域输0.中治学借,X题社实任的通X能治助面个要8输1交的两军好并知

基于线性判别分析的高光谱图像分类研究

基于线性判别分析的高光谱图像分类研究

基于线性判别分析的高光谱图像分类研究近年来,随着卫星、遥感等技术的发展,获取高光谱图像数据已成为可能。

高光谱图像是指一种具有多光谱波段的图像,它能够提供有关场景中物质种类、含量、空间分布等方面的详细信息。

高光谱图像分类就是将高光谱图像中不同波段的反射率或辐射值作为特征,通过对这些特征进行分类,并区分出图像中的不同物质种类和空间组成结构。

高光谱图像分类技术在军事、环境监测、农业等领域有着广泛的应用价值。

本文将围绕基于线性判别分析的高光谱图像分类研究进行探讨,并介绍其应用及研究进展。

一、线性判别分析(LDA)技术线性判别分析(LDA)是一种经典的多元统计分析方法,旨在发现不同类别之间的线性关系。

LDA 的目的是对样本进行投影,使得不同类别之间线性可分,同一类别内部的样本在投影后尽量紧凑。

该方法适用于低维数据的分类问题,广泛应用于各种数据分类问题中,是许多模式识别和图像处理算法的关键技术,包括高光谱遥感图像分类。

在高光谱图像分类中,我们将高光谱图像中的每个像素点看成一个样本,每个波段的反射率或辐射值看成该样本的特征。

通过应用 LDA 对这些特征进行分类,可以得到一个分类器,可以对高光谱图像进行分类,实现图像中不同物质种类和空间组成结构的区分。

二、高光谱图像分类研究进展在高光谱图像分类研究领域,目前有许多研究者在探索各种新的方法和技术。

其中,LDA 技术作为一种经典的分类方法,在高光谱图像分类中也得到了广泛应用。

LDA 技术的主要步骤包括:数据预处理、降维、分类模型构建和分类预测。

数据预处理包括去除噪声和归一化处理;降维可以采用主成分分析(PCA)等方法;分类模型构建则是在降维后选择合适的 LDA 模型,并在训练集上调整模型参数;分类预测则是利用训练出的模型对新图像进行分类。

近年来,有许多研究者通过改进 LDA 方法,对高光谱图像分类研究做出了贡献。

例如,将核函数引入LDA 方法中,可以将低维度的数据映射到高维度空间中,从而更好地提取数据的特征信息;使用深度学习来处理高光谱图像,利用深度神经网络(DNN)来提取高光谱图像的特征信息,这种方法可以学习到更精细的特征,提高了分类的准确度。

基于NDVI的决策树分类方法研究

基于NDVI的决策树分类方法研究

基于NDVI的决策树分类方法研究严玉奎【摘要】20世纪80年代以来,随着城镇化进程的快速发展,我国土地利用结构发生了明显的变化.及时准确地掌握土地利用状况有利于有关部门根据土地利用现状做出合理的规划和正确的决策,有利于促进经济和社会的协调发展.本文针对石河子垦区地物覆盖的特点,综合分析了不同覆盖类别区域的时序NDVI特性以及他们之间的差异性,选择最能反映土地覆盖情况和有效区分不同地类的两期TM影像,解算制作NDVI亮度图.利用均值滤波器对NDVI亮度图进行平滑处理,降低噪声.根据不同地物时序NDVI的差异选择适当的阈值进行决策树分类.精度评价结果表明该方法能够简单有效的区分不同覆盖类型的地类,特别是季节性变化差异较大的地区.【期刊名称】《北京测绘》【年(卷),期】2016(000)003【总页数】6页(P85-89,84)【关键词】NDVI;均值滤波;决策树;分类【作者】严玉奎【作者单位】中材地质工程勘查研究院有限公司,北京100102【正文语种】中文【中图分类】P237土地资源是人类赖以生存和发展的物质基础。

随着科学技术的大幅度进步和经济水平快速提高,人类对土地的利用强度不断增强,导致了地表生物地球化学循环水温过程和景观动态的快速变化,土地利用成为当前人类活动对全球变化的重要影响因素。

土地覆盖变化及其时空规律研究已经成为当前全球变化研究的热点问题[1]。

遥感能够快速、准确地获取大范围地表变化信息,已经成为当前土地覆盖变化研究的主要手段。

NDVI( Normalized Difference Vegetation Index , 归一化植被指数)作为一个重要的遥感参数,能够敏感地反映出植被生长状况、生物物理化学性质及生态系统参数的变化,在一定程度上反映了像元所对应区域的土地覆盖类型的综合情况,因而在在土地覆盖遥感研究中植被系数常被用于土地覆盖的分类、描述植被生长状况、植被光合能力、叶面积指数 ( LAI) 、现存绿色生物量和植被生产力等。

用随机决策树群算法进行高光谱遥感影像分类

用随机决策树群算法进行高光谱遥感影像分类

rd ci i u saem to s n ae nteseta rn e sp otvco c i S M)n ua eut nwt sbpc eh d db sdo h pcrl ag, u p r etr o h a mahn V , e rl e(
摘 要 : 高光谱影像 具有丰富 的光谱信 息,与全色 、多光谱影像相 比能更好地进行地面 目标的分类 识别. 该文对
决策 树分类算法的优劣进行分析 ,引入 随机 决策树群算法, 青海省祁连县H p r n 对 y ei 高光谱影像¥ I — 6 o iRSP 影像数 l
据进行实验 , 使用子 空间划分和光 谱距离进行降维后 , 分别采用支持 向量机 、 神经 网络 、最大似然法进行分类 ,并 与随机决策树群算法分类结果进行 比较. 结果表 明, 该算法表现最优且无需降维预处理,可广 泛应用于 高光谱遥感
Abs r c : Hy e s e t a m a e o t i i h s c r li f r a i n a d h v e t r p r o m a c n g o n tat p r p c r li g s c n an rc pe t a n o m to n a e b t e e f r n e i r u d
He a o i c ,Ch n n n Pr v n e ia
3 S h o { ealria ce c n n i ern } e ta o t nvri } h n s a4 0 8 ,C i a . c o l M tl gcl in ea dE gn e g C nrl uh U iest C a gh 1 0 3 hn 0 u S i S y
D : 036 /.s. 5—272 1. . 8 OI 1. 9 jsn0 589 . 1 60 9 i 2 0 0 0

多光谱遥感图像分类算法研究与实现

多光谱遥感图像分类算法研究与实现

多光谱遥感图像分类算法研究与实现随着技术开发的进步,遥感技术逐渐受到广泛关注。

近年来,随着计算机技术的快速发展,人工智能等新技术的不断涌现,遥感图像分类算法的应用越来越广泛。

多光谱遥感图像分类算法作为遥感图像分类领域的一种经典算法,其具有精度高、可靠性强等优点,得到广泛应用和研究。

一、多光谱遥感图像分类算法的定义多光谱遥感图像分类算法是指运用机器学习方法对多光谱遥感图像中的特征进行学习和分类的一种算法。

其基本思想是通过测量地球自然和人造物体反射或辐射出的电磁波的能量,形成具有不同波长和频率的多光谱图像,从而获取图像数据。

通过对多光谱图像数据的处理和分析,可以提取具有代表性的信息,为不同地物的快速识别和分类提供有力支撑。

二、多光谱遥感图像特征提取多光谱遥感图像分类算法的核心之一是特征提取。

特征提取是利用计算方法,对多光谱图像中的像元进行判断和分类,从中提取出具有代表性的信息。

其过程通常包括数据预处理、特征提取和特征选择等步骤。

数据预处理包括图像去噪、图像增强等,以保证提取到的特征具有鲁棒性和稳定性。

特征提取可以通过多种数学方法实现,如投影法、主成分分析法、独立成分分析法等。

三、多光谱遥感图像分类算法多光谱遥感图像分类算法是将图像中的像元分为不同类别的过程。

其目的是将图像像元的不同特征进行聚类,以便表现地物分类特征。

它可以通过无监督和监督学习等方法实现。

其中,无监督学习是指基于聚类分析的算法,可以在不事先知道分类种类的情况下对图像进行分类;监督学习是指通过已有的各类地物分类信息,建立分类模型,并在该模型指导下对图像进行分类。

常见的多光谱遥感图像分类算法包括最小距离分类法、最大似然分类法、支持向量机分类法、决策树分类法等。

四、多光谱遥感图像分类算法实现多光谱遥感图像分类算法实现的步骤包括图像预处理、特征提取、像元分类等。

具体步骤如下:1.图像预处理:对多光谱图像进行去噪、增强等处理,以提高算法的准确性。

基于机器学习的高光谱图像分类方法研究

基于机器学习的高光谱图像分类方法研究

基于机器学习的高光谱图像分类方法研究高光谱图像分类是从高光谱遥感图像中提取出不同地物的特征,并将其分配到相应的类别中的过程。

高光谱图像具有丰富的光谱信息,因此在地物分类和识别中具有广泛的应用。

近年来,随着机器学习方法的发展,基于机器学习的高光谱图像分类方法成为研究热点之一。

本文将重点探讨基于机器学习的高光谱图像分类方法的研究进展和应用现状。

高光谱图像分类算法的关键在于选择合适的特征提取方法和分类器。

特征提取是高光谱图像分类的前提,其目的是从图像中提取出能够有效表征不同地物的特征。

常用的特征提取方法包括光谱特征提取、空间特征提取和频谱特征提取。

光谱特征提取是指从高光谱图像的光谱波段中提取特征,如反射率、发射率等。

空间特征提取是指从高光谱图像的空间分布中提取特征,如纹理、形状等。

频谱特征提取是指从高光谱图像的频域中提取特征,如能量、频率等。

在特征提取之后,需要选择合适的分类器对提取到的特征进行分类。

常用的高光谱图像分类器包括支持向量机(SVM)、随机森林(Random Forest)、人工神经网络(Artificial Neural Network)等。

支持向量机是一种基于间隔最大化的分类方法,其优点是对小样本和非线性数据有较好的适应能力。

随机森林是一种集成学习方法,通过构建多个决策树进行分类,具有较强的鲁棒性和精度。

人工神经网络是一种仿生学习模型,可以模拟人脑神经元的工作原理,具有较强的非线性建模能力。

以支持向量机为例,介绍基于机器学习的高光谱图像分类方法的一般流程。

首先,对高光谱图像进行预处理,包括波段选择、波段去噪、图像辐射定标等。

然后,从预处理后的图像中提取特征,常用的特征提取方法包括主成分分析(Principal Component Analysis)、线性判别分析(Linear Discriminant Analysis)等。

接着,将提取到的特征作为训练样本输入到支持向量机模型中进行训练。

多光谱 树种分类

多光谱 树种分类

多光谱树种分类
多光谱技术可以用于树种分类。

多光谱数据包含了不同波段的光谱信息,通过对这些信息的提取和分析,可以对不同的树种进行分类。

以下是进行树种分类的一般步骤:
数据采集:使用多光谱设备对树木进行数据采集,获取不同波段的光谱信息。

数据预处理:对采集的数据进行预处理,包括辐射定标、大气校正、几何校正等,以消除环境因素和设备因素的影响。

特征提取:从预处理后的数据中提取出能够反映树种差异的光谱特征,如光谱反射率、谱线特征等。

分类器设计:根据提取出的光谱特征,设计分类器或选择已有的分类算法,用于树种分类。

常用的分类算法有支持向量机、随机森林、神经网络等。

模型训练和验证:使用已知树种的多光谱数据对分类器进行训练和验证,评估模型的准确性和可靠性。

树种分类:将训练好的模型应用于未知树种的多光谱数据,进行树种分类。

结果分析和解释:对分类结果进行分析和解释,提供树种识别和分类的依据和建议。

多光谱技术在进行树种分类时具有很多优势,如能够获取到连续的光谱信息、能够区分不同波段的光谱特征、能够提高树种分类的准确性
和可靠性等。

同时,多光谱技术也存在着一些局限性,如设备成本较高、数据处理复杂等。

因此,在实际应用中需要根据具体情况选择合适的技术和方法。

如何使用多光谱遥感图像进行农作物分类

如何使用多光谱遥感图像进行农作物分类

如何使用多光谱遥感图像进行农作物分类遥感技术作为一种获取地球表面信息的方法,正被越来越广泛地应用于农业领域。

其中,多光谱遥感图像被用来进行农作物分类,可以帮助农业生产者快速准确地了解农田的种植情况,提高农作物管理的效率和决策的准确性。

农业是人类社会的基石,而农作物的分类是农业生产管理的重要一环。

在过去,传统的农作物分类方法主要依靠人工观察和地面调查,但这种方法需要耗费大量的时间、人力和物力,而且结果往往有一定的主观性和不准确性。

多光谱遥感图像则提供了一种更加高效、准确的农作物分类技术。

多光谱遥感图像是通过采集地球表面不同波段的光谱信息来获取农田的遥感数据。

传感器可以捕捉不同植被类型的反射特征,根据不同植被在不同波段的光谱响应,可以将农田中的植被按照其类型进行分类。

首先,多光谱遥感图像可以通过准确捕捉不同波段的反射光谱特征,对农田中的不同植被进行分类。

例如,在红外光谱波段中,植被的反射率较高,而土壤的反射率较低。

因此,通过解析多光谱图像中的红外波段,可以清楚地区分出植被和土壤区域,从而实现农作物的分类。

其次,多光谱遥感图像可以识别和区分不同农作物。

不同的农作物具有不同的反射光谱特征,通过比对多光谱图像和农作物光谱库的数据,可以将农田中的不同农作物进行分类。

例如,小麦和玉米在绿光波段的反射率差异较大,因此可以通过解析多光谱图像中的绿光波段,对小麦和玉米进行分类。

此外,多光谱遥感图像还可以提供农作物生长状况的评估。

不同农作物在不同生长时间段具有不同的反射光谱特征。

通过定期获取多光谱遥感图像,可以对农田中的农作物生长情况进行监测和评估。

例如,在农作物生长的初期,由于植被覆盖较少,土壤的反射率较高;随着农作物生长,植被的反射率逐渐增加。

通过解析多光谱图像中的近红外波段,可以对农作物的生长情况进行快速评估。

最后,多光谱遥感图像的分类结果可以为农业生产和管理提供决策依据。

通过对农田的分类,可以了解农田中不同农作物的分布情况,对农田的利用和种植计划进行优化和调整。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 试验与分析
试验选用武汉地区 TM 影像 ,大小为 1 009 ×1 175 。设 TM 第 i 波段的灰度值为 S i ,光谱特征 S 采用 TM2 、3 、4 、5 、7 波段的灰度值 ;纹理特征 T 包括从灰度共生矩阵提取的 8 个 特征 : T1 对质度 、T2 对比 、T3 不相似度 、T4 共生和均值 、T5 方 差 、T6 熵 、T7 角二阶矩 、T8 相似度 。采用 d = 1 , 4 个方向 ( 0 , 45 , 90 , 135) 的 加 权 平 均 值 , 窗 口 大 小 为 5 ×5 , 分 别 提 取 TM2 、3 、4 、5 、7 波段的 5 ×5 窗口灰度共生矩阵的 8 个纹理特 征 ,共 40 个纹理特征 , 设 B iTj 表示 TM 第 i 波段的第 j 个纹 理特征值 。
基于云模型的图像分割方法研究
秦 昆1 李德毅2 许 凯1
(1 武汉大学遥感信息工程学院 ,武汉市珞喻路 129 号 ,430079 ; 2 中国电子工程系统研究所 ,北京市万寿路 6 号 ,100840)
摘 要 分析了图像信息的不确定性 、云模型的理论和方法 ,提出了一种基于云模型的图像分割新方法 ,实现了 图像分割 ,取得了良好效果 。 关键词 图像分割 ; 云模型 ; 确定度 ; 不确定性
摘 要 采用了辅以纹理特征的决策树方法进行分类 ,探讨了决策树在遥感数据分类方面的优势 ,提高了遥感影 像的分类精度 。 关键词 决策树 ; 分类 ; 纹理 ; 特征选择 ; TM ; 遥感
决策树具有非参数的特点 ,能够处理噪声数据 ,尤其是 能自动选取特征 ;对于预测新数据 ,能给出一个易于解译的 树结构 ,故用于遥感分类具有很大优势[1] 。当前多光谱遥感 影像分类大多基于光谱特征 ,忽略了影像的纹理结构[2] 。多 光谱影像具有大量的纹理特征 ,但并非所有特征对分类都有 效 。而决策树算法能自动选取与分类任务最相关的特征[3] , 据此 ,采用 C4. 5 决策树分类算法[4 ,5] , 对辅以纹理特征的 TM 多光谱影像进行分类[6] 。
1) 试验内容 。采用 C4. 5 对具有光谱特征 S 的样本进 行训练 ,决策树分类模型如图 1 所示 , S i为 TM 第 i 波段灰度 值 。首先计算所有特征的信息增益率 , TM4 具有最高增益
2
测绘信息与工程 Jo urnal of Geomatics Oct . 2006 ; 31 (5)
图 2 决策树分类模型
2) 精度 和 结 果 分 析 。仅 采 用 光 谱 特 征 的 ML C 分 类 误 差矩阵如表1所示 ,各类分类精度如表2所示 。从表1和表
表 1 仅采用光谱特征的 MLC 分类误差矩阵
C1
C2
C3
C4
C5
C6
C1
398
2
C2
78
322
C31399C4400C5
34
366
遥感影像的特征可能包括光谱和纹理特征 ,先对每个连续属 性特征值进行离散化[8] 。
其次 ,利用训练数据集建立一棵决策树模型 。根据特征 的信息增益率构建树模型 ,也是特征选择的过程 。
最后 ,采用已生成的决策树模型对新样本的分类 ,即对 新样本属性值的测试 ,从树的根节点开始 ,按照样本属性的 取值 ,逐渐沿着决策树向下 ,直到树的叶节点 ,该叶节点表示 的类别就是新样本的类别 。
通过对实际地形的了解和目标解译 , 并综合现有地形 图 ,把影像分为 6 大地类 : C1 水域 、C2 密集城区 、C3 新城区 、C4 密集植被 、C5 稀疏植被覆盖的土地 、C6 水质有问题的水域 。 样本的选取对结果影响很大 ,文中分别在不同区域随机选取 两套样本 ,使两套样本在空间上尽量远离 , 每类中各取 100 个训练样本 、400 个测试样本 。
测绘信息与工程 Jo urnal of Geomatics Oct . 2006 ; 31 (5)
1
文章编号 :100723817 (2006) 0520001202
中图分类号 : P237 文献标志码 :B
基于决策树的多光谱影像分类研究
林丽群 舒 宁
(武汉大学遥感信息工程学院 ,武汉市珞喻路 129 号 , 430079)
首先选择能够最好地将样本分类的属性作为“测试”属 性 ,即计算每个属性的信息增益率 ,并选取具有最高增益率 的属性作为给定数据集的测试属性 ,再创建一个节点 ,并以 该属性标记 ;然后对属性的每个值分别创建分枝 ,并且据此 划分样本 。递归地使用上述过程 ,并依据预设的终止条件 , 从而可构造出一个树状结构的模型 。出现在树中的特征即 为简化后的特征子集 ,不出现在树中的所有特征被认为是不 相关的 。这个特征子集使得所构造的决策树模型尽可能接 近使用所有特征的原分布 ,并且形成相对简单的树结构更易 于理解 。运用决策树从大量数据中进行分类特征选择[3] ,取 得较好效果 。
率 ,故作为根节点 ;根据 TM4 产生两个分支 ,左分支为所有 样本 TM4 波段的灰度值 ≤122 的样本集合 , TM7 为该子集 中信息量最大的属性 ,故中间节点 TM7 为该子树的根节点 ; 这是一个递归调用的过程 ,直至完成整个分类模型的构建 。 从该模型可以看出 ,对 TM 影像分类 , 决策树能给出一个易 于解译的树结构 。如某一像元若具有 : S4 ≤122 , S7 > 74 , 则 为类 2 。
1) 特征选择 。决策树的特点是建树过程中 ,能自动选 择有效的属性特征 。构建一棵决策树 ,关键是选择作为树节 点的属性特征 。用于构造模型的训练样本可能包含数百个 属性特征 ,其中大部分特征可能是不相关或是冗余的 。为找 到一个有效的特征子集 , C4. 5 算法采用属性的信息增益率 来选择[4 ] 。
2) 基于决策树的遥感影像分类 。目前国内运用决策树 进行遥感影像分类的研究主要是基于光谱统计特征生成的 阈值以及相关先验知识[7] ,比较耗费人力 。采用 C4. 5 算法 , 能自动完成特征选择及生成分类模型 。用决策树对遥感影
像分类包括 : 首先 ,训练数据集要由其特征矢量及相应的类别组成 。
为说明实际分类效果 ,截取了分类图中的部分结果 。试 验结果如图 3 所示 ,其中图 3 (a) 为 ML C 分类结果 ,图3 (b) 为 决策树光谱分类结果 ,图 3 (c) 为引入纹理特征的决策树分类 结果 。
图 3 试验结果
从图 3 中看出 ,采用决策树分类的结果比 ML C 更接近 实际地形 。ML C 在密集城市跟水体的混淆较大 ,水域边缘 与密集城市的错分较大 。在图 3 (a) 中左上角的本应为水域 的地区 ,被 ML C 误分为密集城市 ,而采用决策树分类能够很 好区分该水域 ,见图 3 ( b) 和图 3 (c) 。采用光谱 + 纹理的分 类结果比仅用光谱特征的分类效果更好 。因为考虑了像元 的空间纹理特征 ,引入纹理特征的水域基本没有噪声点 ;而 且从整体看 ,引入纹理的分类在空间上更加统一 ,孤立点少 , 区域更加连通 。引入纹理后 ,水域的边缘并未错分 ,主要是 因为在决策树分类模型中是分级考虑光谱和纹理特征的 ,而 非单一将光谱和纹理特征作为整体来考虑 。
C6
35
365
2 可知 ,ML C 在 C1 水体与 C2 密集城市区分上混淆较大 , C2 的分类精度较低 ,而决策树在 C2 的识别上比 ML C 的精度提
3 结束语
较传统的 ML C 分类算法 ,决策树算法简单能获得更准 确的分类结果 。其对输入特征进行了有效降维的特点 ,减少 了分类时的计算复杂度 ,提高了分类准确度 ,获得更精简 、更 易理解的分类模型 。作为一种监督分类方法 ,其简单 、高效 、 稳健 、无需先验知识 ,尤其能有效对大量特征进行选择的优 点 ,在土地覆盖研究中将有很重要的应用 。
决策树 S
100 98. 75 100 97. 50 95. 75 95. 75
S + T 100 98. 75 100 99. 00 95. 75 98. 00
各种分类方法的总误差 ,对于决策树的误差检验采用 10 次交叉检验 ,其结果低于测试样本的精度 ,由此可见交叉检 验能更客观地估计分类误差 。ML C 的分类误差为 6. 25 % , 决策树对 S 的分类误差为 4. 50 % ,决策树对 S + T 的分类误 差为 2. 10 %。可见 ,决策树分类的精度高于 ML C 的分类精 度 ,而且纹理特征的引入也有助于分类精度的提高 ,并在各 类的识别上也都有所提高 。
3) 精 度 评 价 。交 叉 检 验 可 以 用 来 客 观 估 计 分 类 精 度[5] 。采用 k 次交叉检验 , 将所有初始数据集 (包括训练样 本和测试样本) 随机分为 k 个互不相交的子集 , 每个子集大 小基本相同 ,进行 k 次迭代交叉检验 。在第 i 次分类中 ,子集 S i作为测试集 ,其他子集则合并到一起 , 构成一个大训练数 据集 ,并通过学习获得相应的分类模型 , 用子集 S i 进行测试 该分类结果 。以此循环 k 次 ,最终计算出 k 次结果的平均分 类精度 ,来客观估计分类精度 。
1 基于决策树的特征选择与分类
决策树是由根节点 、中间节点和叶节点组成的树型结 构 。它是用样本的属性作为节点 ,用属性的取值作为分支的 树结构 。它采用信息论原理对大量样本的属性进行分析和 归纳 ,其根节点是所有样本中信息量最大的属性 。树的中间 节点是以该节点为根的子树所包含的样本子集中信息量最 大的属性 。决策树的叶节点是样本的类别值 。决策树算法 很多 ,本文采用的是 C4. 5 算法 ,具体可参考文献[ 4 ] 。
图 1 决策树分类模型 对具有光谱特征 S 和纹理特征 T 的样本训练 ,决策树分 类模型如图 2 所示 , B iTj 为 TM 第 i 波段的第 j 个纹理特征 值 。纹理特征的引入使训练样本具有包括光谱特征在内的 45 维属性特征 ( S + T) 。在构建模型的过程中 ,并非 45 维特 征都被选作树节点 ,而是根据信息增益率来选择与分类相关 的特征 。因树节点涉及到 6 个特征 B3 T8 (第 3 波段的共生和 均值) 、B4 T8 (第 4 波段的共生和均值) 、B5 T6 (第 5 波段的相似 度) 及 TM3 、TM4 和 TM7 波段的光谱特征 ,是所有 45 维特 征中信息增益率最大的特征子集 ,故选其构建分类模型 。在 实际的分类过程中 ,仅需要提取每个像元点的这 6 个特征 , 确定其归属类别 ,就有效降低了输入数据的维数 ,输入特征 从 45 维降至 6 维 ,输入特征降低了 86. 7 %。
相关文档
最新文档