实验六-主成分分析
主成分变换实验报告

一、实验背景随着遥感技术的快速发展,遥感图像数据在地理信息系统、环境监测、资源调查等领域得到了广泛应用。
然而,遥感图像数据通常具有高维、大数据量等特点,给数据处理和分析带来了巨大挑战。
主成分变换(PCA)作为一种有效的数据降维方法,能够将高维数据转化为低维数据,同时保留大部分信息,在遥感图像处理中具有广泛的应用。
二、实验目的本次实验旨在通过主成分变换方法对遥感图像进行降维处理,分析不同主成分对图像信息的贡献,并探讨主成分变换在遥感图像中的应用。
三、实验原理主成分变换是一种基于特征值分解的降维方法。
其基本原理如下:1. 对原始数据进行标准化处理,消除不同量纲的影响;2. 计算原始数据的协方差矩阵;3. 对协方差矩阵进行特征值分解,得到特征值和特征向量;4. 根据特征值的大小,选取前k个特征向量,构成主成分变换矩阵;5. 对原始数据进行主成分变换,得到降维后的数据。
四、实验步骤1. 读取遥感图像数据;2. 对图像数据进行预处理,包括去噪声、归一化等;3. 计算图像数据的协方差矩阵;4. 对协方差矩阵进行特征值分解;5. 根据特征值的大小,选取前k个特征向量,构成主成分变换矩阵;6. 对原始图像数据进行主成分变换;7. 分析不同主成分对图像信息的贡献;8. 生成降维后的图像,并进行可视化。
五、实验结果与分析1. 主成分分析结果:经过主成分变换后,前k个主成分的方差贡献率逐渐减小,其中第一主成分的方差贡献率最大,说明第一主成分包含了原始图像的大部分信息。
2. 主成分可视化:通过将主成分绘制成散点图,可以直观地观察到不同主成分之间的相关性。
可以发现,第一主成分与其他主成分之间的相关性较低,说明主成分变换有效地降低了数据之间的冗余。
3. 降维后的图像:将原始图像进行主成分变换后,得到的降维图像具有较低的分辨率,但能够保留原始图像的主要特征。
在遥感图像处理中,可以通过降维后的图像进行后续分析,如目标检测、分类等。
《数据分析方法》课程教学大纲

《数据分析方法》课程教学大纲
课程编码:08122430
课程名称:数据分析方法/ Data Analysis methods
总学时/学分:40/2.5(其中理论:32,实验:8)
适用专业:计算机科学与技术
一、课程目标
通过本课程学习,学生应达到如下目标:
目标1. 利用数据描述性分析和数据分布来表达数据特征。
目标2. 运用回归分析、方差分析、主成分分析、典型相关分析、判别分析及聚类分析方法进行大数据建模与求解。
目标3. 针对数据模型,用程序语言实现,并对实验结果进行分析和解释,综合得到结论,形成报告。
二、课程目标对毕业要求的支撑
三、教学过程安排
四、实验或上机内容
五、课程目标达成方法
六、考核标准
本门课程考核包括6个部分,分别为考试、作业、实验、测验。
具体要求及评分方法如下:
2、作业
4、测验
随堂测验,老师给出题目,学生回答。
具体由任课老师给出评分标准。
七、教材及主要参考资料
[1] 梅长林,范金城.数据分析方法(第二版), 高等教育出版社, 2018.10.
[2] 吴礼斌,李柏年, MA TLAB数据分析方法(第2版), 机械工业出版社,2017.02
[3] 李红松,邓旭东,殷志平. 统计数据分析方法与技术,经济管理出版社,2014.5.
[4] 大数据挖掘与统计机器学习(大数据分析统计应用丛书),中国人民大学出版社,2016.7
[5] 大数据分析:方法与应用,清华大学出版社,2017.4。
数据挖掘实验报告-数据预处理

数据挖掘实验报告-数据预处理数据挖掘实验报告数据预处理一、实验目的本次实验的主要目的是深入了解和掌握数据预处理在数据挖掘过程中的重要性及相关技术,通过对实际数据集的处理,提高数据质量,为后续的数据挖掘和分析工作奠定良好的基础。
二、实验背景在当今数字化时代,数据的规模和复杂性不断增加,而原始数据往往存在着各种问题,如缺失值、噪声、异常值、不一致性等。
这些问题如果不加以处理,将会严重影响数据挖掘算法的性能和结果的准确性。
因此,数据预处理成为了数据挖掘过程中不可或缺的重要环节。
三、实验数据集本次实验使用了一个名为“销售数据”的数据集,该数据集包含了某公司在过去一年中不同产品的销售记录,包括产品名称、销售日期、销售数量、销售价格、客户信息等字段。
四、数据预处理技术(一)数据清洗1、处理缺失值首先,对数据集中的缺失值进行了识别和分析。
通过观察发现,“客户信息”字段存在部分缺失。
对于这些缺失值,采用了两种处理方法:一是如果缺失比例较小(小于5%),直接删除含有缺失值的记录;二是如果缺失比例较大,采用均值填充的方法进行补充。
2、处理噪声数据数据中的噪声通常表现为数据中的错误或异常值。
通过对销售数量和销售价格的观察,发现了一些明显不合理的数值,如销售数量为负数或销售价格过高或过低的情况。
对于这些噪声数据,采用了基于统计的方法进行识别和处理,将超出合理范围的数据视为噪声并进行删除。
(二)数据集成由于原始数据集可能来自多个数据源,存在着重复和不一致的问题。
在本次实验中,对“销售数据”进行了集成处理,通过对关键字段(如产品名称、销售日期)的比较和合并,消除了重复的记录,并确保了数据的一致性。
(三)数据变换1、数据标准化为了消除不同字段之间量纲的影响,对销售数量和销售价格进行了标准化处理,使其具有可比性。
2、数据离散化对于连续型的数据字段,如销售价格,采用了等宽离散化的方法将其转换为离散型数据,以便于后续的数据挖掘算法处理。
主成分分析实验报告

一、实验目的本次实验旨在通过主成分分析(PCA)方法,对给定的数据集进行降维处理,从而简化数据结构,提高数据可解释性,并分析主成分对原始数据的代表性。
二、实验背景在许多实际问题中,数据集往往包含大量的变量,这些变量之间可能存在高度相关性,导致数据分析困难。
主成分分析(PCA)是一种常用的降维技术,通过提取原始数据中的主要特征,将数据投影到低维空间,从而简化数据结构。
三、实验数据本次实验采用的数据集为某电商平台用户购买行为的调查数据,包含用户年龄、性别、收入、职业、购买商品种类、购买次数等10个变量。
四、实验步骤1. 数据预处理首先,对数据进行标准化处理,消除不同变量之间的量纲影响。
然后,进行缺失值处理,删除含有缺失值的样本。
2. 计算协方差矩阵计算标准化后的数据集的协方差矩阵,以了解变量之间的相关性。
3. 计算特征值和特征向量求解协方差矩阵的特征值和特征向量,特征值表示对应特征向量的方差,特征向量表示数据在对应特征方向上的分布。
4. 选择主成分根据特征值的大小,选择前几个特征值对应特征向量作为主成分,通常选择特征值大于1的主成分。
5. 构建主成分空间将选定的主成分进行线性组合,构建主成分空间。
6. 降维与可视化将原始数据投影到主成分空间,得到降维后的数据,并进行可视化分析。
五、实验结果与分析1. 主成分分析结果根据特征值大小,选取前三个主成分,其累计贡献率达到85%,说明这三个主成分能够较好地反映原始数据的信息。
2. 主成分空间可视化将原始数据投影到主成分空间,绘制散点图,可以看出用户在主成分空间中的分布情况。
3. 主成分解释根据主成分的系数,可以解释主成分所代表的原始数据特征。
例如,第一个主成分可能主要反映了用户的购买次数和购买商品种类,第二个主成分可能反映了用户的年龄和性别,第三个主成分可能反映了用户的收入和职业。
六、实验结论通过本次实验,我们成功运用主成分分析(PCA)方法对数据进行了降维处理,提高了数据可解释性,并揭示了数据在主成分空间中的分布规律。
运用主成分分析评价海洋沉积物中重金属污染来源

运用主成分分析评价海洋沉积物中重金属污染来源一、本文概述本文旨在运用主成分分析(PCA)这一统计工具,对海洋沉积物中的重金属污染来源进行评价。
随着工业化和城市化的快速发展,海洋环境面临着日益严重的重金属污染问题,这不仅对海洋生态系统构成威胁,还可能通过食物链对人类健康造成潜在影响。
因此,识别和评价重金属污染的来源对于制定有效的污染防治策略至关重要。
主成分分析作为一种多变量统计分析方法,能够通过降维处理,提取出数据中的主要信息,揭示隐藏在复杂数据背后的污染源信息。
本文首先将对主成分分析的基本原理进行介绍,然后详细阐述其在海洋沉积物重金属污染来源评价中的应用过程,包括数据收集、预处理、主成分提取与解释等步骤。
通过实例分析,展示主成分分析在海洋沉积物重金属污染来源评价中的实际应用效果,以期为相关研究和实践工作提供有益的参考。
二、研究区域与样品采集本研究选取位于中国东南沿海的某典型海域作为研究对象。
该海域受到人类活动影响显著,包括工业排放、农业活动、城市污水排放以及船舶运输等,使得该海域的海洋沉积物中可能含有多种重金属元素。
在研究区域内,我们选择了10个代表性站位进行沉积物样品的采集。
站位的选择考虑了海域内不同污染源的分布、水深、水流等因素,以确保采集到的样品能够全面反映研究区域的污染状况。
样品采集使用抓斗式采样器,在每个选定的站位采集表层沉积物样品,深度约为0-10厘米。
采样过程中,我们严格遵守了无污染的采样原则,确保采集到的样品不受外界因素的干扰。
同时,我们还对每个站位的水深、水温、盐度等环境参数进行了现场测量,以便后续分析。
采集到的沉积物样品被立即装入洁净的聚乙烯塑料袋中,密封后低温保存,以确保样品的原始状态不受破坏。
在实验室中,我们对每个样品进行了详细的记录,包括站位位置、采样日期、环境参数等信息,为后续的数据分析提供了基础数据。
通过本次采样工作,我们共获得了10个站位的海洋沉积物样品,这些样品将用于后续的主成分分析,以评价研究区域内重金属污染的来源。
样品成分分析

样品成分分析成分分析是指通过多种技术性的手段对被测对象进行成分分析,得出被测物定性或定量的元素成分组成结果,俗称未知物分析。
中心运用多项技术专利,可以快速、高效的分析出产品的成分,对各个成分进行定性定量,并可还原组成配方。
成分分析包括:主成分分析成分分析材质鉴定全成分分析成分分析比例分析配比分析特定物质分析一、成分分析成分分析是根据委托单位提供材料,综合利用定性、定量分析手段,可以万分之一的精确度精确分析材料的各类组成成分、元素含量以及填料含量。
将橡胶塑料原料与制品通过多种分离技术,利用高科技分析仪器进行检测,而后将检测的结果通过经过技术人员的逆向推导,最终对完成对样品未知成分进行定性、定量判断的过程。
在这个过程中技术人员除了依靠先进设备支持外,同时还必须具有丰富的行业知识和理论知识。
主成分分析:是把几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关的一种数学降维的方法。
全成分分析:是将送检样品中的原材料、填料、助剂等进行定性定量分析。
塑料原材料种类,填料种类、粒径,助剂种类都能影响对产品的性能、寿命,通常是同一种原材料、同一种填料,因为助剂种类的不同,造成产品性能大不相同。
二、材质鉴定材质鉴定主要是指对化工产品的材质进行检测判定。
以橡塑产品为例,表面出现不明析出物,而客户不能判定到底是什么物质析出或者是什么原因析出,这种现象往往会对客户造成很大的困扰。
我中心在力所能及的范围内推出部分的材质鉴别分析方法,希望可以帮生产客户解决疑难问题。
三·比例分析比例分析就是检测出样品配方的成分和比例,可以综合分析样品中的有机物和无机物的组成和含量,对所有化工行业的高分子产品进行定性定量剖析,为样品的性能的改性、优化提供必要的解决方案。
四、成分配比通过实验、鉴定、分析,而取得各种原料成分的最佳配比。
由于配方的专利性,反向剖析是配方设计中最重要的环节。
配方分析是化工行业中影响大、可变因素多、经济效益显著的专业技术。
降维分析实验报告

一、实验背景随着数据量的不断增长,如何从大量数据中提取有价值的信息成为数据分析和处理的关键问题。
降维分析作为一种数据预处理方法,旨在减少数据集的维度,降低数据复杂度,提高数据分析的效率。
本实验通过降维分析,对原始数据进行处理,提取关键特征,为后续的数据挖掘和分析提供支持。
二、实验目的1. 了解降维分析的基本原理和方法;2. 掌握主成分分析(PCA)和因子分析(FA)两种降维方法;3. 通过实验验证降维分析在实际数据中的应用效果。
三、实验内容1. 数据集介绍:选取某电商平台用户购买行为的原始数据集,包含用户ID、商品ID、购买金额、购买时间等特征;2. 数据预处理:对原始数据进行清洗、缺失值处理和异常值处理;3. 主成分分析(PCA):(1)计算原始数据的协方差矩阵;(2)计算协方差矩阵的特征值和特征向量;(3)根据特征值选择主成分;(4)对原始数据进行主成分转换;4. 因子分析(FA):(1)计算原始数据的协方差矩阵;(2)提取因子;(3)对原始数据进行因子转换;5. 降维效果评估:比较原始数据集与降维后数据集的维度、方差解释率和模型拟合度等指标。
四、实验步骤1. 数据导入与预处理(1)使用Python的pandas库导入原始数据集;(2)对缺失值进行处理,采用均值、中位数或众数填充;(3)对异常值进行处理,采用Z-score或IQR方法剔除;(4)数据标准化,将特征值缩放到0-1之间。
2. 主成分分析(PCA)(1)计算原始数据的协方差矩阵;(2)计算协方差矩阵的特征值和特征向量;(3)根据特征值选择主成分,选取累计方差贡献率大于85%的主成分;(4)对原始数据进行主成分转换。
3. 因子分析(FA)(1)计算原始数据的协方差矩阵;(2)提取因子,采用主成分提取法;(3)对原始数据进行因子转换。
4. 降维效果评估(1)比较原始数据集与降维后数据集的维度;(2)计算方差解释率,评估降维后的数据集对原始数据的保留程度;(3)比较原始数据集与降维后数据集的模型拟合度。
非财务因素分析实验报告(3篇)

第1篇一、实验目的本次实验旨在通过分析企业非财务因素,探讨其对企业经营绩效的影响,为企业管理者提供决策参考。
非财务因素是企业经营过程中不可忽视的重要方面,它包括企业文化、人力资源、研发能力、市场营销、供应链管理等多个方面。
通过对这些因素的分析,可以帮助企业识别自身优势与不足,从而提升整体竞争力。
二、实验背景随着经济全球化和市场竞争的加剧,企业越来越重视非财务因素对经营绩效的影响。
传统的财务分析方法虽然能够反映企业的财务状况,但对于企业长期发展、市场竞争等方面难以提供全面的信息。
因此,非财务因素分析成为企业管理者关注的焦点。
三、实验方法1. 文献综述:通过查阅相关文献,了解非财务因素对企业经营绩效的影响机制。
2. 案例选择:选择具有代表性的企业作为研究对象,以便更好地分析非财务因素对企业经营绩效的影响。
3. 数据收集:通过问卷调查、访谈、公开资料等方式收集企业非财务因素数据。
4. 数据分析:运用统计学方法和定性分析方法对收集到的数据进行处理和分析。
5. 结果验证:通过对比分析不同企业的非财务因素,验证非财务因素对企业经营绩效的影响。
四、实验过程1. 文献综述:通过查阅国内外相关文献,了解到非财务因素主要包括企业文化、人力资源、研发能力、市场营销、供应链管理等方面。
这些因素通过影响企业的战略决策、资源配置、运营效率等,最终影响企业的经营绩效。
2. 案例选择:选择我国一家知名企业作为研究对象,该企业在同行业中具有较强的竞争力,具有一定的代表性。
3. 数据收集:通过问卷调查、访谈和公开资料等方式,收集了该企业在企业文化、人力资源、研发能力、市场营销、供应链管理等方面的数据。
4. 数据分析:(1)企业文化:通过问卷调查,了解到该企业在企业文化建设方面较为完善,员工对企业文化的认同度较高。
(2)人力资源:通过访谈,了解到该企业在人力资源方面具有较强的优势,拥有一支高素质、高效率的团队。
(3)研发能力:通过公开资料,了解到该企业在研发投入方面位居行业前列,具有较强的技术创新能力。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验六 主成分分析一、实验目的通过本次实验,掌握SPSS 及ENVI 的主成分分析方法。
二、有关概念1. 主成分分析的概念主成分分析(又称因子分析),是将多个实测变量转换为少数几个不相关的综合指标的多元统计分析方法。
代表各类信息的综合指标就称为因子或主成份。
主成分分析的数学模型可写为:m m x a x a x a x a z 131********++++=m m x a x a x a x a z 23232221212++++=m m x a x a x a x a z 33332321313++++=………m nm n n n n x a x a x a x a z ++++= 332211其中,x 1、x 2、 x 3、 x 4 …x m 为原始变量;z 1、 z 2、 z 3、 z 4 …z n 为主成份,且有m≥n。
写成矩阵形式为:Z=AX 。
Z 为主成份向量,A 为主成份变换矩阵,X 为原始变量向量。
主成份分析的目的是把系数矩阵A 求出,主成份Z1、Z2、Z3…在总方差中所占比重依次递减。
从理论上讲m=n 即有多少原始变量就有多少主成份,但实际上前面几个主成份集中了大部分方差,因此取主成份数目远远小于原始变量的数目,但信息损失很小。
因子分析的一个重要目的还在于对原始变量进行分门别类的综合评价。
如果因子分析结果保证了因子之间的正交性(不相关)但对因子不易命名,还可以通过对因子模型的旋转变换使公因子负荷系数向更大(向1)或更小(向0)方向变化,使得对公因子的命名和解释变得更加容易。
进行正交变换可以保证变换后各因子仍正交,这是比较理想的情况。
如果经过正交变换后对公因子仍然不易解释,也可进行斜交旋转。
2. 因子提取方法SPSS 提供的因子提取方法有:①Principal components 主成份法。
该方法假设变量是因子的纯线性组合。
这是SPSS 最通用的因子提取方法,故因子分析有时又称为主成份分析。
②Unweighted least squar e不加权最小平方法。
该方法使观测的和再生的相关阵之差的平方最小。
③Generalized least square 用变量的单值加权,使观测的和再生的相关阵之差的平方最小。
④Maximum likelihood 最大似然法。
此方法不要求多元正态分布。
给出参数估计,如果样本来自多元正态总体它们与原始变量的相关阵极为相似。
⑤Prin cipal axis factoring 使用多元相关的平方作为对公因子方差的初始估计。
⑥Alpha factoring α因子提取法3.因子旋转方法SPSS提供的因子旋转方法有:①None 不进行旋转。
此为系统默认的选择项。
②Varimax方差最大旋转。
③Equamax 平均正交旋转。
④Quartmax四次方最大正交旋转。
⑤Direct Oblimin 斜交旋转,指定此项可以在下面的矩形框中键入Delta 值,该值应该在0~-1之间,是因子映象自相关的围。
0值产生最高相关因子,大负数产生旋转的结果与正交接近。
三、实验容1. 在市宝山、吴淞地区的环境质量综合评价中,对20个监测点的大气、地面水和土壤要素进行监测,得到三种要素的实测超标倍数数据。
本实验对这批资料进行主成份分析,为进一步进行环境综合分析作准备。
2. 对2009年钱塘江湾TM影像进行主成分分析四、实验步骤(一)SPSS主成分分析1.主成分分析的基本步骤(1)打开“d:\SPSS实习\主成份分析.sav”文件,选择Analyze菜单下的Data Reduction的Factor项,展开主对话框。
(2)在左侧源变量框中选取“大气超标倍数”、“地面水超标倍数” “土壤超标倍数”变量,进入Variables框中,作为参与因子分析的变量。
(3)单击Descriptives按钮,展开相应的子对话框。
在Statistics组中选取Initial solution 选择项,显示初始分析结果,给出原始变量的公因子方差、与变量数目相等的因子、各因子的特征值、各因子特征占总方差的百分比以及累积百分比。
在Correlation Matrix组中选取Coefficients,显示原始变量相关系数矩阵。
按Continue返回主对话框。
(Statistics组中的Univariate descriptive项要求给出各变量的均数和标准差;Correlation Matrix组提供以下几种检验变量是否适合作因子分析的方法:(4)单击Extraction按钮,展开相应的子对话框。
在Method组中选择Principal components主成份法作为提取公因子的方法;在Extract组中选取Number of factors,并在其右侧框中输入“2”,指定提取公因子的数目为2;在Display组中选取Unrotated factor solution及Screen plot选项,要求显示未经旋转的因子提取结果因了载荷碎石图;Maximum iterations forconvergence为因子分析收敛的最大迭代次数,系统默认为25;按Continue返回主对话框。
(5)单击Scores按钮,展开相应的子对话框。
选取Save as variables 选项,即要求将因子得分作为新变量保存在数据文件中;在Method组选取Regression选项,即因子的得分用回归法,其因子得分的均值为0(Regression Method: A method for estimating factor score coefficients. The scores that are produced have a mean of 0 and a variance equal to the squared multiple correlation between the estimated factor scores and the true factor values. The scores may be correlated even when factors are orthogonal.);选取Display factor score coeffient matrix,显示因子得分系数矩阵;按Continue返回主对话框(6)单击OK,提交运行。
(7)输出结果分析。
2.主成分分析结果分析输出结果分析如下列表6.1~表6.6所示:表6.1给出了三个原始变量的相关系数矩阵。
表 6.1表6.2第二列给出原始变量的公因子方差,三个均为1,三个变量的公因子方差之总和为3;第三列给出的是使用两个因子代替原始变量后对各原始变量方差解释的百分比。
表 6.2表6.3为方差解释表。
第一列为主成份名,第二、三、四列分别为第一、二、三主成份的特征值、方差百分比、方差累积百分比;后三列为选用两个主成份时的特征值、方差百分比、方差累积百分比。
表 6.3表6.4为因子矩阵表。
给出原始变量对第一、第二主成份的贡献。
表 6.4a 2 components extracted.表6.5为因子得分系数矩阵。
给出第一、第二主成份与原始变量的关系。
根据该矩阵可以写出因子的表达式为:Factor1=0.281*x1*+0.484*x2*+0.516*x3* Factor2=0.955*x1*-0.414*x2*-0.131*x3*可以说,用这两个因子代替三个原始变量,可以概括原始变量所包含信息的87.806%。
表 6.5Component Score Coefficient MatrixComponent1 2大气超标倍数.281 .955地面水超标倍数.484 -.414土壤超标倍数.516 -.131Extraction Method: Principal ComponentAnalysis.Component Scores.表6.6给出了两主成份间的协方差矩阵。
表 6.6Component Score Covariance MatrixComponent 1 21 1.000 .0002 .000 1.000图6.1可以看出因子1与因子2,以及因子2与因子3之间的特征值之差值比较大,可以初步得出提取两个因子将能概括绝大部分信息。
图 6.1注:在“Factor1=0.281*x1*+0.484*x2*+0.516*x3*及Factor2=0.955*x1*-0.414*x2*-0.131*x3*”中的x1* \x2*\x3*\变量是原始变量做了均值为0处理后的新变量。
(二)ENVI主成分分析1. 打开LT51180392009262BJC00下的B1-6及B7, 用Basic Tools下的Layer Stacking进行6波段叠合(如图6-2,拾取Import File选择叠合的波段,拾取Reorder Files对波段进行排序,建议按B1—B7顺序),并选择Output Result to File,将结果输出到QT_River文件。
图6-22. 用ROI TOOLS选择一块感兴趣区(建议选择地类比较全的部分),并将子集存为subset文件。
3. ENVI 【Transform】->【Principal Components】->【Forward PC Rotate 正向PC旋转】->【Compute New Statistics and Rotate】,展开如图所示对话框,选中文件,并进行空间子集、光谱子集以及掩膜设置后,按OK,进入如图6-3所示对话框。
图6-3图6-44. 在图6-4对话框的Stats Subset中,输入小于1如0.1的值,表示在统计计算时只用到十分之一像元(也可保持缺省值不变,表示统计全部像元),在Output Stats Filename 中输入PC_stats,即将统计结果放入该文件,并在“Select Subset from Eigenvalues”中选择Yes, 统计信息将被计算,并出现如图6-5 Select Output PC Bands 对话框。
该对话框中列出每个波段和其相应的特征值,同时也列出每个主成分波段中包含的数据方差的累积百分比。
在“Number of Output PC Bands”文本框中,键入一个数字或点击箭头按钮,确定要输出的波段数,此处可选3,也可保持6不变,看主成份结果图。
可以看出,前三个主成份占了原始6个波段信息的98%以上,因此完全可以用前三个主成份来代替原始6个波段来进行后续的分类处理。
图6-55. 用【Basic Tools】 ->【Statistics】->【View statistics File】工具查看PC_Stats.sta文件信息,在对话框的Select Plot中,拾取Engevalus, 展开如图6-6所示对话框,上方图表示各主成份的值。