一组空气污染数据的主成分分析

合集下载

基于主成分分析及多元线性回归的空气质量预测算法研究

基于主成分分析及多元线性回归的空气质量预测算法研究

基于主成分分析及多元线性回归的空气质量预测算法研究近年来,随着城市空气质量的恶化和人们对健康的重视,空气质量的预测变得越来越重要。

本文基于主成分分析和多元线性回归两种方法,进行空气质量预测算法的研究。

在进行主成分分析之前,我们需要收集一定数量的空气质量监测数据。

这些数据包括各种空气污染物的浓度以及其他与空气质量相关的因素,如天气条件、地理位置等。

将收集到的数据进行预处理,处理掉异常值和缺失值,并进行数据归一化。

接下来,使用主成分分析方法对数据进行降维。

首先计算数据集的协方差矩阵,然后对该矩阵进行特征值分解,得到特征值和对应的特征向量。

按照特征值从大到小的顺序选择前几个特征向量作为主成分。

通过将数据集投影到主成分上,就可以得到降维后的数据集。

在进行多元线性回归之前,我们需要将数据集分为训练集和测试集。

训练集用于训练回归模型,测试集用于评估模型的表现。

选择适当的回归模型,并根据训练集的数据,通过最小二乘法估计回归系数。

将训练得到的回归模型应用到测试集上,计算预测值和实际值之间的误差。

通过对比预测值和实际值的误差,可以评估模型的准确性。

如果误差较小,说明模型对空气质量的预测效果较好;如果误差较大,可能需要调整模型或者改进数据预处理的方法。

综上所述,本文基于主成分分析和多元线性回归的方法,对空气质量进行预测的算法进行了研究。

通过降维和回归分析,可以提取出影响空气质量的主要特征,并建立相应的模型进行预测。

该算法对于城市管理部门和居民提供了一种有效的工具,可以及时了解和监测空气质量,采取相应的措施保护健康。

基于主成分分析的空气质量评价方法研究

基于主成分分析的空气质量评价方法研究

基于主成分分析的空气质量评价方法研究刘萍(昆明市官渡区环境保护监测站,云南昆明650200)46环境保护与循环经济_________________________________________________________________摘要:采用主成分分析法对收集数据进行分析,得出影响昆明市空气环境的主要污染物为颗粒物和二氧化氮。

再以全年 月均值和最高月的日均值代入主成分分析,验证其与空气质量指数实测值变化趋势,结果表明,预测值和实际值的最高点日期一 致、预测值和实际值的最低点日期一致。

根据主成分分析结果,为今后更加有针对性地进行环境空气质量管理奠定了基础,数学 模型的提出有利于进一步的环境评价和管理。

关键词:环境空气质量;规律分析;主成分分析Abstract:By using principal component analysis method to analyze the collected data,find out that the main pol­lutants affects environmental air in Kunming City is particulate matter and nitrogen dioxide. Then use the average value of year and the day value of highest mouth substitute into main component analysis,verify it with air quality index measured values change trend,date of the predicted value highest point and actual value is consistent,date of the predicted value lowest point and actual value is consistent. According to the main factor calculation analy­sis,it lays a foundation for carrying out the environmental air quality management more pertinently in the future,and the proposed mathematical model is conducive to further environmental assessment and management.Keywords: air e nvironmental quality; rule analysis; principal component analysis中图分类号:F2文献标识码:A文章编号&1674-1021(2018)07-0046-071引言近年来,昆明的环境空气质量一直名列前茅,尽管有着良好的自然生态环境基础,然而昆明的地理 位置位于云贵高原中部,102。

探讨利用SPSS软件分析城市大气环境污染

探讨利用SPSS软件分析城市大气环境污染

探讨利用SPSS软件分析城市大气环境污染摘要:伴随着我国经济的高速发展,城市化的持续加速,城市大气污染问题也愈发严重,对人民群众的生产生活造成极大的影响。

更好地保护和改善空气质量,为人民群众提供健康舒适的环境。

本文主要采用SPSS软件的主成分分析方法对城市的空气质量进行研究,探讨各参数对空气质量的影响及因素。

关键词:SPSS软件分析;城市大气环境污染;主成分分析方法近年来,伴随着现代化、工业化的发展,我国主要城市大气中的“煤烟”类污染占主导地位,大气中的总悬浮物含量偏高,SO2污染偏高,汽车排放污染物总量迅速增长,NOx污染日趋严重,我国已经出现多个“酸雨区”。

这不仅给生态环境带来严重的破坏,而且还会影响到人们的身体健康。

在污染物的组成上,空气污染可以分为三类:第一类是生活污染源,即食物、取暖、燃烧等过程中产生的有害气体、烟气;二是工业污染源,主要指火电、钢铁厂、有色金属厂、各类化工企业等引起的空气污染;三是交通污染物,包括机动车、航空器、火车和轮船等交通工具产生的烟尘和尾气。

一、SPSS软件技术概述1.1SPSSSPSS(Statistical Package for the Social Science)是一种广泛应用于多个学科的、具有广泛应用前景的数据处理软件。

该软件具有无需编写程序,只需简单的图形界面就能完成,而且运算速度很快的特点,因而深受广大用户的喜爱。

目前,SPSS是一种在社会,经济,生物,教育,心理学等众多学科中都有很大的应用。

1.2多元统计分析方法多元统计分析是一种有效的数学工具,可以快速分类、筛选、总结和提取少数隐含和独立的环境事件的主要控制因素,从而找出环境事件的科学规律。

它是实现快速有效的空间统计分析和数据挖掘的有效技术手段。

环境系统是一个非常复杂的体系,在研究往往涉及多个变量。

环境监测数据因其数量多、动态变化、相互关系等特点,给从这些数据中提取有用的信息带来了很大的困难。

环境问题调查统计报告初中数学

环境问题调查统计报告初中数学

环境问题调查统计报告一、引言环境问题已成为全球最严峻的挑战之一。

为了更好地了解环境问题的现状和成因,我们进行了一次环境问题调查。

本报告将通过数学统计的方法,对调查结果进行分析,并提出相应的建议。

二、调查方法本次调查采用问卷调查和实地考察相结合的方式,共收集了100份有效问卷和若干实地考察数据。

问卷主要针对不同年龄、性别、职业和地区的人群,以了解他们对环境问题的认识和态度。

实地考察主要针对当地的生态环境和污染情况。

三、调查结果1、空气污染根据问卷调查和实地考察,我们发现本地区的空气污染比较严重。

其中,PM2.5和O3的浓度较高,尤其是在交通繁忙的路段和工业区。

空气污染的主要原因是汽车尾气、工业排放和农业活动。

2、水污染通过实地考察,我们发现当地的水资源存在不同程度的污染。

主要污染物包括重金属、有机物和细菌等。

水污染的主要原因是工业废水、农业化肥和城市污水。

3、垃圾污染问卷调查显示,大部分受访者认为当地垃圾处理存在问题。

主要原因是垃圾分类不彻底、回收利用率低和垃圾填埋场的污染问题。

四、数学统计与分析为了更准确地描述环境问题的严重程度,我们对收集到的数据进行了数学统计与分析。

具体如下:1.平均值与标准差:通过计算各污染物的平均值和标准差,可以了解当地环境问题的总体情况和差异程度。

2.相关性分析:通过相关性分析,可以探讨各污染物之间的关联程度,以及与环境问题之间的关系。

3.主成分分析:通过主成分分析,可以找出影响环境问题的主要因素,并针对这些因素制定相应的解决方案。

五、结论与建议通过本次调查与数学统计,我们得出以下结论:本地区的环境问题比较严重,主要表现为空气、水和垃圾污染。

造成这些问题的主要原因是汽车尾气、工业排放、农业活动、垃圾处理等方面的问题。

为了改善当地环境,我们建议采取以下措施:加强环保宣传教育;加大环保投入力度;推广清洁能源;加强垃圾分类与回收利用等。

空气质量检测数据处理与分析

空气质量检测数据处理与分析

空气质量检测数据处理与分析Introduction空气质量是现代城市生活和发展中的一个重要问题。

空气质量估计主要包括监测,分析和预测,所有这些都需要对大量数据进行处理和分析。

在这篇论文中,我们将讨论空气质量检测数据的处理和分析。

我们将讨论每个步骤的重要性,以及如何使用不同的技术和工具来处理和分析这些数据。

1. 数据收集空气质量的检测开始于数据收集。

这可以通过起点监测站来实现,该站通过使用传感器或其他设备来测量各种大气组分的浓度。

这些测量可以是连续的或定时的。

传感器可以测量颗粒物,氧气,臭氧,硫化氢,一氧化碳和二氧化氮等大气组分。

数据收集还可以利用其他来源,例如地面站测量,遥感探测,移动监测等。

利用卫星遥感技术可以使我们观察到大范围的区域,这种方法可以获得区域性的数据。

但是,根据收集的数据的精度和可靠性,需要在数据处理之前对数据进行验证和质量控制。

2. 数据处理在数据收集完成后,下一步是数据处理。

数据处理的主要目的是将原始数据转换为有用的和可理解的数据。

这可以通过使用各种数据处理技术来实现。

第一种数据处理技术是数据清洗,这可以通过删除并填充丢失的数据,自动纠正和检查异常值等方式降低噪声。

在这一步中,我们还可以将数据进行“去重”,以消除不必要或重复的信息。

第二种方法是数据转换。

这可以通过将原始数据转换为统计量,比如平均值,中位数等,也可以通过对原始数据进行标准化来实现。

标准化可以将原始数据转换为平均等于0并具有标准差的值的分数,从而使数据比较方便。

第三种方法是数据集成。

这可以通过将来自不同测量设备的数据集成到单个数据集中来实现,并在该数据集中对数据进行关联分析。

3. 数据分析在数据处理完成后,下一步是分析数据。

分析的目的是从海量数据中提取信息和知识。

这可以通过使用各种分析技术来实现。

第一种数据分析方法是描述性分析,这可以通过呈现原始数据的统计数据,如平均值,分位数和标准差来实现。

描述性分析可以帮助我们理解数据的分布和异常值。

主成分分析法在大气环境质量评价中的应用

主成分分析法在大气环境质量评价中的应用

个指标 的信息 , 再考虑选取第 2个线性组合 y , 2 与
其优点在于 : 充分考虑 了各指标之 间的相关性 , 能 够最大限度地保 留原有信息 , 对高维数据进行最佳 的综合降维处理 , 且更客观地确定各个指标 的权重
数, 避免 了主观 随 意 性 . 者 利 用该 方 法 对 福 州 市 笔
第2 6卷第 2期 2 1 年 4月 01
平顶 山学 院学报
J u a fPn dn s a ies y o r lo ig igh n Unvri n t
V0. 6 N . 12 o 2 Ap . 01 r2 1
主 成 分 分 析 法 在 大 气 环 境 质 量 评 价 中 的应 用
1 数据标 准化. ) 为了排除数 量级 和量 纲不 同 带来的影响 , 原始数据 能在 同一尺度 上进行 比 使
丹 (9 4 一 ) 女 ,四川省成都人 , 18 , 成都信 息工程 学院资源环境学院硕士研究生 ,主要研究方 向: 环境 系统分 析和土地科 学
原理与应用.
第 2期

1 1基 本 原理 .
近年来 , 经济的发展及人 口的增长导致 了大气
环境 质 量不 断恶 化 , 因此 , 于 大气 环 境 质 量 的评 对 价工 作 就显 得 十 分 重 要 . 何 合 理 、 观 地 描 述 大 如 客
主成分分析法是建立一种从高维空间到低维 空间的映射 , 即把多个指标转化为少数几个综合指 标的一种统计分析方法 , 目的是在保证信息损失 其
般取 累计解释方差达 8 % 以上 即可作为主 5
成分 , 从表 3 以看 出第一主成分的解释方差 已超 可
过9% , 4 可认 为 第 一 主成 分 即 可反 映原 变 量 的 主

空气质量的测量和分析方法

空气质量的测量和分析方法空气质量是现代城市发展中一个比较重要的问题,而空气质量的测量和分析方法也是相应工作中不可或缺的一部分。

那么,关于空气质量的测量和分析方法有哪些呢?一、测量方法1. 室内空气质量测量室内空气质量测量可以通过一些常用的仪器来完成,如气体检测仪、颗粒物测量仪等。

这些仪器能够检测室内空气中的各种污染物,如二氧化碳、甲醛、苯等,以及室内PM2.5等颗粒物的浓度,从而判断室内空气质量的好坏。

2. 户外空气质量测量户外空气质量测量需要使用专门的空气质量监测仪器,如空气质量自动监测站、大气降尘采样器等。

这些仪器可以测量空气中各种污染物的浓度,如PM2.5、PM10、二氧化氮、臭氧等,以及大气气溶胶、气溶胶元素等。

二、分析方法1. 统计学方法统计学方法是对不同时间、不同地点、不同污染物浓度的数据进行统计分析,以反映空气质量状况的方法。

常见的统计学方法有百分位数、平均数、标准差等。

这些指标可以反映出某个污染物在一段时间内的浓度水平、浓度分布状态等。

2. 空间分析方法空间分析方法是将污染物浓度随时间的变化和地点的变化综合起来进行分析,从而判断空气污染的扩散范围和污染物来源。

常见的空间分析方法有Kriging插值方法、地统计方法、空间状态分析等。

这些方法可以给出空气质量状况的空间分布图、空气污染源的位置和污染程度等信息。

3. 多元统计学方法多元统计学方法是将多个指标综合起来分析,以反映不同因素对空气质量影响的综合作用。

常见的多元统计学方法有主成分分析、因子分析等。

这些方法可以反映不同因素(如人口密度、交通情况、工业排放等)对空气质量状况的贡献程度,从而提出相应的治理措施。

综上所述,空气质量的测量和分析方法是对空气污染问题进行科学研究和治理的重要手段。

不同的测量方法和分析方法可以从不同角度反映空气质量的状况,为制定相应的治理措施提供经验依据。

基于层次分析和主成分分析的城市空气质量评价——以徐州市为例

基于层次分析和主成分分析的城市空气质量评价——以徐州市为例张茹;张学杨;陆洪光;刘强【摘要】为评价城市空气质量,以徐州市为例,分别运用层次分析法和主成分分析法对大气监测数据进行了对比研究.层次分析表明:研究期间徐州市大气环境质量为一级时的权重为0.450 2,为二级时的权重为0.549 8,表明该市空气质量等级为二级;主要大气污染物的权重排序为PM2.5 >PM10 >NO2 >SO2,说明首要大气污染物为PM2.5,表明徐州市大气污染表现为颗粒物污染.主成分分析表明:在特征值大于1的基础上,选取前两种污染物的总方差累计贡献率为78.804%的主成分作为综合性指标来反映徐州市大气环境质量;第一主成分的方差累计贡献率为59.562%,表明该市大气环境质量的主要影响因素依次为PM2.5、PM10、SO2、NO2、CO,其中PM2.5是首要大气污染物.层次分析和主成分分析结果均与《徐州市环境状况公报》发布的该市大气中首要污染物为细颗粒物(PM25)的结论相吻合,表明上述两种方法均可作为城市大气环境质量评价的方法.【期刊名称】《安全与环境工程》【年(卷),期】2017(024)003【总页数】5页(P103-107)【关键词】大气环境污染;层次分析法;主成分分析法;PM2.5;空气质量评价;徐州市【作者】张茹;张学杨;陆洪光;刘强【作者单位】徐州工程学院环境工程学院,江苏徐州221111;徐州工程学院环境工程学院,江苏徐州221111;江苏省环境材料与环境工程重点实验室,江苏扬州225009;徐州工程学院机电工程学院,江苏徐州221111;徐州工程学院环境工程学院,江苏徐州221111【正文语种】中文【中图分类】X823随着经济的快速发展,工业化和城市化进程与相对滞后的环保设施之间的矛盾日益尖锐,从而导致城市大气环境污染状况日益严重。

大气环境污染严重影响了人们的日常生活和身体健康。

如陶燕等[1]通过对可吸入颗粒物与心脑血管疾病和呼吸系统疾病进行相关性研究,发现PM2.5的浓度每升高10 μg/m3,患上述疾病的危险率分别增加0.697%和0.604%;秦萌等[2]通过对上海市奉贤区SO2、NO2和PM10与该地区居民循环系统疾病死亡的关系进行研究,发现SO2的浓度每上升10 μg/m3,居民循环系统疾病死亡率将增加1.82%。

主 成 分 分 析

主成分分析主成分分析(Principal Component Analysis,PCA)是一种常用的数据降维方法,它可以将高维度数据转换成低维度数据,并尽量保留数据的信息。

主成分分析的思想是通过对原始数据的线性变换,将其转换为一组新的变量,这些新变量是原始变量的线性组合。

这些新变量被称为主成分,它们可以解释原始数据的大部分方差,从而将原始数据的维度降低。

主成分分析的作用主成分分析可以用于数据预处理、数据压缩、数据可视化和模型建立等方面。

在数据预处理阶段,主成分分析可以用于去除数据中的冗余信息,减少数据噪声,提高数据的质量。

在数据压缩阶段,主成分分析可以将高维度数据压缩成低维度数据,从而节省存储空间和计算时间。

在数据可视化阶段,主成分分析可以将高维度数据转换成低维度数据,进行可视化展示,帮助用户更直观地理解数据和发现数据中隐藏的规律。

在模型建立阶段,主成分分析可以用于特征提取,减少维度的同时又不失去数据的重要特征,帮助用户更准确地建立模型,提高模型的预测准确率。

主成分分析的应用主成分分析广泛应用于各个领域,例如金融、医学、环境、工业等。

在金融领域,主成分分析可以用于建立风险评估模型,帮助投资者了解投资组合的风险。

在医学领域,主成分分析可以用于进行疾病预测,帮助医生快速准确地诊断疾病。

在环境领域,主成分分析可以用于分析空气质量和水质,帮助政府和公众了解环境状况。

在工业领域,主成分分析可以用于质量控制和生产优化,帮助企业降低成本和提高效率。

主成分分析的注意事项要注意主成分分析的前提条件,即原始数据必须为线性数据,在进行主成分分析前需要先对数据进行标准化处理。

此外,在进行主成分分析时,应根据实际问题选择合适的主成分数量,不能盲目追求降维程度,以免丢失重要信息。

同时,主成分分析的结果需要进行解释和验证,以确保分析结果的可靠性和有效性。

结语主成分分析是一种十分常用且十分有效的数据降维方法,它能够将高维度数据转换成低维度数据,并尽量保留数据的信息。

主成分分析在城市大气环境质量评价中的应用

主成分分析在城市大气环境质量评价中的应用
随着城市的发展和社会的进步,城市大气环境质量的变化也在不断地提升,但是严重污染依然困扰着其中很多村镇。

为了有效地评估城市大气环境质量,主成分分析技术被广泛应用于此。

主成分分析是一种非常有效的数据处理方法,可以将多维空间数据映射到较低维空间,以了解城市空气质量的主要污染物来源和潜在前景,并以此做出合理的解决方案。

主成分分析还可以通过调整每种污染指标的组合,更好地表示数据,有助于更准确地识别不同污染物的来源和贡献,进而进行有效的污染防治控制。

此外,利用主成分分析可以更加清晰直观地查看问题,更好地发现与城市大气质量相关的关系,也更便于后续分析和决策过程。

总之,主成分分析是一项有力的技术支持,可以帮助我们更好地了解和评估城市大气环境质量,有效开展污染防治工作。

在未来,主成分分析将在城市大气环境质量评价及作出相应管理和控制措施的过程中发挥更大的作用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一组空气污染数据的主成分分析

Company number:【WTUT-WT88Y-W8BBGB-BWYTT-19998】 一组空气污染数据的主成分分析 【说明】下面的多元统计分析练习题摘自. Johnson等编写的《应用多元统计分析(第五版)》,原书为:Richard A. Johnson and Dean W. Wichern. Applied Multivariate Statistical Analysis (5th Ed). Pearson Education, Inc. 2003。我看的是中国统计出版社(China Statistics Press)2003年发行的影印本。 第一题为原书第题,即第1章的第6题,第二题为原书第题,即第8章的第12题。 第二题用的是第一题的数据。

1 习题 . The data in Table are 42 measurements on air-pollution variables recorded at 12:00 noon in the Los Angeles area on different days. (a) Plot the marginal dot diagrams for all the variables. (b) Construct the x, Sn, and R arrays, and interpret the entries in R. TABLE AIR-POLLUTION DATA

Wind (x1) Solar radiation (x2) CO (x3) NO (x4) NO2 (x5) O3 (x6) HC (x7) 8 98 7 2 12 8 2 7 107 4 3 9 5 3 7 103 4 3 5 6 3 10 88 5 2 8 15 4 6 91 4 2 8 10 3 8 90 5 2 12 12 4 9 84 7 4 12 15 5 5 72 6 4 21 14 4 7 82 5 1 11 11 3 8 64 5 2 13 9 4 6 71 5 4 10 3 3 6 91 4 2 12 7 3 7 72 7 4 18 10 3 10 70 4 2 11 7 3 10 72 4 1 8 10 3 9 77 4 1 9 10 3 8 76 4 1 7 7 3 8 71 5 3 16 4 4 9 67 4 2 13 2 3 9 69 3 3 9 5 3 10 62 5 3 14 4 4 9 88 4 2 7 6 3 8 80 4 2 13 11 4 5 30 3 3 5 2 3 6 83 5 1 10 23 4 8 84 3 2 7 6 3 6 78 4 2 11 11 3 8 79 2 1 7 10 3 6 62 4 3 9 8 3 10 37 3 1 7 2 3 8 71 4 1 10 7 3 7 52 4 1 12 8 4 5 48 6 5 8 4 3 6 75 4 1 10 24 3 10 35 4 1 6 9 2 8 85 4 1 9 10 2 5 86 3 1 6 12 2 5 86 7 2 13 18 2 7 79 7 4 9 25 3 7 79 5 2 8 6 2 6 68 6 2 11 14 3 8 40 4 3 6 5 2

Source: Data courtesy of Professor . Tiao. . Consider the air-pollution data listed in Table . Your job is to summarize these data in fewer than p=7 dimensions if possible. Conduct a principal component analysis of the data using both the covariance matrix S and the correlation matrix R. What have you learned Does it make any difference which matrix is chosen for analysis Can the data be summarized in three or fewer dimensions Can you interpret the principal components

2 部分解答 部分统计参数 利用Excel计算的平均值(x)和标准差 Wind Solar radiation CO NO NO2 O3 HC Average Stdev

Excel给出的协方差矩阵S Wind Solar CO NO NO2 O3 HC radiation Wind Solar radiation CO NO NO2 O3 HC

Excel给出相关系数矩阵R

Wind Solar radiation CO NO NO2 O3 HC Wind 1 Solar radiation 1 CO 1 NO 1 NO2 1 O3 1 HC 1

从相关系数矩阵可以看出,CO与NO、NO2相关性明显,O3与Solar

radiation、CO相关性明显。后面的主成分分析将CO与NO、NO2归并到一个主成分,将O3与Solar radiation归并到一个主成分,将HC、Wind归并到一个主

成分。HC与Wind的相关系数并不高,但从正相关的角度看,二者的数值倒是最高的。方差极大正交旋转之后,HC与CO、NO、NO2归并到一个因子,因为

HC与NO2的相关系数较高,与CO、NO的相关系数高于其他变量。 主成分分析之一——数据未经标准化 下面是从相关矩阵R出发,SPSS给出的结果。原始数据未经标准化。所谓从R出发,就是在SPSS的Factor Analysis: Extraction—Analysis选项中选中Correlation Matrix。 SPSS给出的相关系数矩阵(Correlation Matrix),与Excel计算的结果一样。 公因子方差(Communalities)表如下。公因子方差变化于~之间,相差不是很大。但是,公因子方差值没有达到以上的,可见每一个变量体现在三个主成分中的信息都不超过80%。 特征根与方差贡献(Total Variance Explained)如下表。可见提取三个主成分可以解释原来7格变量的%。 主成分载荷矩阵(Component Matrix)见下表。 将上表从SPSS中复制到Excel中,进行涂色分类,结果如下表所示。 Component 1 2 3 WIND Solar radiation CO NO NO2 O3 HC

主成分分类如下:

 第一主成分的主要相关变量:CO、NO、NO2。

 第二主成分的主要相关变量:Solar radiation、O3。

 第三主成分的主要相关变量:Wind、HC。 在主成分载荷图(Component Plot)中,三个变量分别落入三个不同的主成分代表的区域。 主成分得分表如下。最后一栏对几个典型的样本给出了简单的解释。注意解释的时候看清主成分载荷矩阵中载荷值的正负号。 Cases f1 f2 f3 典型的说明 S1 S2 S3 S4 样本4代表的区域Wind、HC污染严重

S5 S6 S7 样本7和8代表的区域与CO、NO、NO

2

污染有明显的关系 S8

S9 S10 S11 S12 S13 S14 S15 S16 S17 S18 S19 S20 S21 样本21代表的区域Solar radiation、O

3污

染较小 S22 S23 S24 S25 S26 S27 S28 S29 S30 S31 S32 S33 样本33代表的区域Wind、HC污染较小

S34 S35 S36 S37 样本37和38代表的区域Solar radiation、

O3污染严重 S38 S39 S40 S41 S42 主成分分析之二——数据未经标准化 下面是从协方差矩阵S出发,SPSS给出的结果。原始数据未经标准化。所谓从S出发,就是在SPSS的Factor Analysis: Extraction—Analysis选项中选中Covariance Matrix。 公因子方差(Communalities)表如下。在未经处理的(Raw)公因子方差一栏,其Initial数值都是原始数据的方差。不过与前面Excel给出的协方差矩阵有所不同,Excel给出的是总体方差,SPSS给出的是抽样方差。例如以Wind的Initial值为例,×42/41=,或者×41/42=(对照前面的协方差矩阵)。 重标的(Rescaled)结果是Extraction值与Initial值之比。 公因子方差的合计结果如下: Raw Rescaled Initial Extraction Initial Extraction WIND 1 Solar radiation 1 CO 1 NO 1 NO2 1 O3 1 HC 1 合计 7

特征根与方差贡献(Total Variance Explained)如下表。在Raw一栏中显

示,提取一个主成分似乎可以解释原来7格变量的%。但重标之后显示的数值却是%。 根据公因子方差表和合计结果,重标之前,全部的方差解释为 *100=%; 重标之后,全部的方差解释为 7*100=%。

相关文档
最新文档