城市空气污染程度的分析和预测模型
环境空气质量监测与预测模型研究

环境空气质量监测与预测模型研究环境空气质量是影响人类健康和生命安全的重要因素之一。
长期以来,全球各国都在不断探索和研究如何监测和预测环境空气质量,以提高人民生活质量和健康水平。
在这方面,人们开发了各种监测设备和预测模型,以便更准确地了解和把握环境空气质量的变化。
环境空气质量监测的重要性首先,要明确环境空气质量监测的重要性。
随着工业生产和交通发展,大量废气排放和沙尘暴天气等问题给环境空气质量带来了很大的挑战。
而环境空气质量的变化对人体健康的影响很大,例如一些重金属、有机污染物等物质,经常会诱发呼吸系统疾病、心脑血管疾病、私密部位疾病等。
因此,环境空气质量监测的重要性就不言而喻。
常用的空气质量监测方法环境空气质量监测采用的常见方法有现场监测和远程监测两种。
现场监测是指人们利用专业的环境监测设备对环境空气质量进行实时检测和采样,这种方法得到的数据准确度较高,但能力有限,只能监测到其所在地的空气质量情况,难以覆盖广大地区。
而远程监测是指人们利用网络等手段对环境空气质量进行远程监测,这种方法依靠已经布设好的空气监测站点,可以得到较为全面的空气质量数据,但需要总结与分析该站点数据和其他因素综合得到的整个区域的空气质量状况,准确度相对较低。
环境空气质量预测模型是怎样研究的?除了现场监测和远程监测外,人们还可以通过构建环境空气质量预测模型,实现对环境空气质量变化趋势的预测。
环境空气质量预测模型是通过收集并分析环境监测站的数年或数月的空气质量数据,特征数据,如环境因素、气象因素、经济因素等,制定特定的算法来预测未来一段时间的环境空气质量状态。
这种方法可以帮助人们提前预判环境空气质量的变化趋势,并采取相应的措施加以调整和控制。
环境空气质量预测模型的应用环境空气质量预测模型可以采用时间序列模型,也可以利用人工神经网络模型,如BP神经网络,SVM等。
这些模型通过不断地回归、分析和累积数据,可以进行准确预测,并实现空气质量变化的可视化监测和应对方案的调整。
环境监测领域中的大气污染模型使用教程

环境监测领域中的大气污染模型使用教程大气污染是当前全球范围内面临的重要环境问题之一。
为了保护人类健康和环境可持续发展,科学家们开发了各种大气污染模型来预测和评估不同因素对空气质量的影响。
本文将介绍环境监测领域中常用的大气污染模型以及如何使用它们进行预测和分析。
1. 模型介绍在环境监测领域中,常用的大气污染模型包括:CMAQ模型、WRF-Chem模型、AERMOD模型等。
这些模型基于物理、化学和数学原理,通过模拟大气过程、污染物传输和变化,提供了对大气污染的准确预测和评估。
- CMAQ模型(Community Multiscale Air Quality Model)是一种广泛应用于大气环境模拟和预测的模型。
它可以模拟大尺度到细尺度的空气流动和污染物传输,包括气溶胶、氧化物、二氧化氮等。
- WRF-Chem模型(Weather Research and Forecasting model coupled with Chemistry)是一种将大气动力学模拟和化学传输过程相结合的模型。
它可以模拟气象过程和污染物分布,有助于理解不同气象条件下的空气污染形成和传播机理。
- AERMOD模型是一种广泛用于工业源排放和城市环境中污染物传输建模的模型。
它基于高斯模型原理,能够预测工业源的排放对周围地区空气质量的影响。
2. 模型使用教程为了能够准确有效地使用这些大气污染模型,以下是一些基本的使用教程和注意事项:2.1 数据准备在使用大气污染模型之前,首先需要准备好相关的输入数据。
这些数据包括气象数据、地理信息、土地利用数据、废气排放数据等。
可以从气象台、环境保护部门等机构获取这些数据,也可以使用开源数据集和模型提供的默认数据。
2.2 模型配置配置大气污染模型是一个重要的步骤,决定了模型的运行方式和输出结果的准确性。
在配置模型时,需要设置模型的运行时间、空间范围、污染物的初始浓度和排放源信息等。
每个模型都有相应的配置文件和参数,使用者需要根据应用需求进行相应的设置。
城市空气质量综合评估与预测

城市空气质量综合评估与预测近年来,城市化进程加速,城市面积增加,人口数量增多,城市发展与环境保护的矛盾日益突出,其中空气污染问题成为城市环境管理的重点。
因此,如何综合评估和预测城市空气质量,显得至关重要。
一、城市空气质量综合评估城市空气质量综合评估是建立在大量数据的基础上,对城市空气质量进行分析和评估的过程。
衡量城市空气质量的标准是多元的,如PM2.5、PM10、SO2、NO2等空气污染物浓度、扩散条件、风向风速、气象条件等多种因素。
通过分析这些数据指标,可以评估城市环境的整体状况,给出科学合理的环境治理优化方案,为城市环境管理提供可靠的依据。
二、城市空气质量预测城市空气质量预测是建立在环境监测数据的基础上,综合运用气象、大气化学等学科的知识手段,对未来一段时间内城市空气质量进行预测。
城市空气质量的预测主要可以分为以下类别:1.短期预测短期预测主要指对当天甚至当时的空气质量情况进行分析,并发布到公众平台上供市民参考。
通过分析当天的大气化学成分、气象条件、人为活动等因素,可以综合判断今天的空气质量和明天的趋势,提醒市民关注自身健康状况,做好相应的防护措施。
2.中期预测中期预测指对未来数天的空气质量进行预测。
通过收集历史数据、环境监测数据、气象数据和人为活动数据,分析其相互关系,结合数据模型,可以预测未来几天的空气质量状况。
3.长期预测长期预测主要指对未来一段时间内空气质量形势进行预测。
通过综合考虑历史数据、大气环境动态、环境政策等多方面的因素,建立空气质量长期变化趋势的预测模型。
三、综合评估与预测在城市空气质量管理中的应用城市空气质量管理是综合性的,旨在确保城市空气质量达到污染物排放标准,在这个过程中,评估和预测是非常重要的工具。
综合评估可以帮助相关部门了解整个城市空气质量的状况,同时也能发现地点上存在的问题。
预测功能可以帮助部门及时采取必要的措施以控制空气污染,同时也可以为市民提供方便的环境展望。
大气污染现状分析及其预测模型研究

大气污染现状分析及其预测模型研究近年来,大气污染问题日益严重,已经成为人们关注的热点话题之一。
据统计,全球每年因空气污染而导致的早逝人数高达700万人,其中我国是空气污染问题最为突出的国家之一。
本文将从大气污染现状分析和预测模型研究两个方面来探讨这一问题。
一、大气污染现状分析1.1 污染物来源和种类大气污染的来源非常广泛,主要包括工业生产、交通运输、农业活动、城市建设等多个方面。
其中,二氧化硫、氮氧化物、颗粒物、臭氧、一氧化碳等是主要的污染物种类。
1.2 污染物的危害空气中的污染物对人类健康和环境产生的影响非常严重,包括呼吸系统病变、心血管疾病、免疫系统功能下降等,其中孕妇和儿童更容易受到影响。
1.3 污染现状据报道,我国大气污染问题十分突出,全国近半数城市空气质量达不到国家二级标准,其中京津冀、长三角等城市群污染严重。
另外,2019年污染物排放总量增加、季节性污染和区域性污染问题也日益凸显。
二、大气污染预测模型研究2.1 预测模型的作用预测模型是指通过数据统计和数学模型进行预测,能够对未来的污染情况进行预测。
这种方法能够帮助我们及时采取措施,预防和减少污染的发生。
2.2 现有的预测模型主要有基于统计学的时间序列分析模型、基于数学运算和人工神经网络的物理模型、基于地理信息技术的空间交互作用模型等。
2.3 预测模型的不足虽然现有的预测模型能够对未来的污染情况进行一定程度的预测,但是预测精度仍有很大的提高空间;同时涉及的因素也过于单一,不能全面反映污染源和环境的综合影响。
三、总结大气污染问题已经成为我们不容忽视的环境问题,急需制定更为严格的环保措施,加强大气污染治理工作。
同时,也需要进一步提高预测模型的精度和预测能力,提高信息的获取和传递效率,为治理工作提供更为准确可靠的数据支持。
空气质量预测模型的构建方法与预测精度分析

空气质量预测模型的构建方法与预测精度分析摘要:空气质量预测是保护公众健康、减少环境污染的重要任务。
本文介绍了空气质量预测模型的构建方法,并分析了不同方法对预测精度的影响。
引言:随着经济的快速发展和城市化进程的加速,大气污染成为了严重的环境问题。
空气质量预测可以提前预警,采取合适的控制策略,减少人们患病和环境污染的风险。
因此,构建准确高效的空气质量预测模型非常重要。
一、空气质量预测模型的构建方法1. 数据采集与预处理空气质量预测需要大量的气象和环境数据作为输入。
常见的数据包括温度、湿度、风向、风速等气象数据,以及PM2.5、PM10、NO2等环境数据。
数据的采集可以通过气象站和环保监测站等手段获得,然后对数据进行预处理,如去除异常值、缺失值补全等,确保数据的准确性和完整性。
2. 特征提取与选择在构建预测模型之前,需要从大量的数据中提取有意义的特征,以更好地描述空气质量的变化规律。
常用的特征提取方法包括统计特征、频谱特征、小波变换等。
此外,为了避免维度灾难和提高模型的拟合能力,还需要进行特征选择,选取与目标变量相关性高的特征。
3. 模型选择与构建目前常用的空气质量预测模型包括回归模型、时间序列模型和机器学习模型等。
回归模型适用于具有线性关系的数据,如线性回归、岭回归等。
时间序列模型适用于具有一定时序关系的数据,如ARIMA、SARIMA等。
机器学习模型适用于非线性关系的数据,如神经网络、支持向量机、随机森林等。
在选择模型时,需要考虑数据的特点、模型的复杂度和计算效率等因素。
4. 模型训练与优化模型的训练是指通过已有的数据样本,调整模型的参数,使其能够拟合数据的特征,并能够准确地预测未来的空气质量。
训练过程中可以使用各种优化算法如梯度下降、遗传算法等,以提高模型的性能和收敛速度。
二、预测精度分析预测模型的精度是衡量其优劣的重要指标。
常用的评价指标包括均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R2)等。
空气污染的监测与预测模型

空气污染的监测与预测模型近来,随着人们生活水平的提高,工业、交通等活动不断增加,导致空气污染问题成为社会公众关注的焦点。
大气通常是人类最重要的资源之一,但是吸入污染空气会严重影响人类健康和生活质量。
面对这一问题,空气污染监测与预测模型变得越来越受欢迎。
本文将着重探讨空气污染的监测与预测系统及其作用。
空气污染监测系统空气污染监测系统是为了收集和记录和评估大气环境的质量,这使得对大气环境质量的控制和管理成为可能。
现在,空气污染监测已经成为政府和环保机构的重点任务,以帮助优化信息收集和传递,并协调与各地的环保组织进行沟通,同时也能促进实施环保控制措施的有效性。
空气质量的监测是基于大气环境的先进技术、仪器和方法。
常用的监测参数包括常规大气污染物、重金属和挥发性有机物。
在城市中,还需要监测车辆尾气中的排放物、建筑施工和垃圾填埋场的排放、火力发电和工业设施以及其他人类活动的污染物的排放。
通过这些监测,监测机构可以及时获取大气质量数据,并向公众发布相关信息,以便公众采取必要的保护措施。
空气污染预测模型与空气质量监测不同,空气污染预测模型是基于公共和经验性的方法,通过复杂的算法和数学模型来预测未来的污染水平。
这些模型根据过去的数据、经验,以及天气和其它因素,预测未来污染水平及主要污染物。
空气污染预测同样也被广泛应用于环保政策制定、应急响应和环境规划。
目前,空气质量预测主要分为三大方向:基于物理模型、统计模型和人工智能模型。
物理模型是一种基于物理方程的理论模型,强调环境系统中的物理、化学和生物过程本质上是物理方程的解。
统计模型则是一种基于统计研究的方法,它利用大量过去的观测数据和统计方法估计大气污染物的空间和时间规律。
而人工智能模型则是一种基于神经网络、支持向量机等的数据驱动方法,通过大量的数据集对模型进行训练,从而对未来趋势进行预测。
结论空气质量监测和预测是现代环保监管的关键目标之一,监测系统和预测模型有助于预测和处理污染问题。
应用多元回归分析模型预测城市空气质量

应用多元回归分析模型预测城市空气质量城市空气质量是影响城市居民身体健康和生命安全的重要因素之一。
随着城市化进程的加快和人口增长速度的加快,城市空气污染问题越来越受到人们的关注。
由于城市大气环境受多种因素影响,因此,采用多元回归分析模型来预测城市空气质量是一种有效的方法。
一、多元回归分析模型简介多元回归分析是一种统计学方法,可以通过建立多元线性回归模型来分析多个自变量(影响因素)对一个因变量(被解释变量)的影响。
在环境科学和大气环境领域,多元回归分析方法常用于预测城市空气质量、环境污染等问题。
多元回归分析模型的基本形式为:Y = β0 + β1X1 + β2X2 + …… + βnXn + ε其中,Y为因变量,表示要解释的变量或预测变量,Xi为自变量,表示影响因素,βi表示第i个自变量的回归系数,ε为误差项。
回归系数表示自变量与因变量之间的关系强度和方向。
二、多元回归分析在城市空气质量预测中的应用城市空气质量受多种因素影响,包括气象条件、交通情况、工业污染、建筑物高度、绿地覆盖率等。
多元回归分析可以通过同时考虑多个因素对城市空气质量的影响,建立预测模型,帮助人们更好地了解和预测城市空气质量。
在多元回归分析中,需要先确定自变量和因变量。
对于城市空气质量预测,因变量可选取空气质量指数(AQI)等常用指标。
自变量则需要根据实际情况进行选择,并进行数据分析和处理。
例如,在北京市的空气质量预测中,研究人员选择了气象条件、交通情况、工业污染等多个因素作为自变量,并对收集到的相关数据进行归一化处理。
通过应用多元回归分析模型,建立了城市空气质量预测模型,成功预测了北京市空气质量的变化趋势和高峰期。
三、多元回归分析模型的优势应用多元回归分析模型预测城市空气质量的优势在于,可以综合考虑多个影响因素,减少个别因素对预测结果的影响。
相比于单个影响因素的分析方法,多元回归分析可以更准确地预测城市空气质量的变化趋势。
此外,多元回归分析模型还具有灵活性和可靠性。
空气质量预测模型的研究与评估

空气质量预测模型的研究与评估1. 前言空气质量是人们生命必需的元素之一,所以如何保障空气质量的提升是每个国家都需要考虑的问题。
为了更好的研究空气质量预测模型并对其进行评估,本文将从以下几个方面进行探讨。
2. 空气质量预测模型的研究2.1 研究背景在每个城市都存在着空气污染的问题。
为了更好的解决这个问题,需要对空气质量进行预测。
通过对气象、环境、空气质量监测等多方位的数据融合,可以构建多种空气质量预测模型。
2.2 研究现状国内外对空气质量预测模型的研究主要包括以下几个方面:(1)统计分析法:通过对历史数据进行统计分析,预测空气质量;(2)人工神经网络法:将空气质量预测问题转化为一个模式识别问题,通过对历史数据进行学习建立模型;(3)回归分析法:建立模型描述某些污染物质与气象因素之间的关系;(4)机器学习法:通过对空气质量相关数据进行学习建模,实现空气质量预测。
2.3 研究前景随着科技的不断发展,人工智能、大数据等技术的广泛应用,空气质量预测模型的研究将会越来越精准,能够更有效地预测空气污染物浓度的变化情况,有助于保障人们的身体健康。
3. 空气质量预测模型的评估3.1 评估指标在对空气质量预测模型进行评估时,需要对其进行指标评估。
主要包括以下几个方面:(1)准确率:预测的值与真实值之间的误差;(2)Kappa系数:衡量预测模型对矩阵的拟合程度;(3)ROC曲线:能够判定分类模型的表现;(4)F1 Score:同时考虑模型的召回率和精准度。
3.2 评估方法在评估空气质量预测模型时,一般采用交叉验证和拟合优度进行评估。
其中,交叉验证可以从训练集和测试集中随机抽取样本,进行多次训练和测试,取平均值做为最终评估结果。
拟合优度可以通过计算实际值与预测值之间的相关系数来进行评估。
4. 空气质量预测模型的应用通过对空气质量预测模型的研究和评估,可以为城市空气污染防治提供有力的支撑。
一些地方甚至开始采用机器学习的方法对空气质量进行预测和监测,如北京、上海等大城市已经开展了相关的工作。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
城市空气污染程度的分析和预测摘 要 本文讨论了有关城市污染程度、污染因素及污染扩散的问题。
对于问题一,本文主要从大气污染、噪声污染和水体污染这三个面选取主要污染物,查阅北京、天津、上海、重庆和西安五座城市2007-2012年的年度平均污染数据,采用降维的思想,运用主成分分析法减少变量个数,再借助Matlab 软件计算各主成分的贡献率,分析知可选取前三个主成分作为衡量污染程度的标准,最后根据综合指标得到这五个城市的污染程度从高到低依次为:重庆、上海、北京、天津、西安。
通过判断相关系数的大小,确定五个城市影响人们生活的主要污染因素是水污染,其四项指标依次为化学需氧量、总氮、总磷和氨氮。
对于问题二,以北京市大气污染为例。
首先,利用GPS 记录北京市14个城区观测点的位置,并查阅2013年污染指标2SO 、2CO 、5.2PM 与10PM 的污染数据,绘制出相应的空间浓度分布图,估计这四种污染物的大致污染源位置依次为:)100,110(附近、)83,130(附近,)85,125(附近和)80,132(附近;其次,根据污染扩散原理和方式,建立Cauchy 污染传播模型,根据各地区空气污染物的浓度分布,运用Matlab 软件对数据非线性拟合,得出扩散模型各参数的值,计算得出各项污染指标的污染源位置依次为:)3.97,5.115(,)3.85,2.128(,)8.80,1.129(和)6.87,5.125(;最后,比较污染物位置的计算值与实际值,发现误差相差较小,故模型建立较为合理。
对于问题三,分析西安市的主要污染——大气污染。
收集西安市2014年4.1-7.31日的空气污染数据,根据时间序列的平稳性特点及AIC 定阶准则选取合适的时间序列模型)11(ARMA ,,利用Matlab 软件对序列模型的各项参数进行估计并检验模型的合理性,并将模型用于数据预报。
利用时间序列模型预测西安市未来10天的空气污染状况总体等级为良。
对于问题四,基于问题一、二、三对污染因素的分析和污染扩散的特点,主要从减少污染物的产生和治理净化已产生的污染物两方面,针对大气污染、水体污染和噪声污染为相关部门提供合理化防治建议。
关键词 主成分分析;Cauchy 污染传播模型;时间序列模型;Matlab 软件一、 问题重述环境质量的好坏对人们的生活有着最直接的影响,包括身体健康、寿命长短、生活质量以及经济发展水平、生态环境等。
因此保护环境的工作需要个人、集体、国家、乃至全球各国的共同努力。
事实上,环境保护事业从1962年起步至今,一直备受人们关注和重视,环境污染的防治工作也一步步开展运营,然而较经济发展的速度和水平,还有很多需要为之努力的工作要做。
环境保护工作一方面是要从减少污染物的产生方面,预防和控制污染源头污染物的排放,另一方面是治理净化已产生的污染物。
环境污染是指环境因受人类活动影响而改变了原有性质和状态的现象,其实质是人类活动中将大量的污染物排入环境,影响其自净能力,降低了生态系统的功能。
为考察某时期某区域的环境状况,需统计该地区各项污染指标的数据,根据各污染指标的污染排放标准,确定其污染程度,并通过污染发生的原因、途径和后果制定合理的污染治理方案,加以实施运行,改善环境。
统计北京、天津、上海、重庆和西安五座城市的污染数据,讨论如下问题: 问题一:比较五座城市的污染程度及影响人们生活的主要污染因素; 问题二:建立城市污染扩散模型确定某城市污染程度并检验; 问题三:给出西安市某方面污染状况的中长期预测数据; 问题四:给相关部门提供一篇治理污染的建议短文。
二、 问题分析对于问题一,本文将查阅收集北京、上海、天津、重庆以及西安五座城市大气污染、噪声污染和水体污染2007-2012年的数据,由于各项污染指标众多,所以选取具有代表性的污染物:可吸入颗粒物10PM 、2SO 、2CO 、道路交通噪声、区域环境噪声、化学需氧量、氨氮、总氮和总磷这9项指标来综合衡量各城市的污染程度,本文将运用降维的思想,利用主成分分析法计算前几个主成分的贡献率大小及通过线性组后的综合指标,以此来衡量各城市的污染程度,根据各主成分的相关系数大小即可确定影响人们生活的主要污染因素([1])。
对于问题二,本文将以北京市的大气污染为例,收集北京市2013年14个城区的2SO 、2CO 、5.2PM 和10PM 的污染数据,绘制出这四种污染物浓度的空间浓度分布图,估算出这四种污染物的大致污染源位置;建立Cauchy 污染传播模型,根据各地区空气污染物的浓度分布,运用Matlab 软件对数据nlinfit 非线性拟合,计算出扩散模型各参数值,得出各空气污染物的污染源位置;比较污染物位置的计算值与实际值,检验污染传播模型建立是否合理([2])。
对于问题三,本文将考虑西安市大气污染的各项污染指标,搜集2014年4月1日至2014年7月31日的污染数据,根据时间序列的平稳性特点及AIC 定阶准则选取合适的时间序列模型,利用Matlab 软件([3])估计序列模型的各项参数并检验模型的合理性,考核通过时方可用于数据预报。
对于问题四,基于问题一、二、三对污染因素的分析和污染扩散的特点,主要从减少污染物的产生和治理净化已产生的污染物两方面,针对大气污染、水体污染和噪声污染为相关部门提供合理化防治建议。
三、 模型假设1.所有城市污染数据均真实有效,具有统计价值;2.污染数据的取样为瞬时取样且在某个平面内,不考虑取样前后污染物的浓度变化;3.绘制北京大气污染浓度分布图时不考虑海拔因素的影响;4.大气污染过程经历着扩散与衰减,且沿y x ,轴方向上的扩散系数分别为常数,衰减与浓度成正比;5.不考虑日照等自然因素对各项指标污染浓度的影响。
四、 符号说明4.1 模型一1x : 可吸入颗粒物(单位3/m mg ); 2x : 二氧化硫(单位3/m mg ); 3x : 二氧化氮(单位3/m mg );4x : 道路交通噪声(单位分贝); 5x : 区域环境噪声(单位分贝); 6x : 化学需氧量(单位万吨); 7x : 氨氮(单位万吨); 8x : 总氮(单位万吨); 9x : 总磷(单位万吨) ;∑ : 样本协方差矩阵 ; i λ : 协方差矩阵的特征值 ; i e : 协方差矩阵的特征向量; **i i X Y ,ρ : 相关系数;i σ : 样本方差向量 ; ρ : 样本相关矩阵;*i λ : 样本相关矩阵的特征值;*i e : 样本相关矩阵的特征向量; i μ : 样本均值向量; *i Y : 主成分;Y : 污染程度综合指标。
(其中9,,2,1 =i ) 4.2模型二x : 位置坐标/横轴; y : 位置坐标/纵轴; z : 位置坐标/竖轴; c : 污染物浓度; m ∆ : 污染物质量;M : 污染物排放量; σ : 扩散系数。
4.3模型三 t X : 序列; t ε :平稳白噪声; )(MA q : 滑动平均序列; )(AR p : 自回归序列;),(ARMA q p : 自回归滑动平均序列 ; c : 常数; k γ : 自协方差函数; k ρ : 自相关函数; )(x f : 概率密度; i β : 未知参数向量 )(ˆm kβ: 最大似然估计; l ϕ : 自回归参数。
p l k i t ,,2,1;,,2,1;,2,1,0 ==±±=五、 模型建立与求解5.1 问题一的模型建立与求解环境因受人类活动影响而改变了原有性质和状态的现象称为环境污染。
环境污染的实质是人类活动中将大量的污染物排入环境,影响其自净能力,降低了生态系统的功能。
然而生活中环境的污染也是多方面的,污染按环境要素分类,可分为:大气污染、土壤污染和水体污染。
为此,本文选取环境污染的主要污染影响指标,建立污染评价模型,即主成分分析模型,比较北京、天津、上海、重庆和西安五座城市的污染程度,并得出影响人们生活的主要污染因素。
5.1.1 建立主成分分析模型首先选取环境污染的部分污染指标:可吸入颗粒物1x 、二氧化硫2x 、二氧化氮3x 、道路交通噪声4x 、区域环境噪声5x 、化学需氧量6x 、氨氮7x 、总氮8x 和总磷9x 。
北京、天津、上海、重庆和西安五座城市的各项指标年平均数据(见附录表1)。
问题中变量太多不但会增加计算的复杂性,也给合理的分析问题和解决问题带来很大困难;同时,这些变量之间存在的相关性,也使得这些变量所反映的信息在一定程度上有所重叠。
为了减少变量个数,本文采用了降维的思想,利用主成分分析法得出污染空气的主要因素变量,提高问题研究的合理性,同时不会使数据反映的信息量有大的损失。
设∑是T 321),,,,(p x x x x x =的协方差矩阵,∑的特征值与正交化特征向量分别为0321≥≥≥≥≥p λλλλ 及p e e e e ,,,,321 ,且x 的第i 个主成分为),,3,2,1(,332211p i x e x e x e x e Y p ip i i i i =+++= (1)根据平均值计算公式∑==n1j i 1ij x n x 代入数据计算样本),,,,(321p x x x x x =的均值向量),,,,(321p x x x x x =为)3475.09390.22110.35925.234760.543480.680434.00354.00986.0(=x 根据协方差矩阵计算公式T 1))((1n 1x x x x i i ni ---=∑∑= (2)利用Matlab 软件代入数据可求得随机变量),,,,(321p x x x x x =)9(=p 相应样本协方差矩阵为(只写下三角部分)⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡--------------------=∑0437.03485.01690.07574.11029.00963.00005.00003.00003.08425.24350.18003.147895.09387.00049.00039.00028.00058.30630.163881.03351.00051.00062.00281.05272.1108197.30768.50409.00031.01114.02917.00891.000003.00020.07820.00050.00064.00034.00000001.00001.00003.0 由于协方差矩阵对角线元素即为样本),,,,(321p x x x x x =的方差值,观察矩阵易知其方差值相差较大,即各量纲间分散程度较大,不适用于环境污染模型中各成分指标间的相关性分析,为消除由于量纲不同可能带来的结果误差,故将样本变量),,,,(321p x x x x x =)9(=p 标准化,即令9,,2,1, =-=*i x X iiii i σμ(3)得到一组新的数据),,(921****=X X X X 。