基于多元线性回归对AQI预测
基于偏相关与逐步回归方法的AQI影响因素分析及预测

Advances in Environmental Protection 环境保护前沿, 2017, 7(3), 191-201Published Online June 2017 in Hans. /journal/aephttps:///10.12677/aep.2017.73028The Analysis of Influence Factors of AQIand Prediction Based on Partial Correlation and Stepwise Regression MethodsMenglian Dai1, Tong Wang1, Haiyin Deng1, Fang Wang1,2*1College of Science, Hunan Agricultural University, Changsha Hunan2Agricultural Mathematical Model and Data Process Center, Hunan Agricultural University, Changsha HunanReceived: May 19th, 2017; accepted: Jun. 5th, 2017; published: Jun. 8th, 2017AbstractAir quality index (AQI) is a dimensionless index which describes air condition quantitatively. It can be used to evaluate the quality of atmospheric environment as well as control contamination.In this paper, to investigate the influence of atmospheric pollution indexes on AQI, three cities of China, namely, Beijing, Changsha and Haikou, are chosen for your consideration. Six kinds of at-mospheric pollution index contains PM2.5 of daily date are used as observation. On the one hand, partial correlation analysis is employed for each index of the three cities respectively to deter-mine the main pollutants affecting AQI. It shows the main factors affecting the air quality in Beijing, Changsha and Haikou are PM10, PM2.5, NO2 and O3; PM10, PM2.5, NO2 and CO; PM10, PM2.5 and SO2, respectively. Moreover, the most significant correlation between the six indicators and AQI is PM2.5 for both Beijing and Changsha, but that is PM10 for Haikou. On the other hand, we also use stepwise regression method to access the primary factors affecting the AQI, which is consistent with the conclusion obtained from partial correlation analysis. In addition, we obtain the AQI op-timal linear regression prediction model through partial correlation analysis and stepwise re-gression analysis. Besides, by the model tests, we find the proposed models for the three cities are workable, which can be used to forecast short-term AQI. Finally, some suggestions are provided for improving the air quality according to the results.KeywordsAir Quality Index (AQI), Partial Correlation Analysis, Stepwise Regression Analysis基于偏相关与逐步回归方法的AQI影响因素分析及预测戴孟莲1,王彤1,邓海银1,王访1,2**通讯作者。
基于主成分分析及多元线性回归的空气质量预测算法研究

基于主成分分析及多元线性回归的空气质量预测算法研究近年来,随着城市空气质量的恶化和人们对健康的重视,空气质量的预测变得越来越重要。
本文基于主成分分析和多元线性回归两种方法,进行空气质量预测算法的研究。
在进行主成分分析之前,我们需要收集一定数量的空气质量监测数据。
这些数据包括各种空气污染物的浓度以及其他与空气质量相关的因素,如天气条件、地理位置等。
将收集到的数据进行预处理,处理掉异常值和缺失值,并进行数据归一化。
接下来,使用主成分分析方法对数据进行降维。
首先计算数据集的协方差矩阵,然后对该矩阵进行特征值分解,得到特征值和对应的特征向量。
按照特征值从大到小的顺序选择前几个特征向量作为主成分。
通过将数据集投影到主成分上,就可以得到降维后的数据集。
在进行多元线性回归之前,我们需要将数据集分为训练集和测试集。
训练集用于训练回归模型,测试集用于评估模型的表现。
选择适当的回归模型,并根据训练集的数据,通过最小二乘法估计回归系数。
将训练得到的回归模型应用到测试集上,计算预测值和实际值之间的误差。
通过对比预测值和实际值的误差,可以评估模型的准确性。
如果误差较小,说明模型对空气质量的预测效果较好;如果误差较大,可能需要调整模型或者改进数据预处理的方法。
综上所述,本文基于主成分分析和多元线性回归的方法,对空气质量进行预测的算法进行了研究。
通过降维和回归分析,可以提取出影响空气质量的主要特征,并建立相应的模型进行预测。
该算法对于城市管理部门和居民提供了一种有效的工具,可以及时了解和监测空气质量,采取相应的措施保护健康。
基于多元线性回归的空气质量指数预测模型

基于多元线性回归的空气质量指数预测模型
王凯文;李宏滨
【期刊名称】《信息记录材料》
【年(卷),期】2024(25)2
【摘要】随着中国社会的发展和人口数量的增多,空气污染环境问题表现突出,对人们的生活环境以及生态系统造成严重破坏。
本文基于《中国统计年鉴2022》的相关数据,选取PM_(10)、O_(3)、SO_(2)、PM_(2.5)、N0_(2)、CO六个影响空气质量指数的指标。
首先,通过相关性分析模型验证六个影响指标都对空气质量指数有较强的相关性;其次,通过各污染物浓度计算相应污染物分指数,利用多元线性回归模型建立空气质量指数(air quality index, AQI)与各影响指标之间的数学模型,利用该模型对城市空气质量指数进行预测;最后,将真实值与预测值使用皮尔逊相关性检验对模型评估,准确率达到0.928,能够反映空气质量的总体状况。
【总页数】4页(P1-3)
【作者】王凯文;李宏滨
【作者单位】太原师范学院计算机科学与技术学院
【正文语种】中文
【中图分类】TP3
【相关文献】
1.基于CART 算法的空气质量指数回归预测模型的学习
2.基于多元线性回归和层次分析法的案例推理上证指数预测模型的开发及应用
3.多元线性回归方法在空气
质量指数AQI分析中的应用4.基于主成分分析及多元线性回归的空气质量预测算法研究5.陕西关中空气质量指数(AQI)特征及预测模型研究
因版权原因,仅展示原文概要,查看原文内容请购买。
基于多元线性回归预测水泥强度-工程技术研究0606

基于多元线性回归预测水泥强度本文研究的是预测水泥强度的问题。
测定水泥熟料强度的传统方法是实测水泥预制品在第3天与第28天的强度,本文采用了多元线性回归模型来更简化、快度、准确的预测水泥强度,通过细度、比表面积、SO3质量分数、CaO 质量分数、快速抗压强度、快速抗折强度、1天抗压强度、1天抗折强度,这几个与水泥强度密切相关且容易测得8个参数作为水泥强度的自变量。
通过R2检验和t 检验证明修改模型的准确性,用多元线性回归的方法得到水泥强度的直方图、回归标准化残差标准P-P 图以及部分回归图,并且得到水泥强度与几个参数之间的系数关系,最后确定水泥强度的多元线性回归方程:y=-194.199-21.276a+0.975b+53.938c-1.8d-4.949e+20.072f-3.017g+0.612h 。
引言:水泥的强度是评价水泥质量的重要标准,是划分水泥强度等级的重要依据。
水泥的强度指水泥胶砂硬化试体所能承受外力破坏的能力。
水泥强度是水泥重要的物理力学性能之一。
现实生活中,人们传统的通过对水泥制品熟料第3天与第28天抗压强度、抗折强度和抗拉强度水泥强度的测定来确定水泥强度,目前以这种方法可以准确、快速的测定水泥制品强度,但是这种方法消耗的时间比较长,水泥强度也不是很准确。
由于水泥制品强度的预测是一个多变量、无固定模型的复杂问题,本文通过多元线性回归方法来建立水泥强度与细度、比表面积、SO 3质量分数、CaO 质量分数、快速抗压强度、快速抗折强度、1天抗压强度、1天抗折强度几个参数的回归方程。
1、问题假设1、假设由与水泥强度密切相关的因素主要有细度、比表面积、SO 3质量分数、CaO 质量分数、快速抗压强度、快速抗折强度、1天抗压强度、1天抗折强度,其他因素忽略不计;2、假设所参考的某省水泥厂2007年9-11月实验数据足够准确SO 3。
23、问题求解 3.1、问题分析根据要解决的问题,以及所查到的资料,可以看出需要分析的是水泥强度与细度、比表面积、SO 3质量分数、CaO 质量分数、快速抗压强度、快速抗折强度、1天抗压强度、1天抗折强度这几个参数之间的关系。
(仅供参考)基于多元线性回归对AQI预测

基于多元线性回归模型对AQI研究与分析摘要:目前中国大气污染形势严峻,以可吸入颗粒物、细颗粒物为特征污染物的区域性大气环境问题日益突出,损害人民群众的身体健康,影响社会和谐稳定。
本文根据相关数据,选取了一部分影响因子:PM2.5、PM10、CO、NO2、SO2、温度和降雨量,对我国部分城市的空气质量进行评价,采用了多元线性回归模型方法,预测空气质量指数。
通过回归分析发现,空气质量指数和PM2.5、PM10、CO、NO2和降雨量有关,并得到空气质量指数的预测模型,有利于我们对未来各城市空气质量的走势有所了解。
1研究背景和目的空气是人类生活中不可或缺的一部分,是城市生产活动的基础。
空气污染不仅会影响人的身体健康,还会对动植物的生长有非常不利的影响,损害农业和林业的发展,是城市所面临的最严峻的问题之一。
现代医学研究表明,呼吸新鲜自然的空气能够增强免疫力、促进血液循环、消除疲劳、提高工作效率等;否则就会引起乏力、烦闷、头晕、注意力不集中、精神不振等不良症状,日积月累,将可能会导致多种人体疾病的发生。
因此空气质量的好坏对我们的生活有着重大的影响。
为了研究空气的好坏,提出了空气质量的概念。
空气质量指数(air quality)的好坏反映了空气污染程度,它是依据空气中污染物浓度的高低来判断的。
空气质量问题始终是世界各国备受关注的一个问题。
随着我国工业化、城镇化的深入推进,能源和资源消耗持续增加,大气污染防治压力继续加大。
了解我国空气质量现状,及时采取有效措施进行治理,是改善空气质量的唯一途径。
我国从1973年召开第一次全国环境保护会议开始,通过制定环境保护五年计划,对空气污染物排放进行约束与管理,为城市环境空气质量保护、工业污染防治等提供方向。
为了改善环境空气质量,防止生态破坏,创造清洁适宜的环境,保护人体健康,研究影响空气质量的影响因子刻不容缓。
本文运用多元线性回归模型,对影响空气质量的因子进行分析,最终得到空气质量预测模型。
基于多元回归分析的大气污染控制研究

基于多元回归分析的大气污染控制研究随着人们日益关注大气污染对健康和环境的影响,研究如何有效地控制和减少大气污染已成为科学家们探索的热门话题。
在此背景下,多元回归分析作为一种有效的研究手段,被广泛应用于大气污染控制的研究中。
1. 多元回归分析的基本原理多元回归分析可以被看做是一种对自变量和因变量之间关系的解释和预测的分析方法。
它基于多元线性方程模型,通过对自变量与因变量之间线性关系的建模和分析,探究自变量对因变量的影响规律,并通过拟合和预测模型来实现因变量的控制。
在大气污染控制研究中,多元回归分析可以用来探究大气污染物的排放源、环境因素等多种因素对大气污染物浓度的影响,进而找到有效的控制路径。
2. 多元回归分析在大气污染控制研究中的应用目前,多元回归分析已广泛用于大气污染控制的研究中,其应用主要分为以下两个方面:2.1. 排放源控制多元回归分析可以用来建立污染源与污染物浓度之间的关系模型,进而预测不同排放量情况下的污染物浓度变化,并找到最佳排放控制路径。
例如,通过对火电厂运行排放数据的分析可以找到影响火电厂污染排放的因素,比如发电量、燃煤性质等,进而实现火电厂污染物排放的最优化控制。
2.2. 大气环境改善多元回归分析也可以用来探究大气污染物浓度与环境变量之间的关系,如气象参数、地形高度等,进而提出针对性的环境改善措施。
例如,通过对不同气象条件下的污染物浓度数据的比对,可以发现气象因素对污染物的传输和分布起着关键作用,并据此制定对应的环境改善方案。
3. 多元回归分析存在的问题及展望多元回归分析作为一种有效的分析工具,在大气污染控制研究中已经取得了显著的成果。
但同时也存在一些问题和局限性。
例如,多元回归分析只能考虑线性关系,难以准确探究非线性关系的影响;同时,多元回归分析结果也容易受到样本数据的影响,因此结果可能不够稳定和可靠。
展望未来,我们可以进一步利用多元回归分析以及其他更加先进的数据分析技术,结合更为准确的观测数据和模拟模型,深入探究大气污染的复杂机理,并进一步提高大气污染控制的效率和精准度。
基于多元分析法的空气质量预测研究

基于多元分析法的空气质量预测研究随着城市化进程的不断加速,城市空气污染越来越严重,成为了我们日常生活中极为紧迫的问题之一。
而对于预测空气污染的情况,基于多元分析法的模型逐渐成为了热门工具之一,因为这种预测模型具有比较好的准确度和实用性。
多元分析法,是统计学中的一种分析方法,对于多个自变量和一个或多个因变量之间的关系进行建模和预测。
在空气质量预测中,我们可以使用多元分析法来预测一些可能影响空气质量的因素与空气质量之间的关系,从而为我们提供更加准确的预测和改善建议。
首先,我们需要收集一些可能影响空气质量的因素。
这些因素可以包括气象数据(如温度、湿度、风速、雨量等)、道路交通状况、工业污染排放量、人口密度等等。
其中,气象数据是最为重要的一个因素,因为它们直接影响着空气质量状况。
其他因素则需要根据实际情况来进行选择和权重的判断。
然后,我们需要对这些因素进行数据采集和预处理。
其中,数据采集涉及到对于数据源的选择和数据的收集方式,而预处理则包括数据清洗、数据整合、数据标准化、数据变换等多个步骤。
在数据清洗中,我们需要去除掉缺失值、异常值、重复值等无效数据,以确保数据的可靠性和稳定性。
在数据整合中,则需要将多个数据源中的数据进行合并和整合,以便于我们进行后续的建模和分析。
接下来,我们需要对于数据进行建模和分析。
在这一步中,我们可以使用不同的模型和算法进行分析,如多元线性回归模型、主成分分析、聚类分析、决策树分析等。
这些模型和算法的选择需要根据我们的实际需求和数据情况进行选择,并且针对不同的问题可以采用不同的方法。
最后,我们需要对于结果进行评估和优化。
在评估中,我们可采用预测精度、误差分析、模型稳定性等多个方面来进行评估。
在优化中,我们可以通过改变模型参数、改进数据质量、优化算法等方式来进一步提高预测准确度和实用性。
总之,基于多元分析法的空气质量预测研究是一项非常重要的工作,通过对于各种因素之间的关系进行建模和分析,从而可以对于空气质量的变化进行预测和调控。
应用多元回归分析模型预测城市空气质量

应用多元回归分析模型预测城市空气质量城市空气质量是影响城市居民身体健康和生命安全的重要因素之一。
随着城市化进程的加快和人口增长速度的加快,城市空气污染问题越来越受到人们的关注。
由于城市大气环境受多种因素影响,因此,采用多元回归分析模型来预测城市空气质量是一种有效的方法。
一、多元回归分析模型简介多元回归分析是一种统计学方法,可以通过建立多元线性回归模型来分析多个自变量(影响因素)对一个因变量(被解释变量)的影响。
在环境科学和大气环境领域,多元回归分析方法常用于预测城市空气质量、环境污染等问题。
多元回归分析模型的基本形式为:Y = β0 + β1X1 + β2X2 + …… + βnXn + ε其中,Y为因变量,表示要解释的变量或预测变量,Xi为自变量,表示影响因素,βi表示第i个自变量的回归系数,ε为误差项。
回归系数表示自变量与因变量之间的关系强度和方向。
二、多元回归分析在城市空气质量预测中的应用城市空气质量受多种因素影响,包括气象条件、交通情况、工业污染、建筑物高度、绿地覆盖率等。
多元回归分析可以通过同时考虑多个因素对城市空气质量的影响,建立预测模型,帮助人们更好地了解和预测城市空气质量。
在多元回归分析中,需要先确定自变量和因变量。
对于城市空气质量预测,因变量可选取空气质量指数(AQI)等常用指标。
自变量则需要根据实际情况进行选择,并进行数据分析和处理。
例如,在北京市的空气质量预测中,研究人员选择了气象条件、交通情况、工业污染等多个因素作为自变量,并对收集到的相关数据进行归一化处理。
通过应用多元回归分析模型,建立了城市空气质量预测模型,成功预测了北京市空气质量的变化趋势和高峰期。
三、多元回归分析模型的优势应用多元回归分析模型预测城市空气质量的优势在于,可以综合考虑多个影响因素,减少个别因素对预测结果的影响。
相比于单个影响因素的分析方法,多元回归分析可以更准确地预测城市空气质量的变化趋势。
此外,多元回归分析模型还具有灵活性和可靠性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于多元线性回归模型对AQI研究与分析摘要:目前中国大气污染形势严峻,以可吸入颗粒物、细颗粒物为特征污染物的区域性大气环境问题日益突出,损害人民群众的身体健康,影响社会和谐稳定。
本文根据相关数据,选取了一部分影响因子:PM2.5、PM10、CO、NO2、SO2、温度和降雨量,对我国部分城市的空气质量进行评价,采用了多元线性回归模型方法,预测空气质量指数。
通过回归分析发现,空气质量指数和PM2.5、PM10、CO、NO2和降雨量有关,并得到空气质量指数的预测模型,有利于我们对未来各城市空气质量的走势有所了解。
1研究背景和目的空气是人类生活中不可或缺的一部分,是城市生产活动的基础。
空气污染不仅会影响人的身体健康,还会对动植物的生长有非常不利的影响,损害农业和林业的发展,是城市所面临的最严峻的问题之一。
现代医学研究表明,呼吸新鲜自然的空气能够增强免疫力、促进血液循环、消除疲劳、提高工作效率等;否则就会引起乏力、烦闷、头晕、注意力不集中、精神不振等不良症状,日积月累,将可能会导致多种人体疾病的发生。
因此空气质量的好坏对我们的生活有着重大的影响。
为了研究空气的好坏,提出了空气质量的概念。
空气质量指数(air quality)的好坏反映了空气污染程度,它是依据空气中污染物浓度的高低来判断的。
空气质量问题始终是世界各国备受关注的一个问题。
随着我国工业化、城镇化的深入推进,能源和资源消耗持续增加,大气污染防治压力继续加大。
了解我国空气质量现状,及时采取有效措施进行治理,是改善空气质量的唯一途径。
我国从1973年召开第一次全国环境保护会议开始,通过制定环境保护五年计划,对空气污染物排放进行约束与管理,为城市环境空气质量保护、工业污染防治等提供方向。
为了改善环境空气质量,防止生态破坏,创造清洁适宜的环境,保护人体健康,研究影响空气质量的影响因子刻不容缓。
本文运用多元线性回归模型,对影响空气质量的因子进行分析,最终得到空气质量预测模型。
2研究方法与原理回归分析研巧的主要对象是客观事物变量间的统计关系,它是建立在对客观事物进行大量实验和观察的基础上,用来寻找隐藏在那些看上去是不确定的现象中的统计规律性的统计方法。
考察某一个变量(因变量)与其余多个变量(自变量)的相互依赖关系,便是多元回归问题。
因此本文采用多元线性回归模型对空气质量指数进行预测。
空气质量指数AQI与巧染物浓度值间的多元线性回归模型建立为Y=a0+a1X1+a2X2+a3X3+a4X4+a5X5+a6X6+a7X7其中,a0表示回归常数,a i为个回归系数X1表示PM2.5含量,X2表示PM10含量,X3表示一氧化碳含量,X4表示二氧化氮含量,X5表示二氧化硫的含量,X6温度,X7表示降雨量。
3研究区域与数据来源主要选择2016年我国14个城市的PM2.5、PM10、CO、NO2、SO2、温度、降雨量等影响因子作为自变量对因变量AQI(空气质量指数)的影响分析。
并且构建了多元线性回归方程模型,最终得出利用PM2.5、PM10、CO、NO2、降雨量反映AQI的多元线性方程。
计算理论预测的AQI,利用获得的监测站的实际AQI,两者之间进行比较,来验证模型的准确性。
表1AQI及其影响因子因子城市PM2.5PM10CO NO2SO2温度降雨量AQI 荆门370.551671309萍乡7100.9678220.311吕梁6111.3183912013衢州10130.6672411230.714襄阳9121.05265100.514重庆32521.0543813230.551沈阳34510.7332211051拉萨29900.9543817070巴彦淖尔701091.2382713094银川65961.78391816088泉州631950.8253827295.3123库尔勒2231.5615911053和田4451.552210634130145喀什5191.43344721201524 过程与分析4.1 过程1从表2中可一看出,相关系数R为0.999,说明自变量与因变量之间有比较好的相关性,决定系数R方为0.998(R方反映总体的回归效果,越接近1越好),即在因变量的变异中,有99.8%可由自变量的变化来解释。
表3 回归系数及显著性检验表从表中可以看出:常数项的t的显著性概率为0.512>0.05,表示常数项与0没有显著性差异,表名常数项不应该出现在方程中。
而温度、NO2和SO2的t 的显著性概率为均大于0.05,表示几个参数与0没有显著性差异,则不应该出现在方程中。
PM2.5的t显著性概率为0.000<0.05,表示PM2.5的系数与0有显著性差异,PM2.5应当作为解释变量出现在方程中。
同理可知,CO、PM10和降雨量的t显著性概率均小于0.05,表面这几个参数的系数与0均有显著性差异,所以应当作为解释变量出现在方程中。
由此可见,PM2.5、PM10、CO和降雨量可以作为解释变量存在于方程中,而由于SO2的Sig值太大,所以首先将其从“解释变量”中剔除。
4.2 过程2表4 回归系数及显著性检验表模型非标准化系数标准系数t Sig.共线性统计量B标准误差试用版容差VIF(常量) PM2.5 PM10CO NO2温度降雨量2.2192.778.799.451.312.0071.04042.937.000.2474.054 .614.017.69837.094.000.4082.449 -.350.063-.133-5.594.001.2563.901 .093.033.0472.834.025.5341.871 .121.157.014.774.464.4352.298 -4.756.779-.131-6.105.000.3123.204模型非标准化系数标准系数t Sig.共线性统计量B标准误差试用版容差VIF(常量) PM2.5 PM10 CO NO2 SO2温度降雨量2.3163.327.696.512.312.0081.04039.566.000.2444.094 .614.018.69834.295.000.4072.458 -.350.068-.133-5.178.002.2563.910 .095.040.0472.357.056.4202.382 -.005.074-.001-.068.948.5951.681 .118.178.014.663.532.3962.526 -4.742.867-.131-5.469.002.2943.405从表中可以看出:常数项的t 的显著性概率为0.451>0.05,表示常数项与0没有显著性差异,表名常数项不应该出现在方程中。
而温度的t 的显著性概率为大于0.05,表示温度与0没有显著性差异,不应该出现在方程中。
PM2.5的t 显著性概率为0.000<0.05,表示PM2.5的系数与0有显著性差异,PM2.5应当作为解释变量出现在方程中。
同理可知,CO 、PM10、NO 2和降雨量的t 显著性概率均小于0.05,表面这几个参数的系数与0均有显著性差异,所以应当作为解释变量出现在方程中。
由此可见,PM2.5、PM10、CO 、NO 2和降雨量可以作为解释变量存在于方程中,而由于温度的显著性检验没有通过,故将其从“解释变量”中剔除。
4.3 过程3表5 回归系数及显著性检验表从表中可以看出PM2.5的t 显著性概率为0.000<0.05,表示PM2.5的系数与0有显著性差异,PM2.5应当作为解释变量出现在方程中。
同理可知,常数项、CO 、PM10、NO 2和降雨量的t 显著性概率均小于0.05,表面这几个参数的系数与0均有显著性差异,所以应当作为解释变量出现在方程中。
由此可见,常数项、PM2.5、PM10、CO 、NO 2和降雨量可以作为解释变量存在最终的到的模型包含这五个因子。
模型 非标准化系数标准系数 t Sig . 共线性统计量 B 标准误差 试用版容差 VIF (常量) PM2.5 PM10 CO NO2 降雨量 4.143 1.207 3.432 .009 .312 .007 1.040 44.049 .000 .247 4.052 .614 .016 .698 38.073 .000 .410 2.442 -.359 .060 -.136 -5.997 .000 .266 3.763 .093 .032 .046 2.884 .020 .535 1.869 -4.400.612-.122-7.186.000.4802.084表6 Anova d模型平方和df均方F Sig.1 回归33153.83174736.262845.828.000a残差33.59765.600总计33187.429132回归33153.80665525.6341150.387.000b 残差33.62374.803总计33187.429133回归33150.93056630.1861453.244.000c 残差36.49984.562总计33187.42913该表是使用方差分析Analysis of Variance对整个回归方程作显著性检验,可以看出表中每一步的Sig都小于0.05,即P值小于0.05,说明差异有显著性意义,即此方程有必要成立。
综上所述,本文最终得出空气质量指数的预测方程为:Y=4.143+0.312X1+0.614X2-0.359X3+0.093X4-4.4X7Durbin-Watson统计量是用来检验残差分布是否为正态分布的,进行回归估计是假设模型残差服从正态分布的,如果残差不服从正态分布,那么模型将是有偏的,也就是说模型的解释能力是不强的. Durbin-Watson统计量在2左右说明残差是服从正态分布的,若偏离2太远,那么你所构建的模型的解释能力就要受影响了。
上表分析:根据Durbin-Watson = 1.741 较为接近2,选择的数据较为合理,AQI 基本呈现正态分布。
PM2.5,PM10,CO,NO2,降雨量与AQI基本呈现线性关系,说明多元线性回归模型拟合效果满足基本要求。
图能够用来判断数据的是否异常,若数据都在(-2,2)的区间内,表明数据具有正态性;若数据点超出(-2,2)的区间,表明该数据为异常点,不能加入到回归直线拟合当中,也无正态性。
上表中散点都在(-2,2)之间,散点较为分散,所选数据效果较好。
5 结果与总结表7 模型检验文中通过对AQI的研究,R2检验通过说明影响因子PM2.5、PM10、CO、NO2、降雨量能较好的解释AQI变化,D-W检验通过说明回归分析模型基本符合正态分布,模型解释效果不错,T检验通过说明自变量之间差异性显著。