基于集合经验模态分解和BP神经网络的北京市PM2.5预报研究

合集下载

基于LSTM的PM2.5浓度预测模型

基于LSTM的PM2.5浓度预测模型

基于LSTM的PM2.5浓度预测模型段大高;赵振东;梁少虎;杨伟杰;韩忠明【摘要】随着近年雾霾天气的频繁出现,空气质量开始越来越受到公众关注;PM2.5浓度指数是判断空气质量的重要指标,如何根据历史数据有效地预测空气中PM2.5浓度,具有很高的应用价值;分析以往空气质量数据表明,PM2.5浓度有明显的非线性和不确定性波动,很难用传统机器学习算法有效地预测;文章基于LSTM循环神经网络,依据过去20小时采集的空气数据,预测未来5小时的PM2.5浓度指数;实验结果表明,LSTM可以有效地捕获空气质量的时序特征,较准确预测出未来时刻的PM2.5浓度指数.【期刊名称】《计算机测量与控制》【年(卷),期】2019(027)003【总页数】5页(P215-219)【关键词】PM2.5;LSTM循环神经网络;时序特征【作者】段大高;赵振东;梁少虎;杨伟杰;韩忠明【作者单位】北京工商大学计算机与信息工程学院,北京 100048;北京工商大学计算机与信息工程学院,北京 100048;北京工商大学计算机与信息工程学院,北京100048;北京工商大学计算机与信息工程学院,北京 100048;北京工商大学计算机与信息工程学院,北京 100048【正文语种】中文【中图分类】TP3990 引言随着近几年雾霾天气在全国范围内的频繁出现,细微颗粒物(Fine Particulate Matter, PM2.5)受到了公众的广泛关注。

PM2.5通常指环境空气中空气动力学当量直径小于等于 2.5 微米的颗粒物。

PM2.5能较长时间悬浮于空气中,其在空气中含量浓度越高,代表空气污染越严重。

与较粗的环境空气颗粒物相比,PM2.5粒径小,活性强,极易附带有毒、有害物质(例如,重金属、微生物等),且在大气中的停留时间长、输送距离远,因而对人体健康和大气环境质量的影响更大。

如何有效的对空气PM2.5浓度进行准确的预测和预报,对于保护公众身体健康,环境治理具有重要的意义。

应用时间序列分析对北京PM2.5浓度预测

应用时间序列分析对北京PM2.5浓度预测

应用时间序列分析对北京PM2.5浓度预测
许晟昊
【期刊名称】《化工中间体》
【年(卷),期】2017(000)010
【摘要】雾霾是特定气候与人类作用相互作用的结果.随着城市不断发展,城市人口的高度集中,人类通过汽车尾气、工业排放等途径产生的细小颗粒物数量大且集中.鉴于我国华北地区雾霾天气的严峻形势,通过探究雾霾天气的变化规律寻找其出现原因来帮助我们认识雾霾天气的污染来源.PM2.5是空气污染物之一,它能较长时间悬浮于空气中.虽然PM2.5只是地球大气成分中含量很少的组分,但它对空气质量和能见度等有重要的影响.在本文中,采用时间序列分析的方法,查找到中国北京的污染状况的统计结论.然后根据北京市数据,建立逐天、逐小时模型对北京市空气中
PM2.5浓度进行预测分析.
【总页数】3页(P62-64)
【作者】许晟昊
【作者单位】佛山市顺德区第一中学广东 528000
【正文语种】中文
【中图分类】X
【相关文献】
1.应用时间序列分析进行网络负载预测 [J], 沈富可;张卫;常潘
2.基于时间序列分析的北京地区PM2.5浓度研究 [J], 李为东;李莉;徐岩
3.应用时间序列分析法预测南昌县二化螟发生程度 [J], 金伟;陈伟;魏洪义
4.应用时间序列分析对北京PM2.5浓度预测 [J], 许晟昊;
5.基于BP神经网络的北京市PM2.5浓度预测 [J], 薛同来; 赵冬晖; 韩菲
因版权原因,仅展示原文概要,查看原文内容请购买。

基于样本熵和优化极限学习机的PM_(2.5)浓度预测

基于样本熵和优化极限学习机的PM_(2.5)浓度预测

统计与决策2021年第3期·总第567期管理决策0引言近年来,随着经济社会的发展以及工业化和城镇化进程的加快,空气污染问题日益突显,PM 2.5作为大气污染中的主要污染物之一,对空气质量以及人们的生活造成了很大的影响。

对PM 2.5浓度做出精准的预测,有效地减少和控制大气污染,降低公众健康风险,可以为相关政策制定者提供有意义的参考。

目前PM 2.5等空气污染物浓度的预测,主要可分为三类:确定性模型、经典的统计学模型和机器学习模型。

确定性方法主要包括天气研究预报模式(Weather Researchand Forecasting,WRF )[1]、多尺度空气质量模型(CommunityMultiscale Air Quality Modeling System,CMAQ)[2]、WRF-CMAQ 气象化学耦合模型[3]等,利用相关的气象数据和污染源数据,模拟污染物复杂的排放、累积、扩散和转移过程,从而对污染物的浓度进行预测和分析。

该方法复杂且和其他模型相比,在预测精度上并没有明显的优势[4]。

统计学模型中自回归移动平均(Autoregressive Moving Inte-grated Average,ARIMA)模型[5]、多元线性回归(MultipleLinear Regression,MLR )[6]模型等经常被用于PM 2.5浓度的预测。

然而,PM 2.5浓度受到多种可变因素的影响,具有较强的非线性和复杂性,这类模型在处理非线性时间序列数据上,通常不能达到令人满意的效果[7]。

随着数据挖掘技术的兴起,机器学习方法以其优越的预测性能受到了大量的关注,被广泛应用于空气污染物的浓度预测中,主要包括人工神经网络(Artificial Neural Network,ANN)[8—10]、支持向量机[11,12]等。

Park 等(2018)[9]建立了人工神经网络模型,通过室外PM 10浓度、地铁列车的运行数量和通风率的信息,对6个地铁站内的PM 10浓度进行了预测,精度达到了67%~80%。

基于LSTM循环神经网络的PM2.5预测

基于LSTM循环神经网络的PM2.5预测

Abstract PM2.5 factorhasagreatinfluenceonairquality.PM2.5 concentrationchangeistheresultofmanyfactors, andtheprocessissudden,nonlinear,andhasobviousuncertainty,soitisdifficulttousetraditionalmethodstopredict. Tosolve thisproblem, a PM2.5 prediction modelbased on LSTM recurrentneuralnetwork wasproposed with meteorologicalandatmosphericpollutantfactorsasPM2.5 predictionindicators.Weusedthegreycorrelationanalysis methodtoanalyzethecorrelationintensityofseveralmeteorologicalandatmosphericpollutionindicators.Thedatawas smoothedandthetimeseriesproblem wastreatedasasupervisoryproblem.WebuiltamultivariableLSTM recurrent neuralnetworkPM2.5 predictionmodeltoachieveaccuratepredictionofPM2.5 concentration.Weusedthemeteorological dataandairpollutantdataofBeijingfrom2010to2017tosimulatetheexperiment.Theresultsshowthatthemodelcan betterpredictthedailyvariationtrendofPM2.5.

集合时间因素及外界因素的PM2.5预测研究

集合时间因素及外界因素的PM2.5预测研究

集合时间因素及外界因素的PM2.5猜测探究PM2.5是指大气中直径小于或等于2.5微米的颗粒物,具有高度的危害性,严峻影响人们的健康与生活质量。

本文旨在探究集合时间和外界因素对PM2.5猜测的影响,通过对北京地区从2016年1月至2018年12月每小时的监测数据进行分析,建立回归猜测模型,得出猜测结果,并对模型的准确性进行评判。

探究结果表明,集合时间和外界因素对PM2.5猜测均有较大的影响,建议在猜测中充分思量这两个因素,以提高猜测准确性。

关键词:PM2.5猜测;集合时间;外界因素;回归模型;猜测准确性。

一、引言大气颗粒物污染已成为全球环境问题的重要组成部分,其中PM2.5是人们最为关注的颗粒物之一。

PM2.5颗粒物直径小于或等于2.5μm,能够进入人体呼吸道和肺泡,对人类健康危害极大。

同时,PM2.5还会影响交通运输、农业生产和城市建设等方面,严峻影响生态环境和社会经济进步。

为了有效缩减PM2.5的浓度并保卫人类健康,探究PM2.5猜测模型已成为城市空气污染治理的重要内容。

二、数据来源与处理本文选取了北京市2016年1月至2018年12月PM2.5监测数据作为探究对象,共计26280个样本点。

起首对数据进行处理,剔除掉空值和异常值。

然后,将数据按照每小时为单位进行集合,形成24小时的曲线。

最后,将外部因素分为天气因素和经济因素,分别将它们和PM2.5数据对应起来。

三、模型建立本文接受线性回归模型建立PM2.5猜测模型,其中自变量为时间因素和外界因素,因变量为PM2.5的浓度值。

模型建立基于R语言实现,详尽步骤如下:1.数据预处理:对数据进行清洗、处理;2.特征工程:用Spearman相关性分析法选取相关性比较高的特征作为模型的输入特征,并进行特征工程;3.回归模型建立:用建好的特征,通过线性回归模型建立PM2.5猜测模型;4.模型训练:使用训练数据集对模型进行训练,得到最佳模型;5.模型评判:使用测试数据集对模型进行评判,计算模型的准确性。

PM2.5概况及研究方法

PM2.5概况及研究方法

PM2.51、雾霾(含PM2.5)国内外研究现状、水平2、研究方法:采样、分析测试(化学、电镜等)评价方法3、形成机理研究现状、研究方法4、光化学反应研究、实验方法PM2.5的化学物种采样与分析方法定义:PM2.5是指空气动力学直径小于或等于2.5μm 的大气颗粒物。

滤膜采样器的主要部件,包括粒径切割器、常用滤膜、滤膜支撑垫以及采样流量的测量与控制装置等。

气溶胶的物理化学性质(如总粒数浓度、云凝结核浓度、光学系数、密度和平衡态含水量等) 、特定粒径颗粒物的化学成分。

成分:PM2.5主要包括含碳组分、水溶性离子物种以及无机多元素,其中既有性质稳定的组分,也有半挥发性成分,包括硝酸铵、半挥发性有机物(SVOCs)和水蒸气(H2O)PM2.5中的许多无机物质(如水溶性组分2-4SO 、-3NO 、+4NH 和其它无机离子)以及部分有机物在大气中具有吸湿性。

虽然有一些研究尝试采用不同的技术与方法(如微波共振、热力学模拟等)对气溶胶中的含水量进行测量或计算,但目前尚无可靠的技术对大气颗粒物中的含水量进行直接(化学)测量,因此在采样中通常未对H2O 的含量变化加以考虑。

PM2.5中半挥发性无机组分(主要是硝酸铵) 在采样过程中的吸附与挥发问题得到成功解决,而在SVOCs 的采样误差问题上迄今尚未形成统一的认识,有关的采样技术仍在发展之中。

温度、压力和相对湿度等均对NH4NO3的热力学平衡有影响,其中温度的影响最大:当温度低于15℃时,NH4NO3主要以颗粒物的形式存在;当气温高于30℃时,NH4NO3主要以气态HNO3 和NH3的形式存在。

因此,采样过程中温度与压力的变化均可改变NH4NO3的分配平衡。

硝酸铵采样: 在采样器的切割器之后设置扩散溶蚀器(Diffusion denuder)吸收气流中的气态硝酸与NOx 以消除其与Teflon 滤膜上所捕集的颗粒物反应,同时在Teflon 滤膜之后设置一张尼龙滤膜以吸收从Teflon 膜的颗粒物中挥发的硝酸盐离子.有机碳( OC)的采样: 研究认为石英膜与所捕集的颗粒物对有机气体的吸附是主要的,如果不对收集在石英滤膜上的气相成分加以修正,则所测得的碳质颗粒物的含量存在正偏差. 通常在第一个石英膜后再串联一个后置石英膜或在另一个平行的端口设置一个Teflon 膜和一个后置石英膜来进行修正。

北京PM2.5数据分析处理

北京PM2.5数据分析处理

北京PM2.5数据分析处理张奕辰【摘要】PM2.5是地球大气成分中含量很少的组分,但它对空气质量和能见度等有重要的影响.与较粗的大气颗粒物相比,PM2.5粒径小,面积大,活性强,易附带有毒、有害物质(例如,重金属、微生物等),且在大气中的停留时间长、输送距离远,因而对人体健康和大气环境质量的影响更大.因此,通过对PM2.5浓度的分析处理,能够作为判定空气污染程度的一个重要指标,从而能够为雾霾的防治起到参考作用.【期刊名称】《化工中间体》【年(卷),期】2017(000)010【总页数】4页(P77-80)【关键词】PM2.5;建模分析;数据处理【作者】张奕辰【作者单位】陕西省西安中学陕西 710000【正文语种】中文【中图分类】X1.概述(1)背景雾霾天气是一种大气污染状态,雾霾是对大气中各种悬浮颗粒物含量超标的笼统表述,尤其是PM2.5被认为是造成雾霾天气的“元凶”。

随着空气质量的恶化,阴霾天气现象出现增多,危害加重。

中国不少地区把阴霾天气现象并入雾一起作为灾害性天气预警预报。

统称为“雾霾天气”。

本文将以北京为例,对PM2.5浓度进行时间序列分析,以期对PM2.5的数据进行预测。

(以上概念来自百度百科“雾霾”及百度百科“细颗粒物”)(2)可行性分析①研究PM2.5浓度问题的必要性:空气污染问题的现实意义。

随着现代工业化进程的推进和人民生活水平的提高,人们对环境质量的要求和工业化加速的环境代价之间的矛盾日益突出,其中又尤以空气污染问题最为迫切。

这严重限制了我国经济社会可持续发展,因此,可以通过对PM2.5数据的研究,抛砖引玉,一方面提起对空气污染问题的重视,另一方面为解决这一问题提供具体数据,推动环境友好型资源节约型社会的发展。

②研究PM2.5浓度问题的可行性:近年来关于PM2.5浓度的数据集日趋完善,给研究这一问题提供了极大的方便;有了具体的数据,可以应用时间序列相关的知识进行研究,把实际问题转化成数学模型,找到数据中隐含的信息;充分挖掘信息,并进行深入分析,可以得出适应性较好的模型和一系列结论。

基于BP神经网络的PM2.5预测

基于BP神经网络的PM2.5预测

基于BP神经网络的PM2.5预测作者:陈志文刘立来源:《电子技术与软件工程》2019年第05期摘要;;; 自进入工业化社会以来,空气污染逐渐成为全球最大的环境问题之一。

空气中的悬浮粒子对人类身体健康产生有害影响,减少空气污染的重要前提就是预测PM2.5的浓度。

因此,对大气质量污染的监测以及预测研究显得尤为重要。

本文采用openstack 云计算组件,部署了大数据平台,通过历史数据加实时抓取的数据来完善BP 神经网络,以实现自我学习来提高预测数据的准确度。

【关键词】PM2.5 云计算 BP 神经网络 预测1 引言空气污染是全球最大的环境问题之一。

空气污染涉及若干因素,包括工厂产生的大量有毒气体、车辆的尾气、农作物的焚烧以及火灾等,其中主要成分包括CO 、SO2、O3、NO2。

空气污染是对人类健康的严重威胁,会导致严重的呼吸道疾病和皮肤病,如肺部、呼吸系统病变、哮喘等,甚至引起死亡,所以对空气质量污染的监测以及预测研究显得特别重要。

国内许多学者在空气质量预测等方面做了大量的研究工作。

王灿星等人构建了BP神经网络对空气中颗粒物进行研究,能得到较高的预测精度;秦霞提出了一种用贝叶斯归一化训练算法训练改进的BP预报模型;李龙提出了一种基于与PM2.5浓度相关性较强的因素组成特征向量的最小二乘支持向量机预测模型,该模型有较准确地预测精度,泛化能力也较强;HuangM构建了一种新的基于数据挖掘和人工神经网络的空气污染预测模型,该模型在天气严重污染时预测准确率高,中度污染及以下准确率接近;唐晓城提出一种基于BP神经网络改进算法的大气污染预测模型,较大的提高了预测准确率;TianJ采用模糊C-均值聚类算法(FCM)对空气质量监测的原始数据进行分类,通过对数据的仿真训练,建立了预测空气质量水平的BP神经网络模型。

由于PM2.5的形成因素比较多而复杂,因此全面对它进行准确实时的预测比较困难,当前存在的主要问题包括:(1)模型比较复杂,计算量较大;(2)实时数据难以获取,随时间与地点发生极大的变化。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
近年来, 机器学习方法逐渐展现出对大数据的 非线性处理能力和广泛的应用前景。Wei 等[13]利用 机器学习算法估算台风引起的海表温度降温, 为台 风预报模式设计了台风引起海表降温的参数化方 案 。 Jiang 等 [14] 利 用 卷 积 神 经 网 络 (convolutional neural network, CNN)算法, 研究台风和海洋表面反 馈机制, 改进了台风数值预报模型, 2015—2016 年 间 17 个台风强度的预报准确率比模型改进前提高 约 20%。Li 等[15]利用人工神经网络模型重建印尼 贯穿流 ITF 的多年代际长时间序列。作为一种有效 的统计预报方法, 人工神经网络在空气污染预报研 究中也有广泛的应用。Dutot 等[16]使用改进的多层 感知机模型(multilayer perceptron, MLP), 提高了传 统 MLP 模型对 O3 的预报准确率, 且优于确定性方 法 CHIMERE 模型的结果。Zhou 等[17]利用集合经验 模 态 分 解 (EEMD) 与 广 义 回 归 神 经 网 络 (generalized regression neural network, GRNN)模型相结合的方 法, 对西安市的 PM2.5 浓度值进行预测, 并分别与 多元线性回归模型、主成分回归模型、差分整合移 动平均自回归模型以及单独使用 GRNN 模型进行 对比, 发现混合模型的效果均优于其他模型。Feng 等 [10] 综 合 利 用 气 团 轨 迹 追 踪 模 型 、 小 波 转 换 以 及 神经网络算法建立一套混合模型来预报北京市的 PM2.5 浓度值, 得到较好的结果。
Guangzhou 510275; 4. 96813 Troops of PLA, Huangshan 245000; † Corresponding author, E-mail: junwei@
Abstract A hybrid model with ensemble empirical mode decomposition (EEMD) and BP (Back-Propagation) neural network for next-day forecasting of PM2.5 concentration in Beijing is developed. The results show that the forecast accuracy of the hybrid model is higher than single BP model. The main error comes from the highest frequency component. The input variables of the hybrid model need to contain information about the output variables. The level of pollutant concentration in the early stage has great influence on the prediction result of the models. Key words ensemble empirical mode decomposition (EEMD); BP neural network; PM2.5 forecast
PM2.5 Forecast of Beijing Based on Ensemble Empirical Mode Decomposition and BP Neural Network
REN Xiaochen1,4, ZOU Silin1, TANG Xian2, WEI Jun3,†
1. Department of Atmospheric and Oceanic Sciences, School of Physics, Peking University, Beijing 100871; 2. Public Meteorological Service Centre, China Meteorological Administration, Beijing 100081; 3. School of Atmospheric Sciences, Sun Yat-sen University,
基于集合经验模态分解和 BP 神经 网络的北京市 PM2.5 预报研究
任晓晨1,4 邹思琳1 唐娴2 韦骏3,†
1. 北京大学物理学院大气与海洋科学系, 北京 100871; 2. 中国气象局公共气象服务中心, 北京 100081; 3. 中山大学 大气科学学院, 广州 510275; 4. 中国人民解放军 96813 部队, 黄山 245000; † 通信作者, E-mail: junwei@
国家自然科学基金(41476008, 41576018)和广西壮族自治区特聘专家专项经费(2018B08)资助 收稿日期: 2018‒08‒08; பைடு நூலகம்回日期: 2018‒09‒25
615
北京大学学报(自然科学版) 第 55 卷 第 4 期 2019 年 7 月
统计方法需要利用大量历史观测数据, 通过回归分 析和机器学习等方法找出不同变量之间的函数关 系, 再应用到未来的预报中[10]。
摘要 利用集合经验模态分解算法(EEMD)和 BP 神经网络组成的混合模型, 对北京城区 PM2.5 浓度值进行短 期预报。结果表明, 与单独使用 BP 神经网络模型相比, EEMD-BP 混合模型的预报准确率更高; 混合模型高 频部分的预报误差是整体误差的主要方面; 混合模型的输入变量中需包含输出变量的信息; 前期污染物浓度 的数值对模型的预报结果有较大的影响。 关键词 集合经验模态分解算法(EEMD); BP 神经网络; PM2.5 预报
化造成影响[7‒9]。因此, 研究 PM2.5 的特征并对其浓 度值进行预报十分必要。
目前, PM2.5 浓度值的预报方法主要有确定性方 法 (deterministic approaches) 和 统 计 方 法 (statistical approaches)[10]。Zhang 等[11‒12]对实时空气质量预报 的研究历史和现状、面临的挑战和发展方向做了总 结, 指出确定性方法在提高气象场预报准确率和模 型输入条件准确率、模型中化学物理过程的描述、 精度提高和计算有效性提升等方面仍面临着挑战。
北京大学学报(自然科学版) 第 55 卷 第 4 期 2019 年 7 月 Acta Scientiarum Naturalium Universitatis Pekinensis, Vol. 55, No. 4 (July 2019)
doi: 10.13209/j.0479-8023.2019.041
近年来, 北京的高速发展引发不少环境问题, 其中的空气污染问题, 特别是大气中可吸入颗粒物 危害人体健康的问题越来越受重视。李令军等[1]发 现, 近期北京重污染天气的首要污染物为 PM2.5。 PM2.5 指大气中直径小于或等于 2.5 μm 的颗粒状悬 浮物。研究发现, 环境中 PM2.5 浓度的提高增加了 人 类 因 心 血 管 疾 病 引 发 的 死 亡 风 险 [2‒4] 。 此 外 , PM2.5 可以对大气的辐射过程产生影响[5‒6], 进而对 大气的能见度、降水等一系列天气现象以及气候变
相关文档
最新文档