近42年北京气温数据的处理和分析

近42年北京气温数据的处理和分析
近42年北京气温数据的处理和分析

? 60

?

ELECTRONICS WORLD ?探索与观察

近42年北京气温数据的

处理和分析

安徽理工大学计算机科学与工程学院 王三好

本文利用全球站点无线电高空探测资料数据集(the Integrated Global Radiosonde Archive ,简称IGAR)获取了北京市近42年来0-10km 的温度数据资料。并通过对所获取的数据进行预处理,在保证数据的完整性和准确性的前提下,对北京市的年平均温度数据采用线性拟合和Mann-Kendall 突变检验等方法,进行温度分析,发现北京市的年平均温度整体呈现上升趋势,且在2002年气温发生突增现象。

近年来,随着信息社会的发展,高空大气数据的获取手段越来越多,数据量也越来越大;而且高空大气数据参数多样,且数据当中易参杂一些错误或者未收集的信息,因此大数据的数据处理方法在气象数据的分析中得到了广泛的应用(王星.大数据分析:方法与应用[M].清华大学出版社,2013;曾忠禄.大数据分析:方向、方法与工具[J].情报理论与实践,2017,40(1):1-5;樊重俊,刘臣,霍良安.大数据分析与应用[M].立信会计出版社,2016.);而进行数据分析的前提首先要保证使用数据的准确性和完整性,常见的数据处理方法有数据清理、数据集成、数据变换和数据归约等(王尧.基于大数据的数据处理方法研究分析[J].数字技术与应用,2014(6):98-98.)。本文在以IGAR (陈哲,高杰,杨旭.IGRA 全球站点探空数据集及其资料质量状况分析[J].气象与环境学报,2013(5):106-111.)数据集为基础,并使用大数据预处理方式,获取了北京近42年来0-10km 区域内高空的气温数据,然后又对北京市的年平均气温进行了细致分析,希望可以帮助人们了解北京市的气温变化。

1 资料和方法

1.1 研究资料

本文利用IGAR 高空探测资料获取了北京从1956-2016年的气温数据,同时根据IGAR 数据集的特点,将北京数据集当中的1956-1974年间的不完整和错误的数据进行了删除,并对1956-2016年的数据进行再分析,最后获取北京1975-2016年0时和12时的气温数据进行分析,并使用Excel 、OrgrinPro 2017对数据进行线性分析,同时使用matlab 对数据进行降噪处理,使用Mann-Kendall 突变分析法对北京气温进行分析研究。1.2 研究方法

本文使用线性趋向分析和Mann-Kendall 突变检验分析(简称M-K 法)、等方法对北京市的温度数据进行分析。其中M-K 法是一种非参数统计检验方式,对变量是否具备正态分布并没有具体要求,多用于

气候要素变化趋势的显著性检验及突变检测,其公式如下:

式中采用:Z c —秩相关系数;τ—检验统计变量;P —数据序列所有对偶观测值(R j , R i , j > i )中R j > R i 出现的次数;n —序列长度;

—方差。在M-K 检验中,若统计量

,则认为序列没有显示趋势;

时,表明序列有显著下降趋势;当

时,表明序列有显著上升趋势。α表示显著性水平,当α=0.05时,

=1.96。

M-K 突变检验中,在正序列曲线超过临界值置信线的前提下,若正序列和反序列2个统计量序列仅有一个明显的交叉点,且位于置信线之间,则表明该交叉点为突变点,且在统计上显著;若交叉点位于置信线区域之外,或者是存在多个明显的交叉点,则不确定是否为突变点。

2 结果与分析

2.1 年平均温度的变化趋势

图1所示是1975-2016年北京市年均温度的变化,从图中可以看出,近42年来北京市年平均温度-9.06℃;由线性趋势分析可知,北京市从1975年以来的温度呈现逐渐增加的趋势,且线性拟合的相关程度值为0.734,具有高度相关性,再根据十年际温度变化特征(如表1所示)结果可发现,从1975以来至今,10年际的平均温度变化模式总体呈直线上升,最高的10年平均温度分布区间在2005-2016年之间(-7.62℃),最低10年平均温度分布区间在1985-1994年之间(-10.33℃);且由图可知年平均最大值是在2007年温度为-6.45℃,而年平均最小值是在1985年温度为-11.55

℃。图1 1975-2016年北京市年均温度的变化

(下转第62页)

《大数据云气象》阅读练习及解析答案

大数据云气象 ①我们平时从电视、报纸、网站或手机上获取的看似简单的天气预报,其背后却有着极其庞杂的数据采集和分析作支撑。用现在时髦的话来说,天气预报是经过“云计算”得到的 大数据产品。 ②为了获取精确的气象预报,气象部门历来都会收集大量数据,组成超大的“数据库”。这些数据来自一个庞大的观测网络。目前,全国有 2 000多个地面站、120多个高空探测站、6颗在轨卫星、5万多个自动监测站、600多个农业检测站、300多个雷达站等,逐日逐小时甚至逐分钟对不同地点、不同高度的各种气象要素进行监测。仅在贵州,每天就有85个气象站、3万多个区域自动气象站、7部新一代多普勒天气雷达、2个探空雷达站对贵州境内 的各种气象要素进行实时监测。 ③随着预报业务的不断发展以及大数据、云计算的应用,这些数据变得更加精密,数量也持续增加,气象预报也变得越来越精确。现在,我们已经可以随时随地....通过电脑、手机、 电视、网站等查询天气预报,其精度甚至可以精确到一公里...、一小时 ...以内。 ④早晨起床后,穿薄的还是厚的衣服?要不要进行晨练?长假期间是否要外出旅游?旅 游时需要带哪些随身物品……如何选择,天气预报会为你提供有效的参考。 ⑤随着各行各业对气象信息的需求越来越大,气象部门还需要针对不同领域、不同行业、不同群体制作相应的气象产品,包括面向社会群体的公众气象服务,面向水利、电力、交通、农业以及其他部门或企业的专业专项服务,以及针对干旱、暴雨、森林火险、雷电等灾害性天气的气象灾害预报预警服务等。 ⑥比如说能源,可以通过分析电力负荷历史加上气象数据进行用电量估算;农业方面, 通过某一地的农耕历史与相关气候信息,就可以指导农户进行农作物种养殖结构调整;还有交通,航班准点率历史加上机场历史天气特征,就可以得到航班延误预测……这些日益丰富 的气象产品构成了气象大数据的重要部分,让我们的生活变得更加丰富、便捷。 ⑦当气象邂逅大数据,气象大数据将大有作为,它必将更大程度地减轻灾害损失,为社会创造更多的财富,为人们带来更加美好的生活。 (1)第②段主要运用了________和________的说明方法,作用是________。 (2)阅读第④⑤⑥段,你认为下面这句话放在其中哪段的开头合适?为什么? 更精细、更准确、更长时效的天气预报让我们日常生活中的衣食住行变得更加便捷。 答:________________________________________________________________________ ________________________________________________________________________ (3)分析下列句子中加点词语的表达效果。 现在,我们已经可以随时随地 ....通过电脑、手机、电视、网站等查询天气预报,其精度甚 至可以精确到一公里 ...以内。 ...、一小时 答:________________________________________________________________________

大到暴雨天气数据分析

龙源期刊网 https://www.360docs.net/doc/e11715420.html, 大到暴雨天气数据分析 作者:马颐樱 来源:《科学与信息化》2018年第32期 摘要通过常规资料和物理量场产品,从环流系统特征和物理量场特征,对青海省2016年7月7-8日大到暴雨天气过程进行了分析。结果表明:500 hPa高空切变和700 hPa暖低压是此次大到暴雨降水过程直接影响系统,高层西风急流和强南风是暴雨产生和维持重要因素,为以后大到暴雨天气预报和预警服务提供参考。 关键词大到暴雨;物理量场特征;环流系统特征 青海省位于内陆,受水汽条件的限制,暴雨发生的概率比较小,但是如果发生大到暴雨对青海省所造成的灾害是非常严重的。据相关统计显示,青海省的大到暴雨主要集中在汛期,是青海主要的灾害性天气之一。随着全球不断变暖,青海地区的极端天气也是越来越多,灾害性天气也是越来越多。本文主要青海省2016年7月7-8日大到暴雨天气过程进行了分析,为以 后大到暴雨天气预报和预警服务提供参考。 1 降水情况 相关规定在24小时降水量大于25毫米的降水称为大到暴雨,同时规定当有≥1个站日降 水量达到该标准记为一个大到暴雨日;同日有≥3个站出现达到暴雨时称为一次区域性大到暴 雨降水过程。在2016年7月7-8日,青海省东部出现了大范围降水天气,其中降水量达40毫米以上有11个站点。造成了青海省东部受灾严重,其中部分乡镇出现了洪涝灾害,造成了一定的经济损失[1]。 2 环流系统特征 在2016年7月7日8点,500 hPa处于反气旋环流中;在晚上8点,500 hPa青海省形成 东北西南向切变,暖空气在东部交汇,T-Td小于4℃,从而导致青海省东部区域降水。此时,300 hPa中高纬环流比较平直,河西走廊有急流带,非常利用高空抽吸作用。高层冷暖空气进行交汇,底层暖气压低,导致了青海省东部大雨天气[2]。 3 物理量场特征分析 在在2016年7月7日~8日,青海东部出现了大到暴雨天气,主要是受500 hPa高空切变、西太平洋副热带高压和700 hPa上的暖低压的影响,导致出现大到暴雨天气[3]。 在2016年7~8日沿102°E垂直速度纬度-高度垂直剖面,暴雨发生当日上午8点(图 1a),暴雨区附近就开始有垂直上升运动。随着时间的推移,后上升运动强度增强,在下午2点(图1b)暴雨区上空上升运动比较强,在晚上8点,上升运动高度达250 hPa左右(图

气象大数据资料

1 引言 在气象行业内部,气象数据的价值已经和正在被深入挖掘着。但是,不能将气象预报产品的社会化推广简单地认为就是“气象大数据的广泛应用”。 大数据实际上是一种混杂数据,气象大数据应该是指气象行业所拥有的以及锁接触到的全体数据,包括传统的气象数据和对外服务提供的影视音频资料、网页资料、预报文本以及地理位置相关数据、社会经济共享数据等等。 传统的”气象数据“,地面观测、气象卫星遥感、天气雷达和数值预报产品四类数据占数据总量的90%以上,基本的气象数据直接用途是气象业务、天气预报、气候预测以及气象服务。“大数据应用”与目前的气象服务有所不同,前者是气象数据的“深度应用”和“增值应用”,后者是既定业务数据加工产品的社会推广应用。 “大数据的核心就是预测”,这是《大数据时代》的作者舍恩伯格的名言。天气和气候系统是典型的非线性系统,无法通过运用简单的统计分析方法来对其进行准确的预报和预测。人们常说的南美丛林里一只蝴蝶扇动几下翅膀,会在几周后引发北美的一场暴风雪这一现象,形象地描绘了气象科学的复杂性。运用统计分析方法进行天气预报在数十年前便已被气象科学界否决了——也就是说,目前经典的大数据应用方法并不适用于天气预报业务。 现在,气象行业的公共服务职能越来越强,面向政府提供决策服务,面向公众提供气象预报预警服务,面向社会发展,应对气候发展节能减排。这些决策信息怎么来依赖于我们对气象数据的处理。

气象大数据应该在跨行业综合应用这一“增值应用”价值挖掘过程中焕发出的新的光芒。 2 大数据平台的基本构成 2.1 概述 “大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。 从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘(SaaS),但它必须依托云计算的分布式处理、分布式数据库(PaaS)和云存储、虚拟化技术(IaaS)。 大数据可通过许多方式来存储、获取、处理和分析。每个大数据来源都有不同的特征,包括数据的频率、量、速度、类型和真实性。处理并存储大数据时,会涉及到更多维度,比如治理、安全性和策略。选择一种架构并构建合适的大数据解决方案极具挑战,因为需要考虑非常多的因素。 气象行业的数据情况则更为复杂,除了“机器生成”(可以理解为遥测、传感设备产生的观测数据,大量参与气象服务和共享的信息都以文本、图片、视频等多种形式存储,符合“大数据”的4V特点:Volume(大量)、Velocity(高速)、

数据分析1一个月31天三城市气温

matlab数据分析 由于MATLAB面向矩阵,所以它很容易对数据集合进行统计分析。按规定,数据集存储在面向列的矩阵里。也就是,一个矩阵的每一列代表不同的被测变量,每一行代表各个样本或观察值。例如,让我们假定,一个月31天的三城市每日高温(单位为0C)被记录,并赋给脚本M文件中的变量temps,在精通MATLAB工具箱里取名为mmtemp.m。运行M文件,把变量temps放在MATLAB工作空间里。这样,变量temps包含: ? temps temps = 12818 15922 12519 14823 12622 119 19 15915 81020

12718 141019 11817 9723 8819 15818 8920 10717 12722 9819 12821 12820 10917 131218

10622 14721 12522 13718 151023 131124 121222 每一行包含了给定一天的高温;每一列包含不同城市的高温。为了使数据可视,把它绘图: ? d=1:31;%number the days of the month ? plot(d, tem ps) ? xlabel(' Day of Month '),ylabel(' Celsius ') ? title(' Daily High Temperatures in Three Cities ') (见图9.1)

图9.1三个城市的每日高温 上面的plot命令也说明了plot命令用法的另一种形式。变量d是一个长度为31的向量,而temps是一个31×3矩阵。给定这些数据,plot命令绘出了temps 对每一列d的曲线。绘图在第7和8章进一步讨论。 为了说明MATLAB数据分析的一些功能,根据上面温度数据考虑以下命令。 ? avg_temp=mean(temps) avg_temp = 11.96778.225819.8710 表明第三个城市有最高平均温度。这里MATLAB分别地找出了各列的平均值。? avg_avg=mean(avg_temp)

相关主题
相关文档
最新文档