基于概率图模型的天气预测研究

合集下载

基于组合模型的PM,s浓度预测及其不确定性分析

基于组合模型的PM,s浓度预测及其不确定性分析

Keywords: PM 2. 5 concentrations; spatial and temporal distribution; prediction;composite model; uncertainty analysis
0 引 言
随着我国社会经济的快速发展以及城市化进程
的持续加快,环境污染的压力越来越大。 环境空气质
数据、地面气象站点数据及历史气象数据,采用多元回归 分 析、相 关 分 析 等 方 法,研 究 合 肥 市 PM 2. 5 浓 度 的 影 响 因 素。
结果表明:1) PM 2. 5 浓度整体变化情况为冬季 >秋季 >春季 >夏 季,大 部 分 城 市 PM 2. 5 浓 度 峰 值 出 现 在 1 月,之 后 浓 度 开
价具有重 要 的 现 实 意 义
[ 3,4]
。 李松等
[ 5]
利 用 GIS 对
贵州省遵义市 PM 2. 5 浓度变化特征进行了 分 析,发 现
PM 2. 5 浓度的季节性变 化 特 征 明 显,并 且 其 日 变 化 受
到人类活 动 的 影 响。 任 才 溶 [ 6] 利 用 随 机 森 林 算 法,
( 1. 安徽农业大学 资源与环境学院,合肥 230036; 2. 安徽省宣城市气象局,安徽 宣城 242000;
3. 安徽农业大学 工学院,合肥 230036; 4. 安徽农业大学 理学院,合肥 230036)
摘要:运用 GIS 软件及克里金( Kriging) 插值等方法分析合肥城市圈 PM 2. 5 浓度的时空分布,根据合 肥 市 环 境 监 测 历 史
in most cities peaked in January, then gradually declined, reached the lowest value in July, and then gradually increased; 2)

第14讲条件随机场课件

第14讲条件随机场课件

概率图模型基本思想
� 无向图:马尔可夫随机场(Markov Random Fields, MRF) 马尔可夫随机场模型中包含了一组具有马尔可夫性质的随机变量,这 些变量之间的关系用无向图来表示
� �
马尔科夫性: 举例
p( xi x j , j ≠ i ) = p xi x j , xi ∼ x j

Observed Ball Sequence
⋯⋯

HMMs等生产式模型存在的问题:
T
P( X ) =

所有的Y i = 1
∑ ∏ p( y
i
yi −1 ) p( xi yi )
由于生成模型定义的是联合概率,必须列举所有观察序列的可能值,这对 多数领域来说是比较困难的。

基于观察序列中的每个元素都相互条件独立。即在任何时刻观察值仅仅与 状态(即要标注的标签)有关。对于简单的数据集,这个假设倒是合理。 但大多数现实世界中的真实观察序列是由多个相互作用的特征和观察序列 中较长范围内的元素之间的依赖而形成的。

HMM是一个五元组 λ= (Y, X, Π, A, B) ,其中 Y是隐状态(输出变量) 的集合,)X是观察值(输入)集合, Π是初始状态的概率,A是状态转移 概率矩阵,B是输出观察值概率矩阵。 today sun cloud rain
yesterday sun cloud rain
⎡ 0.50 0.375 0.125⎤ ⎢ 0.25 0.125 ⎥ 0.625 ⎢ ⎥ ⎢ ⎣ 0.25 0.375 0.375⎥ ⎦
⎡ 0.50 0.375 0.125 ⎤ ⎢ 0.25 0.125 ⎥ 0.625 ⎢ ⎥ ⎢ ⎣ 0.25 0.375 0.375 ⎥ ⎦

基于贝叶斯网络的学生成绩预测模型研究

基于贝叶斯网络的学生成绩预测模型研究

基于贝叶斯网络的学生成绩预测模型研究学生成绩预测一直是教育领域中的重要问题,针对这一问题,贝叶斯网络成为了预测模型中的研究热点。

贝叶斯网络是一种基于概率的图模型,能够有效地处理不确定性,并且具有建模简洁、灵活性高的特点。

本文将探讨基于贝叶斯网络的学生成绩预测模型,并研究其应用。

首先,进行学生成绩预测需要考虑的因素较多,如学生个人信息、学习能力、家庭背景等。

贝叶斯网络能够帮助我们对这些因素进行建模,并通过概率推断预测学生成绩。

在建模过程中,我们需要确定变量之间的依赖关系,并使用先验概率来表示已知信息。

随着数据的不断积累,我们可以通过观察数据来修正先验概率,从而提高预测的准确性。

其次,研究表明,学习行为对学生成绩有着重要影响。

贝叶斯网络可以帮助我们探索学习行为和学生成绩之间的关系,从而找到影响成绩的主要因素。

通过分析学生在课堂上的参与程度、作业完成情况、学习时间分配等因素,我们可以建立学习行为与成绩之间的贝叶斯网络模型,并通过模型进行预测。

这将帮助教师和学生了解学习行为对成绩的影响,从而制定相应的改进措施。

此外,家庭背景也是影响学生成绩的重要因素之一。

通过贝叶斯网络,我们可以探索家庭背景与成绩之间的潜在关系。

通过分析家庭收入、父母受教育程度、家庭环境等因素,我们可以建立一个包含家庭背景变量的贝叶斯网络模型,并利用该模型进行学生成绩预测。

这将有助于制定针对不同家庭背景学生的教育策略,从而提高教育公平性。

此外,贝叶斯网络还可以用于解释学生成绩预测模型的结果。

通过分析网络结构和概率推断结果,我们可以了解到影响学生成绩的主要因素,并进行因果推断。

这将有助于分析教育政策对学生成绩的影响,从而优化教育资源的配置。

需要注意的是,贝叶斯网络虽然具有很多优点,但也存在一些挑战。

首先,贝叶斯网络的建模需要大量的数据支持,否则模型预测的准确性会受到影响。

其次,贝叶斯网络的参数估计和结构学习一直是研究的难点,需要运用合适的算法进行优化。

概率论应用于航空安全事故的预测

概率论应用于航空安全事故的预测

概率论应用于航空安全事故的预测在人类飞行的历史中,航空安全问题一直是备受关注的话题。

尽管技术的进步使得航空安全水平得到了大幅提高,但是事故仍然时有发生。

如何准确预测航空事故并采取有效的措施进行干预,一直是各国专家学者共同关注的问题。

而其中,概率论就是一种重要的工具,它可以提供有力的理论基础为规划和预测航空事故提供较为准确的依据。

首先,我们需要知道航空安全事故的产生原因。

一般来说,有人为因素和自然因素两个方面。

人为因素包括机组成员的失误、机务人员的疏忽、恶劣的天气和异常情况等等。

自然因素则包括气象、地貌、机场覆盖等等。

在对航空事故的严格统计分析之后,通常可以得出一个关键的结论:人为因素是航空事故发生的主要原因。

那么,如何利用概率论来预测可能发生的航空安全事故呢?在这里,建议利用贝叶斯网络模型。

贝叶斯网络模型是一种基于贝叶斯概率理论的概率图模型,可以用来研究因果关系。

这个模型通常被用来描述因果关系的概率分布,并在新数据可用时更新这些概率分布。

在航空安全事故预测中,可以通过建立一个贝叶斯网络模型从而将事故的几种原因和可能因素的相互联系、影响表现出来,方便对未来的安全隐患进行预测。

假设我们将发生航空安全事故拆分为四个子集:人为因素、气象因素、机务因素和其他因素,如计划路线标注不明确或其他个别情况。

假设每个子集内又各有若干个变量,并且四个子集相互联系产生了一种因果关系网。

通过概率计算得出每个变量的概率分布,可以计算出如果某个变量发生改变的情况下,最终航空安全事故的发生概率。

例如,我们可以对“人为因素”子集内再进行拆分,如机长失误、副驾驶员失误、地勤人员失误等等。

再以机长失误为例,我们可以再将其拆分为不同种类的失误,如导航失误、气象判断错误、机械问题等等。

将其整合到一个贝叶斯网络模型中,就形成了一个复杂的网络结构,可以计算发生安全事故的概率。

通过这种方法,就可以得出比较准确的航空安全事故的发生概率,从而对未来空难进行预测。

基于I-D阈值的滑坡气象预警双指标模型

基于I-D阈值的滑坡气象预警双指标模型

地质科技通报㊀㊀2024年㊀第43卷㊀第1期©Editorial Office of Bulletin of Geological Science and T echnology.This is an open access article under the CC BY -NC -ND license.https:ʊ基于I-D 阈值的滑坡气象预警双指标模型龚泉冰1a ,殷坤龙1a∗,肖常贵2,3,陈丽霞1b ,严亮轩1a ,曾韬睿1c ,刘谢攀1a1.中国地质大学a.工程学院;b.地球物理与空间信息学院;c.地质调查研究院,武汉430074;2.浙江省地质环境监测中心,杭州310007;3.自然资源部浙江地质灾害野外科学观测研究站,杭州310007㊀第一作者,E-mail:qbgong@∗通信作者,E-mail:yinkl@2022-06-20收稿;2022-10-29修回;2022-10-31接受基金项目:国家重点研发计划课题(2023YFC3007201);衢州市自然资源和规划局柯城分局科研项目(ZZCG2021058)中图分类号:P642.22㊀㊀㊀文章编号:2096-8523(2024)01-0262-13㊀㊀㊀doi:10.19509/ki.dzkq.tb20220254摘㊀要:确定降雨阈值对于管控降雨型滑坡灾害风险具有重要意义㊂以浙江衢州市98处降雨型滑坡为例进行降雨阈值研究㊂在统计分析1970 2019年梅汛期间诱发滑坡降雨特征的基础上,首先对比分析I-D㊁E-D 和E-I 曲线建立的降雨阈值模型,然后基于I-D 阈值建立以当日降雨量R 0和5d 有效降雨量R 5为预警指标的滑坡气象预警双指标模型,最后采用历史降雨和滑坡数据检验模型的合理性和可靠性㊂结果表明:(1)I-D 模型对于降雨型滑坡的预测能力优于E-D 和E-I 模型;(2)按双指标模型反演衢州市历史50a 滑坡气象预警情况,红色㊁橙色和黄色预警的年均预警次数为1.5,3.2,9.3次,具有较高的合理性;20处验证滑坡点被双指标模型准确预警,其中15处为红色和橙色预警,此外模型成功预警了2014年全部8处降雨型滑坡;(3)用于检验模型预测能力的7处滞后性滑坡全部成功预警,其中3处橙色预警㊁3处黄色预警和1处蓝色预警㊂本研究提出的预警模型有助于衢州市滑坡气象预警发布,为政府部门开展风险评价和管理提供新思路与方法㊂关键词:降雨型滑坡;有效降雨量;降雨阈值;双指标模型;滑坡气象预警㊀㊀滑坡是我国发生频繁㊁分布广泛,常常造成人员伤亡和经济损失的自然灾害[1]㊂降雨是控制滑坡发生的主要因素之一,其通过抬升地下水位,改变滑体容重,产生水压力和弱化滑动面抗剪强度来影响滑坡稳定性㊂由降雨作用导致的滑坡称为降雨型滑坡[2],中国约有95.5%的滑坡灾害由降雨诱发[3]㊂在降雨型滑坡易发地区,建立滑坡灾害气象预警系统是管控灾害风险的有效手段,诱发滑坡的降雨阈值是建立预警系统的基础数据㊂降雨阈值表示导致滑坡发生的降雨量㊁土壤含水量或其他水文条件的临界值[4]㊂降雨阈值可以通过分析灾害发生的物理过程进行确定性定义,也可以基于历史灾害和降雨数据统计分析得出㊂通过分析滑坡的水文地质条件和稳定性系数变化过程可以确定滑坡发生的具体时间和地点,但是由于难以获取区域上详细准确的地质地理信息,基于滑坡发生物理过程的降雨阈值使用受限㊂数理统计模型通过分析历史滑坡和降雨数据来定义区域滑坡发生的降雨阈值㊂YANG 等[5]利用滑坡发生当日和前7日有效降雨量确定了达州市的降雨阈值㊂HE 等[6]根据我国771处滑坡利用分位数回归方法建立了雨季和非雨季的累计降雨量-持续时间(E-D )阈值㊂MA 等[7]确定了浙江省62个区县的降雨强度-持续时间(I-D )阈值㊂不同数理统计阈值模型从不同方面龚泉冰等:基于I-D阈值的滑坡气象预警双指标模型表征了诱发滑坡降雨事件的降雨特征,阈值研究中应用最广泛的是I-D和E-D模型,少有学者对比不同阈值模型在同一研究区的适用性㊂自然灾害预警系统是减轻灾害风险,实现可持续发展的重要工具㊂基于降雨阈值建立的滑坡气象预警系统已得到广泛运用㊂1985年美国地质调查局在旧金山湾区基于6h预报降雨量和滑坡降雨阈值开发了早期的预警系统[8]㊂日本利用60min的累计降雨量结合土-水特征指标建立了滑坡灾害预警系统[9]㊂香港土力工程处和天文台依据24h预报降雨量建立了国内最早的滑坡灾害预警系统[10]㊂现有预警系统主要选择未来一段时间的预报雨量作为预警指标,此类单一指标主要考虑短时强降雨的影响,在表征前期降雨对滑坡的作用方面有所不足㊂诱发滑坡灾害的数理统计降雨阈值研究已经取得了长足进步,但是由于区域气候特征㊁地质环境背景等条件的区别,不同地区降雨阈值差别显著[11-18],建立具有区域针对性的降雨阈值是必要的㊂进一步地建立滑坡气象预警模型要同时考虑短时强降雨和前期降雨作用,针对研究区域的降雨特征选取预警指标㊂浙江省位于中国东南沿海,雨量充沛,梅汛期间降雨量大且持续时间长,是我国降雨型滑坡最频发的地区之一[19]㊂在分析研究区降雨和滑坡发育特征的基础上,笔者拟以更符合实际降雨入渗情况的有效降雨模型计算前期有效降雨量,对比常用的I-D㊁E-D和E-I模型在研究区的适用性㊂基于研究区特有的梅汛过程确定当日降雨量R0和5d有效降雨量R5为气象预警模型的预警指标,建立滑坡气象预警R0-R5双指标模型,旨在为研究区滑坡预警提供理论指导㊂1㊀研究方法1.1㊀降雨事件定义确定诱发滑坡的降雨阈值前,首先要完成对诱发滑坡降雨事件的定义,即建立同一标准确定降雨开始和结束的时间㊂对降雨事件的准确定义是保证阈值可靠性的重要条件,但目前并没有统一的降雨事件定义标准㊂衢州市汛期降雨具有强弱降雨交替发生,持续时间长等特点㊂本研究对降雨事件划分标准为连续2d累计降雨量小于5mm,如图1所示㊂分析降雨阈值所需的降雨参数有:E,D,I㊂E 为降雨事件的有效降雨量,计算公式为式(1),降雨事件持续时间D为滑坡发生时间前推至本场降雨开始,降雨强度I采用过程平均雨强,即降雨过程中的有效降雨量除以降雨持续时间㊂图1㊀诱发滑坡的降雨事件定义Fig.1㊀Definition of the rainfall events inducing landslides1.2㊀前期降雨作用和有效降雨模型降雨型滑坡的形成过程包括降雨入渗㊁吸水饱和㊁结构劣化㊁坡体失稳等阶段[20]㊂滑坡发生时间较降雨过程可能存在滞后性㊂一般可将触发滑坡的降雨过程分为2个阶段:①前期降雨阶段,此阶段降雨持续入渗会抬升地下水位,产生水压力,增大土体容重,滑面遇水后抗剪强度弱化,为滑坡发育成熟提供条件;②触发降雨阶段,此阶段的降雨直接导致了滑坡发生㊂因此,前期降雨和当日降雨共同作用导致滑坡发生㊂前期降雨在土层缓慢饱和的过程中影响土壤含水量和地下水位等因素从而导致滑坡发生㊂因地下水位和土壤含水量取决于土壤性质(粒径㊁颗粒分布和排列㊁密度㊁孔隙度㊁渗透性等)㊁降雨和温度等因素,难以准确确定㊂ROSSI等[21]通过统计滑坡发生当日降雨和前期降雨的关系来表示前期降雨在诱发滑坡时的作用㊂在降雨诱发滑坡的过程中,由于水分蒸发和地表径流等作用,实际作用于滑坡的降雨量不是前期雨量的简单累加,要考虑雨量的衰减㊂本研究采用有效降雨模型来计算实际作用于滑坡的前期有效降雨量,有效降雨量由滑坡发生前及滑坡发生当日的降雨量分别乘以各自对应的有效降雨系数并求和所得,计算公式如下[22]:R e=R0+αR1+α2R2+ +αn R n,(1)式中:R e为有效降雨量;R0为滑坡发生当日降雨量;R n为滑坡发生前n d降雨量;α为有效降雨系数,反映了前期降雨的实际入渗情况,α=0.8是最适合研究区的有效降雨系数[23]㊂362地质科技通报㊀㊀2024年㊀第43卷㊀第1期1.3㊀降雨阈值模型滑坡发生不仅与降雨相关,同时还取决于岩土体抗剪强度㊁植被覆盖㊁地形地貌等条件㊂在以上众多条件的影响下,即使降雨量相同,诱发滑坡的情况也可能不同,此时仅用降雨并不能表征如上全部因素,也不能完全区分滑坡发生与不发生的降雨边界条件,所以在建立阈值模型时常用一定的滑坡发生概率来确定阈值㊂对于概率的划分主要有2种形式:一是以如1%,10%等滑坡发生概率制作下包络线确定降雨阈值,表示诱发滑坡所需的最小降雨量[24];二是采用贝叶斯[25]㊁分位数回归[26]等方法确定多个滑坡发生概率对应的降雨条件作为降雨阈值,常用于预测滑坡㊂GUZZETTI等[27]将数理统计阈值分为4类:降雨强度-持续时间阈值(I-D);累计降雨量阈值(E);累计降雨量-持续时间阈值(E-D);累计降雨量-降雨强度阈值(E-I)㊂按照建立分级阈值的常用方法[28],本研究先按照各降雨阈值模型的幂函数形式拟合阈值方程,确定阈值曲线的斜率,再以滑坡数量的15%,30%,60%,85%确定各曲线的截距,得到4个等级的阈值曲线㊂降雨强度I 和持续时间D是表征降雨事件的主要参数,也是影响滑坡发生的关键因素㊂I-D阈值建立了诱发滑坡的降雨强度随持续时间的变化关系㊂CAINE[29]在1980年基于全球73个滑坡和降雨数据建立了第一个I-D阈值,其形式如式(2)所示㊂I-D阈值也是目前使用最广泛的阈值模型[30-32]㊂I=αDβ,(2)式中:α和β为拟合参数,其中α为幂函数的截距,β控制了幂函数的斜率,β<0㊂E-D阈值建立了诱发滑坡降雨事件的累计降雨量和降雨持续时间之间的关系,随着降雨持续时间增加,诱发滑坡所需的累计降雨量增大,E-D模型使用也较为广泛[33-34],其形式如式(3)所示:E=αDβ,(3)式中:β>0㊂E-I阈值建立了诱发滑坡降雨事件的累计降雨量和降雨强度之间的关系,其形式如式(4)所示: E=αIβ,(4)式中:β>0㊂1.4㊀滑坡气象预警指标滑坡气象预警是利用滑坡与降雨的关系实现滑坡的预测预报,降雨是预警模型所需的重要信息,所选降雨指标必须能表征降雨与滑坡之间的关系㊂PICIULLO等[35]统计了全球24个滑坡气象预警系统的预警指标,主要采用的是未来1~96h的预报雨量,其中6,12,24h的预报雨量使用最多㊂以预报雨量作为预警指标实际上反映的是滑坡与待发生降雨的关系,没有反映滑坡与前期降雨的关系㊂在浙江,大量滑坡同时受短时强降雨和前期降雨的影响,所以在设计预警指标时既要考虑预报雨量,也应考虑已发生降雨对诱发滑坡的作用㊂对此,本研究提出滑坡气象预警双指标模型,包括预报降雨指标R0和有效降雨指标R e㊂R0为未来一段时间的预报雨量,一般为短时强降雨,可单独诱发滑坡;R e为有效降雨,反映前期降雨诱发滑坡的作用,前期降雨计算天数依据本地实际降雨特征确定㊂降雨阈值建立了降雨与滑坡之间的关系,R0和R e可通过阈值确定㊂以常见的I-D阈值为例,确定预报降雨时长和前期降雨计算时长D后,即可反算预警指标R0和R e㊂2㊀研究区概况及降雨特征2.1㊀研究区概况衢州市位于浙江省西部,金衢盆地西端,钱塘江上游,属亚热带季风气候区,降水充沛,降雨是滑坡的主要诱发因素㊂衢州市域面积8844km2,其中丘陵山地面积达7560km2,占土地总面积的85.5%㊂境内海拔以衢江为轴向南北对称展布,高度逐级提升㊂衢江两侧为河谷,外延为丘陵低山,再扩展上升为低山与中山,海拔为33~1500m㊂NE-SW向的江山-绍兴深断裂横跨衢州全境,境内地质环境复杂,构造形态多样㊂地壳经历了地槽-地台-陆缘活动三大发育阶段,形成了碎屑沉积岩㊁海底火山喷发岩为主的海相㊁滨海相碎屑岩,碳酸盐岩为主的陆相火山喷发岩和陆缘粗碎屑堆积三大沉积建造系列㊂2011年6月15日,研究区受强降雨影响发生群发性地质灾害,全区受灾15处㊂2021年汛期,研究区内遭遇强降雨,诱发多处浅层滑坡(图2)㊂2.2㊀滑坡和降雨数据衢州市历史灾害数据集共记录了369起滑坡,其中211起滑坡记录有具体发生时间和地点,时间跨度为1975-2020年,发生时间精确到天㊂356处滑坡发育规模为小型,其余13处为中型,无大型滑坡发育㊂数据集仅包含滑坡发生时间㊁地点㊁规模和承灾体的社会经济属性等基本信息,基于滑坡发育规模或坡体结构分类建立阈值时受数据制约明显㊂部分滑坡发生前一段时间内无降雨或降雨量明显不足以导致滑坡,在后续降雨阈值分析时,此类数据予462龚泉冰等:基于I-D阈值的滑坡气象预警双指标模型图2㊀衢州市地理位置及区内滑坡Fig.2㊀Location and typical landslides in Quzhou以剔除㊂本研究降雨数据来源于衢州市境内的3个国家级地面气象观测站,其中衢州站为根据全国气候分析和天气预报需要所设置的地面气象观测站,龙游和常山站为以降雨量㊁气温㊁湿度㊁风向㊁风速等基本气象要素观测为主的地面气象观测站㊂观测站记录数据时间为1970 2019年,数据类型为日降雨量㊂3个观测站的位置和年均降雨量等基本信息如表1所示㊂2.3㊀降雨特征分析(1)整体降雨研究区降水充沛㊁旱涝明显㊂据衢州市19702019年降雨资料,年平均降雨量为1700mm,各年降雨量起伏较大,丰水年和枯水年出现频繁,最大年表1㊀衢州市国家地面气象观测站基本情况Table 1㊀Basic information of national ground meteorological observation stations in Quzhou区站号站名站类观测场海拔/m经度/(ʎ)纬度/(ʎ)平均年降雨量/mm最大日降雨量/mm58633衢州国家基本气象站82.4118.890828.9942170020658547龙游国家气象观测站66.2119.194729.04031661170.958631常山国家气象观测站137118.507228.90721769204.2降雨量为2560mm,最小仅为1092mm㊂六月份是全年降雨最集中的时段,月降雨量占全年雨量的19%,降雨和滑坡发育联系紧密,降雨最频繁的月份滑坡也最发育,如图3㊂区内复杂的地形条件有助于静止锋滞留,利于降雨发生㊂台风较难深入境内,影响较小㊂(2)梅汛特征衢州市多年月平均降雨量呈单峰型,降雨过程具有典型的梅汛特征㊂3 5月为春雨期,降水日多,平均雨量小㊂6 7月为梅汛期,降水量大且持续时间长,长时间的持续降雨极易诱发滑坡㊂统计2013 2018年衢州市年度降雨过程,虽然各年度降雨总量相差较大,2015年降雨量为2560mm,2013年降雨量仅为1315mm,但是在6 7月梅汛期降雨量均较大,降雨总量在梅汛期间陡增,如图4㊂以2011年和2017年梅汛过程为例分析其降雨特征,如图5㊂梅汛过程持续时间长,2次降雨过程持续时间分别为20,35d;梅汛期间累计降雨量大,2场降雨事件累计降雨量分别为711,599mm,降雨量可达全年降雨量的1/3以上;降雨呈多峰型,日均降雨量较小,期间穿插发生多次暴雨甚至大暴雨事件,在降雨过程的中后期且日降雨量达峰时是滑坡最易发的时期㊂(3)暴雨特征暴雨诱发滑坡的作用已被广泛证实[36]㊂衢州市562地质科技通报㊀㊀2024年㊀第43卷㊀第1期图3衢州市1970 2019年各月平均降雨量和滑坡分布Fig.3㊀Average monthly rainfall and landslide distribution inQuzhou from 1970to2019图4㊀衢州市2013 2018年累计降雨量Fig.4㊀Accumulated rainfall during 2013-2018inQuzhou图5㊀衢州市2011年(a)和2017年(b)梅汛降雨过程Fig.5㊀Rainfall process of the plum rain season in 2011(a)and 2017(b)in Quzhou39%的暴雨事件发生在6月份,正值梅汛期,如图6所示㊂6月为滑坡最频发时期,数量占全年的46.3%㊂5 7月的暴雨事件占全年的67%,同时期地质灾害占全年的72%,灾害发生和暴雨事件具有良好相关性㊂衢州市50d 内暴雨次数为267,年平均暴雨次数为5.34㊂88.4%的暴雨日降雨量小于100mm,累计236次,大暴雨事件累计31次,无特大暴雨事件㊂综上所述,衢州市梅汛诱发滑坡具有两大特点:①日均雨量小,持续时间长,累计雨量大,降雨过程中微雨㊁中小雨和暴雨交替出现㊂②梅汛诱发滑坡是中小雨持续入渗叠加短时暴雨作用的结果㊂梅汛期间动辄持续2周以上的降雨入渗可深入土体内部,软化斜坡土体,减小抗剪强度,其间叠加多次暴雨作用进一步加大滑坡发生的可能性㊂图6㊀衢州市1970 2019年各月累计暴雨次数和滑坡分布图Fig.6㊀Rainstorm frequency and landslide distribution inQuzhou from 1970to 2019662龚泉冰等:基于I-D 阈值的滑坡气象预警双指标模型3㊀阈值结果和双指标预警模型3.1㊀降雨阈值结果(1)I-D 阈值剔除非降雨诱发和发生时间㊁地点模糊的灾害点,将剩余98处具有明确发生时间和地点的滑坡用于阈值分析,其中78处用于拟合I-D 阈值曲线,另20处用于验证拟合效果㊂以降雨持续时间D 为横轴,有效降雨强度I 为纵轴,统计诱发滑坡降雨事件的持续时间和有效降雨强度作双对数坐标散点图,以区域滑坡15%,30%,60%,85%的发生概率按式(2)建立I-D 阈值曲线为I 15%=25D -0.568,I 30%=40D -0.568,I 60%=62D -0.568和I 85%=90D -0.568,结果如图7㊂I-D 阈值曲线表明持续时间短的降雨事件诱发滑坡所需的降雨强度大,但是经过一段时间的降雨积累后,强度较小的降雨也能够诱发滑坡㊂这说明在前期降雨对滑坡的持续浸润下,岩土体趋于饱和,抗剪强度降低,后续诱发滑坡所需的降雨强度变小㊂图7㊀降雨诱发滑坡的I-D 阈值曲线Fig.7㊀Rainfall intensity-duration (I-D )thresholds for the in-itiation of landslides(2)E-D 阈值以降雨持续时间D 为横轴,有效降雨量E 为纵轴,统计诱发滑坡降雨事件的持续时间和有效降雨量作双对数坐标散点图,以区域滑坡15%,30%,60%,85%的发生概率按式(3)建立E-D 阈值曲线为E 15%=43D 0.151,E 30%=70D 0.151,E 60%=115D 0.151和E 85%=150D 0.151,结果如图8㊂E-D 阈值曲线整体上呈现出有效降雨量E 随持续时间D 增加而增大的趋势,但是曲线较为平缓,累计有效降雨量E变化图8㊀降雨诱发滑坡的E-D 阈值曲线Fig.8㊀Cumulated event rainfall-duration (E-D )thresholdsfor the initiation of landslides不明显,说明在不同持续时间的降雨事件中,滑坡发生对累计有效降雨量敏感度较低㊂图9㊀降雨诱发滑坡的E-I 阈值曲线Fig.9㊀Cumulated event rainfall-intensity(E-I )threshold forthe initiation of landslides(3)E-I 阈值以有效降雨强度I 为横轴,有效降雨量E 为纵轴,统计诱发滑坡降雨事件的有效降雨强度和有效降雨量作双对数坐标散点图,以区域滑坡15%,30%,60%,85%的发生比例按式(4)建立E-I 阈值曲线为E 15%=37I 0.348,E 30%=58I 0.348,E 60%=80I 0.348和E 85%=99I 0.348,结果如图9㊂E-I 阈值曲线整体上反映了有效降雨量E 随有效降雨强度I 的变化趋势:E 随I 增大而增大,降雨强度较小时,有效降雨量也较小,降雨强度增大,有效降雨量也随之增大㊂在较小和较大的降雨强度下,诱发的滑坡数量较少,这是因为E 和I 较小时不易诱发滑坡,E 和I 较大的极端降雨出现次数较少㊂诱发滑坡的降雨强度主要集中在8~50mm /d 内,累计有效降雨量主要集中于762地质科技通报㊀㊀2024年㊀第43卷㊀第1期80~250mm㊂3.2㊀阈值模型预测能力评价3类模型以有效降雨强度㊁降雨持续时间和有效降雨量为基础数据,从不同方面表示了诱发滑坡降雨事件的降雨特征㊂使用独立于阈值建立的滑坡数据集检验各模型对滑坡灾害的预测能力,验证滑坡所处区间概率越大,说明模型预测能力更好[37]㊂20处滑坡对应的降雨事件分布如图10所示,分布区间如表2所示㊂I-D 模型的验证滑坡全部位于15%的阈值线以上,E-D 模型和E-I 模型各有2处和7处滑坡位于15%阈值线以下㊂I-D 模型有13处滑坡位于60%线以上,E-D 模型和E-I 模型各有11和7处滑坡位于60%线以上㊂由验证滑坡的分布可以看出,I-D 阈值模型对滑坡的预测能力优于E-D 模型和E-I 模型,更能反映研究区诱发滑坡降雨的实际特征,后续将在I-D阈值模型基础上设计图10㊀阈值模型预测能力检验Fig.10㊀Prediction ability test of the threshold model表2㊀验证滑坡数据集分布情况Table 2㊀Distribution of threshold model prediction ability testlandslides滑坡概率<15%[15%,30%)[30%,60%)[60%,85%]>85%I-D 模型04349E-D 模型24329E-I 模型74234滑坡气象预警指标㊂3.3㊀滑坡与前期降雨作用前期降雨和持续时间是影响滑坡发生的重要因素,在分析降雨型滑坡时,既要考虑滑坡发生时降雨事件的影响,也要考虑前期降雨诱发滑坡的作用[38]㊂为研究滑坡发生与前期降雨的关系,本研究统计了滑坡当天降雨量和前期有效降雨量的分布,如图11所示㊂31%的滑坡发生当天降雨量小于25mm,甚至无降雨,而前期有效降雨量分布于30~217mm 之间㊂当日降雨量很小也有可能发生滑坡,说明前期降雨是诱发滑坡的重要因素㊂统计滑坡发生当天的降雨量与滑坡发生前3,5,7,10,15,20d 的累积降雨量,绘制两者关系如图12,对比滑坡发生当天降雨量和前期降雨量的大小㊂对角线上的点表示当日降雨量和前期累计降雨量相等㊂对角线偏左的点表示当日降雨量大于前期累计降雨量,说明滑坡发生更多受当日降雨控制㊂对角图11㊀滑坡发生当日降雨量与前期有效降雨量分布图Fig.11㊀Distribution of rainfall on the day of landslide occur-rence and effective rainfall in the earlier period线偏右的点表示当日降雨量小于前期累计降雨量,说明滑坡发生更多受前期降雨控制[34]㊂如图12所示,在前期不同持续时间的降雨下,大量滑坡事件点偏向对角线右侧,说明衢州市前期降雨在诱发滑坡的过程中扮演了重要角色,在设计滑坡气象预警指标时要充分考虑前期降雨的作用㊂3.4㊀滑坡气象预警双指标模型I-D 阈值曲线反映了诱发滑坡的降雨强度随降雨持续时间变化的关系,由I-D 曲线可反演获得不同持续时间的降雨诱发滑坡所需的平均降雨强度,862龚泉冰等:基于I-D阈值的滑坡气象预警双指标模型图12㊀滑坡发生当日降雨量与前期降雨量Fig.12㊀Rainfall on the day of the landslide occurrence and in the earlier period并在此基础上设计适用于研究区的滑坡气象预警指标㊂梅汛期是研究区滑坡最频发的时期,本研究针对梅汛期持续时间长,中小雨和暴雨交替出现的特点设计预警指标,同时考虑受前期降雨和短时强降雨作用的情况㊂研究区内数量众多的滑坡发生前已有较长持续时间的降雨发生,其中降雨持续时间达到5d及以上的滑坡数量占比为69.2%,说明5d 及以上的持续降雨对于滑坡的诱发作用明显㊂据谢剑明等[23]对研究区内滑坡与降雨相关性研究表明,滑坡发生与前期5d降雨最相关,故选择前期5d有效降雨量R5作为预警指标以表征前期降雨的影响㊂对梅汛期间交替出现的多次短时暴雨诱发滑坡的特点以当日降雨量R0进行预警㊂综合对比R5和R02类指标预警情况,选取较高等级预警发布,实现针对研究区降雨特征的双指标综合预警㊂将本研究设计的4个等级阈值与浙江省地质灾害气象预警等级结合:I15%阈值对应Ⅰ级低风险蓝色预警;I30%对应Ⅱ级中风险黄色预警,提醒预报区内人员开展巡查监测,关注降雨和实时预警信息;I60%对应Ⅲ级高风险橙色预警,停止预报区内户外作业,密切关注降雨和实时预警信息,做好受地灾威胁居民转移准备,落实应急措施;I85%对应Ⅳ级极高风险红色预警,加强预报区内风险管控,密切关注降雨和实时预警信息,可根据实际情况提前疏散受地灾威胁的人员,做好应急准备㊂按照浙江省地质灾害气象预警各等级的相应措施,可分为警告级和行动级预警㊂其中Ⅰ㊁Ⅱ级为警告级,主要目的是提高地质灾害防范意识㊂Ⅲ㊁Ⅳ级为行动级,要采取诸如停止作业㊁转移安置等避险行动㊂基于I-D阈值计算得出滑坡气象预警双指标判据如表3所示㊂表3㊀基于I-D阈值的滑坡气象预警双指标模型Table3㊀Landslide meteorological warning double-index model based on the I-D threshold预警等级ⅠⅡⅢⅣ日降雨量R0/mm[25,40)[40,60)[60,90)ȡ90 5d有效降雨量R5/mm[50,80)[80,125)[125,180)ȡ1804㊀气象预警双指标模型验证4.1㊀基于历史降雨的预警情况反演衢州市1970 2019年共18262个自然日,获取所有自然日当日降雨量R0并计算5d有效降雨量R5,按双指标模型对比日降雨量和5d有效降雨量进行预警分析㊂50a综合预警总计1728次,其中红色预警76次,橙色预警162次,黄色预警463次,如表4所示㊂双指标模型触发的各等级年均预警次数合理,便于政府管理部门进行预警发布,可避免因频繁的预警发布造成预警信号可信度下降㊂图13为衢州市50a按双指标模型统计的预警分布情况㊂红色㊁橙色等行动级预警点广泛散布在高日降雨量和高有效降雨量的扇形外围区域,呈现量少分散的特点,小部分降雨事件点紧靠扇形边缘,具有超大的前期降雨量或日降雨量,是衢州市极端降雨天气诱发滑坡的代表㊂数量众多的非预警点和警告级预警点集中分布在扇形中心区域㊂表4㊀衢州市按双指标模型50a预警反演情况Table4㊀Release of early warning in Quzhou over the past50 years预警等级蓝色预警黄色预警橙色预警红色预警按R0预警/次55026711553按R5预警/次8783559535综合预警/次102746316276年均次数20.59.3 3.2 1.5 4.2㊀基于历史灾害的模型可靠性分析检验预警模型可靠性最直接㊁可靠的方式即对比历史灾害发生情况和预警等级的一致性㊂通过衢州市多年梅汛期间诱发滑坡的20场降雨事件检验双指标模型的可靠性㊂统计滑坡发生当日降雨量和5d有效降雨量,判断其触发的预警等级,如图14㊂单一日降雨量指标R0成功预警了全部20处滑坡,其中橙色和红色预警11处㊂单一5d有效降雨量962。

基于贝叶斯网络的风险评估模型研究

基于贝叶斯网络的风险评估模型研究

基于贝叶斯网络的风险评估模型研究风险评估是在现代社会中广泛应用的一种分析方法,它通过对各种风险因素进行识别、评估和管理,帮助决策者制定合理的风险防范策略。

贝叶斯网络作为一种概率图模型,具有适应不确定性、模型可解释性好等优点,在风险评估领域也得到了广泛的应用。

本文将介绍基于贝叶斯网络的风险评估模型研究,包括贝叶斯网络的基本理论、概率推理算法以及在风险评估中的应用案例。

首先,我们将介绍贝叶斯网络的基本理论。

贝叶斯网络采用有向无环图描述变量之间的依赖关系,并使用条件概率表表示变量之间的概率关系。

贝叶斯网络通过贝叶斯定理和链式法则进行概率推理,可以推测给定概率信息下的其他变量的概率分布。

贝叶斯网络具有直观的图形表示,可以帮助决策者理解各个变量之间的依赖关系。

其次,我们将介绍贝叶斯网络的概率推理算法。

贝叶斯网络的概率推理可以分为两种类型:前向推理和后向推理。

前向推理从观测变量出发,逐步计算目标变量的概率分布;后向推理从目标变量出发,逐步计算观测变量的概率分布。

贝叶斯网络的概率推理算法包括变量消去算法、置信传播算法等。

这些算法可以高效地计算出给定观测信息下目标变量的概率分布,有助于风险评估的决策过程。

最后,我们将介绍贝叶斯网络在风险评估中的应用案例。

贝叶斯网络可以用来建立风险评估模型,通过对各种风险因素进行建模和分析,估计和预测风险事件的发生概率。

例如,在金融领域,可以使用贝叶斯网络来建模各种影响股价波动的因素,如宏观经济指标、行业状况、公司财务状况等,评估股价波动的风险程度。

在环境领域,可以使用贝叶斯网络来建立气候变化模型,评估不同气候因素对气候变化的影响,预测未来的气候情况。

总结起来,基于贝叶斯网络的风险评估模型研究在风险评估领域具有重要的应用价值。

通过贝叶斯网络的概率推理算法,可以对各种风险因素进行建模和分析,预测风险事件的发生概率,为决策者制定合理的风险防范策略提供参考。

贝叶斯网络的优势在于模型的可解释性好,能够帮助决策者理解各个变量之间的依赖关系,增加决策的准确性和可靠性。

基于贝叶斯网络的风险预测与评估技术研究

基于贝叶斯网络的风险预测与评估技术研究

基于贝叶斯网络的风险预测与评估技术研究随着社会的发展,人们越来越关注风险预测与评估技术的研究与应用。

其中,基于贝叶斯网络的风险预测与评估技术备受关注。

本文将就该技术进行分析和探讨。

一、贝叶斯网络的概念和基本原理贝叶斯网络是一种灵活的概率图模型,它将变量之间的关系表示为有向无环图。

其中,每个节点都表示一个变量,每条边都表示变量之间的依赖关系。

贝叶斯网络的基本原理是基于贝叶斯定理,即通过先验概率和观测数据来计算后验概率。

贝叶斯网络的应用十分广泛,可以用于风险预测、医学诊断、自然语言处理、图像识别等领域。

在风险预测和评估方面,贝叶斯网络可以帮助我们分析和评估不同决策的风险性和可行性。

二、贝叶斯网络在风险预测和评估中的应用在风险预测和评估中,贝叶斯网络通常用于建立概率模型,预测和评估不同变量之间的关系,并确定不同决策的风险性和可行性。

例如,我们可以基于贝叶斯网络来预测某一企业的破产风险。

在这个模型中,我们可以将企业的不同经济指标(如利润、资产负债率、现金流等)作为节点,而这些节点之间的依赖关系则通过先验统计学数据来确定。

当我们观测到某一节点时,利用贝叶斯定理,我们可以计算出其他节点的概率分布,从而预测该企业的破产风险。

类似地,我们也可以基于贝叶斯网络来评估某一决策的风险性和可行性。

例如,在某一房地产投资决策中,我们可以将不同经济指标(如房价、租金收入等)作为节点,而这些节点之间的依赖关系可以通过历史数据或专家判断来确定。

当我们输入不同决策参数时,利用贝叶斯定理,我们可以估计该决策的风险性和可行性,从而做出最优决策。

三、贝叶斯网络的优势和不足相比于其他风险预测和评估技术,贝叶斯网络具有以下优势:1. 灵活性强。

贝叶斯网络是一种灵活的概率图模型,可以根据不同应用场景来构建模型。

2. 易于处理不确定性。

贝叶斯网络可以考虑到潜在因素之间的不确定性,并利用贝叶斯定理来计算概率分布。

3. 适用于小样本数据。

贝叶斯网络可以用较少的历史数据来建立模型,从而适用于小样本数据的情况。

气候变化背景下基于MaxEnt模型的刺梨潜在适生区分布预测

气候变化背景下基于MaxEnt模型的刺梨潜在适生区分布预测
此外,它还 富 含 维 生 素 B1、
B2、
E、K1 等 16 种 微 量
元素,其营养功能 比 酸 枣 高 46 倍,叶 总 黄 酮 含 量 比
[
19
22]
。果 肉 含 抗 癌 物 质 及 SOD 抗 衰
银杏高 2.
4倍
老物质,同时还具有 排 铅 的 作 用,刺 梨 还 被 誉 为 “长
寿防癌”的绿色珍果。因此,刺梨的研究与开发利用
ima
t
echange;po
t
en
t
i
a
lsu
i
t
ab
l
er
eg
i
on
ywo
气候变化对生态系统的影响一直以来是生态学
家关注的 热 点 问 题。 政 府 间 气 候 变 化 专 门 委 员 会
(
IPCC)第 五 次 评 估 报 告 表 明,
1880~2012 年 间 全
球升温 0.
85 ℃ ,预 测 到 21 世 纪 全 球 将 升 温 0.
西北植物学报,
2021,
41(
1):
0159-0167
Ac
t
aBo
t.
Bo
r
ea
l.
Oc
c
i
den
t.
S
i
n.
do
i:
10.
7606/
i
s
sn.
1000
4025.
2021.
01.
0159
j.
//xb
h
t
t
zwxb.
a
l
l
ou
r
na
l.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

收稿日期:2018-08-28摇摇摇摇摇摇修回日期:2018-12-28摇摇摇摇摇摇网络出版时间:2019-03-21基金项目:国家自然科学基金青年科学基金(41405135)作者简介:刘丽丹(1981-),女,工程师,研究方向为人工智能与机器学习。网络出版地址:http://kns.cnki.net/kcms/detail/61.1450.TP.20190321.0942.072.html

基于概率图模型的天气预测研究刘丽丹(南京航空航天大学计算机科学与技术学院,江苏南京210018)

摘摇要:天气预测关系国计民生,从传统预报到数值预报,随着科技进步特别是计算能力的提升,预测准确率已大幅提高,但仍受限于对大气变化规律的认知程度。由数据驱动的天气预测方法层出不穷,以期帮助人们发现更多天气规律,提高预测准确率。机器学习方法一直是备受各个领域青睐的建模方法,气象领域也不例外。为解决非平稳时间序列的天气预测中的多重共线性问题,探索空间相关关系,文中应用图信号方法,以条件高斯图模型,学习出华东地区21个测站之间可解释的降水量空间相关关系和气温相关性,在此基础上用联合条件高斯图模型,联合预测各站未来24小时的降水量和平均气温,与其他未考虑空间相关性和输出变量相关性的预测模型相比,预测准确率有所提升。因为所用数据为易获取的国际交换站地面观测数据,模型简单而高效,经准确率验证,该方法可在天气预报业务中推广应用。关键词:概率图模型;条件高斯图模型;联合条件高斯图模型;空间相关性;天气预测中图分类号:TP399摇摇摇摇摇摇文献标识码:A摇摇摇摇摇摇文章编号:1673-629X(2019)07-0103-05doi:10.3969/j.issn.1673-629X.2019.07.021

ResearchonWeatherPredictionBasedonProbabilityGraphModel

LIULi-dan(SchoolofComputerScienceandTechnology,NanjingUniversityofPostsandTelecommunications,Nanjing210018,China)

Abstract:Weatherforecastingiscloselyrelatedtonationaleconomyandpeople爷slivelihood.Fromthetraditionalforecasttothenumericalforecast,withthedevelopmentofscienceandtechnology,especiallytheimprovementofcomputingpower,theaccuracyofweatherforecastinghasbeengreatlyimproved,butitisstilllimitedbythecognitionofthelawofatmosphericchange.Data-drivenweatherforecastingmethodsemergeinendlesslyinordertohelppeoplefindmoreweatherpatternsandimprovetheaccuracyofforecasting.Machinelearninghasalwaysbeenapopularmodelingmethodinallfields,andthemeteorologicalfieldisnoexception.Inordertosolvetheproblemofmulti-collinearityandexplorethespatialcorrelationinweatherpredictionofnon-stationarytimeseries,theconditionalGaussiangraphmodelisusedtostudythespatialcorrelationandtemperaturecorrelationbetween21stationsinEastChina.Onthisbasis,thejointconditionalGaussiangraphmodelisusedtopredictprecipitationandmeantemperatureinthenext24hourscombined.Comparedwithotherpredictionmodelswhichdonotconsiderspatialcorrelationandoutputvariablecorrelation,theaccuracyofcombinedpredictionhasimproved.Becausethedatausedarethegroundobservationdataoftheinternationalswitchingstation,whichiseasytoobtain,themodelissimpleandefficient,accordingtotheaccuracyverification,thismethodcanbepopularizedandappliedintheweatherforecastingbusiness.Keywords:probabilitygraphmodel;conditionalGaussiangraphmodel;jointconditionalGaussiangraphmodel;spatialcorrelation;weatherprediction

0摇引摇言天气变化与人们的生活有着十分密切的关系,人们总是想方设法去预测未来的天气变化,以期能够利用有利天气,防范不利天气。传统的天气预测方法主要有天气学方法、动力学方法和统计学方法。到20世纪50年代,数值预报的出现使天气预测有了革命性的变化,是大气科学发展的一个里程碑,也是近代大气科学成为一门精细和定量化科学的标志[1],直到现在仍

第29卷摇第7期2019年7月摇摇摇摇摇摇摇摇摇摇计算机技术与发展COMPUTERTECHNOLOGYANDDEVELOPMENT摇摇摇摇摇摇摇摇摇摇Vol.29摇No.7July摇2019是天气预报的核心。但是数值模型并不能完全模拟大气运动,对于很多天气现象的发生、演变的内在机理和规律,人们尚未完全掌握,提高天气预报的准确率,仍是一个世界性难题。目前,随着人工智能和机器学习的蓬勃发展,天气预测也迎来了新的发展机遇。一方面,机器学习方法可以用于解决数值预报分辨率低的问题,通过降尺度方法,提高预测精度。自20世纪90年代统计降尺度方法发展以来,以人工神经网络和支持向量机为代表的各种机器学习方法被应用于统计降尺度研究。1997年,Cavasos用人工神经网络降尺度预测墨西哥东北部20个站的冬季日降水[2];2006年,Tripathi等将基于支持向量机的统计降尺度模型用于研究印度月降水[3];2016年,Santri等用基于最小绝对值收缩和选择算子(Lasso[4])的分位数回归建立统计降尺度模型[5],用于预测印度尼西亚单个站点的极端降水;周璞等用自组织映射神经网络(SOM)降尺度方法对江淮流域逐日降水量进行了模拟评估[6]。这些方法都取得了较好的效果,但是,此类方法依赖原始天气模型输出产品,准确率依然受限于对天气规律的模拟程度。另一方面,由数据驱动的机器学习方法可能帮助人们认识到更多的天气规律,它不依赖任何物理模型,能够从历史观测数据中寻找天气演变规律,进而做出预测。预测未来时间空间的气象要素值,是属于非平稳时间序列的预测问题。非平稳时间序列的预测,可以采用参数方法或非参数方法,参数方法有自回归(AR)、神经网络(NN)、支持向量回归(SVR)和隐马尔可夫模型(HMM)等,非参数方法有近邻(neighborhood)和局部拓扑(localtopology)模型、非参数贝叶斯模型和函数分解等[7]。由于用于预测的自变量之间存在相关性,天气预测还要解决多重共线性的问题,适合的方法有Lasso回归、Ridge回归[8]和SVR[9]等。将这些方法用于单站天气预测,国内外研究已有很多,但关于区域多站点空间相关性的研究并不多,大气作为一个连续的系统,各站点间是有一定联系的,如果进行多站点联合预测,加入协变量相关性的考量,理论上应该能够提高预测准确率。李艳玲等用空间自回归模型预测新疆地区气温与降水量[10],对新疆地区各个测站气温和降水量之间的空间关系进行了研究,研究表明相邻地区气温和降水量的分布在空间上具有较强的相关性,但是其中的空间相关矩阵是人为设定的。在概率图模型研究领域,一些方法已经被证实可以应用于天气预测。WytockM等给出了条件高斯图模型的一种估计方法,可以学习出随机变量间的相关关系[11],最近,Huang等提出了一种基于联合条件图套索(JCGL)的联合条件高斯图模型[12],能够学习异构协变量的条件相关性,同时预测不同地域的不同气象变量。文中主要尝试使用易获取的国际交换站地面观测数据,应用条件高斯图模型,学习出可以从天气学角度解释的区域多站点降水量和平均气温的空间相关关系,并检验联合条件高斯图模型联合预测多站点降水量和气温在实际应用中的准确率和稳定性。

1摇相关工作概率图模型可以简洁地刻画出复杂分布的结构,具有表示、推理和学习的能力[13],现已被广泛应用于

机器学习、计算机视觉、自然语言处理、语音识别、专家系统、用户推荐、社交网络挖掘、生物信息学等研究领域的最新成果中[14-15]。它以图为表示工具,最常见的

是用一个节点表示一个或一组随机变量,节点之间的边表示变量间的概率相关关系,即“变量关系图冶。根据边的性质不同,概率图模型可大致分为两类:一类是使用有向无环图表示变量间的依赖关系,称为有向图模型或贝叶斯网,另一类是使用无向图表示变量间的相关关系,称为无向图模型或马尔可夫网[16]。无向图

中的高斯图模型,虽带有强假设,但在数学上易于处理,而且根据中心极限定理,可以较好地近似实际连续分布[17]。

1.1摇高斯图模型

假设p维随机向量Y=(Y(1),Y(2),…,Y(p))服从

多元正态分布N(滋,撞),给定一个随机样本Y(1),Y(2),…,Y(n),希望估计出精度矩阵C=撞-1,C中元素Cij=0表示Y(i)与Y(j)在给定其他所有变量的条件下

相互独立,可表示为Y(i)彝Y(j)Y

S\i,j

高斯图模型中,随机向量Y由图G=(V,E)表示,其中V为图的节点集,包含p个节点,E为图中节点之间的边集,E=(ei,j)1臆i条件独立关系,Y(i)与Y(j)之间没有边就表示它们是条件独立的。1.2摇条件高斯图模型

相关文档
最新文档