正态逆高斯扩散模型的MCMC估计

正态逆高斯扩散模型的MCMC估计
正态逆高斯扩散模型的MCMC估计

 第15卷第2期 2006年4月

系统工程理论方法应用

SY ST EM S EN GI NEER IN G-T HEO RY M ET HO DO LO G Y A PP L ICA T IO N S

Vol.15No.2 Apr.2006 

文章编号:1005-2542(2006)02-0133-06

正态逆高斯扩散模型的MCMC 估计

胡素华, 张 彤, 张世英

(天津大学管理学院,天津300072)

【摘要】使用贝叶斯方法估计了正态逆高斯扩散模型,该方法首先使用Euler 方法对连续过程进行离散化,用离散过程的似然函数做为模型参数的近似似然函数。证明了MCM C 方法是分析正态逆高斯扩散模型的有效工具,由M CMC 方法抽样所得的后验分布可以用来进行统计推断。模拟试验表明:正态逆高斯扩散能够体现资产收益的许多经验特征,如泰勒效应、尖峰厚尾等。

关键词:MCM C;正态逆高斯扩散;广义抛物线扩散;贝叶斯方法中图分类号:F 830.91 文献标识码:A

Estimation of Normal Inverse Gaussian Diffusion

Using MCMC Method

H U Su -hua , ZH A N G T ong , ZH A N G Shi -ying

(Scho ol o f Management,T ianjin Univ.,Tianjin 300072,China)

【Abstract 】In this paper w e propose a Bay esian method to estimate the normal inverse Gaussian (NIG )dif-fusion model .T he approach is based o n the Markov chain M onte Carlo (M CMC )m ethod w ith the likeli-ho od of the discredited pro cess as the appr oxim ate posterio r likeliho od.We demo nstrate that the M CM C metho d provides a useful too l in analyzing NIG diffusion.In particular,quantities of posterior distribu-tio ns obtained fro m the M CMC outputs can be used for statistical inference .T he MCM C m ethod is based on Euler schem e.Our simulation study show s that the NIG diffusio n exhibits many of the stylized facts abo ut asset retur ns docum ented in the discrete-time financial eco nom etrics literature,such as the Taylor effect ,a slo wly declining autocorrelation function of the squar ed retur ns ,and thick tails .

Key words :M ar ko v chain M onte Car lo ;normal inv er se Gaussian diffusion ;generalized hy perbolic diffu-sion;Bayes metho d

收稿日期:2004-11-05

基多项目:国家自然科学基金资助项目(70301006)

作者简介:胡素华(1977-),男,博士生。主要从事连续时间金融

模型研究与金融波动研究。

在金融学文献中,几何布朗运动被用来描述股票价格运动,虽然在期权定价和其他理论中具有重要的作用,但是几何布朗运动不能很好地描述股票收益的经验统计特征,如高峰、波动集聚和长记忆性。为了反映这些特征,有跳跃扩散模型、随机波动模型、随机波动加跳跃模型以及时变列维过程。作为非线性扩散过程,Bibby 和S rensen [1]的抛物线扩

散过程也得到了重视,NIG (正态逆高斯)扩散过程和抛物线扩散过程都是GH(广义抛物线)扩散过程

的特殊情况,Ry dberg [2]用NIG 扩散过程作为金融数据建模,在用NIG 模型拟合一些股票数据上取得了良好的效果,并将NIG 扩散模型运用到期权定价中。但是,目前国内使用非线性连续时间扩散过程为资产收益建模的研究还处在一个起步阶段,关于这方面的研究成果还不多。

虽然NIG 扩散过程的稳定分布服从抛物线分布并有封闭形式表达式,但是转移密度没有封闭形式的解。由于缺少转移密度的知识,使用准确似然方法进行模型的计量经济估计是不可行的。Ry dber g

采用鞅估计函数方程方法来估计NIG扩散过程,然而基于鞅函数估计方程的估计值存在且是非对称正态分布,同时估计值不是有效的;另外,估计值的标准差的计算非常复杂。

本文通过将扩散过程的离散似然作为近似后验,使用MCM C方法来估计抛物线扩散过程;与在经典框架中的M L方法一样,MCM C方法提供了一个基于贝叶斯分析的全似然推断。在抛物线扩散,离散化近似ML方法在数值收敛方面存在困难,然而,MCM C方法提供了从后验分布中抽取参数样本的方法避免了数值优化的问题,并使借助蒙特卡罗方法的准确有限样本的推断可行。

1 NIG模型

NIG分布和抛物线分布都是广义抛物线分布的两种特例,NIG扩散过程较抛物线扩散过程具有更厚的尾部,从而更有利于描述股票价格,为其建模[3]。

假定股票价格满足:

S t=ex p( t+X t)(1)式中: 为股票价格对数随时间变化系数;S t为股票价格;X t为股票价格对数除趋势项后的状态变量,

X t=X0+∫t0v(X s)d W s(2)通过伊藤公式,有

d S t=S t +1

2

v2(log S t- t)d t+

v(log S t+ t)d W t(3)

注意到,如果函数v(?)是一个常数,关于S t的模型是一个在B-S公式中使用的几何布朗运动。过程X t 是一个时变维纳过程,这样式(3)就是一个简单的B-S模型广义形式。关于lo g S t的漂移项是一个时间的线性函数 t的假定不是必须的,做这样的假定是为了简单和尽可能的不改变几何布朗运动模型。在本文中,要讨论的就是当log S t有一个确定性漂移时的情况。

通过选择合适的v(x)可以得到几个有趣的模型,但是在此仅仅考虑一个特殊而常见的情况,并推广到一般情况。经验研究表明,股票收益log S t+ -log S t的分布不是正态的,分布的尾部趋向于对数线性。若选择式(4)形式,就是Bibby和S rensen的抛物线扩散过程:

v(t)= ex p 1

2

2+(x- )2-1

2

(x- )

(4)

本文中,选择v(x)满足:

v(x)= exp-1

2

(x- )g (x- )

K1( g (x- ))

(5)

式中:g (x)= 2+x2; , , , 是分布参数,满足

> ≥0, >0。 是标度参数, 是位置参数, 决

定对称性, 决定分布的倾斜度。

用MCM C方法估计NIG模型时,首先总结在

众多金融文献中关于资产收益序列的经验特征,定

义r t为股票收益,Ry den[4]总结了r t的下列动态性

质:

(1)r t是不相关的;

(2) r t ,r2t的自相关函数缓慢衰减,衰减的速

度较稳定ARM A自相关函数要慢的多;

(3)收益绝对值的自相关在幂=1时最大,这

就是泰勒效应,即

corr( r t , r t-k )>co rr( r t , r t-k ) ≠1

(4)收益常常表现出厚尾的边际分布特征。

2 NIG扩散过程的离散化

使用广泛应用的Euler方法对广义扩散过程

d X t= (?)d t+ (?)近似,其表达式为:

X t+ t=X t+ (X t, ) t+ (X t, ) W t(6)

式中, W t= t t, t~iid N(0,1),给定X t的观测

值集合X={x t∶t=0,1,…,n},则参数 基于观测

值集合的对数似然函数为

log p E( X)=-

1

2

∑n

t=1

lo g( (x t, )2 t)-

1

2

∑n

t=1

(x t-x t-1- (x t, ) t)2

(x t, )2 t(7)

式中,p E( X)是基于Euler离散方法的似然函数。

3 借助MCMC方法估计NIG扩散

3.1 MCMC方法

M CM C方法已经成功应用到统计学中,且相对

于传统的独立取样方法具有很多优势,Gew eke[5]提

出了使用后验模拟方法完成贝叶斯推断,并强调了

基于贝叶斯推断的MCM C模拟的重要性。Gilks[6]

总结了M CM C算法的应用。M CM C方法在计量经

济学和金融学中的广泛应用可以参见文献[7~9]。

基于数据集合X参数向量 的贝叶斯推断后

验可以借助后验密度p( X)得到,通过贝叶斯原

理,有

( X)=cp( X) ( )(8)

134 系 统 工 程 理 论 方 法 应 用第15卷 

式中:c是标准化常数;p(X )是以 为条件的似然函数; ( )是 的先验密度。贝叶斯方法要求统计推断必须是基于参数的后验分布,然而直接处理后验是很困难的。但是,如果可从后验分布抽取参数向量的样本,关于参数向量的统计推断就可以使用一般的蒙特卡罗方法实现。MCM C方法的目的就是提供一种从参数后验分布中抽取样本的一种机制。由于从后验中直接取样是很困难的,从而可以用M CM C 方法建立马尔可夫链,使它的稳定分布和后验分布相同,当马尔可夫链收敛时,模拟值可以看作是从后验分布中抽取的样本。

关于MCM C方法有Gibbs取样和M H算法二类。本文采用M H算法,需要注意的是: 接受概率的计算不需要后验函数中正规化常量的知识; 建议密度的选择。

M H算法从建议密度q(? )生成备选 ′,该建议密度必须满足一定的性质[10]。备选 ′以概率T( , ′)被接受,而接受概率[10]为

T( , ′)=m in1, ( ′ x)q( ′)

( x)q( ′ )(9)

算法如下:

(1)给定现在状态 (i),从建议密度q(? (i))生成备选值 ′;

(2)按照式(9)计算接受概率T( (i), ′);

(3)以概率T( (i), ′)接受备选值,即 (i+1)= ′;反之,拒绝备选值,即 (i+1)= (i);

(4)重复前面的步骤,获得{ (0), (1),…},剔除前面的d个值,则{ (d+1), (d+2),…}都具有相同的后验密度 ( X)。

3.2 经验结果

假定参数的联合先验信息是 ( ),基于Euler 似然函数为p E( X),则联合后验为 ( X)∝ ( )p E( X)。在随机游走M H算法中,建议密度是在[-0.5,0.5]上的均匀分布,参数向量 按照下面的方法更新:

′= + (10)式中: 是在区间上[-0.5,0.5]生成的随机数; 是调和参数,因此, 的选择应使参数 ′被接受的概率在20%~30%。一般来说,如果参数之间是弱相关的, 就可以是一个常数;否则, 应是一个常向量。

3.3 参数模拟的收敛性分析

在M CM C算法中,取样的样本路线为{ (i)∶i=1,2,…,N},并且输出的遍历均值有下列形式:

f-N=N

11)

式中,函数f(?)是一个实值函数,遍历均值的中心

极限定理有:

N(f-N-E (f( )))D→N(0, 2f)(12)

E (?)是关于分布 ( X)的期望算子,为讨论

E (f( ))做为遍历均值估计的准确性,必须估计

2f。估计 2f最普遍的方法就是由Roberts[11]提出的

块均值。

为了使用块均值估计 2f,M CM C算法运行N=

m×n,这里n足够大,取:

y k=

1

n

∑kn

i=(k-1)n+1

f( (i))(13)

对于k=1,2,…,m,y k近似于独立同分布

N E (f( )), 2f/n,这样 2f的估计值为

⌒2f=n

m-1

∑m

k=1

(y k-f-N)2(14)

同时,f-N的标准误差可以用 ⌒2f/N来估计,该标准

误差也成为参数估计值的蒙特卡罗标准误差

(MCSE)。另外还要计算所有样本的标准离差:

~f=1

N-1

∑N

i=1

[f( (i))-f-N]2(15)

Kim[12]提出了可以用模拟无效因子(SIF)来评

价抽样样本的模拟效果,M eyer和Yu[13]给出了SIF

的计算公式:

SIF= ⌒2f/ ~2f(16)

4 实证研究

4.1 参数的估计结果

使用M CMC方法来估计NIG扩散模型,数据

分别采用上海和深圳股市的周综合指数,即从

1992-05-03~2004-04-30共12年的上海和深圳股

市周综合指数。

参数先验分布利用文献[3,9]中介绍的先验分

布,各个参数的先验分别假定为: ~N(0,10), ~

(1,20), 2~ (0.05,20), ~N(5,10), ~

U(- , ), 2~I G(5,0.05)。

按照随机游走MH算法对NIG扩散模型进行

参数估计,每个参数共产生60000个样本,剔除前

面的10000个模拟样本,记录的模拟样本为后面的

50000个。其中,上海综指参数的样本曲线见图1,

上海和深圳综合指数的参数估计结果为表1所示。

表1总结了各个参数的遍历平均(M ean)、标准

离差(SD)、95%的贝叶斯置信区间(CI)、蒙特卡罗

标准误差(M CSE)和SIF;贝叶斯置信区间说明了

各参数估计的有效性。

135

 第2期胡素华,等:正态逆高斯扩散模型的M CMC估计

图1 上海股市综指参数的样本曲线

表1 Euler方法下NIG扩散模型的MCMC结果

参数均值置信区间S D M CS E SIF AC

上海 -0.00327855 -0.0032807,-0.0032764 1.08752E-006 5.21409E-005 94.9950.20 0.2064440.202463,0.2104260.002031480.0032385298.1360.25 20.2558330.251503,0.2601630.002209170.0023284592.7090.23 7.851327.82939,7.873260.01119240.0057937789.9580.21 0.1076260.096752,0.11850.005548020.0026051761.16540.29 20.00195060.0019503,0.0019509 1.42622E-007 2.22522E-00593.5910.22

深圳 -0.00223947 -0.0022419,-0.002237 1.24242E-006 6.94479E-005 104.0970.24 0.08841630.0872825,0.08955010.0005784780.00196124102.4650.24 20.3049530.299149,0.3107560.002960960.0029884100.8050.24 8.63038.58676,8.673850.02221640.010*******.6450.24 -0.006615-0.0119509,-0.00127910.002722450.0011906926.03790.27 20.002117920.0021176,0.0021183 1.86513E-007 3.18588E-005102.0940.22

对于每个参数样本集合,MCSE可以通过式(11)~(14)来计算,SIF则通过式(15)和(16)计算,其中,选择:f(x)=x,块的个数m=50,在每块中样本数量n=1000。

从表1可以看出,各个参数的估计值都是显著不为0。注意到对称参数 ,上海股市综指的 为正,

136 系 统 工 程 理 论 方 法 应 用第15卷 

即收益分布向右倾斜,而深圳股市综指的 为负,从而说明了资产收益分布的有偏性这一经验特征。另外,对于倾斜度参数 而言,上海股市综指为0.206444较深圳股市综指0.088高,这说明上海股市综指和深圳股市综指的收益分布都不同程度的存在尖峰厚尾的特征,但是,上海股市的尖峰厚尾特征更为明显。所以,NIG模型很好的揭示了收益分布的尖峰厚尾、弱对称的经验特征。4.2 先验分布的鲁棒性检查

为检查先验分布对参数估计结果的鲁棒性,从两个方面来改变参数先验分布。 假定参数的先验分布就是3.2节中的形式,但是改变先验分布的参数,结果与原来非常相似。 用均匀分布代替3.2节中的参数先验分布,采用上面使用的M CMC估计方法,得到的结果见表2。

表2 参数先验分布为均匀分布的NIG扩散模型的MCMC结果

参数均值置信区间S D M CS E SIF AC

上海股市综合指数 -0.00347855 -0.0034807,-0.0034764 1.06752E-006 5.41409E-005 124.9950.21 0.2164440.212463,0.2204260.002331480.00353852158.1360.24 20.2358330.231503,0.2401630.002309170.00242845122.7090.22 7.951327.92939,7.973260.01019240.00589377149.9580.22 0.0976260.086752,0.10850.005348020.0036051761.16540.27 20.00205060.0020503,0.0020509 1.22622E-007 2.42522E-005143.5910.23

深圳股市综合指数 -0.00243947 -0.0024419,-0.002437 1.25242E-006 7.04479E-005 164.0970.23 0.09041630.0892825,0.09055010.0005684780.00206124132.4650.25 20.3149530.309149,0.3207560.003060960.0030884145.8050.21 8.73038.68676,8.773850.02421640.0110352156.6450.23 -0.008615-0.0139509,-0.00427910.002622450.0014906946.03790.26 20.003117920.0031176,0.0031183 1.76513E-007 3.2588E-005172.0940.23

通过与表1的结果相比较发现。参数的遍历均值与置信区间没有明显的差异,即参数的估计值不会随参数先验分布的改变而发生明显的变化。这也就说明参数的后验分布不会随着参数的先验分布发生变化。

5 NIG扩散模型的经验特征

Ry dber g介绍了 r t ,r2t的自相关函数缓慢衰减,衰减的速度较稳定A RM A自相关函数要慢的多,在此,本文将更详细的介绍NIG扩散模型的更多统计特征。

为了证明NIG扩散的后验特征,利用上述上海股市综合指数中所获得的参数样本,形成1000组参数的样本向量(50个样本为一组,每个参数共50000个样本),使用每组样本向量模拟获得2000个收益序列,计算每个收益序列的偏度和峰度以及自相关系数。表3列示了偏度、峰度和自相关系数的均值,最后一行说明了峰度>3、偏度<0等的比例, r 的自相关系数为最大的概率。

从表3可以看出,运用NIG扩散模型模拟出的资产收益序列的峰度均值为18.53、且峰度>3的概表3 NIG扩散模型的统计特征

峰度偏度

r , r 1.5,r2的自相关系数

滞后100滞后200滞后300

均值

18.530.0820.145/0.113

/0.082

0.095/0.073

/0.052

0.065/0.043

/0.028

概率0.9980.5130.6920.6850.654

率为0.998,这很好地体现了分布的高峰厚尾的特征。模拟的资产收益序列偏度系数为0.082,说明收益具有较弱的非对称性。另外,从收益的自相关系数来看, r 具有微弱而持续的自相关性;同时,收益的绝对值在幂=1时,自相关系数最大(幂=1时最大的概率都在65%以上),故通过NIG扩散模型模拟出来的收益序列体现了泰勒效应。

综上,通过NIG扩散模型的模拟实验,发现NIG扩散模型很好地体现了第1节中提及的有关资产收益序列的经验特征:尖峰厚尾、收益的持续弱自相关性以及泰勒效应等经验特征。另外,NIG扩散模型除了可以用来为资产价格建模,还可以为研究期权定价、利率的期限结构以及其他衍生资产定价提供方便。

137

 第2期胡素华,等:正态逆高斯扩散模型的M CMC估计

6 结 语

本文基于用Euler方法获得参数后验分布的离散密度,使用M CM C方法来估计NIG扩散。相对于其他估计方法,如M L估计,可以发现MCM C方法可以提供更好的经验结果。除了说明M CM C方法是估计NIG扩散和进行统计推断的有效工具外,还说明了NIG扩散可以体现资产收益的不相关性和泰勒效应以及收益分布的尖峰厚尾、弱有偏等。

参考文献:

[1] Bibby B M,S r ensen M,A hy perbolic diffusio n

model fo r sto ck pr ices[J].F inance and Stochastic,

1997(1):25-41.

[2] Ry dberg T H.G ener alized hyperbo lic diffusion pr o-

cesses with applicatio ns in fianc [J].M athemat ical

Finance,1999,9(2):183-201.

[3] Ry dberg T H.T he nor mal inver se Gaussian levy

pr ocess:Simulat ion and appr ox imatio n[J].Co mmo

Stat:Stoch M o dels,1997,13:887-910.

[4] Ry den T,T era sv erta T,Asbr ink S.Sty lized fact s of

daily retur n series and the Hidden M arko v model[J].

J A ppl Econo metrics,1998,13:217-44.

[5] Gew eke J.1999U sing simulat ion met ho ds fo r

Bay esian eco no metr ic models:Infer ence,develo p-

ment,and com municat ion[J].Economet ric R ev,

1999,18:1-73.[6] G ilks W R.R ichardson S,Spiegelhatler D J.I nt ro-

ducing M ar kov chain M onte Car lo in P ractice[M].

G ilks W R,Richar dson S,Spieg elha lter D J,eds.

L o ndon:Chapman and Hall,1996:45-57.

[7] Er aker B.M CM C analysis of diffusion models w ith

applicat ion t o finance[J].J Business Eco no mic

Sta tistics,2001,19:177-91.

[8] Elerian O,Chib S,Shephar d N.L ikeliho od infer-

ence for discret ely o bser ved no n-linear diffusions[J].

Econo metr ica,2001,69:959-93.

[9] T se Y K,Zhang X ibin,Y u Jun.Estimatio n o f hy-

perbo lic diffusion using the M arko v cha in M onte

Car lo method[J].Quantit ativ e F inance,2003,3:1-

12.

[10] Chibs S,G r eenber g E.U nder standing the M et ro po-

lis-Hasting s algo rithm[J].A m Statistician,1995,

49:327-35.

[11] R obert s G O,M arko v chain co ncepts related t o sam-

pling algo rithms M arko v Chain M onte Car lo in Pr ac-

tice[M].G ilks W R,Richar dso n S,Spieg elhalter D

J,eds.L o ndon:Chapman and Hall,1996:45-57.

[12] K im S,Shephard N,Chibs.St ochastic vo lat ility:

L ikeliho od inference and compar ison w ith A RCH

mo dels[J].Rev Eco n Stud,1998,65:361-93. [13] M eyer R,Y u J.BU G S for a Bay esian analysis of

sto chastic vo lat ility models[J].Eco nometr ics J,

2000,3:198-215.

(上接第132页)

6 结 语

本文将DEA评价方法应用于物流园区投资规模规划的评价中,结果表明,DEA评价方法能做到对所有被评价物流园区规划方案的充分评价,且能提出进一步的目标改进措施,为规划决策者进行规划和决策提供了更加全面的信息。因此,通过应用DEA方法评价,能够显著地改善目前物流园区规划的质量。

参考文献:

[1] 李旭宏,毛海军.开发区专业物流园区规划[J].交通运

输工程学报,2002,2(3):81-84.

[2] 王战权,杨东援.物流园区规划初探[J].系统工程,

2001,19(1):79-83.

[3] Char nes A,Coo per W W,Rhodes E.M easuring t he

efficiency of decision-making units[J].Eur opean Jour na l o f Operat ional Resear ch,1978,2(4):429-444.

[4] Charnes A,Coo per W W,L ewin A Y,et al.Data en-

velopment analysis[M].Bo st on,Dor dr echt,Lo n-do n:K luw er A cadem ic Publisher,1994.

[5] Wei Q L,Sun D B,Xiao Z J.M easuring technical

pr o gr ess with data env elo pment analy sis[J].Euro-pean Jo ur nal o f Oper atio nal Resear ch,1995,80(3):

691-702.

[6] 魏权龄.评价相对有效性的DEA方法[M].北京:中国

人民大学出版社,1988.

[7] 同济大学.南京现代物流产业发展规划研究[R].

2002.

[8] 吴文江,用数据包络分析进行规模收益分析的探讨

[J],系统工程理论方法应用,2000,9(3):248-251. [9] 东南大学交通学院.连云港市现代物流业发展规划

[R],2003.

138 系 统 工 程 理 论 方 法 应 用第15卷 

2011数学建模A题优秀论文

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

基于系统综合评价的城市表层土壤重金属污染分析 摘要 本文针对城市表层土壤重金属污染问题,首先对各重金属元素进行分析,然后对各种重金属元素的基本数据进行统计分析及无量纲化处理,再对各金属元素进行相关性分析,最后针对各个问题建立模型并求解。 针对问题一,我们首先利用EXCEL 和 SPSS 统计软件对各金属元素的数据进行处理,再利用Matlab 软件绘制出该城区内8种重金属元素的空间分布图最后通过内梅罗污染 模型:2 /12 max 22?? ? ? ??+=P P P 平均综,其中平均P 为所有单项污染指数的平均值,max P 为土壤环境中 针对问题二,我们首先利用EXCELL 软件画出8种元素在各个区内相对含量的柱状图,由图可以明显地看出各个区内各种元素的污染情况,然后再根据重金属元素污染来源及传播特征进行分析,可以得出工业区及生活区重金属的堆积和迁移是造成污染的主要原因,Cu 、Hg 、Zn 主要在工业区和交通区如公路、铁路等交通设施的两侧富集,随时间的推移,工业区、交通区的土壤重金属具有很强的叠加性,受人类活动的影响较大。同时城市人口密度,土地利用率,机动车密度也是造成重金属污染的原因。 针对问题三,我们从两个方面考虑建模即以点为传染源和以线为传染源。针对以点为传染源我们建立了两个模型:无约束优化模型()[]()[]() 22y i y x i x m D -+-=,得到污染源的位置坐标()6782,5567;有衰减的扩散过程模型得位置坐标(8500,5500),模型为: u k z u c y u b x u a h u 222 2222222-??+??+??=??, 针对以线为传染源我们建立了l c be u Y ?-+=0模型,并通过线性拟合分析线性污染源的位置。 针对问题四,我们在已有信息的基础上,还应收集不同时间内的样点对应的浓度以及各污染源重金属的产生率。根据高斯浓度模型建立高斯修正模型,得到浓度关于时间和空间的表达式ut e C C -?=0。 在本题求解过程中,我们所建立的模型与实际紧密联系,有很好的通用性和推广性。但在求点污染源时,我们假设只有一个污染源,而实际上可能有多个点污染源,从而使得误差增大,或者使污染源的位置够不准确。 关键词 内梅罗污染模型 无量纲化 相关性 回归模型 高斯浓度模型

改进高斯过程回归算法及其应用研究

改进高斯过程回归算法及其应用研究 在工业生产过程中,由于受到工艺、检测技术以及工况等条件限制,一些重要变量常常无法直接检测,这严重制约了自动控制技术的普及与应用,软测量技术因此应运而生。软测量技术最重要的一步就是软测量建模,近几年各种软测量建模方法不断涌现,其中高斯过程回归方法(Gaussian process regression,GPR)凭借其在处理小样本、复杂度较高的工业数据上的优势,被越来越多的学者关注。然而作为传统的软测量建模算法,高斯过程回归存在核函数单一、计算量较大、对初值敏感等问题,本文将针对这些问题开展改进研究。本文的研究得到了浙江省自然科学基金的资助,主要的研究内容和成果总结如下:(1)高斯过程回归结构以及参数优化研究。 针对延迟焦化过程数据具有非线性、时变性和较强的复杂性等特点,提出一种基于万有引力搜索优化的组合核函数高斯过程回归算法。该算法具有两大特点:1)用组合核函数代替传统的单一核函数,相较于单一核函数,选择组合核函数能够更大可能地保留数据特征信息,使得映射关系更加符合数据分布,同时组合核函数的引入在结构上保证了算法具有更好的泛化能力;2)引入万有引力搜索算法寻找每一个核函数的最优超参数,克服共轭梯度法对初值依赖性强、迭代次数不确定等缺点。(2)高斯过程回归集成算法研究。针对工业现场工况复杂,不同的工况下数据特征间的相关性可能会不同等问题,提出一种基于K-means聚类的集成自适应高斯过程回归算法。 首先利用K-means聚类算法将工业数据集划分成三个簇,然后利用自适应算法自适应地为每个簇选出最优核函数并建立最优局部模型。预测阶段,选用贝叶斯后验概率的融合方式对每个子模型赋予权重,从而对每个局部模型进行加权集成,得到预测结果。(3)改进高斯过程回归算法的应用研究。将所提两种算法应用于某延迟焦化系统开工线温度预测中,建立开工线温度预测模型,并与传统GPR 算法、基于粒子群寻优的GPR(PSO-GPR)、基于遗传算法寻优的GPR(GA-GPR)、基于万有引力寻优的SVR(GSA-SVR)以及基于均值融和方式的K-means自适应高斯过程回归集成算法进行对比,结果表明本文提出的算法具有最高的预测精度、最强的稳定性,同时也证明了所提算法在延迟焦化系统中的实用性、有效性。 (4)延迟焦化温度预测系统软件开发与应用。基于本文所提两种算法的基础

高斯扩散模型.

大气污染扩散 第一节大气结构与气象 有效地防止大气污染的途径,除了采用除尘及废气净化装置等各种工程技术手段外,还需充分利用大气的湍流混合作用对污染物的扩散稀释能力,即大气的自净能力。污染物从污染源排放到大气中的扩散过程及其危害程度,主要决定于气象因素,此外还与污染物的特征和排放特性,以及排放区的地形地貌状况有关。下面简要介绍大气结构以及气象条件的一些基本概念。 一、大气的结构 气象学中的大气是指地球引力作用下包围地球的空气层,其最外层的界限难以确定。通常把自地面至1200 km左右范围内的空气层称做大气圈或大气层,而空气总质量的98.2%集中在距离地球表面30 km以下。超过1200 km的范围,由于空气极其稀薄,一般视为宇宙空间。 自然状态的大气由多种气体的混合物、水蒸气和悬浮微粒组成。其中,纯净干空气中的氧气、氮气和氩气三种主要成分的总和占空气体积的99.97%,它们之间的比例从地面直到90km高空基本不变,为大气的恒定的组分;二氧化碳由于燃料燃烧和动物的呼吸,陆地的含量比海上多,臭氧主要集中在55~60km高空,水蒸气含量在4%以下,在极地或沙漠区的体积分数接近于零,这些为大气的可变的组分;而来源于人类社会生产和火山爆发、森林火灾、海啸、地震等暂时性的灾害排放的煤烟、粉尘、氯化氢、硫化氢、硫氧化物、氮氧化物、碳氧化物为大气的不定的组分。 大气的结构是指垂直(即竖直)方向上大气的 密度、温度及其组成的分布状况。根据大气温度在 垂直方向上的分布规律,可将大气划分为四层:对 流层、平流层、中间层和暖层,如图5-1所示。 1. 对流层 对流层是大气圈最靠近地面的一层,集中了大 气质量的75%和几乎全部的水蒸气、微尘杂质。受 太阳辐射与大气环流的影响,对流层中空气的湍流 运动和垂直方向混合比较强烈,主要的天气现象云 雨风雪等都发生在这一层,有可能形成污染物易于 扩散的气象条件,也可能生成对环境产生有危害的 逆温气象条件。因此,该层对大气污染物的扩散、输送和转化影响最大。 大气对流层的厚度不恒定,随地球纬度增高而降低,且与季节的变化有关,赤道附近约

数学建模(关于扩散问题的建模)

关于金属汞扩散的问题 引言: 我们都知道,重金属丢弃到土地后会严重污染环境,同时对人体健康造成危害。著名的秦始皇陵墓,据专家在陵墓周围取数据观测,周围的汞含量呈现出外渗的趋势。也就是说,随着外围半径的扩大,汞含量浓度递减,并且随着时间的增加,汞渗透的半径越来越大。这就证明了汞金属在泥土中会发生扩散。因此,我们就提出,能否通过在外部取样的观察数据,建立一个数学模型,来判断陵墓中心处汞的浓度呢? 模型的提出: 由于汞的扩散快慢跟本身的化学性质,物理性质有关。还有,由于在土堆里头,在各个方向上受到的力不相同和各种因素的影响,因此扩散的速度也会有差异。例如东西方向和南北方向会因为地球的自传而扩散速度会不一样。另一方面,汞在扩散的过程,由于泥土的吸收,化学反应等因数的影响,也会影响到汞的扩散。 为此我们引入一个函数u(x, y, z, t),它表示t时刻在(x,y,z)处汞的浓度。我们的目标就是利用所观测到的数据,来推断出这个函数的表达式。 模型符号的引入: 为了表示汞在想x,y,z 方向上的扩散速度,我们在此引

入扩散系数: 2 a :x 方向上的扩散系数 2 b :y 方向上的扩散系数 2 c :z 方向上的扩散系数 2 k :由于泥土吸收,化学反应而引起的衰减系数 M :扩散源汞的质量 模型假设: 1。假设有一汞扩散源,汞从扩散源沿 x ,y ,z 三个方向向四周扩散。 2。扩散前周围空间此物质的浓度为零。 3。扩散过程中没有人为因素的影响。 模型建立: u(x, y, z, t) 是 t 时刻点 (x, y , z) 处某物质的浓度。任取一个闭曲面 S ,它所围的区域是Ω,由于扩散,从 t 到 t t +? 时刻这段时间内,通过 S 流入Ω的质量为 1 M 2 2 2 1(cos cos cos )d d t t t S u u u M a b c S t x y z αβγ+????= ++???? ?? 其中 2 a ,2 b ,2 c 分别是沿 x ,y ,z 方向的扩散系数。 由高斯公式 : ? ??? ?+Ω ??+??+??= t t t t z y x z u c y u b x u a M d d d d )(2 2 2 2 2 2 2 2 2 1

云团扩散模型

1 云团扩散模型 根据物质泄漏后所形成的气云的物理性质的不同,可以将描述气云扩散的模型分为非重气云模型和重气云模型两种[5-13]。 1.1 非重气云模型 高斯模型是一种常用的非重气扩散模型,高斯烟羽(Plume model)模型又称高架点连续点源扩散模型,适用于连续源的扩散,即连续源或泄放时间大于或等于扩散时间的扩散。 高斯烟团(Puff model)模型适用于短时间泄漏的扩散,即泄放时间相对于扩散时间比较短的情形,如突发性泄放等。若假设气体云内空间上的分布为高斯分布,则地面地处风向的烟团浓度分布算式为 式中, c(x,y,H)——点(x,y,H)处浓度值,mg/m3; Q——源强,即单位时问的排放量,mg/s; u——环境平均风速,m/s; σx,σy,σz——扩散参数; H——源高(烟团高度),m; x——下方向到泄漏原点的距离,m; y,z——侧风方向、垂直向上方向离泄漏原点的距离,m。 高斯模式的实际应用效果很大程度上依赖于如何给定模式中的一些参数,尤其要注意源强、扩散参数等的确定。 源强与污染物的物理化学属性、扩散方式、释放点的地理环境等有关。扩散参数表征大气边界层内

湍流扩散的强弱,是高斯模式的一项重要数据。高斯扩散模式所描述的扩散过程(实质上也包含了在实际应用中对高斯模式的一些限制)主要有: 1)下垫面平坦、开阔、性质均匀,平均流场稳定,不考虑风场的切变。 2)扩散过程中,污染物本身是被动、保守的,即污染物和空气无相对运动,且扩散过程中污染物无损失、无转化,污染物在地面被反射。 3)扩散在同一温度层结中发生,平均风速大于1.0 m/s。 4)适用范围一般小于10~20 km。 1.2 重气云模型 由于重气本身的特殊性,在重气扩散领域也有大量基于不同理论的模型。鉴于重气扩散与中性或浮性气体扩散有着明显的区别,目前国内外已开发大量的不同复杂程度的重气扩散模型,如箱模型、相似模型、LTA-HGDM模型、CFD模型等。 1.2.1 箱(BOX)模型 箱模型是指假定浓度、温度和其他场,在任何下风横截面处为矩形分布等简单形状,这里的矩形分布是指在某些空间范围内场是均匀的,而在其他地方为零。该类模型预报气云的总体特征,如平均半径、平均高度和平均气云温度,而不考虑其在空间上的细节特征。重气效应消失后其行为表现为被动气体扩散,所以该类模型还包括被动扩散的高斯模型及对它的修正。 1.2.2 层流及湍流大气环境中的重气扩散(LTA-HGDM)模型 LTA-HGDM模型(Heavy Gas Dispersion Model in Lsaminar and Turbulent Atmosphere层流及湍流大气环境中的重气扩散模型)以箱模型为基础,结合虚点源模型,能描述重气泄漏扩散整个过程。模型同三维有限元模型相比,具有形式简单、原始输入数据运算速度快等优点。 LTA-HGDM模型的建立基于以下几点假设: 1)危险性气体初时泄漏时,其外形呈正圆柱形(H=2R)。 2)初始时刻泄漏源即此核电站内部的浓度、温度呈均匀分布。 3)扩散过程不考虑泄漏源即此核电站内部温度的变化,忽略热传递、热对流及热辐射。

推荐-基于修正高斯扩散模型的城市表层土壤重金属污染探究 精品

基于修正高斯扩散模型的城市表层土壤重金属污染探究 (标题,3号黑体) 摘要(4号黑体) (小4号宋体)本文基于修正的高斯扩散模型,针对城市表层土壤重金属污染问题,考虑到重金属的传播特征,建立了一系列逐步完善和精确化的数学模型,很好地解决了重金属污染物分布、污染程度评价及污染源确定的问题。 对于问题一,首先利用MATLAB软件分别做出了8种重金属污染物浓度的等高线空间分布图。然后综合使用内梅罗单因子和综合因子指数法评价该城区不同功能区域的污染程度。具体过程如下:先对每个取样点使用内梅罗单因子指数法确定其污染程度,再按功能区域的划分将监测点分为5类,对每一类都使用内梅罗综合指数法便可得到各区域综合污染指数,其中综合指数的大小反映了污染程度的轻重。结果显示该城区5个功能区域的污染程度从重到轻的排序依次为:工业区>交通区>生活区>公园绿地区>山地区。 对于问题二,使用主因子分析法研究各功能区的重金属污染原因。通过使用SPSS 软件处理数据我们可以得到如下结论:对于工业区来说造成土壤重金属污染的主要原因是工业生产过程中排放的废气、废水和废渣;对于交通区来说造成区内土壤重金属污染的主要原因是汽车排放的气;对于生活区来说造成其重金属污染的主要原因是生活垃圾的废弃及来自工业区和交通区的废气污染;对于公园绿地区来说造成其重金属污染的主要原因是来自工业区与交通区的废气污染以及植物 对重金属的富集作用;山地区域污染较轻气污染主要原因是工业废气和汽车尾气。对于问题三,首先分析重金属污染物的传播特征,得到了重金属有如下几种基本运动方式:随介质迁移的传播运动、分散运动、被环境介质吸收或降解、沉积、传播中转化。其次考虑到重金属污染物传播过程与流体介质的不同,对适用于流体的高斯模型进行了修正,得到了能反映本题要求的修正后的高斯扩散模型。接着对修正后的高斯扩散模型微分方程组进行了求解,得到了3个主要污染源的位 对于问题四,首先评价问题三中所建立模型,模型的优点是充分考虑了重金属的传播特征,对求出污染源非常有效;缺点在于未能考虑当地降雨及常年风向等影响重金属污染传播的因素,对污染的预测不能很好反映。鉴于此,在改进模型时增加收集当地降水及常年风向这两项信息。最后在改进模型时给原微分方程组增加降水和风向两个控制因子,通过求解改进后的微分方程组,相信会得到更加贴近实际的结果。 关键字:内梅罗指数法主因子分析修正高斯扩散模型

纵向数据中线性混合模型的估计与检验

纵向数据中线性混合模型的估计与检验 【摘要】:在对社会学,生物学,经济学以及农业等学科的连续性纵向数据研究时,线性混合效应模型是很受欢迎的研究工具。这是因为模型中随机效应和误差的分布往往假设为正态分布,这样我们就可以很方便的使用极大似然估计方法(MLE)或者限制极大似然估计方法(RMLE)来研究模型中的参数性质。特别地,人们可以使用SAS,R等统计软件直接分析数据。然而,随着对线性混合模型研究的深入,人们发现实际数据中正态性假设并不完全成立,特别是随机效应的正态性假设更值得怀疑。如何检验模型中的分布的正态性,以及拒绝正态性假设后,如何估计模型参数,研究随机效应和误差的局部性质是本文要研究的问题。在论文的第一部分,我们将研究线性混合效应模型中随机效应的正态性假设。在文献中,基于经验特征函数,Epps&Pulley(1983)提出了对一维随机变量的正态性假设的拟和检验,Baringhaus&Henze(1988)解决了多维随机向量的正态性检验问题,与此类似的检验被统计学家统称为BHEP检验。这里,我们推广HenzeWanger(1997)提出的BHEP检验方法来构造我们的检验统计量。因为模型中随机效应是不可观测的,我们只有使用相应的最优线性无偏预测(BLUP)。研究发现,文中的检验统计量在原假设下渐近收敛于一个零均值的高斯过程,并且对以参数速度收敛到原假设的被择分布特别敏锐。因为极限高斯过程不易用来模拟检验统计量的临界值,我们提出了条件蒙特卡洛模拟方法(CMCT)。为了直观的研究我们的检验统计量的功效,我

们给出了不同分布假设下,检验的p-值,并与文献中已有的两种检验方法作了比较。此外,我们还进行的了一些实际数据分析。经过上述检验方法分析实际数据,我们发现正态性假设确实不完全成立。在论文的余下部分,我们来研究非正态假设下如何估计模型的未知参数,以及研究随机效应和误差的局部性质,也就是估计它们的一些高阶矩,文中我们主要研究了前四阶矩的非参数估计。首先,当模型中的随机效应是一维的并且其协变量都是1时,我们利用模型的特征构造了前四阶矩的估计方程,而后给出相应的非参数估计。通过对所有估计的渐近性质的研究,我们发现,如果每组实验的次数也能足够多时,我们的估计拥有最小的渐近方差。在这种意义上说,我们的方法优于第一个研究此问题的文献Cox&Hall(2002)提出的估计方法。此外,在他们的模型下,我们也可以从另一个角度更简单的构造他们的估计方程。通过一些简单的模拟,也证实了我们的估计方法的优越性,特别是对误差的高阶矩的估计。但是,无论我们的估计方法或者他们的都很难推广到更高阶矩的估计或者随机效应为多维时更一般的情形。正如Jiang(2006)所说的那样,对于这种一般的模型,我们很难建立估计方程。为了解决这个问题,我们提出了一个简单的矩估计方法。主要推导工具是矩阵中Kronecker乘积,矩阵拉直运算以及数学期望。我们研究了随机效应和误差的前四阶矩估计的渐近性质,并给出了简单的模拟结果。比较上述两种估计法,我们发现:当随机效应是一维的时侯,误差的各阶矩的估计不依赖不可观测的随机效应,随机效应的估计也不依赖误差,因此,估计的渐近方差结构特别简单也是最优的;而当随机

污染物扩散模型-深圳数学建模

赛区评阅编号(由赛区组委会填写): 2015高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号(从A/B/C/D中选择一项填写): C 我们的报名参赛队号(12位数字全国统一编号): 参赛学校(完整的学校全称,不含院系名):温州医科大学 参赛队员 (打印并签名) :1. 章成俊 2. 杨超 3. 谢锦 指导教师或指导教师组负责人 (打印并签名): 日期:年月日

赛区评阅编号(由赛区组委会填写): 2015高教社杯全国大学生数学建模竞赛 编号专用页 送全国评阅统一编号(由赛区组委会填写): 全国评阅随机编号(由全国组委会填写):

对垃圾处理厂污染的动态监控及居民补偿 摘要 城市垃圾处理问题是一个世界性难题。目前垃圾焚烧正逐步成为中国垃圾处理的主要手段之一。本论文构根据题目设置的垃圾处理厂规模,建立了环境动态监控体系,并根据潜在污染风险对周围居民进行了合理经济补偿的设计。 对于问题(1),为了实现对垃圾焚烧厂烟气排放及相关环境影响状况的动态监控,本论文在高斯烟羽模型的基础上进行改进,引入温度、降雨对污染物扩散的影响,建立了新的污染物扩散模型。本论文创新性的提出了风雨影响指数M,用来衡量风向、降雨对颗粒物扩散的影响。本论文将抽象的污染物含量形象化,利用空气污染指数API描述具体的污染程度及其给周围居民带来的影响。并且从不同角度给出了模型检验,验证了所建模型的准确性。 对于问题(1)具体赔偿方案的制定,在综合考虑了不同方位风向频率、受污染时间、受污染程度的基础上,本论文使用了层次分析法,并且进行了一致性检验,使得赔偿方案具有说服力。通过MATLAB编程,计算出当政府和垃圾处理厂共支付风险赔偿金为N时,得出居住地的每位居民应得的赔偿金额计算公式。对于监测点的设置,经计算共需21个,具体布置情况见后文。 对于问题(2),在题目所述的发生事故的情况下,对污染物的具体含量进行了合理的预测与假设。模拟出酸性物质与颗粒物的影响范围,并根据具体的污染程度设置不同的污染区。对每个污染区的不同情况设置更改监测点的设置,并且在问题(1)的基础上对居民的经济补偿进行合理修改。 关键词:高斯烟羽模型,层次分析法,空气污染指数,烟气抬升公式 一、问题重述 “垃圾围城”是世界性难题,在今天的中国显得尤为突出。数据显示,目前全国三分之二以上的城市面临“垃圾围城”问题,垃圾堆放累计侵占土地75万亩。因此,垃圾焚烧正逐步成为中国垃圾处理的主要手段之一。然而,由于政府监管不力、投资者目光短浅等多方面的原因,致使前些年各地建设的垃圾焚烧电厂在运营中出现了环境污染问题,给垃圾焚烧技术在我国的推广造成了很大阻力,许多城市的新建垃圾焚烧厂选址都出现因居民反对而难以落地的局面。在垃圾焚烧厂运行监管方面,目前主要是在垃圾焚烧厂内进行测量监控,缺少从周边环境视角出发的外围动态监控,因而难以形成为民众所信服的全方位垃圾焚烧厂环境监控体系。 深圳市某地点计划建立一个中型的垃圾焚烧厂,计划处理垃圾量1950吨/天(设置三台可处理垃圾650吨/天的焚烧炉,排烟口高度80米,每天24小时运转)。从构建环境动态监控体系、并根据潜在污染风险对周围居民进行合理经济补偿的需求出发,有关部门希望能综合考虑垃圾焚烧厂对周围带来环境污染以及其他危害的多种因素(例如,焚烧炉的污染物排放量、居住点离开垃圾焚烧厂的距离、风力和风向及降雨等气象条件、地形地貌以及建筑物的遮挡程度等等),在进行科学定量分析的基础

【原创】R语言实现有限混合模型建模数据分析报告论文(附代码数据)

务(附代码数据),咨询QQ:3025393450 有问题到百度搜索“大数据部落”就可以了 欢迎登陆官网:https://www.360docs.net/doc/b03580133.html,/datablog R语言实现有限混合模型建模分析 介绍 有限混合模型在应用于数据时非常有用,其中观察来自不同的群体,并且群体隶属关系未知。模拟数据 首先,我们将模拟一些数据。让我们模拟两个正态分布 - 一个平均值为0,另一个平均值为50,两者的标准差为5。 m1<-0

务(附代码数据),咨询QQ:3025393450 有问题到百度搜索“大数据部落”就可以了 欢迎登陆官网:https://www.360docs.net/doc/b03580133.html,/datablog m2<-50 sd1<-sd2<-5 N1<-100 N2<-10 a<-rnorm(n=N1,mean=m1,sd=sd1) b<-rnorm(n=N2,mean=m2,sd=sd2) 现在让我们将数据“混合”在一起...... x<-c(a,b) class<-c(rep('a',N1),rep('b',N2)) data<-data.frame(cbind(x=as.numeric(x),class=as.factor(class))) library("ggplot2") p<-ggplot(data,aes(x=x))+

务(附代码数据),咨询QQ:3025393450 有问题到百度搜索“大数据部落”就可以了 欢迎登陆官网:https://www.360docs.net/doc/b03580133.html,/datablog geom_histogram(aes(x,..density..),binwidth=1,colour="black",fill ="white")+ geom_vline(xintercept=m1,col="red",size=2)+ geom_vline(xintercept=m2,col="blue",size=2) p

基于高斯模型的放射性物质扩散模型

放射性气体扩散浓度预估模型 【摘要】本文是以日本地震引起的福岛核电站的核泄漏为背景,并以给出的数据为基础,研究某一假设核电站的核泄漏问题。我们通过收集相关的资料,并结合题目给出的数据,建立了高斯模型、连续点源高斯扩散模型解决了题目提出的四个问题。 针对问题一:考虑到泄漏源是连续、均匀和稳定的,我们运用散度、梯度、流量等数学概念,通过“泄漏放射性物质质量守恒”、“气体泄漏连续性定理”、 Guass 公式及积分中值定理得到了无界区域的抛物线型偏微分方程,然后再通过电源函数解出空间任意一点的放射性物质浓度的表达式,把此表达式定为模型一的前身。鉴于放射性物质的扩散受到诸多因素的影响,如:泄漏源的实际高度、地面反射等。我们以泄漏口为坐标原点建立三维坐标系,通过“像源法”处理地面反射对放射性物质浓度的影响,并由此对模型一的前身进行修正完善,得到模型一:高斯模型,即放射性物质浓度的预测模型。最后我们模拟了放射性物质无风扩散仿真图。 针对问题二:当风速为k m/s 时,我们根据放射性核素云团在大气中迁移和扩散的数值计算的基本方法和步骤,并以泄漏点源在地面的投影点为坐标原点,以风向方向为x 轴,铅直方向为z 轴,与x 轴水平面垂直方向为y 轴建立三维坐标系,地面的反射作用同样利用“像源法”进行处理,得到连续点源高斯扩散模型。考虑到地面反射、烟云抬升、放射性物质自身的沉降及雨水的吸附等对浓度的影响,我们对连续点源高斯扩散模型进行了修正,建立了修正的连续点源高斯扩散模型。最后利用大气稳定度确定了扩散参数,进而求解了模型。 针对问题三:经分析,问题三的提出是以问题二为基础的,模型三的建立只需要将模型二加以调整即可。我们以风速方向为x 轴正方向,将风速与放射性物质的扩散速度进行矢量运算,此问题则转化为求(,0,)L z 和(,0,)L z -两点处的放射性物质浓度,由此建立模型三,即上风和下风L 公里处放射性物质浓度浓度的预测模型。 针对问题四:首先,我们通过网络收集了相关数据,然后,我们结合模型二、模型三对数据进行整理代入,算出了日本福岛核电站泄漏的放射性物质扩散到中国东海岸和美国西海岸的浓度分别为334.242910/g m -?、432.385410/g m -?。 关键词:高斯模型 连续点源高斯扩散模型 核泄漏

(完整)高斯扩散模型及其适用条件

高斯扩散模型及其适用条件 (1)一般表达式 根据质量守恒原理和梯度输送理论,污染物在大气中一般运动规律为:(3分) 1N x y z p p c c c c c c c u v w k k k S t x y z x x y y z z =????????????????+++=+++ ? ? ?????????????????∑ C :污染物质平均浓度; X ,y ,z :三个方向坐标; u ,v ,w :三个方向速度分量; k x ,k y ,k z :三个方向扩散系数; t :为污染物扩散时间; S P :污染物源、汇强度。 (2)高斯模型的适用条件:①大气流动稳定,表明污染物浓度不随时间改变,即0t ?=?; ②有主导风向,表明u=常数,且v=w=0; ③污染物在大气中只有物理运动,物化学 和生物变化,且预测范围内无其他同类 污染的源和汇。表明S P =0(p=1,2,….n ) 此时三维的动态模型就可简化为三维的稳态模型,得: x y z c c c c u k k k x x x y y z z ?????????????=++ ? ? ???????????? ?? (3分) ④有主导风情况下,主导风对污染物输送 应远远大于湍流运动引起污染物在主导风方

向上扩散。即c u x ??(平流输送作用)远远大于x c k x x ???? ????? (湍流弥散作用)。 此时方程又可以简化为: y z c c c u k k x y y z z ?????????=+ ? ???????? ?? (2分) (3)由于y 和z 方向上污染物浓度不发生变化,故规定y k 与y 无关,z k 与z 无关,即: 22z 22z y c c c u k k x y ???=+??? (1分) (4)由质量守恒原,理运用连续点源源强计算方式,按照单元体积(3)简化得到的方程进行积分ucdydz=Q ∞∞ -∞-∞??,结合边界条件 {0c=x y z c=0x y z ===∞ →∞时,,,时,对方程进行求解。(2分) (5)设x=ut ,令22y y z z =2k t =2k t σσ;。化简求解得到高斯扩散模型的标准 形式: ()2222y z 1c ,,exp 22y z Q y z x y z u πσσσσ????=-+?? ? ??????? (1分)

高斯过程在机器学习中的应用

西安郵電大学 科研训练报告书 基于高斯过程在机器学习中的应用

摘要 高斯过程是近年来发展起来的一种新的机器学习方法,它有着严格的统计学习理论基础,对处理高维数非线性小样本复杂问题具有良好的适应性。对列车精准停车问题的这种复杂的非线性问题,将高斯过程机器学习方法应用于此问题,并提出相应的模型,减少数据间复杂的内在物理或其他关系。很多工程实例研究表明,高斯过程机器学习模型是科学可行的,预测精度高,简单实用,对很多问题问题具有较好的适用性。 关键词:高斯过程;机器学习;列车精准停车 Abstract Gaussian processes ( GP) is a newly developed machine learning method based on the strict statistical learning theory. GP is capable of solving the highly nonlinear problem with small samples and high dimensions.Precise train stopping complex nonlinear problem, GP machine learning model applied to this problem, and propose a model to reduce the complexity of data between the intrinsic physical or other relationship. Case studies show that many of the works, GP machine learning model is scientific and feasible, the prediction accuracy is high, simple and practical, on many issues the problem has good applicability. Key Words:Gaussian processes;machine learning;precise train stopping 1引言 列车(包括火车、地铁、轻轨等轨道交通工具)的精确停车是轨道交通控制系统中的一项关键技术。对于有效使用站台屏蔽门、保证乘客安全、较少乘客换乘时间等有着至关重要的作用。然而就实际物理模型建模时收到很多方面的制约,且耗费大量的金钱。通过研究,将实际上依赖于物理模型的建立和控制参数的调整,而采用对数据本身的练习进行学习和建模。如果能从数据中学习到列车精确停车的规律,则可以在保证列车达到精确停车所需指标的同时,大量节省硬件方面的费用,并建立数据规律,同时使结果与实际模型相联系,促进物理模型的建立。因此,在利用机器学习来分析列车精确停车问题时,不需要过多关注各种复杂的如轨道坡度、摩擦系数、天气状况、乘客数量等外在因素,而只需关注对精度有明显影响的因素如停车的初始速度及距离等。 在本文中,将研究机器学习领域的高斯过程(Gaussian Process,GP),并以实际的列车停车

大气污染物扩散高斯模型模拟

大气污染物扩散的高斯模型模拟:可视化模拟点源大气污染的扩散Gaussian Atmospheric Dispersion Model 突发性大气污染事故时有发生,对大气污染扩散进行模拟和分析,有利于减小事故的危害,减轻人员伤亡和财产损失。高斯扩散模型是国际原子能机构(IAEA)推荐使用于重气云扩散模拟的数学模型,该模型在非重气云扩散的应用日益广泛。高斯扩散模型是描述大气对有害气体的输移、扩散和稀释作用的物理或数学模型,是进行灾害预测和救援指挥的有力手段之一。 高斯扩散模型 高斯模型又分为高斯烟团模型和高斯烟羽模型。大气污染物泄漏分为瞬时泄漏和连续泄漏,瞬时泄漏是指污染物泄放的时间相对于污染物扩散的时间较短如突发泄漏等的情形,连续泄漏则是指污染物泄放的时间较长的情形。瞬时泄漏采用高斯烟团模型模拟,而连续泄漏采用高斯模型烟羽模型模拟。高斯模型适用于非重气云气体,包括轻气云和中性气云气体。要求气体在扩散过程中,风速均匀稳定。 在高斯烟团模型中,选择风向建立坐标系统,即取泄漏源为坐标原点,x轴指向风向,y轴表示在水平面内与风向垂直的方向,z轴则指向与水平面垂直的方向,具体公式见式: (mg/s); x、y、z轴上的扩散系数,需根据大气稳定度选择参数计算得到(m);x、y、z表示x、y、z上的坐标值(m);u 表示平均风速(m/s);t表示扩散时间(s);H 表示泄漏源的高度(m)。 同理,高斯烟羽模型的表达式如: 技术方法 若用高斯模型算出空间每一个点在一个时刻的污染浓度,这个计算量是很大的。因此所设计的系统一般都是采用先进行图层网格化,由高斯模型计算出有限个网格点的上的污染物浓度,在进行空间内插得到面上每一个点的污染物浓度,并由此得到污染物浓度的等值线。整个过程的示意图如图所示

数学建模高斯扩散模型培训资料

数学建模高斯扩散模 型

§4-2高斯扩散模式 ū —平均风速; Q—源强是指污染物排放速率。与空气中污染物质的浓度成正比,它是研究空气污染问题的基础数据。通常: (ⅰ)瞬时点源的源强以一次释放的总量表示; (ⅱ)连续点源以单位时间的释放量表示; (ⅲ)连续线源以单位时间单位长度的排放量表示; (ⅳ)连续面源以单位时间单位面积的排放量表示。 δy—侧向扩散参数,污染物在y方向分布的标准偏差,是距离y的函数,m; δz—竖向扩散参数,污染物在z方向分布的标准偏差,是距离z的函数,m; 未知量—浓度c、待定函数A(x)、待定系数a、b; 式①、②、③、④组成一方程组,四个方程式有四个未知数,故方程式可解。 二、高斯扩散模式 (一)连续点源的扩散 连续点源一般指排放大量污染物的烟囱、放散管、通风口等。排放口安置在地面的称为地面点源,处于高空位置的称为高架点源。 1. 大空间点源扩散 高斯扩散公式的建立有如下假设:①风的平均流场稳定,风速均匀,风向平直;②污染物的浓度在y、z轴方向符合正态分布;③污染物在输送扩散中质量守恒; ④污染源的源强均匀、连续。 图5-9所示为点源的高斯扩散模式示意图。有效源位于坐标原点o处,平均风向与x轴平行,并与x轴正向同向。假设点源在没有任何障碍物的自由空间扩散,不考虑下垫面的存在。大气中的扩散是具有y与z两个坐标方向的二维正态分布,当两坐

标方向的随机变量独立时,分布密度为每个坐标方向的一维正态分布密度函数的乘积。由正态分布的假设条件②,参照正态分布函数的基本形式式(5-15),取μ=0,则在点源下风向任一点的浓度分布函数为: (5-16)式中 C—空间点(x,y,z)的污染物的浓度,mg/m3; A(x)—待定函数; σy、σz—分别为水平、垂直方向的标准差,即y、x方向的扩散参数,m。 由守恒和连续假设条件③和④,在任一垂直于x轴的烟流截面上有: (5-17) 式中 q—源强,即单位时间内排放的污染物,μg/s; u—平均风速,m/s。 将式(5-16)代入式(5-17), 由风速稳定假设条件①,A与y、z无关,考虑到③和④,积分可得待定函数A(x): (5-18) 将式(5-18)代入式(5-16),得大空间连续点源的高斯扩散模式 (5-19) 式中,扩散系数σy、σz与大气稳定度和水平距离x有关,并随x的增大而增加。当y=0,z=0时,A(x)=C(x,0,0),即A(x)为x轴上的浓度,也是垂直于x轴截面上污染物的最大浓度点C max。当x→∞,σy及σz→∞,则C→0,表明污染物以在大气中得以完全扩散。 2.高架点源扩散

高斯过程在机器学习中的应用

高斯过程在机器学习中的应用

西安郵電大学 科研训练报告书 基于高斯过程在机器学习中的应用

摘要 高斯过程是近年来发展起来的一种新的机器学习方法,它有着严格的统计学习理论基础,对处理高维数非线性小样本复杂问题具有良好的适应性。对列车精准停车问题的这种复杂的非线性问题,将高斯过程机器学习方法应用于此问题,并提出相应的模型,减少数据间复杂的内在物理或其他关系。很多工程实例研究表明,高斯过程机器学习模型是科学可行的,预测精度高,简单实用,对很多问题问题具有较好的适用性。关键词:高斯过程;机器学习;列车精准停车 Abstract Gaussian processes ( GP) is a newly developed machine learning method based on the strict statistical learning theory. GP is capable of solving the highly nonlinear problem with small samples and high dimensions.Precise train stopping complex nonlinear problem, GP machine learning model applied to this problem, and propose a model to reduce the complexity of data between the intrinsic physical or other relationship. Case studies show that many of the works, GP machine learning model is scientific and feasible, the prediction accuracy is high, simple and practical, on many issues the problem has good applicability. Key Words: Gaussian processes;machine learning;precise train stopping

扩散问题的偏微分方程模型,数学建模

第七节 扩散问题的偏微分方程模型 物质的扩散问题,在石油开采、环境污染、疾病流行、化学反应、新闻传播、煤矿瓦斯爆炸、农田墒情、水利工程、生态问题、房屋基建、神经传导、药物在人体内分布以及超导、液晶、燃烧等诸多自然科学与工程技术领域,十分普遍地存在着. 显然,对这些问题的研究是十分必要的,其中的数学含量极大. 事实上,凡与反应扩散有关的现象,大都能由线性或非线性抛物型偏微分方程作为数学模型来定量或定性地加以解决. MCM的试题来自实际,是“真问题⊕数学建模⊕计算机处理”的“三合一”准科研性质的一种竞赛,对上述这种有普遍意义和数学含量高,必须用计算机处理才能得到数值解的扩散问题,当然成为试题的重要来源,例如,AMCM-90A,就是这类试题;AMCM-90A要研究治疗帕金森症的多巴胺(dopamine )在人脑中的分布,此药液注射后在脑子里经历的是扩散衰减过程,可以由线性抛物型方程这一数学模型来刻划. AMCM-90A要研究单层住宅混凝土地板中的温度变化,也属扩散(热传导)问题,其数学模型与AMCM-90A一样,也是线性抛物型方程. 本文交代扩散问题建模的思路以及如何推导出相应的抛物型方程,如何利用积分变换求解、如何确定方程与解的表达式中的参数等关键数学过程,且以AMCM-90A题为例,显示一个较细致的分析、建模、求解过程. §1 抛物型方程的导出 设(,,,)u x y z t 是t 时刻点(,,)x y z 处一种物质的浓度. 任取一个闭曲面S ,它所围的区域是Ω,由于扩散,从t 到t t +?时刻这段时间内,通过S 流入Ω的质量为 2 221(cos cos cos )dSd t t t S u u u M a b c t x y z αβγ+????=++???? ??. 由高斯公式得 2222 221222()d d d d t t t u u u M a b c x y z t x y z +?Ω ???=++???? ???. (1) 其中,222,,a b c 分别是沿,,x y z 方向的扩散系数. 由于衰减(例如吸收、代谢等),Ω内的质量减少为 2 2d d d d t t t M k u x y z t +?Ω =? ???, (2) 其中2 k 是衰减系数. 由物质不灭定律,在Ω内由于扩散与衰减的合作用,积存于Ω内的质量为12M M -. 换一种角度看,Ω内由于深度之变化引起的质量增加为 3[(,,,)(,,,)]d d d d d d d . (3)t t t M u x y z t t u x y z t x y z u x y z t t Ω +?Ω =+?-?=????? ??? 显然312M M M =-,即

数学建模word版素材

1建模中几种基本预测方法(数模大全-数学建模的几种基本预测算法的探讨)1.1微分方程 适用范围: 传染病的预测模型、经济增长预测模型、正规战与游击战的预测模型、药物在体内的分布与排除预测模型、人口的预测模型、烟雾的扩散与消失预测模型以及相应的同类型的预测模型 改进方法: 常系数改进,增加控制系数,综合二者。 优点: 短、中、长期的预测都适合,既能反映内部规律,反映事物的内在关系,也能分析两个因素的相关关系,精度相应的比较高,另外对初等模型的改进也比较容易理解和实现。 缺点:虽然反映的是内部规律,但是由于方程的建立是以局部规律的独立性假定为基础,故做中长期预测时,偏差有点大,而且微分方程的解比较难以得到。1.2时间序列(数模大全-时间序列模型) 使用范围:数据具有以下特点时: (1)长期趋势变动。它是指时间序列朝着一定的方向持续上升或下降,或停留在 某一水平上的倾向,它反映了客观事物的主要变化趋势。 (2)季节变动。 (3)循环变动。通常是指周期为一年以上,由非季节因素引起的涨落起伏波形相 似的波动。 (4)不规则变动。通常它分为突然变动和随机变动。 建立方法有以下几种 1)移动平均法: 简单移动平均:近期预测,趋势变化不大 加权移动平均:不同时期数据影响力不同时,近期预测,趋势变化不大 趋势移动平均:存在直线上升下降时,做二次平均进行调整。使用于直线与周期趋势并存的2)指数平滑法 一般说来历史数据对未来值的影响是随时间间隔的增长而递减的。所以,更切合实际的方法应是对各期观测值依时间顺序进行加权平均作为预测值。前者无法满足,指数可以。 主意:加权系数选择,根据数据变化特性选择。 1).一次指数平滑 2).二次指数平滑(为了解决一次指数平滑中滞后问题) 数据 3).三次指数平滑:当数据量呈现曲线变动时 3)差分指数平滑法 克服了指数平滑法的数据滞后性 4)自适应滤波法 利用部分已知数据先分权后进行预测另外已知数据,然后对权系数进行修正,重复,最终得出较为合理的权系数对未知数进行预测。 5)趋势外推预测方法

相关文档
最新文档