2010年5月苏北赛算法:马尔可夫链。适合很多题型

2010年5月苏北赛算法:马尔可夫链。适合很多题型
2010年5月苏北赛算法:马尔可夫链。适合很多题型

马尔可夫链

在自然界与社会现象中,许多随机现象遵循下列演变规律,已知某个系统(或过程)在时刻0t t =所处的状态,与该系统(或过程)在时刻0t t >所处的状态与时刻0t t <所处的状态无关。例如,微分方程的初值问题描述的物理系统属于这类随机性现象。随机现象具有的这种特性称为无后效性(随机过程的无后效性),无后效性的直观含义:已知“现在”,“将来”和“过去”无关。

在贝努利过程(){}

,1X n n ≥中,设()X n 表示第n 次掷一颗骰子时出现的点数,易见,今后出现的点数与过去出现的点数无关。

在维纳过程(){}

,0X t t ≥中,设()X t 表示花粉在水面上作布朗运动时所处的位置,易见,已知花粉目前所处的位置,花粉将来的位置与过去的位置无关。

在泊松过程(){,0}N t t ≥中,设()N t 表示时间段[0,]t 内进入某商店的顾客数。易见,已知时间段0[0,]t 内进入商店的顾客数()0N t ,在时间段()0[0,]t t t >内进入商店的顾客数

()N t 等于()0N t 加上在时间段0(,]t t 内进入商店的顾客数()()0N t N t -,而与时刻0t 前进

入商店的顾客无关。 一、马尔可夫过程

定义:给定随机过程

(){},X t t T ∈。如果对任意正整数3n ≥,任意的

12,,1,,n i t t t t T i n <<<∈= ,任意的11,,,n x x S -∈ S 是()X t 的状态空间,总有

()()()1111|,n n n n P X x X t x X t x --≤==

()()

11|,n n n n n P X x X t x x R --=≤=∈ 则称(){}

,X t t T ∈为马尔可夫过程。

在这个定义中,如果把时刻1n t -看作“现在”,时刻n t 是“将来”,时刻12,,n t t - 是“过去”。马尔可夫过程要求:已知现在的状态()11n n X t x --=,过程将来的状态()n X t 与过程过去的状态()()1122,,n n X t x X t x --== 无关。这就体现了马尔可夫过程具有无后效性。通常也把无后效性称为马尔可夫性。

从概率论的观点看,马尔可夫过程要求,给定()()1111,,n n X t x X t x --== 时,()n X t 的条件分布仅与()11n n X t x --=有关,而与()()12,,n X t X t - 无关。

二、马尔可夫链及其转移概率

马尔可夫链是参数离散、状态离散的最简单的马尔可夫过程。在马尔可夫链

(){},X t t T ∈中,一般取参数空间{}0,1,2,T = 。马尔可夫链的状态空间E 的一般形式

是{}0,1,2,E = 。

1、马尔柯夫链定义:

一个随机序列{X(t), t=1,2,3,…}取值于正整数空间E ={0,1,2,……},或者为E 的子集, 如果有:()()()()

1111|,n n n n P X t x X t x X t x --===

()()()

11|n n n n P X t x X t x --=== x i ∈E ={0,1,2,……} ; i=1,2,…

则称为序列(){}

,X t t T ∈为马尔柯夫(Markov)链。这种序列具有马尔可夫性,也叫无后致性。注意:t 和i 均取整数。 2、马尔柯夫链的含义:

可以这样理解:序列(){}X t 的“将来”只与“现在”有关而与“过去”无关。 3、马尔柯夫链的状态:

马尔柯夫链序列(){

}

X t 中的某一个符号X(t i )的数值一定为E 中的某一个元素x i (或x j ),这时,称x I (或x j )为随机序列的一个状态Si 。 4、马尔柯夫链的一步转移概率

马尔柯夫(Markov)链的统计特性用条件概率(状态转移概率)来描述: 习惯上把转移概率记做

()()()()()()()()(1)

11|1|n n ij ij P X t x X t x P X t j X t i p t p t -+===+====

这称为马氏链的一步转移概率。为马尔柯夫链从状态i 变为状态j 的条件概率。 它满足:(概率的加法公式)

p ij (1)(t)≥0 i j ∈E

()1

ij j E

p t i E ∈=∈∑

5、马尔柯夫链的K 步转移概率:

其k 步转移概率为:为马尔柯夫链从状态i 经过k 步(k 个单位时间)后变为状态j 的条件概率:

()()()()()

|k ij P X t k j X t i p t +===

它满足:

p (k)ij (t)≥0 i j ∈E

()

()1k ij

j E

p

t i E ∈=∈∑

6、平稳马尔柯夫链的性质:

如果马尔柯夫链是平稳的,即与时刻无关,与t 无关,我们讨论的马尔柯夫链只是这种最简

单的情况。这种平稳马氏链称为齐次马氏链。由于这种齐次马尔柯夫链的转移概率与时间无关,因此去掉其时间变量t ,其中的一步转移概率为()

1ij ij p p =,k 步转移概率为()

k ij p ,n 步转移概率为()

n ij p 。

定义2:向量()

12,,,n u u u u = 称为概率向量,如果u 满足: 1

0,1,2,,1n

j i

i u j n

u

=≥==∑

定义3:若方阵P 的每行都为概率向量,则称此方阵为概率矩阵。

可以证明,如果矩阵A 和B 皆为概率矩阵,则,,k

k

AB A B 也都是概率矩阵(k 为正整数)

由所有一步转移概率组成的矩阵称为一步转移概率矩阵表示为:

11

12121

2221

2n n n n nn p p p p p p P p p p ?? ?

?

= ? ???

120.80.180.020.80.20.650.250.10.70.3001P P ???? ?== ?

???

???

转移矩阵必为概率矩阵,且具有以下两个性质: 1)()

(

)

1k k P

P P -=

2) ()

k k P

P =

下面主要学习正则链和吸收链

1、正则链:这类马氏链的特点是,从任意状态出发经过有限次转移都能达到另外的任意状态,有如下定义.

定义4 一个有n 个状态的马氏链如果存在正整数N ,使从任意状态i 经过N 次转移都已大于零的概率到达状态(),1,2,,j i j n = ,则称为正则链。

正则链的判断方法:对于概率矩阵P ,若幂次方m

P 的所有元素皆为正数(指m

P 的每一元素大于零),则矩阵P 称为正规概率矩阵,此时马氏链称为正则链,或者称马氏链具有遍历性。

遍历性的直观含义:一个遍历的马尔可夫链经过相当长的时间后,它处于各个状态的概率趋于稳定,且概率稳定值与初始状态无关。在工程技术中,当马尔可夫链的极限概率分布存在时,它的遍历性表示一个系统经过相当长时间后趋于平衡状态,这时,系统处于各个状态的概率分布即不依赖于初始状态,也不在随时间的推移而改变。

设系统的极限分布(也是稳态分布)用行向量()013,,,,n πππππ=

来表示,一步转移概

率矩阵为P ,则有

P ππ=

,且1

1n

i i π==∑

从而可以解出系统的极限分布(或稳态分布)

从状态i 出发经k 次转移,第一次到达状态j 的概率称为i 到j 的首达概率,记做()ij f n , 于是 ()1

ij ij

i nf n μ∞

==

为由状态i 第一次到达状态j 的平均转移次数,特别的,ii μ是状态i 首次返回的平均转移次数,ii μ与稳态概率ω有密切关系,即对于正则链,1/ii i μπ=

马尔可夫链模型:

设系统在0k =时所处的初始状态()

()()(

)

(

)00

012,,,n

S S S S = 为已知,经过k 次转移后

所处的状态向量()

()()(

)

(

)()12,,,1,2,k k

k

k n

S

S S S k == ,则

()

()()11121

0021

22212k

n k n k n n nn p p p p p p S

S P S

p p p ??

? ?

== ?

???

此式即为马尔可夫预测模型。

由上式可以看出,系统在经过k 次转移后所处的状态()

k S

只取决于它的初始状态()

0S

转移概率P 。因此对于马氏链模型最基本的问题是构造状态()X t 及写出转移矩阵P ,一旦有了P ,那么给定初始状态概率()

0S

就可以用上式计算任意时段的状态概率()

k S

2、 吸收链

在马尔可夫链中,称1ij p =的状态i,j 为吸收状态。如果一个马尔可夫链中至少包含一个吸收状态,并且从每一个非吸收状态出发,都可以到达某个吸收状态,那么这个马尔可夫链称为吸收链。

含有m 个吸收状态和(n-m)个非吸收状态的吸收链,其转移矩阵的标准形式为

()()0

m m n n

n m n m I P R Q ??-?-??

= ? ???

(1)

其中矩阵R 中含有非零元素,m m I ?为m 阶单位矩阵。Q 不是概率矩阵,它至少存在一个小于1的行和,且如下定理成立。

定理1 对于吸收链P 的标准形式(1),()I Q -可逆,()

1

s s M I Q Q ∞

-==-=∑,记元素全

为1的列向量()1,1,,1e '= ,则y Me =的第i 分量是从第i 个非吸收态出发,到某个吸收状态吸收的平均转移次数。

设状态i 是非吸收态,j 是吸收状态,那么首达概率()ij f n 实际上是i 经n 次转移被j 吸收的概率,而()1

ij ij n f f n ∞

==

∑则是从非吸收状态i 出发终被吸收状态j 吸收的概率,记

{}

()ij k r r

F f -?=,下面的定理给出了计算ij f 的方法。

定理2 设吸收链的转移矩阵P 表为标准形式(1),则

F MR =

例1、设马尔可夫链(){}

,0X t t ≥的状态空间{}1,2,3E =,一步转移概率矩阵为

1/43/401/31/31/301/43/4P ?? ?

= ? ???

初始分布为()

()01/4,1/2,1/4S

=,即

()()()()()()111

01,02,03424

P X P X P X ======

则 ()()()2

20113/576,230/576,233/576P P P ==

用Matlab 计算如下:s0=[1/4 1/2 1/4]; P=[1/4 3/4 0;1/3 1/3 1/3;0 1/4 3/4];

S2=s0*P.^2=(0.0712 0.2118 0.1962)

稳态分布 T=(t1,t2,t3),TP=T,变换后 (P ’-E)T ’=0 T=(0.16 0.36 0.48) 附程序:liyiw.m

市场占有率模型

设有甲、乙、丙三家企业,生产同一种产品,共同供应1000家用户,各用户在各企业间自由选购,但不超出这三家企业,也无新的客户。假定在10月末经过市场调查得知,甲、乙、丙三家企业拥有的客户分别是:250户,300户,450户,而11月份用户可能的流动情况如表所示:

假定该产品用户的流动按上述方向继续变化下去(转移概率不变),预测12月份三家企业市场用户各自的拥有量,并计算经过一段时间后,三家企业在稳定状态下该种产品的市场占有率。

解:第一步:根据调查资料,确定初始状态概率向量,这里

()

()()()()

()00

123,,250/1000,300/1000,4

50/1000S

S S S == ()0.25,0.3,0.45=

第二步:确定一次转移概率矩阵,此例由用户可能流动情况调查表可知,其一步转移概

率矩阵为

230/25010/25010/2500.920.040.0420/300250/30030/3000.0670.833

0.130/45010/450410/4500.0670.0220.911P ???? ? ?

== ? ? ? ?????

矩阵中每一行的元素,代表着各企业保持和失去用户的概率,如第一行甲企业保持用户

的概率是0.92,转移到乙、丙两企业的概率都是0.04,甲企业失去用户的概率是0.04+0.04=0.08。

第三步:利用马尔可夫链模型进行预测。显然,12月份三家企业市场占有率为

()

()()(

)

(

)

()22

2

20

2123

,,S

S S S S P ==

()()2

0.920.040.04

0.25,0.3,0.450.0670.8330.10.2150

,0.2088,0.37690.0670.0220.911?? ?== ? ???

12月份三个企业市场用户拥有量分别为:

甲:1000?0.215=215户 乙:1000?0.2088=208.8户 丙:1000?0.3769=376.9户

现在,假定该产品用户的流动情况按上述方向继续变化下去,我们来求三个企业的该种产品市场占有的稳定状态概率。

易验证P 为正规矩阵,设(),,1,t x y x y =--令tP t =

()()0.920.040.04,,10.0670.8330.1,,10.0670.0220.911x y x y x y x y ??

?

--=-- ? ???

将上式展开,得联立方程式

()()()0.920.0670.06710.040.8330.02210.040.10.91111x y x y x

x y x y y x y x y x y ++--=??

++--=??++--=--?

解之得 0.4558,0.1598,x y == 故()(),,10.4558,0.1598,0.3844x y x y --=

上述结果表明:如果甲、乙、丙三家企业的市场占有率照目前转移概率状态发展下去,

那么经过一段时间后,三企业的市场占有率分别为45.58%、15.98%和38.44%.显然,对于乙、丙两企业而言,必须迅速找出市场占有率下降的原因。

最佳服务地点选择

市汽车出租公司在甲、乙、丙三处开设租车还车处。顾客可在甲、乙、丙三处任意租车和还车。今公司准备在上述三处之一设立汽车维修保养厂。初步确定在汽车集中比较多的一处设置维修保养场。根据统计资料,顾客在上述三处还车的概率如表所示,试确定在何处设汽车维修保养场。

解:由题意可知,该问题的转移概率矩阵P 为:

0.80.2

00.2

00.80.20.20.6P ??

?= ? ???,2

0.680.160.160.320.20.480.320.160.52P ?? ?= ? ???

因为2P 的所有元素都大于零,所以P 为正规矩阵。当甲、乙、丙三处租车、还车业务开展一定时期后,就会达到平衡条件,这样就可以得到一固定概率t ,使得tP t =成立,即

()()0.80.20,,10.200.8,,10.20.20.6x y x y x y x y ??

?

--=-- ? ???

成立

上式展开,得

()0.80.20.21x y x y x ++--= ()0.20.20.21x y x y y ++--= ()0.20.80.611x y x y x y ++--=--

解上述联立方程式,得0.5,0.167x y == 故 ()(),,10.5,0.167,0.333x y x y --=

由上述计算可知,在稳定状态汽车还到甲处得概率为0.5,即向甲处还车得概率占出租

汽车得一半,其余乙、丙处总共也只有一半,因此汽车维修保养场设在甲处是最佳得选择。 变。

钢琴销售的存储策略

一家商店根据以往经验,平均每周只能售出1架钢琴,现在经理制定的存储策略是,每周末检查库存量,仅当库存量为零时,才定购3架供下周销售;否则,不定购。试估计在这种策略下失去销售机会的可能性有多大,以及每周的平均销售量是多少?

问题分析

对于钢琴这种商品的销售,顾客的到来是相互独立的,在服务系统中通常认为需求量近似服从泊松分布,其参数可由每周销售1架得到,由此可以算出不同需求量的概率。周末的库存可能是0,1,2,3,周初的库存量只有1,2,3这3种状态,每周不同的需求将导致周初库存状态的变化,于是可用马氏链来描述这个过程。当需求超过库存时就会失去销售机会,可以计算这种情况发生的概率,在动态过程中这个概率每周是不同的,每周的销售量也不同,通常采用的办法是在时间充分长以后,按稳态情况进行分析和计算。

模型假设

1、钢琴每周需求量服从泊松分布,均值为每周1架

2、存储策略是:当周末库存量为零时,定购3架,周初到货;否则不订购

3、以每周初的库存量作为状态变量,状态转移具有无后效性。

4、在稳态情况下计算该存储策略失去销售机会的概率,和每周的平均销售量 模型建立

记第n 周的需求量为n D ,由假设1,n D 服从均值为1的泊松分布,即 ()()1

/!0,1,2,n p D k e k k -=== (1)

记第n 周的库求量为n S ,{}1,2,3n S ∈是这个系统的状态变量,由假设2,状态转移概率为 13

n n n n n n n

S D D S S D S +-

≥? (2)

由(1)式不难算出()()()00.368,10.368,20.184,n n n p D p D p D ======

()()30.061,30.019,n n p D p D ==>=由此计算状态转移概率 ()()

1111|100.368

n n n p P S S P D +====== ()1212|10n n p P S S +==== ()()1313|110.632n n n p P S S P D +====≥= ()()2111|210.368n n n p P S S P D +=====

= ()()2212|200.368n n n p P S S P D +====== ()()2313|220.264n n n p P S S P D +====≥= ()()

3111|320.184

n n n p P S S P D +====== ()()3212|310.368n n n p P S S P D +======

()()()3313|3030.448n n n n p P S S P D P D +=====+≥=

得到转移概率矩阵

0.368

00.6320.3680.3680.2640.1840.3680.448P ?? ?

= ? ???

记状态概率()()()()()()()

123,1,2,3,,,,i n a n P S i i a n a n a n a n ====根据状态转移具有无后效性的假设,有()()1a n a n P +=,又易验证P 是正则链,具有稳态分布w , 由 3

1

,

1i

i wP w w

===∑,可得到()()123,,0.285,0.263,0.452w w w w ==

该存储策略(第n 周)失去销售机会的概率为()n n P D S >,按照全概率公式有 ()()()3

1

|n n n n

n i P D S P

D i S i P S i

=>=

>==∑ 其中的条件概率()|n n P D i S i >=容易有(1)式计算,当n 充分大时,可以认为

().1,2,3n i P S i w i ===

最终得到

()0.2640.2850.0800.2630.0190.4520.105n n P D S >=?+?+?= 即从长期看,失去销售机会的可能性大约10%。

在计算该存储策略(第n 周)的平均销售量n R 时,应注意到,当需求超过存量时只能销售掉存量,于是

()()()3

111||i n n n n n n i j R jP D j S i iP D i S i P S i -==??

===+≥==????

∑∑

同样的,当n 充分大时用稳态概率i w 代替()n P S i =,得到

0.6320.2850.8960.2630.9770.4520.857n R =?+?+?=

即从长期看,每周的平均销售量为0.857架,这个数值略小于模型假设中给出的每周平均平

均需求量为1架。

基因遗传

豆科植物茎的颜色有绿有黄,生猪的毛有黒有白,有粗有光,人类会出现先天性疾病如色盲等,这都是基因遗传的结果,基因从一代到下一代的转移是随机的,并且具有无后效性,因此马氏链模型是研究遗传学的重要工具之一。本节给出的简单模型属于完全优势基因遗传理论的范畴。

生物的外部表征,如豆科植物茎的颜色,人的皮肤或头发,由生物体内相应的基因决定,。基因分优势基因和劣势基因两种,分别用d 和r 表示,每种外部表征由体内的两个基因决定,而每个基因都可以是d 或者r 中的一个,于是由三种基因类型,即D(dd),H(dr),R(rr),分别称为优种,混种,和劣种,含优种D(dd)和混种H(dr)基因类型的个体,外部表征呈优势,如豆科植物的茎呈绿色,人的皮肤或头发有色素,含劣种R 基因类型的个体,外部特征呈劣势,如豆科植物的茎呈黄色,人的皮肤或头发无色素。

生物繁殖时,一个后代随机地继承父亲两个基因中的一个和母亲两个基因中的一个,,形成它的两个基因,一般的两个基因中哪个遗传下去是等概率的,所以父母的基因类型就决定了每一后代基因类型的概率。父母基因类型,有全是优种DD ,全是劣种RR,一优种一混种DH(父为D,母为H ;或者父为H ,母为D)及DR ,HH ,HR 共6种组合,对每种组合简单的计算可以得到其后代各种基因类型的概率,如表格4所示

表格4 父母基因类型决定后代各种基因类型的概率 下面我们就马氏链为工具讨论两个具体的基因遗传模型,

随机交配 这是自然界中生物群体的一种常见的,最简单的交配方式。假设一个群体中雄性和雌性的比例相同,并且有相同的基因类型分布,即雄性中D,H,R 的比例和雄性中D,H,R 的比例相等。所谓随机交配是指:对于每一个(不论属于D,H 或R)的雌性(或雄性)个体,都以D,H,R 的数量比例为概率,与一个雄性(或雌性)个体交配,其后代则按照前面所说的方式,等概率的继承其父母亲的各一个基因,形成它的基因类型。假定在初始一代的群体中,三种基因类型的数量比例是D(dd):H(dr):R(rr)=a:2b:c,满足a+2b+c=1,记p=a+b,q=b+c ,则群体中优势基因d 与劣势基因r 的数量比例为d:r=p:q ,且p+q=1.

下面讨论随机交配方式产生的一系列后代群体中的基因类型分布。

用1,2,3n X =分别表示第n 代的一个体属于D,H 及R 基因类型,即3种状态,

0,1,2,n = ,()i a n 表示个体属于第i 种状态的概率,1,2,3i =,可视为第n 代的群体属

于第i 种基因类型的比例。转移概率ij p 可用ij p P =(一个后代具有基因类型j|母亲具有基因类型i)来计算。在已知母亲基因类型的条件下,后代的基因类型取决于父亲的基因类型,值得指出的是,在计算ij p 时与其考虑被随机选择为父亲的3种不同基因类型的比例a:2b:c ,不如直接考察从雄性群体中以p:q 的比例获得优势基因d 和劣势基因r ,比如

11p P =(后代为D(dd)|母亲为D(dd))=p

12p P =(后代为D(dr)|母亲为D(dd))=q 13p P =(后代为D(rr)|母亲为D(dd))=0 21p P =(后代为D(dd)|母亲为H(dr))=p/2

因为后代需要以1/2的概率从母体获得d,同时以p 的概率从雄性群体中获得d

22p P =(后代为D(dr)|母亲为H(dr))=p/2+q/2

23/2p q =,同样的方法算出313233,,p p p 后得到转移概率矩阵

0/21/2/20p

q P p q p q ?? ?= ? ???

若初始一代是从3种基因类型比例为a:2b:c 的群体种随机选取的,那么初始状态概率为()()0,2,a a b c =,其中a,2b,c 满足p=a+b,q=b+c, 利用马氏链基本方程可以得到 ()()(

)2

2

10,2,a a P p pq q

==

()()()()222210,2,a a P a P p pq q ===

显然这个分布将保持下去,这表明在随机交配方式中第一代继承者的基因类型分布为

22:::2:D H R p pq q =

并永远不变。这个结果在遗传学中称Hardy-Weinberg 平稳定律。 容易判断这是一个正则链,可计算出它的稳态分布为(

)22

,2,p pq q

π=。表明即使初

始分布不是从群体中随机选取,在随机交配方式下,经过足够长时间后3种基因类型的分布

也趋向上述稳定分布。

这个模型得到的结果的正确性已有观察和试验证明。如自然界中通常有p=q=1/2,于是3种基因类型的平稳分布为::1/4:1/2:1/4D H R =,而优种D 和混种H 的外部表征呈优势。据观察,豆科植物茎呈绿色(优势表征)的约占3/4,与上面的结果相一致。

最后考察在随机交配下3种基因类型的首次返回平均转移稀疏,即平均经过多少代每种基因类型首次回到原来的类型。D,H,R 类型的首次返回平均换代数目

2

2

1122331/,1/2,1/p pq q μμμ===

即一个群体中基因d 越多(p 越大),基因类型D(dd)的平均换代数目越小。特别,当p=q=1/2时,D,H,R 的平均换代数目分别为4(代),2(代)和4(代)。

近亲繁殖:

这是指这样一种繁殖方式,从同一对父母的大量后代中,随机的选取一雄一雌进行交配,产生后代,如此继续下去,考察一系列后代的基因类型的演变情况。

与前面的模型不同的是,那里讨论后代群体中基因类型的分布,只许设置D,H,R 三个

状态即可,这里则需按照随机选取的雄雌配对,分析后代配对中基因类型的变化。于是状态应取雄雌6种基因类型组合,设1,2,3,4,5,6n X =依次定义为DD,RR,DH,DR,HH,HR.

构造马氏链模型的关键是写出转移概率ij p ,它可根据本节开始给出的表看出,显然

()()1112221,01,1,02j j p p j p p j ==≠==≠,因为父母全为优种D(或劣种R)时,后代全

是优种(或劣种),随机选取的雄雌配对当然也是。

311/4p = 因为配对DH(状态3)的后代中D 和H 各占1/2,所以随即选取得配对为DD(状态1)的概率是1/2×1/2=1/4;

31p P =(后代配对为DH|父母配对为DH)=P(后代雄性为D ,雌性为H|父母配对为DH)+P(后代雄性为H ,雌性为D|父母配对为DH)=1/2×1/2+1/2×1/2=1/2;

同理331/4p =,又因配对DH 的后代中没有R ,故对于含有R 的状态2,4,6,有 3234360p p p === 其他的ij p 可以类似的计算,最后得到转移矩阵为

1

000000100001/401/201/400

000101/161/161/41/81/41/401/4001/41/2P ?? ? ? ?

= ? ? ? ? ???

容易看出,状态1(DD)和状态2(RR)是吸收态,这是一个吸收链。它表明不论最初选取得配

对是哪种基因类型组合,经过若干代近亲繁殖,终将变为DD 或RR ,即变成全是优种或全是劣种,而且一旦如此,就永远保持下去。

为了计算从任一个非吸收态3,4,5,6出发,平均经过多少代就会被吸收状态1,2吸收,我们首先将矩阵P 转化为前面给出的转移矩阵地标准形式,得到

1/201/4

00

0101/41/81/41/40

01/41/2Q ?? ?

?= ? ???,1/4

0001/161/1601/4R ?? ?

?= ?

?

??

()1

8/31/6

4/32/34/34/38/34/34/31/38/34/32/3

1/64/38/3M I Q -??

?

?

=-= ?

?

??

52254,6,5,46336y Me '

??== ???

3/41/41/21/21/21/21/43/4F MR ??

? ?

==

?

???

M 的第1行至第4行依次代表非吸收态DH,DR,HH 和HR ,由定理对y 的各个分量的解释,从DH 配对的状态出发,在近亲繁殖的情况下平均经过5

4

6

代就会被状态DD 或RR 吸收,即全变成优种或劣种。而根据定理2,被吸收态吸收的概率为矩阵F 的第1行元素,即变成优种和劣种的概率分别为3/4和1/4。从其他状态DR ,HH 和HR 出发,可以得到相应的结论。

上述结果的使用价值在于,在农业&畜牧业中常常是纯种(优种或劣种)生物的某些品质(如抗病性)不如混种,所以在近亲繁殖情况下大约经过5~6大就应该重新选种,以防品质的下降。

练习

1、某企业根据前一年()0t =统计得知,该企业共有技术人员300名。其中技术员职称的有140名,助理工程师100名,工程师(包括高级工程师)60名。现若规定技术员每年可由30%的人数晋升为助理工程师,又有10%的技术员因各种原因调离该企业,余下60%的技术员留任其原来岗位。而助理工程师每年要有40%留任,30%晋升工程师,30%调离。工程师则每年有60%留任,40%调离或退休。同时,该企业计划每年向社会招聘80名大专学生以补充技术员队伍。现要求预测今后5年内该企业技术人员总的拥有量及各类技术人员的分布情况,假定5年内人员晋升、流动情况按上述比例不变。

2、 将钢琴销售的存储策略修改为:当周末库存量为0或1时,订购,使下周初的库存量达到3架;否则,不订购,建立马氏链,计算稳态下失去销售机会的概率,和每周的平均销售量。

解:仍以第n 周初的库存量为状态,2,3n n S S =,需求概率不变,容易算出状态转移概率矩阵为

0.3680.6320.3680.632P ??

=

???

稳态概率分布为()0.368,0.632ω=,稳态下失去销售机会的概率p=0.041,每周的平均销售量R=0.947.

3、老K 公司生产的某家电产品与其他两家生产同类产品的A 公司和B 公司相竞争。现计划用加强广告宣传的方法以增加改产品的市场占有率。今拟定了两个广告宣传方案1D 和2D ,公司决策人在两个条件相同(指初始市场占有率和初始转移概率矩阵相同)的地区试

用这两个广告方案,试验结果得到不同的转移概率矩阵。今已知市场占有率的全国水平是:老K 公司产品为28%,A 公司产品为39%,B 公司产品为33%。求解下述问题: (1)用初始转移概率矩阵确定在稳定(平衡)时,该两试验地区市场占有率是否接近全国水平?

(2)假定两个广告宣传方案1D 和1D 成本相同,在稳定(平衡)时哪种广告宣传能有最高的市场占有率?

已知初始转移概率矩阵为: K A B

0.60.30.10.20.70.10.10.10.8K A B ?? ?

? ???

广告1D 推出后的转移概率矩阵为:K A B

0.70.20.10.20.70.10.10.10.8K A B ??

?

? ???

广告2D 推出后的转移概率矩阵为:K A B

0.80.10.10.10.70.20.20.10.7K A B ??

?

? ???

4、某供应特需商品的商店,每周再周末营业一天,该店对某种不经常有人购买的商品

库存,采用下述订货策略:如结存0件或1件时,则一次定购3件,如结存超过1件时就不定购。凡在周末停止营业时定购的商品是为了准备在下周末出售。这一订货策略保证商品的初始库存量只能是2件、3件或4件。

又根据统计,该商品每周的需求量为0,1,2,3件的概率分别为0.4,0.3,0.2和0.1,试建立一个转移概率矩阵,用以说明由本周初始库存状态转为下周初始状态的概率。在达到稳定条件下,确定库存量为2,3,4的概率。

蒙特卡罗算法的简单应用

一、蒙特卡洛算法 1、含义的理解 以概率和统计理论方法为基础的一种计算方法。也称统计模拟方法,是指使用随机数(或更常见的伪随机数)来解决很多计算问题的方法,它是将所求解的问题同一定的概率模型相联系,用计算机实现统计模拟或抽样,以获得问题的近似解。 2、算法实例 在数值积分法中,利用求单位圆的1/4的面积来求得Pi/4从而得到Pi 。单位圆的1/4面积是一个扇形,它是边长为1单位正方形的一部分。只要能求出扇形面积S1在正方形面积S 中占的比例K=S1/S 就立即能得到S1,从而得到Pi 的值。怎样求出扇形面积在正方形面积中占的比例K 呢?一个办法是在正方形中随机投入很多点,使所投的点落在正方形中每一个位置的机会相等看其中有多少个点落在扇形内。将落在扇形内的点数m 与所投点的总数n 的比m/n 作为k 的近似值。P 落在扇形内的充要条件是 221x y +≤ 。 已知:K= 1s s ,K ≈m n ,s=1,s1=4P i ,求Pi 。 由1 s m s n ≈,知s1≈*m s n =m n , 而s1=4P i ,则Pi=*4m n 程序: /* 利用蒙特卡洛算法近似求圆周率Pi*/ /*程序使用:VC++6.0 */ #include #include #include #define COUNT 800 /*循环取样次数,每次取样范围依次变大*/ void main() { double x,y; int num=0; int i; for(i=0;i

x=rand()*1.0/RAND_MAX;/*RAND_MAX=32767,包含在中*/ y=rand()*1.0/RAND_MAX; i f((x*x+y*y)<=1) num++; /*统计落在四分之一圆之内的点数*/ } printf("Pi值等于:%f\n",num*4.0/COUNT); printf("RAND_MAX=%d\n",RAND_MAX); 3、应用的范围 蒙特·卡罗方法在金融工程学,宏观经济学,计算物理学(如粒子输运 计算、量子热力学计算、空气动力学计算)等领域应用广泛。 4、参考书籍 [1]蒙特卡罗方法及其在粒子输运问题中的应用[2]蒙特卡罗方法引论

马尔可夫预测

4.6 马尔可夫预测 4.6.1 马尔可夫预测法分析概述 马尔可夫是俄国著名的数学家,马尔可夫过程是以马尔可夫名字命名的一种特殊的描述事物发展过程的方法。马尔可夫过程主要用于对企业产品的市场占有率的预测。 众所周知,事物的发展状态总是随着时间的推移而不断地变化的。对于有些事物的发展,需要综合考察其过去与现在的状态,才能预测未来。但有些事物的发展,只要知道现在状态,就可以预测将来的状态而不需要知道事物的过去状态。例如,在下中国象棋时,一个棋子下一步应该怎样走,只与它当前的位置有关,而不需要知道它以前处于什么位置,也不需要知道它是怎么走到当前位置的。这种与过去的取值无关,称为无后效性。这种无后效性的事物的发展过程,就称为马尔可夫过程。 1.一步转移概率与转移概率矩阵 如果变量的状态是可数的,假设有N个,那么从状态i经一步转移到j,都有发生的可能,我们称Pij为一步转移概率。将这些依序排列起来构成的一个矩阵,叫做转移概率矩阵: 转移概率矩阵具有下述性质; (1)矩阵每个元素均非负; (2)矩阵每行元素之各等于1. 2.多步转移概率与转移概率矩阵 在一步转移概率概念的基础上,可导出多步转移概率。若系统在时刻T0处于状态i,经过n步转移,在时刻Tn时处于状态j,这种转移的可能性的数量指标称为n步转移概率,记为P(Xn=j|X0=i)=Pij(n)。n步转移概率矩阵记为

经过计算,可以得到一个有用的结论: 同时,n步转移概率同一步转移概率一样具有下列性质; 2.4.2市场占有率预测分析 1.市场占有率预测分析概述 在市场经济条件下,各企业都十分重视扩大自身产品的市场占有率。因此,预测企业产品市场占有率,也就成为企业十分关心的问题。 市场占有率是指在一定地理范围内,某一类商品因为具有相同的用途或性质而相互竞争,那么在这类商品的整个销售市场上,每一种品牌的产品的销售额(销量)点该类商品总销售额(销量)的份额即为该品牌商品的市场占有率。 2.市场占有率预测分析的基本 市场占有率预测分析的基本步骤如下:假设该地区市场上有三种同类商品。 (1)调查目前市场占有率情况,得到市场占有率向量A 首先,通过抽样调查,了解目前市场占有率情况。根据调查结果,构建市场占有率向量A。则A=(P1 , P2 ,P3) (2)调查消费者的变动情况,计算转移概率矩阵P 通过合理的消费者抽样调整,汇总消费者消费变动的情况,并计算出转移概率矩阵P。则

基于核函数法及马尔可夫链的节点定位算法

2010年11月Journal on Communications November 2010 第31卷第11期通信学报V ol.31No.11基于核函数法及马尔可夫链的节点定位算法 赵方1,罗海勇2,林权3,马严4 (1. 北京邮电大学软件学院,北京 100876;2.中国科学院计算技术研究所普适计算研究中心,北京 100190; 3.中航工业综合技术研究所,北京 100028; 4.北京邮电大学信息网络中心,北京100876) 摘要:基于贝叶斯滤波框架,提出了基于核函数法及马尔可夫链的节点定位算法,该算法采用射频指纹匹配技术,使用核函数构建似然函数,充分利用观测与多个训练样本之间的相似性,避免使用先验确定型信号分布模型产生的误差。此外,为提高移动目标的定位精度和定位实时性,该算法还使用马尔可夫链,通过利用目标的历史状态和环境布局等信息对匹配定位的网格搜索空间进行限制,剔除目标移动过程中不可能发生的位置跳变。实验证明,与高斯分布模型相比,所提定位算法具有更高的定位正确率和定位精度。 关键词:节点定位;核函数;马尔可夫链 中图分类号:TP301 文献标识码:A 文章编号:1000-436X(2010)11-0195-10 Node localization algorithm based on kernel function and Markov chains ZHAO Fang1, LUO Hai-yong2, LIN Quan3, MA Yan4 (1. School of Software Engineering, Beijing University of Posts and Telecommunications, Beijing 100876, China; 2. Research Center for Pervasive Computing, Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China; 3. Avic Aero-Polytechnology Establishment , Beijing 100028, China; 4. Information Network Center, Beijing University of Posts and Telecommunications, Beijing 100876, China) Abstract: To position indoor objects accurately and robustly, a novel node localization based on kernel function and Markov chains was presented, which employs Bayesian filter framework and radio fingerprinting technology. It uses kernel function to construct likelihood function to take full advantage of the similarity between observation and several training samples, which avoids the error brought by employing a priori determined distribution model. Furthermore, the proposed algorithm uses Markov chains to improve the localization accuracy and shorten the positioning time. It limits the search space of the matching grids with object's previous state and the environment layout, and refuses the object’s impossible position jump during the moving process. Experiments confirm that the proposed localization outperforms the algorithm with Gaussian distribution model. Key words: node localization; kernel function; Markov chain 1引言 现有无线传感器网络(WSN, wireless sensor networks)定位技术一般采用红外线、超声波、射频等传感信号。其中基于红外线、超声波的定位技术精度相对较高,不过由于需要使用专门的硬件设 收稿日期:2010-03-31;修回日期:2010-10-05 基金项目:国家科技重大专项基金资助项目(2010ZX03006-002-03);国家自然科学基金资助项目(60873244, 60973110, 61003307);北京市自然科学基金资助项目(4102059) Foundation Items:Important National Science & Technology Specific Projects(2010ZX03006-002-03); The National Natural Sci-ence Foundation of China (60873244, 60973110, 61003307); The Natural Science Foundation of Beijing (4102059)

浅析蒙特卡洛方法原理及应用

浅析蒙特卡洛方法原理及应用 于希明 (英才学院1236103班测控技术与仪器专业6120110304) 摘要:本文概述了蒙特卡洛方法产生的历史及基本原理,介绍了蒙特卡洛方法的最初应用——蒲丰投针问题求圆周率,并介绍了蒙特卡洛方法在数学及生活中的一些简单应用,最后总结了蒙特卡洛方法的特点。 关键词:蒙特卡洛方法蒲丰投针生活应用 蒙特卡洛方法(Monte Carlo method),也称统计模拟方法,是二十世纪四十年代中期由于科学技术的发展和电子计算机的发明,而被提出的一种以概率统计理论为指导的一类非常重要的数值计算方法。它是以概率统计理论为基础, 依据大数定律( 样本均值代替总体均值) , 利用电子计算机数字模拟技术, 解决一些很难直接用数学运算求解或用其他方法不能解决的复杂问题的一种近似计算法。蒙特卡洛方法在金融工程学,宏观经济学,计算物理学(如粒子输运计算、量子热力学计算、空气动力学计算)等领域应用广泛。 一、蒙特卡洛方法的产生及原理 蒙特卡洛方法于20世纪40年代美国在第二次世界大战中研制原子弹的“曼哈顿计划”计划的成员S.M.乌拉姆和J.冯·诺伊曼首先提出。数学家冯·诺伊曼用驰名世界的赌城—摩纳哥的Monte Carlo—来命名这种方法,为它蒙上了一层神秘色彩。在这之前,蒙特卡洛方法就已经存在。1777年,法国数学家蒲丰(Georges Louis Leclere de Buffon,1707—1788)提出用投针实验的方法求圆周率π。这被认为是蒙特卡洛方法的起源。 其基本原理如下:由概率定义知,某事件的概率可以用大量试验中该事件发生的频率来估算,当样本容量足够大时,可以认为该事件的发生频率即为其概率。因此,可以先对影响其可靠度的随机变量进行大量的随机抽样,然后把这些抽样值一组一组地代入功能函数式,确定结构是否失效,最后从中求得结构的失效概率。蒙特卡洛法正是基于此思路进行分析的。 设有统计独立的随机变量Xi(i=1,2,3,…,k),其对应的概率密度函数分别为fx1,fx2,…,fxk,功能函数式为Z=g(x1,x2,…,xk)。首先根据各随机变量的相应分布,产生N组随机数x1,x2,…,xk值,计算功能函数值Zi=g(x1,x2,…,xk)(i=1,2,…,N),若其中有L组随机数对应的功能函数值Zi≤0,则当N→∞时,根据伯努利大数定理及正态随机变量的特性有:结构失效概率,可靠指标。 二、蒲丰投针问题 作为蒙特卡洛方法的最初应用, 是解决蒲丰投针问题。1777 年, 法国数学家蒲丰提出利用投针实验求解圆周率的问题。设平面上等距离( 如为2a) 画有一些平行线, 将一根长度为2l( l< a) 的针任意投掷到平面上, 针与任一平行线相交的频率为p 。针的位置可以用针的中心坐标x 和针与平行线的夹角θ来决定。任意方向投针, 便意味着x与θ可以任意取一值, 只是0≤x ≤a, 0≤θ≤π。那么, 投针与任意平行线相交的条件为x ≤ l sinθ。相交频率p 便可用下式求

Matlab学习系列34. 马尔可夫预测

33. 马尔可夫预测 马尔可夫预测,是一种预测事件发生的概率的方法。它是基于马尔可夫链,根据事件的目前状况预测其将来各个时刻(或时期)变动状况的一种预测方法。 马尔可夫预测法的基本要求是状态转移概率矩阵必须具有一定的稳定性。因此,必须具有足够的统计数据,才能保证预测的精度与准确性。换句话说,马尔可夫预测模型必须建立在大量的统计数据的基础之上。 (一)经典马尔可夫模型 一、几个概念 状态:指某一事件在某个时刻(或时期)出现的某种结果; 状态转移:事件的发展,从一种状态转变为另一种状态; 马尔可夫过程:在事件的发展过程中,若每次状态的转移都仅与前一时刻的状态有关,而与过去的状态无关,或者说状态转移是无后效性的,则这样的状态转移过程就称为马尔可夫过程。 状态转移概率:在事件的发展变化过程中,从某一种状态出发,下一时刻转移到其它状态的可能性,称为状态转移概率。由状态i E 转为状态j E 的状态转移概率 ()(|)i j j i ij P E E P E E p →== 状态转移概率矩阵:假定某一个事件的发展过程有n 个可能的状

态,即1,,n E E ,则矩阵 1111n n nn p p P p p ????=?????? 其中,ij p 为从状态i E 转为状态j E 的状态转移概率,称为状态转移概率矩阵。 状态转移矩阵满足: (i) 01, ,1,,ij p i j n ≤≤= (ii) 1 1n ij j p ==∑ 二、状态转移矩阵的计算 即求出从每个状态转移到其它任何一个状态的状态转移概率ij p ,一般采用频率近似概率的思想进行计算。 例1某地区农业收成变化的三个状态,即E1“丰收”、E2“平收”和E3“欠收”。下表给出了该地区1960~1999年期间农业收成的状态变化情况(部分)。 计算该地区农业收成变化的状态转移概率矩阵。 datas=xlsread('Agriculture.xlsx');

蒙特卡罗 算法

1、蒙特卡罗定位 足球机器人中自定位方法是由Fox提出的蒙特卡罗定位。这是一种概率方法,把足球机器人当前位置看成许多粒子的密度模型。每个粒子可以看成机器人在此位置定位的假设。在多数应用中,蒙特卡罗定位用在带有距离传感器的机器人设备上,如激光扫描声纳传感器。只有一些方法,视觉用于自定位。在足球机器人自定位有些不同,因为机器人占的面积相对比较小,但是机器人所在位置的面积必须相当准确的确定,以便允许同组不同机器人交流有关场地物体信息和遵守比赛规则。这种定位方法分为如下步骤,首先所有粒子按照一起那机器人的活动的运动模型移动。概率pi取决于在感知模型的基础上所有粒子在当前传感器上的读数。基于这些概率,就提出了所谓的重采样,将更多粒子移向很高概率的采样位置。概率平均分布的确定用来表示当前机器人的位置的最优估计。最后返回开始。 2、蒙塔卡罗 基本思想 当所求解问题是某种随机事件出现的概率,或者是某个随机变量的期望值时,通过某种“实验”的方法,以这种事件出现的频率估计这一随机事件的概率,或者得到这个随机变量的某些数字特征,并将其作为问题的解。 工作过程 蒙特卡罗方法的解题过程可以归结为三个主要步骤:构造或描述概率过程;实现从已知概率分布抽样;建立各种估计量。 蒙特卡罗方法解题过程的三个主要步骤: (1)构造或描述概率过程 对于本身就具有随机性质的问题,如粒子输运问题,主要是正确描述和模拟这个概率过程,对于本来不是随机性质的确定性问题,比如计算定积分,就必须事先构造一个人为的概率过程,它的某些参量正好是所要求问题的解。即要将不具有随机性质的问题转化为随机性质的问题。 2)实现从已知概率分布抽样 构造了概率模型以后,由于各种概率模型都可以看作是由各种各样的概率分布构成的,因此产生已知概率分布的随机变量(或随机向量),就成为实现蒙特卡罗方法模拟实验的基本手段,这也是蒙特卡罗方法被称为随机抽样的原因。最简单、最基本、最重要的一个概率分布是(0,1)上的均匀分布(或称矩形分布)。随机数就是具有这种均匀分布的随机变量。随机数序列就是具有这种分布的总体的一个简单子样,也就是一个具有这种分布的相互独立的随机变数序列。产生随机数的问题,就是从这个分布的抽样问题。在计算机上,可以用物理方法产生随机数,但价格昂贵,不能重复,使用不便。另一种方法是用数学递推公式产生。这样产生的序列,与真正的随机数序列不同,所以称为伪随机数,或伪随机数序列。不过,经过多种统计检验表明,它与真正的随机数,或随机数序列具有相近的性质,因此可把它作为真正的随机数来使用。由已知分布随机抽样有各种方法,与从(0,1)上均匀分布抽样不同,这些方法都是借助于随机序列来实现的,也就是说,都是以产生随机数为前提的。由此可见,随机数是我们实现蒙特卡罗模拟的基本工具。 (3)建立各种估计量

蒙特卡罗方法学习总结

图1-1 蒙特卡罗方法学习总结 核工程与核技术2014级3班张振华20144530317 一、蒙特卡罗方法概述 1.1蒙特卡罗方法的基本思想 1.1.1基本思想 蒙特卡罗方的基本思想就是,当所求问题的解是某个事件的概率,或者是某个随机变量的数学期望,或者是与概率、数学期望有关的量时,通过某种试验方法,得出该事件发生的频率,或者该随机变量若干个具体观察值的算术平均值,通过它得到问题的解。 1.1.2计算机模拟打靶游戏 为了能更为深刻地理解蒙特卡罗方法的基本思想,我们学习了蒲丰氏问题和打靶游戏两大经典例子。下面主要对打靶游戏进行剖析、计算机模拟(MATLAB 程序)。 设某射击运动员的弹着点分布如表1-1 所示, 首先用一维数轴刻画出已知该运动员的弹 着点的分布如图1-1所示。研究打靶游戏,我 们不用考察子弹的运动轨迹,只需研究每次“扣动扳机”后的子弹弹着点。每一环数对应唯一确定的概率,且注意到概率分布函数有单调不减和归一化的性质。首先我们产生一个在(0,1)上均匀分布的随机数(模拟扣动扳机),然后将该随机数代表的点投到P 轴上(模拟子弹射向靶上的一个确定点),得到对应的环数(即子弹的弹着点),模拟打靶完成。反复进行N 次试验,统计出试验结果的样本均值。样本均值应当等于数学期望值,但允许存在一定的偏差,即理论计算值应该约等于模拟试验结果。 clear all;clc; N=100000;s=0; for n=1:N %step 4.重复N 次打靶游戏试验

x=rand(); %step 1.产生在(0,1)上均匀分布的随机数if(x<=0.1) %step 2.若随机数落在(0.0,0.1)上,则代表弹着点在7环g=7; s=s+g; %step 3.统计总环数elseif(x<=0.2) %step 2.若随机数落在(0.1,0.2)上,则代表弹着点在8环g=8;s=s+g; elseif(x<=0.5) %step 2.若随机数落在(0.2,0.5)上,则代表弹着点在9环g=9;s=s+g; else %step 2.若随机数落在(0.5,1.0)上,则代表弹着点在10环 g=10;s=s+g; end end gn_th=7*0.1+8*0.1+9*0.3+10*0.5; %step 5.计算、输出理论值fprintf('理论值:%f\n',gn_th); gn=s/N; %step 6.计算、输出试验结果 fprintf('试验结果:%f\n',gn);1.2蒙特卡罗方法的收敛性与误差 1.2.1收敛性 由大数定律可知,应用蒙特卡罗方法求近似解,当随机变量Z 的简单子样数N 趋向于无穷大(N 充分大)时,其均值依概率收敛于它的数学期望。 1.2.2误差 由中心极限定理可知,近似值与真值的误差为N Z E Z N αλ<-)(?。式中的αλ的值可以根据给出的置信水平,查阅标准正态分布表来确定。 1.2.3收敛性与误差的关系 在一般情况下,求具有有限r 阶原点矩()∞

马尔可夫预测算法

马 尔可夫预测算法 综述 马尔可夫预测法以系统状态转移图为分析对象,对服从给定状态转移率、系统的离散稳定状态或连续时 间变化状态进行分析马尔可夫预测技术是应用马尔可夫链的基本原理和方法研究分析时间序列的变化规律,并预测其未来变化趋势的一种技术。 方法由来 马尔可夫是俄国的一位著名数学家 (1856—1922),20世纪初,他在研究中发现自然界中有一类事物的变化过程仅与事物的近期状况有关,而与事物的过去状态无关。针对这种情况,他提出了马尔可夫预测方法,该方法具有较高的科学性,准确性和适应性,在现代预测方法中占有重要地位。 基础理论 在自然界和人类社会中,事物的变化过程可分为两类:一类是确定性变化过程;另一类是不确定性变化过程。确定性变化过程是指事物的变化是由时间唯一确定的,或者说,对给定的时间,人们事先能够确切地知道事物变化的结果。因此,变化过程可用时间的函数来描述。不确定性变化过程是指对给定的时间,事物变化的结果不止一个,事先人们不能肯定哪个结果一定发生,即事物的变化具有随机性。这样的变化过程称为随机过程一个随机试验的结果有多种可能性,在数学上用一个随机变量(或随机向量)来描述。在许多情况下,人们不仅需要对随机现象进行一次观测,而且要进行多次,甚至接连不断地观测它的变化过程。这就要研究无限多个,即一族随机变量。随机过程理论就是研究随机现象变化过程的概率规律性的。客观事物的状态不是固定不变的,它可能处于这种状态,也可能处于那种状态,往往条件变化,状态也会发生变化状态即为客观事物可能出现或存在的状况,用状态变量表示状态: ??? ? ?????=???==,2,1,,2,1t N i i X t 它表示随机运动系统,在时刻),2,1( =t t 所处的状态为),2,1(N i i =。状态 转移:客观事物由一种状态到另一种状态的变化。设客观事物有 N E E E E ...,,321共 N 种状态,其中每次只能处于一种状态,则每一状态都具有N 个转向(包括转向自身),即由于状态转移是随机的,因此,必须用概率来描述状态转移可能性的大小,将这种转移的可能性用概率描述,就是状态转移概率。

蒙特卡罗方法简介

第三章蒙特卡罗方法简介 3.1 Monte Carlo方法简介 Monte Carlo方法是诺斯阿拉莫斯实验室在总结其二战期间工作(曼哈顿计划)的基础上提出来的。Monte Carlo的发明,主要归功于Enrico Fermi、Von Neumann和Stanislaw Ulam等。自二战以来,Monte Carlo方法由于其在解决粒子输运问题上特有的优势而得到了迅速发展,并在核物理、辐射物理、数学、电子学等方面得到了广泛的应用。Monte Carlo的基本思想就是基于随机数选择的统计抽样,这和赌博中掷色子很类似,故取名Monte Carlo。 Monte Carlo方法非常适于解决复杂的三维问题,对于不能用确定性方法解决的问题尤其有用,可以用来模拟核子与物质的相互作用。在粒子输运中,Monte Carlo技术就是跟踪来自源的每个粒子,从粒子产生开始,直到其消亡(吸收或逃逸等)。在跟踪过程中,利用有关传输数据经随机抽样来决定粒子每一步的结果[6]。 3.2 Monte Carlo发展历程 MCNP程序全名为Monte Carlo Neutron and Photon Transport Code (蒙特卡罗中子-光子输运程序)。Monte Carlo模拟程序是在1940年美国实施“发展核武器计划”时,由洛斯阿拉莫斯实验室(LANL)提出的,为其所投入的研究、发展、程序编写及参数制作超过了500人年。1950年Monte Carlo方法的机器语言出现, 1963年通用性的Monte Carlo方法语言推出,在此基础上,20世纪70年代中期由中子程序和光子程序合并,形成了最初的MCNP程序。自那时起,每2—3年MCNP更新一次, 版本不断发展,功能不断增加,适应面也越来越广。已知的MCNP程序研制版本的更新时间表如下:MCNP-3:1983年写成,为标准的FORTRAN-77版本,截面采用ENDF /B2III。 MCNP-3A:1986年写成,加进了多种标准源,截面采用ENDF /B2I V[20]。

马尔科夫决策过程MDPs

数学模型-MATLAB工具箱-马尔可夫决策过程-MDPs 前言: MDPs提供了一个数学框架来进行建模,适用于结果部分随机部分由决策者控制的决策情景。由于其在数学建模或学术发表中经常被用到,这里我们从实用的角度对其做一些归纳整理,案例涉及到大数据应用方面的最新研究成果,包括基本概念、模型、能解决的问题、基本算法(基于MATLAB或R工具箱)和应用场景。最后简单介绍了部分可观察马尔可夫决策过程(POMDP)。 由于相关的理论和应用研究非常多,这里我们只介绍最基本的东西(但是提供了必要而丰富的展开),并提供相应的参考文献和工具箱链接,以期帮助读者更快上手,至于更加深入的研究和更加细致的应用,则需要参照相关研究领域的学术文献。 一、基本概念 (1)序贯决策(Sequential Decision)[1]: 用于随机性或不确定性动态系统的最优化决策方法。 (2)序贯决策的过程是: 从初始状态开始,每个时刻作出最优决策后,接着观察下一时刻实际出现的状态,即收集新的信息,然后再作出新的最优决策,反复进行直至最后。 (3)无后效性 无后效性是一个问题可以用动态规划求解的标志之一。 某阶段的状态一旦确定,则此后过程的演变不再受此前各种状态及决策的影响,简单的说,就是“未来与过去无关”,当前的状态是此前历史的一个完整总结,此前的历史只能通过当前的状态去影响过程未来的演变。 (4)马尔可夫决策过程 系统在每次作出决策后下一时刻可能出现的状态是不能确切预知的,存在两种情况: ①系统下一步可能出现的状态的概率分布是已知的,可用客观概率的条件分布来描述。对于这类系统的序贯决策研究得较完满的是状态转移律具有无后效性的系统,相应的序贯决策称为马尔可夫决策过程,它是将马尔可夫过程理论与决定性动态规划相结合的产物。 ②系统下一步可能出现的状态的概率分布不知道,只能用主观概率的条件分布来描述。用于这类系统的序贯决策属于决策分析的内容。 注:在现实中,既无纯客观概率,又无纯主观概率。 客观概率是根据事件发展的客观性统计出来的一种概率。主观概率与客观概率的主要区别是,主观概率无法用试验或统计的方法来检验其正确性。 客观概率可以根据历史统计数据或是大量的试验来推定。 客观概率只能用于完全可重复事件,因而并不适用于大部分现实事件。 为什么引入主观概率:有的自然状态无法重复试验。如:明天是否下雨,新产品销路如何。 主观概率以概率估计人的个人信念为基础。主观概率可以定义为根据确凿有效的证据对个别事件设计的概率。这里所说的证据,可以是事件过去的相对频率的形式,也可以是根据丰富的经验进行的推测。比如有人说:“阴云密布,可能要下一场大雨!”这就是关于下雨的可能性的主观概率。主观概率具有最大的灵活性,决策者可以根据任何有效的证据并结合自己对情况的感觉对概率进行调整。 二、和马尔可夫链的联系

基于隐马尔可夫模型的基站定位地图匹配算法研究

第18卷 第7期 中 国 水 运 Vol.18 No.7 2018年 7月 China Water Transport July 2018 收稿日期:2018-03-08 作者简介:马骁骏(1996-),男,河北张家口人,硕士生,上海理工大学 光电信息与计算机工程学院,研究方向为地图 匹配、路径规划等。 基于隐马尔可夫模型的基站定位地图匹配算法研究 马骁骏1,李 烨2 (1.上海理工大学 光电信息与计算机工程学院,上海 200093;2.上海理工大学 光电信息与计算机工程学院,上海 200093) 摘 要:在基站定位过程中,信号衰减、噪声干扰、基站群切换等因素会造成定位数据误差大、无效点多,隐马尔可夫模型若基于定位点间的大圆距离计算转移概率,可能降低最终的路段匹配准确率。文中首先去除定位数据中的不可能点,然后利用截尾均值滤波技术进行预处理;以候选点间的大圆距离替代定位点间的大圆距离、并结合相邻定位点间的时间间隔计算转移概率,利用维特比算法解得最优移动轨迹。基于OSM 实际路网数据的仿真结果表明,文中方法明显提高了基站定位数据的匹配精度。 关键词:基站定位;地图匹配;隐马尔可夫模型;维特比算法;滤波 中图分类号:TP391 文献标识码:A 文章编号:1006-7973(2018)07-0064-03 引言 如今,智能手机用户常使用基于位置的应用程序,并与服务提供商共享他们的位置数据。大量的位置数据对于智能交通系统(Intelligent Transport System,ITS)应用非常有用。例如,这些数据可用于预估道路行驶时间、交通拥堵检测和交通流量预测。但由于位置数据存在误差,这些数据只能通过与电子地图匹配后才可以应用于上述工作。 智能手机可通过多种方式生成位置数据,例如GPS 定位、Wi-Fi 定位和基站定位。不同的定位方式其定位误差差别很大。研究表明,GPS、Wi-Fi 和LBS 定位的定位误差分别可达8、74和600m [1]。虽然GPS 定位具有极好的定位精度,但是,对手机电池的消耗也比其他定位方法高近10倍[2-3]。Wi-Fi 定位主要应用于室内定位场景,不适用于道路网络上的车辆。与前两者相比,LBS 定位虽然定位精度不够高,但它的能耗和成本更低[2]。与匹配GPS 或Wi-Fi 定位数据相比,这种有噪声且误差大的LBS 定位数据的地图匹配是很困难的。为了使这种数据可以应用到智能交通系统中,需要改进现有的地图匹配算法。 本文通过对基站定位方法以及地图匹配理论的研究,提出了一种基于隐马尔可夫模型(Hidden Markov model,HMM)的地图匹配算法。首先利用α-截尾滤波器[4]对基站定位原始数据进行预处理,然后基于隐马尔可夫模型方法对问题建模,定义转移概率模型,利用维特比算法求解以获得最可能的道路序列,对原始移动轨迹进行修复。我们使用来自实际路网的LBS 位置数据来测试该方法,并与文献[5]中的HMM 算法进行比较。 一、基于基站定位的地图匹配算法研究 1.电子地图解析 使用定位数据进行地图匹配时,需要与路网数据结合,从而将定位点投影到对应的路段上面。本文采用的路网数据 来源于Open StreetMap (OSM)[6],地图数据格式为XML (eXtensible Markup Language),地图数据处理流程如下: (1)解析路网数据,解析从OSM 下载的XML 格式的地图数据,解析出来的地图数据主要包括该块地图区域的点(node)、路(ways)、关系(relation)以及边界信息。这四种元素构成了整个地图画面。其中,node 定义为空间中节点的位置;ways 定义为路段或者区域;relation 定义为元素之间的关系。 (2)获取路网中的道路等级信息(highway)标签的值,如高速公路(motorway)、主干道(primary)、次干道(secondary)等,从而得到各个道路的速度限制以用于定位数据的速度过滤。 2.定位数据预处理 由于基站定位数据本身误差大、噪声高,直接应用基于隐马尔可夫模型的地图匹配算法不会有好的修复效果,所以在地图匹配前,需要对定位数据进行预处理,以剔除对匹配产生错误的定位点。预处理步骤如下: (1)去除不可能点。由于基站定位中非视距传播(NLOS)、噪声干扰、信号衰减以及基站群切换时产生的“乒乓效应”[6]造成定位过程中产生错误的无效数据即不可能点。车辆的速度受到很多因素的限制,包括车辆本身的最高速度和道路车速限制。因此,我们假设车辆不能超过一定的速度阈值。利用定位数据的经纬度值以及时间戳,我们可以得到任意两点间的速度值。通过其与速度阈值的比较,如果速度值大于阈值,则后面的点为不可能点; (2)α-截尾均值滤波:采用基于顺序量统计理论,针对中、长拖尾干扰噪声而设计的非线性滤波器。相比与中值滤波和均值滤波,α-截尾均值滤波器可以同时处理包含脉冲、高斯噪声的数据。

马尔可夫决策基础理论

马尔可夫决策基础理论 内容提要 本章介绍与研究背景相关的几类决策模型及算法。模型部分,首先是最基本的马尔可夫决策模型,然后是在此基础上加入观察不确定性的部分可观察马尔可夫决策模型,以及进一步加入多智能体的分布式部分可观察马尔可夫决策模型和部分可观察的随机博弈模型。算法部分,针对上述几类模型,我们均按照后向迭代和前向搜索两大类进行对比分析。最后,我们介绍了半马尔可夫决策模型及Option理论,这一理论为我们后面设计分等级的大规模多智能体系统的决策模型及规划框架提供了重要基础。 2.1 MDP基本模型及概念 马尔可夫决策过程适用的系统有三大特点:一是状态转移的无后效性;二是状态转移可以有不确定性;三是智能体所处的每步状态完全可以观察。下面我们将介绍MDP基本数学模型,并对模型本身的一些概念,及在MDP模型下进行问题求解所引入的相关概念做进一步解释。 2.1.1 基本模型 马尔科夫决策过程最基本的模型是一个四元组S,A,T,R(Puterman M, 1994): ?状态集合S:问题所有可能世界状态的集合; ?行动集合A:问题所有可能行动的集合; ?状态转移函数T: S×A×S’→[0,1]: 用T(s, a, s’)来表示在状态s,执行动作 P s s a; a,而转移到状态s’的概率('|,) ?报酬函数R: S×A→R:我们一般用R(s,a)来表示在状态s执行动作a所能得到的立即报酬。 虽然有针对连续参数情况的MDP模型及算法,然而本文在没有特殊说明的情况都只讨论离散参数的情况,如时间,状态及行动的参数。 图2.1描述的是在MDP模型下,智能体(Agent)与问题对应的环境交互的过程。智能体执行行动,获知环境所处的新的当前状态,同时获得此次行动的立即

第6章 马尔科夫预测方法-思考与练习

第6章 马尔科夫预测方法 思考与练习(参考答案) 1.设某市场销售甲、乙、丙三种牌号的同类型产品,购买该产品的顾客变动情况如下:过去买甲牌产品的顾客,在下一季度中有15%的转买乙牌产品,10%转买丙牌产品。原买乙牌产品的顾客,有30%转卖甲牌的,同时有10%转卖丙牌的。原买丙牌产品的顾客中有5%转买甲牌的,同时有15%转买乙牌的。问经营甲种产品的工厂在当前的市场条件下是否有利于扩大产品的销售? 解:状态转移概率矩阵为: 假设市场达到稳定状态时,甲、乙、丙市场占有率分别为 x 1、 x 2、x 3、,则: 所以,在当前的市场条件下,当甲种产品的市场占有率大于0.40时不利于扩大商品的销售;当甲种产品的市场占有率小于0.40时利于扩大商品的销售。 2.某产品每月的市场状态有畅销和滞销两种,三年来有如下记录,见下表。“1” 解:由题可得:畅销状态有 M 1 =20 滞销状态有 M 2=12 从畅销到畅销有 M 11=12 从畅销到滞销有 M 12=7 从滞销到畅销有 M 21=7 从滞销到滞销有 M 22=5 0.750.150.1P=0.30.60.10.050.150.8?? ???? ???? [][]1123123233120.750.150.10.30.60.10.050.150.0.40,0.27,0.3813x x x x x x x x x x x x ?????????=? ????? ?+=+===??

计算状态转移概率矩阵(在计算状态转移概率矩阵时最后一个数据不参加计算,因为它在之后转移到哪里尚不清楚) 一步转移概率矩阵为: ?? ??? ?=?????? 12719 19P 7512 12 二步转移概率矩阵为: = ??????=?????? 2 (2)21271919P P 751212 3.某市三种主要牌号甲乙丙彩电的市场占有率分别为23%、18%、29%,其余市场 为其它各种品牌的彩电所占有。根据抽样调查,顾客对各类彩电的爱好变化为 0.50.10.150.250.10.50.20.20.150.050.50.30.20.20.20.4???????????? 其中矩阵元素 ij a 表示上月购买i 牌号彩电而下月购买 j 牌号彩电的概率;1,i = 2,3,4分别表示甲乙丙和其他牌号彩电。 1) 试建立该市各牌号彩电市场占有率的预测模型,并预测未来3个月各种牌号彩电市场占有率变化情况; 2)假定该市场彩电销售量为4.7万台,预测未来三个月各牌号彩电的销售量; 3)分析各牌号彩电市场占有率变化的平衡状态; 4)假定生产甲牌彩电的企业采取某种经营策略(例如广告宣传等),竭力保持了原有顾客爱好不向其它牌号转移,其余不变。分析彩电市场占有率的平衡状态。 解:(1)市场占有率初始向量为:P (0)=(0.23 0.18 0.29 0.3) 状态转移概率矩阵为: 则第K 期的市场占有率的预测模型为: 0.50.10.150.250.10.50.20.2P=0.150.050.50.30.20.20.20.4?? ?????? ?? ??k k 0.50.10.150.250.10.50.20.2S =P(0)P =(0.230.180.290.3)0.150.050.50.30.20.20.20.4k ???? ? ???????

马尔科夫预测法

马尔科夫预测案例 一、 市场占有率的预测 例1:在北京地区销售鲜牛奶主要由三个厂家提供。分别用1,2,3表示。去年12月份对2000名消费者进行调查。购买厂家1,2和3产品的消费者分别为800,600和600。同时得到转移频率矩阵为: 3202402403601806036060180N ?? ?= ? ??? 其中第一行表示,在12月份购买厂家1产品的800个消费者中,有320名消费 者继续购买厂家1的 产品。转向购买厂家2和3产品的消费者都是240人。N 的第二行与第三行的含义同第一行。 (1) 试对三个厂家1~7月份的市场占有率进行预测。 (2) 试求均衡状态时,各厂家的市场占有率。 解:(1)用800,600和600分别除以2000,得到去年12月份各厂家的市场占有率,即初始分布0(0.4,0.3,0.3)p =。 用800,600和600分别去除矩阵N 的第一行、第二行和第三行的各元素,得状态转移矩阵: 0.40.30.30.60.30.10.60.10.3P ?? ?= ? ??? 于是,第k 月的绝对分布,或第 月的市场占有率为: 00()(1,2,3,,7)k k P p P k p P =?= 1k =时,()()10.40.30.30.40.30.30.60.30.10.520.240.240.60.10.3p ?? ? == ? ??? 2k =时,()()()220.40.30.30.520.240.240.4960.2520.252p P P === 3 k =时, ()()()330.40.30.30.4960.2520.2520.50080.24960.2496p P P === 类似的可以计算出4p ,5p ,6p 和7p 。

马尔可夫链预测方法及其一类应用【文献综述】

文献综述 数学与应用数学 马尔可夫链预测方法及其一类应用 马尔可夫性是俄国数学家A.A.Mapkov 在1906年最早提出的. 但是, 什么是马尔可夫性呢? 一般来讲,认为它是“相互独立性”的一种自然推广. 设有一串随机事件,...,,...,,121n n A A A A -中(即n A 属于概率空间(P ,,ξΩ)中的σ代数ξ,1≥n ), 如果它们中一个或几个的发生, 对其他事件的发生与否没有影响, 则称这一串事件是相互独立的(用概率空间(P ,,ξΩ)的符号表示, 即))()(11n m n m n n A P A P X I ===, 推广下, 如果在已知,...,1+n n A A 中的某些事件的发生, 与,,...,,121-n A A A 中的事件发生与否无关, 则称这一串事件{1:≥n A n }具有马尔可夫性. 所以说, 马尔可夫性可视为相互独立性的一种自然推广. 从朴素的马尔可夫性, 到抽象出马尔可夫过程的概念, 从最简单的马尔可夫过程到一般的马尔可夫过程, 经历了几十年的发展过程. 它有极其深厚的理论基础, 如拓扑学、函数论、几何学、近世代数、泛函分析. 又有很广泛的应用空间, 如随机分形、近代物理、公共事业中的服务系统、电子信息、计算技术等. 在现实世界中, 有很多过程都是马尔可夫过程, 如软件可靠性测试、传染病受感染的人数、农村剩余劳动力流动趋势预测、液体中微粒所作的布朗运动、产品市场占有率及利润率的变动, 车站排队问题等等, 都可视为马尔可夫过程. 所谓马尔可夫链是指时间连续(或离散)、状态可列、时间齐次的马尔可夫过程. 之所以要研究这种过程, 一方面是由于它的理论比较完整深入, 可以作为一般马尔可夫过程及其他随机过程的借鉴; 二是由于它在自然科学和许多实际问题(如遗传学、教育学、经济学、建筑学、规则论、排队论等)中发挥着越来越大的作用. 自从我国著名数学家、教育家、中科院王梓坤院士在上世纪50年代将马尔可夫理论引入国内以后, 我国数学家对马尔可夫过程的研究也取得了非常好的效果, 在生灭过程的构造和它的积分型泛函的分布、马尔可夫过程的零壹律、Martin 边界与过份函数、马尔可夫过程

论述马尔可夫模型的降水预测方法

随机过程与随机信号处理课程论文

论述马尔可夫模型的降水预测方法 摘要:预测是人们对未知事物或不确定事物行为与状态作出主观的判断。中长 期降水量的预测是气象科学的一个难点问题, 也是水文学中的一个重要问题。今年来,针对降水预测的随机过程多采用随机过程中的马尔可夫链。本文总结了降水预测的马尔可夫预测的多种方法和模型,对其中的各种方法的马尔可夫链进行了比较和分析,得出了一些有用的结论。 关键字:降水预测,随机过程,马尔可夫链,模拟 前言:大气降水是自然界水循环的一个重要环节。尤其在干旱半干旱地区, 降 水是水资源的主要补给来源, 降水量的大小,决定着该地区水资源的丰富程度。因此, 在水资源预测、水文预报中经常需要对降水量进行预报。然而, 由于气象条件的变异性、多样性和复杂性, 降水过程存在着大量的不确定性与随机性, 因此到目前为止还难以通过物理成因来确定出未来某一时段降水量的准确数值。在实际的降水预测中,有时不必预测出某一年的降水量,仅需预测出某个时段内降水的状况既可满足工作需要。因此,预测的范围相应扩大,精度相应提高。因此对降水的预测可采用随机过程的马尔可夫链来实现。 用随机过程中马尔可夫链进行预测是一种较为广泛的预测方法。它可用来预测未来某时间发生的变化, 如预测运输物资需求量、运输市场等等。马尔可夫链, 就是一种随机时间序列, 它表示若已知系统的现在状态, 则系统未来状态的规律就可确定, 而不管系统如何过渡到现在的状态。我们在现实生活中, 有很多情况具有这种属性, 如生物群体的生长与死亡, 一群体增加一个还是减少一个个体, 它只与当前该生物群体大小有关, 而与过去生物群体大小无关。] 本文针对降水预测过程中采用马尔可夫链进行模拟进行了综述和总结。主要的方法有利用传统的马尔可夫链的方法模拟;有采用加权的马尔可夫链模拟来进行预测;还有基于模糊马尔可夫链状模型预测的方法;还有通过聚类分析建立降水序列的分级标准来采用滑动平均的马尔可夫链模型来预测降水量;从这些方法中我们可以看出,马尔可夫链对降水预测有着重要的理论指导意义。 1.随机过程基本原理 我们知道,随机变量的特点是,每次试验结果都是一个实现不可预知的,但为确定的量。而在实际中遇到的许多物理现象,实验所得到的结果是一个随时间变化的随机变量,且用一个或多个随机变量我们有时无法描述很多这种现象的的全部统计规律,这种情况下把随时间变化的随机变量的总体叫做随机过程。对随机过程的定义如下:

相关文档
最新文档