第十二章马尔可夫链第一节第二节(上)

合集下载

齐次马尔可夫链

齐次马尔可夫链

・齐次马尔可夫链作者:日期:第二节齐次马尔可夫链一、齐次马尔可夫链的概念一个随机过程{Xn, n = 0, 1, 2,・・・}就是一族随机变量,而Xn能取的各个不同的值,则称为状态。

如果一个随机过程{Xn, n-0, 1,2,山一种状态转移到另一种状态的转移概率只与现在处于什么状态有矢,而与在这时刻之前所处的状态完全无矢,即如果过程{Xn, n=0, 1,2,-}中,Xn+1的条件概率分布只依赖于Xn的值,而与所有更前面的值相互独立,则该过程就是所谓马尔可夫(Markov)过程.马尔可夫链是指时间离散,状态也离散的马尔可夫过程。

一个马尔可夫链,若从u 时刻处于状态i,转移到t+u时刻处于状态j的转移概率与转移的起始时间U无矢,则称之为齐次马尔可夫链,简称齐次马氏链。

如果把从状态i到状态j的一步转移概率记为Pij,则Pij=P {X八=j I Xn=i} i, j = 0, 1, 2,…,且有转移概率矩阵P,这样,一个齐次马氏链,可以山一个转移概率矩阵P以及在时刻零时状态x=0, 1, 2,…的概率分布列向量Q= (q (0) , q⑴,…)完全确定。

由齐次马氏链性质知道,第i状态的行向量Ai与第i + 1状态的行向量Ai+i之间存在着矢系式:Ai+i=AiP o二、齐次马氏链在评估教学质量中的应用教学过程是一个随机过程,也就是说,对于具有相同基础知识背景的学生(个体),在同时接受新知识时是随机的。

我们可以把一个班(群体)的学生划分为不同的等级(譬如:优、良、中、及格、不及格五个等级),近似地认为处于同一等级的学生具有相同的基础知识,用齐次马氏链,通过学生学习状态的转移概率矩阵,最终可以预测一个班学生学习成绩的稳定状态。

对教师而言,也就可用来评估、预测一个班的教学质量。

在教学效果指标的量化过程中'齐次马氏链评估法是将一个群体(如一个班或一个年级)的学生在某次考试中获得优(90分以上)、良(80〜89分)、中(70〜79分)、及格(60〜69分)和不及格(59分以下)各等级学生人数占总人数之比,作为状态变量,并用向量表示之。

马尔可夫过程基础

马尔可夫过程基础
移动一单位; (2)若移动前在1,5处,则以概率1停留在原处。
因为质点在1,5两点被“吸收”, 故称 有两个吸收壁的随机游动 其一步转 移矩阵为
1 1 2 0 P 1 0 0
0 0 1 2 0 0
0 1 2 0 1 2 0
0 0 1 2 0 0
0 0 0 1 2 1
于是
d j rd j 1
d j rd j 1 r d j 2 r d0
2 j
需讨论 r

r 1 c 1 1 u0 uc (u j u j 1 )


j 0
c 1
d j
i j c 1
j 0 c 1

u j u j uc
用 X n 表示在时刻 n 质点的位置,
则{ X n ,n 0 }是一个有限齐次马氏链,
试写出一步转移矩阵.
分 析
1
2
3
4
5

p11 p 21 p31 P 1 p41 p51
0 1 3 0 P 1 0 0
p12 p22 p32 p42 p52
p0 (i) 1
称 p0 (i) 为马氏链的初始分布
注 马氏链在初始时刻有可能处于I中任意状态,初始分布 就是马氏链在初始时刻的概率分布。 6.绝对分布 概率分布
n0 pn (i) P{X n i} , i I ,
称为马氏链的绝对分布或称绝对概率
定态分布

若绝对分布 pn (i) 与 n 无关,
q c 1 ( p )
例3 排队问题 顾客到服务台排队等候服务,在每一个服务周期中只 要服务台前有顾客在等待,就要对排在前面的一位提 供服务,若服务台前无顾客时就不能实施服务。

第二节离散时间马尔可夫链的几个性质

第二节离散时间马尔可夫链的几个性质
第二节 离散时间马尔可夫链的几个性质
1 互通性 2 周期性 3 常返性 4 遍历性
1
1.3互通性举例
考察具有两个吸收壁的随机游动,E={0,1,2,3,…,a}它的 一步转移概率矩阵为
1 0
q
0
p
q0p
P
...
...
...
...
...
...
.
.
.
q 0 p
0 1
q=(1-p)
p
0
i-1 i i+1
1k
1 1/3 j
l
i
1
2/3 1 k
8
2 .2周期性
如何判别一个状态是非周期的?
若此状态带有自环,则必为非周期的(虽然非周期 的状态不一定有自环)
若此状态与一个非周期的状态互通,则必为非周期 的
以上是两个充分条件
我是非周期的, 因为我有自环
1/4
我也是非周期的, 因为我与非周期 状态1互通
3/4 1
1
1
0
2/3
1
2
非常返
3
1/2
常返
1/3
1/2
14
3.4 常返性
定理2.3 设X是不可约马氏链,那么其状态集E或者全由 非常返态组成,或者全为零常返态,或者全为 正常返态,且每个状态周期相同 这个定理称作“不可约马氏链的状态一致性”
15
定理2.4
4.1 遍历性
若马氏链X是齐次,不可约,非周期的,那么下列极限
19
5 .3离散时间马尔可夫链性质举例
有 p33 1
1
0
1
2
3
可约( 为吸收态) 非周期 非常返 正常返 遍历的 此马氏链不是遍历的

马尔可夫链课件

马尔可夫链课件

PPXX00 ii00,X1PXi1,1L,i1 |XXk01 ii0k1L PXk 马ik |氏Xk性1 ik1 P X k ik |X 0 i0,X1 i1,L ,X k 1 ik 1
P即X马0尔 i可0,夫X链1 {i1,XLn,,Xn k10}i的k1有 限维分布完全由初始
分布PPX{kX0 ik|Xi}k1 和 ik条1件概率 P{Xn j | Xn1 i} 确定.
PX 0 i0,X1 i1,L ,X k 2 ik 2
马氏性
P X k 1 ik 1 | X 0 i0,L ,X k 2 ik 2
P X k ik |X k 1 ik 1
• 第一节 基本概念 • 第二节 状态的分类及性质 • 第三节 极限性态及平稳分布 • 第四节 Markov链的应用
第一节 基本概念
一、Markov链的定义 二、转移概率 三、Markov链的例子 四、n步转移概率,C-K方 程
第一节 基本概念
一、Markov链的定义
马尔可夫性(无后效性)
过程(或系统)在时刻t0所处的状态为已知的条件下,过程在时 刻t>t0所处状态的条件分布与过程在时刻t0之前所处的状态无关。
则称 {Xn,n 0}为齐次马尔可夫链,称 pij 为从状态 i 转移到状态 j 的一步转移概率.
若马尔科夫链 {Xn,n 0}的状态空间是有限集,则 称 {Xn,n 0}为有限状态的马尔科夫链;
若马尔科夫链 {Xn,n 0}的状态空间是可列集,则 称 {Xn,n 0}为可列状态的马尔科夫链.
是状态有限的马尔科夫链. 1.求其一步转移概率矩阵; 2.若 0.7, 0.4 ,且今天有雨,求第四天有雨的
概率.
四、n步转移概率、C-K方程

Markov Chain(马尔科夫链)

Markov Chain(马尔科夫链)

状态转换矩阵:
1 0 0 1 − ������ 0 ������ 0 1 − ������ 0 0 0 1 − ������ 0 0 0
0 0 ������ 0 0
0 0 0 ������ 1
0
赌徒问题(续)
• ������ =
0 ������ 1 − ������ 0 0 1 − ������ 0 0 0 0 0 ������ 0 0 0 0 1 − ������ 0 0 ������ 0 1 阵������的元素������������������ 等于从状态������������ 出发到达稳定时经过������������ 的次数的期望值。 推论:马尔可夫过程中,从非稳定状态������������ 出发,到达稳定状态时的步数期望值 等于矩阵������的������行元素的和。
赌徒问题
• 一个赌徒,假设拿两元钱,一次赌一美元,赢的概率是������,输的概率是1 − ������,当赢够4元,或者全部输光就不赌了。 • 状态转换图:
1 − ������ 1 1 − ������ 1 ������ 2 ������ 3 ������ 1 − ������ 1 4 ������ =
������
������������
.此矩阵
������������������ = 1, ������ = 1,2, … , ������.
������=1
重新标记这些状态的序号,把对角线是1的元素调整到右下角,也就是变成 ������������×������ ������������× ������−������ ������������×������ → ������ ������−������ × ������ ������(������−������)×(������−������) 矩阵������ = ������ − ������������×������

马尔科夫链详解

马尔科夫链详解
态,也可能处于那种状态,往往条件变化,状态也会发生 变化。如某种产品在市场上本来是滞销的,但是由于销售 渠道变化了,或者消费心理发生了变化等,它便可能变为 畅销产品。
4
定义 1 设{ Xn , n 1,2, }是一个随机序列,状态 空间 E为有限或可列集,对于任意的正整数m,n,若
i, j,ik E(k 1, ,n 1),有
15
解 设 Xn(n 1, ,97) 为第 n 个时段的计算机状 态,可以认为它是一个时齐马氏链,状态空间
E {0,1}。要分别统计各状态一步转移的次数,即
0→0,0→1,1→0,1→1 的次数,也就是要统计数据
字符串中‘00’,‘01’,‘10’,‘11’四个子串的个数。
利用 Matlab 软件,求得 96 次状态转移的情况是
马尔科夫Markov链
Markov原名A.A. Markov(俄,1856-1922) 于1906年开始研究此类问题.
1
1 马尔可夫链的定义 现实世界中有很多这样的现象,某一系统在已知 现在情况的条件下,系统未来时刻的情况只与现在有 关,而与过去的历史无直接关系。比如,研究一个商 店的累计销售额,如果现在时刻的累计销售额已知, 则未来某一时刻的累计销售额与现在时刻以前的任一 时刻累计销售额无关。描述这类随机现象的数学模型 称为马尔科夫模型,简称马氏模型。
0→0,8 次;
10
(1)对一切i, j E ,0 pij (m) 1;
(2)对一切i E , pij (m) 1; jE
(3)对一切i,
j
E , pij (0)
ij
1, 当i 0, 当i
j时, j时 .
11
当实际问题可以用马尔可夫链来描述时,首先要 确定它的状态空间及参数集合,然后确定它的一步转 移概率。关于这一概率的确定,可以由问题的内在规 律得到,也可以由过去经验给出,还可以根据观测数 据来估计。

马尔可夫链的定义及例子


3、转移概率
定义 i, j S, 称 P Xn1 j Xn i
的一步转移概率。
pij n 为n时刻
若i, j S, pij n pij ,即pij与n无关,称转移概率
具有平稳性.此时称{Xn,n≥0}为齐次(或时齐的)马尔 可夫链。记P=(pij),称P为{Xn,n≥0}的一步转移概率矩阵.
0
j!
j 0,1, i
pi0公式略有不同,它是服务台由有i个顾客转为空闲的
概率,即第n个顾客来到时刻到第n+1个顾客来到时刻之
间系统服务完的顾客数≥i+1。

pi0 P X n1 0 X n i P(Yn i 1) P(Yn k) k i1
et (t)k dG t ,

0 P{Yn
j Tn1 x}dG x
( x) j exdG x, j 0,1, 2,
0 j!
因此, {Xn,n≥1}是马尔可夫链。其转移概率为
P0 j P( X n1 j X n 0) P(Yn j X n 0)
P(Yn
P( X n1 in1 X n in )
所以{Xn,n≥0}是马尔可夫链,且
pij P( X n1 j X n i) P( f i,Yn1 j) P( f i,Y1 j)
二、切普曼-柯尔莫哥洛夫方程
1,随机矩阵 定义:称矩阵A=(aij)S×S为随机矩阵,若aij ≥0,且
一步转移概率矩阵

0.5009
0.0458 0.2559 0.1388 0.2134
0.0466 0.0988 0.36584 0.14264

《马尔可夫链讲》课件

平稳分布的概率分布函数与时间无关,只与系统的状态空间和转移概率矩阵有关。
在平稳分布下,系统的各个状态之间转移的次数趋于平衡,每个状态的平均逗留时 的 马尔可夫链,都存在至少一个平
稳分布。
存在性定理的证明基于遍历理论 ,即如果马尔可夫链是遍历的,
那么它必然存在平稳分布。
根据接受概率判断是否接受样本的技 术,可以提高样本的质量和效率。
接受-拒绝抽样技术
接受概率
根据目标分布和当前状态计算出的概率,用于判断是否接受当前状态 转移为下一个状态。
拒绝概率
根据当前状态和接受概率计算出的概率,用于判断是否拒绝当前状态 转移为下一个状态。
接受-拒绝抽样过程
根据当前状态和接受概率计算出接受该状态的概率,如果该概率大于 随机数,则接受该状态作为下一个状态,否则拒绝并重新抽样。
详细描述
马尔可夫链定义为一个随机过程,其 中每个状态只与前一个状态有关,当 前状态只依赖于前一时刻的状态,不 受到过去状态的影响。
马尔可夫链的应用场景
总结词
马尔可夫链在多个领域有广泛应用。
详细描述
在自然语言处理中,马尔可夫链可以用于生成文本、语言模型等;在金融领域 ,马尔可夫链可以用于股票价格预测、风险评估等;在物理学中,马尔可夫链 可以用于描述粒子运动、化学反应等。
模型训练与预测
模型选择
根据数据特点和业务需求选择合适的马尔可 夫链模型。
模型训练
使用历史数据训练马尔可夫链模型。
参数设置
根据经验和业务理解设置模型参数。
预测与推断
基于训练好的模型对未来或未知数据进行预 测和推断。
结果评估与优化
评估指标
选择合适的评估指标(如准确率、召回率、F1值等)对预测结果进行评估。

马尔可夫链精品PPT课件

1,i=j .
例2.1 (一维随机游动)
12345
设一随机游动的质点, 在如右上图所示的
直线点集I={1,2,3,4,5}作随机游动,并且仅仅在1秒,2秒
…等时刻发生游动.游动的概率规则是:如果Q现在位于点
i(1<i<5), 则下一时刻各以1/3的概率向左或向右移动
一格,或以1/3的概率留在原处; 如果Q现在位于点1(或5)
式.
利用积事件的概率及上述定义知: P{X0=i0,X1=i1,…,Xn=in} =P{Xn=in|X0=i0,X1=i1,…,Xn-1=in-1}P{X0=i0,X1=i1,…, Xn-1=in-1} =P{Xn=in|Xn-1=in-1}P{X0=i0,X1=i1,…,Xn-1=in-1} =… =P{Xn=in|Xn-1=in-1}P{Xn-1=in-1|Xn-2=in-2}…P{X1=i1| X0=i0}P{X0=i0}.
即马尔可夫链的统计特性完全由条件概率
P{Xn+1=in+1|Xn=in} 所决定. 如何确定这个条件概率,是马尔可夫链理论和应
用中的重要问题之一.
2.转移概率 条件概率P{Xn+1=j|Xn=i}的直观含义是:系统在时刻n处
于状态i的条件下,在时刻n+1系统处于状态j的概率.这相 当于随机游动的质点在时刻n处于状态i的条件下,下一步 转移到状态j的概率.
pij(n)为pij. 下面只讨论齐次马尔可夫链,并将齐次两字省略.
设I=P{为1,一2,步转移概率pij所组成的矩阵,状态空间
…},则 P=
p11 p12 … p1n … p21 p22 … p2n … … … … ……
pi1 pi2 … pin … …… … … …

马尔可夫链

马尔可夫链马尔可夫过程按其状态和时间参数是连续的或离散的,可分为三类: (1) 时间,状态都是离散的马尔可夫过程,称为马尔可夫链.(2) 时间连续,状态离散的马尔可夫过程,称为连续时间的马尔可夫 (3) 时间,状态都连续的马尔可夫过程. 4.1马尔可夫链的概念及转移概率 一,定义假设马尔可夫过程},{T n X n ∈的参数集T 是离散的时间集合,即 T={0,1,2,…},其相应n X 可能取值的全体组成的状态空间是离散的状态集,...}.,{21i i I =定义4.1 设有随机过程},{T n X n ∈,若对于任意的整数T n ∈和任意的I i i i i n ∈+.,...,,,1210,条件概率满足n n n n i X i X i X i X P ====++,...,,{110011}=},{11n n n n i X i X P ==++ (4.1) 则称},{T n X n ∈为马尔可夫链,简称.马氏链.(4.1)式是马尔可夫链的马氏性(或无后效性)的数学表达式.由定义知 ],...,,{1100n n i X i X i X P =====}.,...,,{111100--====n n n n i X i X i X i X P },...,,{111100--===n n i X i X i X P =}{11--==n n n n i X i X P .},...,,{111100--===n n i X i X i X P =… =}{11--==n n n n i X i X P }{2211----==n n n n i X i X P …}{0011i X i X P ==}.{00i X P =可见,马尔可夫链的统计特性完全由条件概率}{11n n n n i X i X P ==++所决定. 二,转移概率条件概率}{1i X j X P n n ==+的直观含义为系统在时刻n 处于状态i 的条件下,在时刻n+1系统处于状态j 的概率.它相当于随机游动的质点在时刻n 处于状态i 的条件下,下一步转移到状态j 的概率.记此条件概率为).(n p ij 定义4.2 称条件概率).(n p ij = }{11n n n n i X i X P ==++为马尔可夫链},{T n X n ∈在时刻n 的一步转移概率,其中i,j I ∈,简称为转移概率. 定义4.3 若对任意i,j I ∈,马尔可夫链},{T n X n ∈的转移概率).(n p ij 与n 无关,则称马尔可夫链是齐次的,并记).(n p ij 为.ij p下面我们只讨论齐次马尔可夫链,通常将齐次两字省略.设p 表示一步转移概率.ij p 所组成的矩阵,且状态空间I={1,2,…},则⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=...........................2222111211nnp p p p p p p 称为系统的一步转移概率矩阵,它有性质: (1) .,1)2(;,,0∑∈∈=∈≥Ij ij ijI i p I j i p通常称满足上述(1),(2)性质的矩阵为随机矩阵. 定义4.4称条件概率ij n p )(= )1,0,,(},{≥≥∈==+n m I j i i X j X P m n m 为马尔可夫链},{T n X n ∈的n 步转移概率,.并称)()()(n ij n p p =为马尔可夫链的n 步转移矩阵,其中(1) .,1)2(;,,0)(∑∈∈=∈≥Ij ij n ij n I i p I j i p 即也是随机矩阵.当n=1 时, .)1(ij p =.ij p ,此时一步转移矩阵.)1(p p =此外我们规定 ⎩⎨⎧=≠=.,1,,0)0(j i j i pij定理4.1设},{T n X n ∈为马尔可夫链,则对任意整数n l n <≤≥0,0和,,I j i ∈n 步转移概率.)(ij n p 具有下列性质:(1)))()()(l n kj Ik l ik n ij p p p -∈∑=; (4.2)(2) ;......112111)(j k Ik k k ik Ik n ij n n p p p p --∑∑∈∈= (4.3)(3);)1()(-=n n PP P (4.4) (4).)(n n P P =(4.5)证明(1) 利用全概率公式及马尔可夫性,有}{)(i X j X P p m n m n ij ===+=}{},{i X P j X i X P m n m m ===+}{},{.},{},,{i X P k X i X P k X i X P j X k X i X P m l m m Ik l m m n m l m m =========+∈+++∑}{}{i X k X P k X j X P m l m l m Ik n m =====++∈+∑=)()()()(m p l m p l ik Ik l n ij +∑∈-=)()(.l n kjIk l ik p p -∈∑. (2)在(1)中令1,1k k l ==得))1()(111-∈∑=n jkIk ik n ij p p p 这是一个递推公式,可递推下下去即得(4.3). (3)在(1).令l=1利用矩阵乘法可得. (4) 由(3),利用归纳法可证.定理4.1中的(1)式称为切普曼---柯尔哥洛夫方程,简称C-K 方程 .定义4.5设},{T n X n ∈为马尔可夫链,称 },{0j X P p j ==)(},{)(I j j X P n p n j ∈==为},{T n X n ∈的初始概率和绝对概率,并分别称}),({},,{I j n p I j p j j ∈∈为},{T n X n ∈的初始分布和绝对分布.简记为}.),({},,{n p p j j 称概率向量 )0(),...),(),(()(21>=n n p n p n P T 为n 时刻的绝对概率向量,而称)0(,...),,(21>=n p p P T为初始向量.定理4.2设},{T n X n ∈为马尔可夫链,则对任意整数I j n ∈≥,1,绝对概率).(n p j 具有下列性质:(1)))()(n ij Ii i j p p n p ∑∈=; (4.6)(2) ij Ii i j p n p p )1(-=∑∈ (4.7)(3);)0()()(n T T P P n P = (4.8) (4)P n P n P T T )1()(-= (4.9)证明(1) ===}{)(j X P n p n j},{0j X i XP n Ii ==∑∈= }{}{00i X P i X j XP nIi ===∑∈ =)(n ijIi i p p ∑∈ (2)===}{)(j X P n p n j },{1j X i X P n Ii n ==∑∈-=}{}{11i X P i X j X P n n n Ii ===--∈∑==ij Ii i p n p ∑∈-)1((3)与(4)是(1)与(2)的矩阵形式.定理4.3 设},{T n X n ∈为马尔可夫链,则对任意,1,,...,1≥∈n I i i n 有 },...{11n n i X i X P ===....11n n i i ii i p p p -∑ (4.10) 证明 由全概率公式及马氏性有},...{11n n i X i X P ===},...,,{110n n Ii i X i X i X P ===∈=},...,,{110n n Ii i X i X i X P ===∑∈=}.,{}{0110i X i X P i X P Ii ===∑∈...},...,{110--===n n n n i X i X i X P=}.,{}{0110i X i X P i X P Ii ===∑∈..}{11--==n n n n i X i X P=n n i i ii Ii i p p p 11...-∑∈.三,马尔可夫链的例子例4.1 无限制随机游动设质点在数轴上移动,每次移动一格,向右移动的概率为p,向左移动的概率为 q=1-p,这种运动称为无限制随机游动.以n X 表示时刻n 质点所处的位置,则},{T n X n ∈是一个齐次马尔可夫链,试写出它的一步和k 步转移概率. 解 },{T n X n ∈的状态空间,...},2,1,0{±±=I 其一步转移概率矩阵为⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=.....................00.........0.....................p q p q P 设在第k 步转移中向右移了x 步向左移动了y 步,且经过k 步转移状态从j 进入j,则⎩⎨⎧-=-=+i j y x k y x ,.2)(,2)(i j k y i j k x --=-+=由于x,y 都只取整数,所以)(i j k -±必须是偶数.又在k 步中哪x 步向右,哪y 步向左是任意的,选取的方法有x k C 种.于是⎩⎨⎧-+-+=是奇数是偶数)(,0)(,i j k i j k q p C p y x x k k ij.例4.2赌徒输光问题.两赌徒甲,乙进行一系列赌博.赌徒甲有a 元,赌注乙有b 元,每赌一局输者给赢者1元,没有和局,直到两人中有一个输光为止.设在每一局中,甲赢的概率为p,输的概率为q=1-p,求甲输光的概率.这个问题实质上是带有两个吸收壁的随机游动,其状态空间为I={0,1,2,…,c} c=a+b.故现在的问题是求质点从a 出发到达0状态先于到达c=a+b 状态的概率.解 设i u 表示甲从状态i 出发转移到状态0的概率,要计算的是a u ..由于0和c 是吸收状态,故,10=u .0=c u i u 由全概公式).1,...,2,1(,11-=+=-+c i qu pu u i i i (4.11) 上式的含义是,甲从状态i 出发开始赌到输光的概率等于’他接下去赢了一局(概率为p)处于状态i+1后再输光”;和他接下去输一局(概率为q),处于状态i-1后再输光”这两个事件的概率.由于p+q=1,(4.11)实质上是一个差分方程.1,...,2,1),(11-=-=--+c i u u r u u i i i i (4.12)其中pqr =,其边界条件为.0,10==c u u (4.13) 先讨论r=1,即p=q=1/2的情况,(4.12)成为 .1,...,2,1),(11-=-=--+c i u u r u u i i i i 令,01α+=u u 得,2012αα+=+=u u u …,01ααi u u u i i +=+=- …,01ααc u u u c c +=+=-将,1,00==u u c 代于最后一式,得参数,1c-=α所以.1,...,2,1,1-=-=ci ciu i 令i=a, 求得甲输光的概率为.1ba bc a u a +=-= 由于甲,乙的地位是对称的,故乙输光的概率为.ba a u a +=再讨论1≠r ,即q p ≠的情况.由(4.12)式得到)(11--=-=-∑i c k i i k c u u r u u =)(011u u r c ki i-=∑-=.1)1(1r r r u ck ---= (4.14) 令k=0,由于,0=c u 有rr u c---=11)1(11即,11)1(1crru --=- 代入(4.14)式,得.1,...,2,1,1-=--=c k rr r u cck k 令k=a,得到输光的概率,1cca a rr r u --= 由对称性,乙输光的概率为.,11111q p r r r r u c cb b =--= 由于,1=+b a u u 因此在1≠r 时,即q p ≠时两个人中也总有一个人要输光的. 例4.3 天气预报问题设昨日,今日都下雨,明日有雨的概率为0.7;昨日无雨今日有雨,明日有雨的概率为0.5;昨日有雨,今日无雨明日有雨的概率为0.4;昨日,今日均无雨,明日有雨的概率为0.2.若星期一星期二均下雨,求星期四下雨的概率.解 设昨日,今日连续两天有雨称为状态0(RR),昨日无雨今日有雨称为状态1(NR),昨日有雨今日无雨称为状态2(RN),昨日今日无雨称为状态3(NN),于是天气预报模型可看作一个四状态的马尔可夫链,其中转移概率为 7.0}{}{}{00====今昨明今昨明今连续三天有雨R R R P P R R R R P p , )(0}{01不可能事件今昨明今==R R R N P p ,,3.07.01}{}{02=-===今昨明今昨明今R R N P R R N R P p)(0}{03不可能事件今昨明今==R R N N P p ,其中R 代表有雨,N 代表无雨.类似地可得到所有状态的一步转移概率,于是它的一步转移概率矩阵为⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=33323130232221201312111003020100p p p p p p p p p p p p p p p p P =⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡8.002.006.004.0005.005.003.007.0其中两步转移矩阵为==P P P .)2(⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡8.002.006.004.0005.005.003.007.0.⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡8.002.006.004.0005.005.003.007.0 = ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡.64.010.016.010.048..020.012.020.030.015.020.035.018.021.012.049.0 由于星期四下雨意味着过程所处的状态为0或1,因此星期一星期二连续下雨,星期四下雨的概率为.61.012.049.0)2(01)2(00=+=+=p p p例 4.4 设质点在线段[1,4]上作随机游动,假设它只能在时刻T n ∈发生移动,且只能停留在1,2,3,4点上.当质点转移到2,3点时,它以1/3的概率向左或向右移动一格或停留在原处.当质点称动到点1时,它以概率1停留在原处.当质点移动到点4时,它以概率1移动到点3.若以n X 表示质点在时刻n 所处的位置,则},{T n X n ∈ 是一个齐次马尔可夫链,其转移概率矩阵为⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=0100313131003131310001P 例中的点1称为吸收壁,即质点一旦到达这种状态后就被吸收住了,不再移动;点4称为反射壁,即质点一旦到达这种状态后,必然被反射出去.例4.5生灭链.观察某种生物群体,以n X 表示在时刻n 群体的数目,设为i 个数量单位,如在时刻n+1增生到i+1个单位的概率为i b ,减灭到i 个数量单位的概率为i a ,保持不变的概率为)(1i i i b a r +-=,则}0,{≥n X n 为齐次马尔可夫链,I={0,1,2,…,}.其转移概率为⎪⎩⎪⎨⎧+==+==.1,,,1,i j a j i r i j b p ii i ij称此马尔可夫链为生灭链. 4.2 遍历性设齐次马氏链的状态空间为I,若对于所有,,I a a j i ∈转移概率)(n P ij 存在极限 j ij n n P π=∞→)(lim (不依赖于i)或 ⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡→=................................................)(212121j j jn P n P πππππππππ则称此链具有遍历性.又若∑=jj 1π,则同时称,...),(21πππ=为链的极限分布.齐次马氏链在什么条件下才具有遍历性?如何求出它的极限分布?这问题在理论上已经解决,但是要较多的篇幅.下面对有限链的遍历性给出一个充分条件. 定理4.4设齐次马氏链},{T n X n ∈的状态空间为P a a a I n },,...,,{21=是它的一步转移概率矩阵,如果存在正整数m,使对任意的j i a a ,都有 ,,...,2,1,,0)(N j i m p ij =>则此链具有遍历性,且有极限分布, ),,...,,(21N ππππ=它是方程组 P ππ=或即ij Ni i j p ∑==1ππ的满足条件∑==>Nj j j 11,0ππ的唯一解.在定理条件下马氏链的极限分布又是平稳分布.即若用π作为链的初始分布,即π=)0(p ,则链在任一时刻T n ∈的分布)(n p 永远与π一致,事实上ππππ======-P P P n P p n p n n ...)()0()(1 例4..6 设马尔可夫链的转移概率矩阵为⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=9.005.005.01.08.01.02.01.07.0P 解 容易证明满足定理4.4条件.可得方程组⎪⎪⎩⎪⎪⎨⎧=++++=++=++=1,9.01.02.0,05.08.01.0,05.01.07.0321321332123211πππππππππππππππ解上述方程组得平稳分布为.5882.0,2353.0,1765.0321===πππ。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十二章 马尔可夫链马尔可夫过程是一类特殊的随机过程, 马尔可夫链是离散状态的马尔可夫过程,最初是由俄国数学家马尔可夫1896年提出和研究的.应用十分广泛,其应用领域涉及计算机,通信,自动控制,随机服务,可靠性,生物学,经济,管理,教育,气象,物理,化学等等.第一节 马尔可夫链的定义设随机过程}),({T t t X ∈的状态空间S 是有限集或可列集,对任意正整数n ,对于T 内任意1+n 个参数121+<<⋅⋅⋅<<n n t t t t 和S 内任意1+n 个状态121,,,,+⋅⋅⋅n n j j j j ,我们需要知道112211{(),(),,(),()}n n n n P X t j X t j X t j X t j ++==⋅⋅⋅== 而112211{(),(),,(),()}n n n n P X t j X t j X t j X t j ++==⋅⋅⋅== 11221111{()}{()|()}{()|(),,n n n n P X t j P X t j X t j P X t j X t j X ++====⋅⋅⋅==这就归结为求形如})(,,)(,)(|)({221111n n n n j t X j t X j t X j t X P =⋅⋅⋅===++的条件概率。

在何种条件下这类条件概率容易算出来?一.定义定义 1 设随机过程}),({T t t X ∈的状态空间S 是有限集或可列集,如果对任意正整数n ,对于T 内任意1+n 个参数121+<<⋅⋅⋅<<n n t t t t 和S 内任意1+n 个状态121,,,,+⋅⋅⋅n n j j j j ,条件概率})(,,)(,)(|)({221111n n n n j t X j t X j t X j t X P =⋅⋅⋅===++})(|)({11n n n n j t X j t X P ===++,(13.1) 恒成立,则称此过程为马尔可夫链.式(13.1)称为马尔可夫性,或称无后效性.显然,若随机过程}),({T t t X ∈的状态空间S 是有限集或可列集, 且}),({T t t X ∈是独立过程, 则}),({T t t X ∈是马尔可夫链 。

马氏性的直观含义可以解释如下: 将n t 看作为现在时刻,那末,121,,,-⋅⋅⋅n t t t 就是过去时刻,而1+n t 则是将来时刻.于是,(13.1)式是说,当已知系统现时情况的条件下,系统将来的发展变化与系统的过去无关.我们称之为无后效性.许多实际问题都具有这种无后效性.例如 生物基因遗传从这一代到下一代的转移中仅依赖于这一代而与以往各代无关.再如,每当评估一个复杂的计算机系统的性能时,就要充分利用系统在各个时刻的状态演变所具有的通常概率特性:即系统下一个将到达的状态,仅依赖于目前所处的状态,而与以往处过的状态无关.此外,诸如某公司的经营状况等等也常常具有或近似具有无后效性.二. 马尔可夫链的分类状态空间S 是离散的(有限集或可列集),参数集T 可为离散或连续的两类.三.离散参数马尔可夫链(1)转移概率定义2 在离散参数马尔可夫链 },,,,,),({210⋅⋅⋅⋅⋅⋅=n t t t t t t X 中, 条件概率)(})(|)({1m ij m m t p i t X j t X P ===+ 称为)(t X 在时刻(参数)m t 由状态i 一步转移到状态j 的一步转移概率,简称转移概率.条件概率)(})(|)({)(m n ij m n m t p i t X j t X P ===+称为)(t X 在时刻(参数)m t 由状态i 经n 步转移到状态j 的n 步转移概率.(2)转移概率的性质:对于状态空间S 内的任意两个状态i 和j ,恒有(1) 0)()(≥m n ij t p ;(2)1)()(=∑∈m Sj n ij t p ,⋅⋅⋅=,2,1n ()()(m Sj n ij t p ∑∈ })(|)({i t X j t X P m n m Sj ===+∈∑ })({})(,)({i t X P i t X j tX P m S j m n m ====∑∈+ })({}})(}){)({({i t X P i t X j t X P m S j m n m ====∑∈+1})({})({====i t X P i t X P m m )四.离散参数齐次马尔可夫链定义3 在离散参数马尔可夫链},,,,,),({210⋅⋅⋅⋅⋅⋅=n t t t t t t X 中,如果一步转移概率)(m ij t p 不依赖于参数m t ,即对任意两个不等的参数m t 和k t ,k m ≠,有)(})(|)({1m ij m m t p i t X j t X P ===+ij k ij k k p t p i t X j t X P =====+)(})(|)({1则称此马尔可夫链具有齐次性或时齐性,称)(t X 为离散参数齐次马尔可夫链.例1 Bernoulli 序列是离散参数齐次马尔可夫链.验证 在Bernoulli 序列},3,2,1,{⋅⋅⋅=n X n 中, 对任意正整数 n , 121+<<⋅⋅⋅<<n n t t t t ,121,,,,+⋅⋅⋅n n t t t t X X X X 相互独立,故对 ,1,0=k j )1,,2,1(+⋅⋅⋅=n k ,有},,,|{211211n t t t n t j X j X j X j X P n n =⋅⋅⋅===++ }{11+==+n t j X P n}|{11n t n t j X j X P n n ===++即满足马尔可夫性,且}|{11n t n t j X j X P n n ==++⎩⎨⎧=-====++++0,11,}{1111n n n t j p j p j X P n 当当 , 不依赖于参数n t ,满足齐次性.故Bernoulli 序列是离散参数齐次马尔可夫链.例2 爱伦菲斯特(Ehrenfest)模型 一容器中有a 2个粒子在作随机运动.设想有一实际不存在的界面把容器分为左右容积相等的两部分.当右边粒子多于左边时,粒子向左边运动的概率要大一些,大出部分与两边粒子的差数成正比;反之,当右边粒子少于左边时,粒子向右边运动的概率要大一些.以nX 表示n 次变化后,右边粒子数与均分数a 之差,则状态空间},1,,2,1,0,1,,1,{a a a a S -⋅⋅⋅-⋅⋅⋅+--=, 转移概率 ⎪⎪⎪⎩⎪⎪⎪⎨⎧==±≠∈-=+=+---+-1,),1(21),1(211,1,1,1,a a a a j j j j p p a j S j a j p a j p ,则},3,2,1,{⋅⋅⋅=n X n 是齐次马尔可夫链.第二节 参数离散的齐次马尔可夫链对于离散参数齐次马尔可夫链,本节讨论以下四个问题.一. 转移概率矩阵设 },,,,,),({210⋅⋅⋅⋅⋅⋅=n t t t t t t X 是齐次马尔可夫链, 由于状态空间S 是离散的(有限集或可列集),不妨设其状态空间 },,,2,1,0{⋅⋅⋅⋅⋅⋅=n S .则对S 内的任意两个状态i 和j ,由转移概率 ij p 排序一个矩阵⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅=ij i i j j p p p p p p p p p P 101111000100 称为(一步)转移概率矩阵 .})(|)({1i t X j t X P p m m ij ===+转移概率矩阵的性质:(1) 0≥ij p ,即元素均非负;(2) 1=∑∈S j ij p ,即每行和为1.具有以上两个特点的方阵称为随机矩阵.转移概率矩阵就是一个随机矩阵.例1 Bernoulli 序列的状态空间}1,0{=S ,转移概率矩阵⎝⎛=⎪⎪⎭⎫ ⎝⎛=q q p p p p P 11100100 ⎪⎪⎭⎫p p , })(|)({1i t X j t X P p m m ij ===+⎩⎨⎧=====+1,0,})({1j p j q j t X P m .例1 一维随机游动一个质点在直线上的五个位置:0,1,2,3,4之上随机游动.当它处在位置1或2或3时,以31的概率向左移动一步而以32的概率向右移动一步;当它到达位置0时,以概率1返回位置1;当它到达位置4时以概率1停留在该位置上(称位置0为反射壁,称位置4为吸收壁).以j t X n =)(表示时刻n t 质点处于位置j ,4,3,2,1,0=j ,则},,,),({210⋅⋅⋅=t t t t t X 是齐次马尔可夫链.其状态空间}4,3,2,1,0{=S ,状态0是反射状态,状态4是吸收状态.其转移概率矩阵⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛==1032031000320310003203100010)(ij p P})(|)({1i t X j t X P p m m ij ===+分别以4,3,2,1,0,0==j i ;4,3,2,1,0,1==j i ;4,3,2,1,0,2==j i ;4,3,2,1,0,3==j i ;4,3,2,1,0,4==j i按题设条件求出转移概率 })(|)({1i t X j t X P p m m ij ===+画出状态转移示意图如图例3(成功流)设在一串贝努里试验中,每次试验成功的概率为p ,令⎩⎨⎧≤≤=n k k n k n X n 1,,,0次成功次试验接连第第次试验失败第则},3,2,1,{⋅⋅⋅=n X n 是齐次马尔可夫链.其状态空间},,,2,1,0{⋅⋅⋅⋅⋅⋅=k S ,其转移概率pq X P i X X P n n n -======++1}0{}|0{11,p n P i X i X P n n =+==+=+}1{}|1{1次试验时成功第,,0,,020100===p p p q p ,⎪⎪⎩⎪⎪⎨⎧=≤<+=+≥====+0,0,01,2,0}|{1j q i j i j p i j i X j X P p n n ij , ( ,3,2,1=i )于是转移概率矩阵⎪⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅=ij i i j j p p p p p p p p p P 101111000100⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=p q p q p q p q 0000000000二. 切普曼-柯尔莫哥洛夫方程定理一 设 },,,,,),({210⋅⋅⋅⋅⋅⋅=n t t t t t t X是马尔可夫链,则有)()()()()()(n m l kj km n ik m l n ij t p t p t p ++∑=, (13.6)称为切普曼-柯尔莫哥洛夫方程.证 由条件概率定义计算公式,利用全概率公式和马氏条件,得})(|)({)()(i t X j t X P t p m l n m m l n ij ===+++})({})(,)({i t X P j t X i t X P m l n m m ====++ })({}})(,)(}){)({({i t X P j t X i t X k t X P m Sk l n m m n m =====∑∈+++})({})(,)(,)({i t X P j t X k t X i tX P m Sk l n m n m m=====∑∈+++})({})(,)({})(,)({})(,)(,)({i t X P k t X i t X P k t X i t X P j t X k t X i t X P m n m m kn m m l n m n m m ===⋅======+++++∑})(|)({})(,)(|)({i t X k t X P k t X i t X j t X P m n m n m m kl n m ==⋅====++++∑})(|)({})(|)({i t X k t X P k t X j t X P m n m n m kl n m ==⋅===++++∑)()()()(n m l kj km n ik t p t p +∑= 证毕.如果马尔可夫链具有齐次性,那么切普曼-柯尔莫哥洛夫方程化为)()()(l kjkn ik l n ij p p p ∑=+ ,(13.7)当1,1==l n 时,得到kj kik ij p p p ∑=)2(,进一步改写为矩阵形式 2)2(P P=其中)()2()2(ijp P =是两步转移概率矩阵,P 是一步转移概率矩阵.用数学归纳法可得n n P P =)(,⋅⋅⋅=,4,3,2n (13.8) 式(13.8)表明:n 步转移概率矩阵)()()(n ij n p P =等于一步转移概率矩阵P 的n 次幂.因此也常把n P 作为n 步转移概率矩阵的符号.例2 在本节例2中,求)2(00p 和)2(31p.解 由kj kik ij p p p ∑=)2(,得3131140)2(00=⨯==∑=k k k p p p,913131413)2(31=⨯==∑=k k k p p p.或用2)2()2()(P p P ij==.例3 传输数字0和1的通讯系统,每个数字的传输需经过若干步骤,设每步传输正确的概率为109,传输错误的概率为101,(1)问:数字1经三步传输出1的概率是多少? (2)若某步传输出数字1,那么又接连两步都传输出1的概率是多少?解 以n X 表示第n 步传输出的数字,则},2,1,0,{⋅⋅⋅=n X n 是一齐次马尔可夫链,0X 是初始状态,状态空间}1,0{=S ,一步转移概率矩阵⎝⎛=101109P ⎪⎪⎪⎪⎭⎫109101 (1) 2)2(P P =⎝⎛=101109⎪⎪⎪⎪⎭⎫109101 ⎝⎛101109 ⎪⎪⎪⎪⎭⎫109101= ⎝⎛1001810082⎪⎪⎪⎪⎭⎫1008210018 3)3(P P =⎝⎛=101109⎪⎪⎪⎪⎭⎫109101 ⎝⎛101109 ⎪⎪⎪⎪⎭⎫109101 ⎝⎛101109⎪⎪⎪⎪⎭⎫109101= ⎝⎛1001810082⎪⎪⎪⎪⎭⎫1008210018 ⎝⎛101109⎪⎪⎪⎪⎭⎫109101=⎝⎛10002441000756 ⎪⎪⎪⎪⎭⎫10007561000244,756.01000756)3(11==p ; (2) }1|1,1{21===++n n n X X X P}1|1{1===+n n X X P }1,1|1{12===⋅++n n n X X X P}1|1{1===+n n X X P }1|1{12==⋅++n n X X P81.0)109(21111==⋅=p p .。

相关文档
最新文档