贝叶斯分析 Bayesean Analysis

贝叶斯分析Bayesean Analysis

一、决策问题的表格表示——损失矩阵

对无观察(No-data)问题a=δ

(损失):

损失矩阵直观、运算方便

二、决策原则

通常,要根据某种原则来选择决策规则δ,使结果最优(或满意),这种原则就叫决策原则,贝叶斯分析的决策原则是使期望效用极大。本章在介绍贝叶斯分析以前先介绍芙他决策原则。

三、决策问题的分类:

1.不确定型(非确定型)

自然状态不确定,且各种状态的概率无法估计.

2.风险型

自然状态不确定,但各种状态的概率可以估计.

四、按状态优于:

l ij ≤l

ik

?I, 且至少对某个i严格不等式成立, 则称行动a

j

按状态优于a

k

1 不确定型决策问题

一、极小化极大(wald)原则(法则、准则) a

1a

2

a

4

min

j max

i

l (θ

i

, a

j

) 或max

j

min

i

u

ij

例:

其中损失最小的损失对应于行动a

3

.

采用该原则者极端保守, 是悲观主义者, 认为老天总跟自己作对.

二、极小化极小

min

j min

i

l (θ

i

, a

j

) 或max

j

max

i

u

ij

例:

其中损失最小的是行动a

2

.

采用该原则者极端冒险,是乐观主义者,认为总能撞大运。

三、Hurwitz准则

上两法的折衷,取乐观系数入

min

j [λmin

i

l (θ

i

, a

j

)+(1-λ〕max

i

l (θ

i

, a

j

)]

例如λ=0.5时

λmin

i l

ij

: 2 0.5 3.5 1

(1-λ〕max

i l

ij

: 6.5 8 6 7

两者之和:8.5 8.5 9.5 8

其中损失最小的是:行动a

4

四、等概率准则(Laplace)

i

∑l ij来评价行动a j的优劣

选min

j

i

∑l ij

上例:

i

∑l ij: 33 34 36 35 其中行动a1的损失最小五、后梅值极小化极大准则(svage-Niehans)

定义后梅值s

ij =l

ij

-min

k

l

ik

其中min

k l

ik

为自然状态为θ

i

时采取不同行动时的最小损失.

构成后梅值(机会成本)矩阵S={s

ij }

m n

?

,使后梅值极小化极大,即:

min max j i s ij

例:损失矩阵同上, 后梅值矩阵为:

3 1 0 2

3 0 8 1

1 4 0 2

0 3 2 4

各种行动的最大后梅值为: 3 4 8 4

其中行动a1 的最大后梅值最小,所以按后梅值极小化极大准则应采取行动1.

六、Krelle准则:

使损失是效用的负数(后果的效用化),再用等概率(Laplace)准则.

七、莫尔诺(Molnor)对理想决策准则的要求(1954)

1.能把方案或行动排居完全序;

2.优劣次序与行动及状态的编号无关;

3.若行动a

k 按状态优于a

j

,则应有a

k

优于a

j

4.无关方案独立性:已经考虑过的若干行动的优劣不因增加新的行动而改变;

5.在损失矩阵的任一行中各元素加同一常数时,各行动间的优劣次序不变;

6.在损失矩阵中添加一行,这一行与原矩阵中的某行相同,则各行动的优劣次序不变。

2 风险型决策问题的决策原则

一、最大可能值准则

令π(θ

k )=maxπ(θ

i

)

选a

r 使l(θ

k

,a

r

)=min

j

l(θ

k

,a

j

)

例:

π(θ

i )a

1

a

2

a

3

θ

1

0.27 6.56

θ

2

0.5345

θ

3

0.3410

π(θ

2

) 概率最大, 各行动损失为3 4 5

∴应选行动a

1

二、贝叶斯原则

使期望损失极小:

min

j {

i

∑l(θi, a j) π(θi) }

上例中,各行动的期望损失分别为4.1 3.6 3.7, 对应于a

2

的期望损失3.6最小

∴应选a

2

.

三、贝努利原则

损失函数取后果效用的负值,再用Bayes原则求最优行动.

四、E—V(均值—方差)准则

若Eπl

ij ≤Eπl

ik

且σσ

j k

≤则a

j

优于a

k

通常不存在这样的a

j 上例中:

a 1a

2

a

3

E 4.1 3.6 3.7

V(σ2) 2.29 3.79 5.967

不存在符合E—V准则的行动, 这时可采用f(μ,σ)的值来判断(μ为效益型后果的期望)

?μ-ασ

f( μ,σ)=?μ-ασ2

?μ-α(μ2+σ2)

f越大越优.

五、不完全信息情况下的决策原则(Hodges-Lehmann原则)

状态概率分布不可靠时, 可采用:

φ(a

j )=λu

ij

i

i

∑?π+ min

i

u

ij

i=1,2,…,m j=1,2,…,n

φ越大越优.

3贝叶斯定理

一、条件概率

1.A 、B 为随机试验E 中的两个事件 P(A |B)=P(AB)/P(B)

由全概率公式: A j j=1,2,…,n 是样本空间的一个划分, P(B)=j

P(B|A j )P(A j )

得Bayes 公式

P(A i |B)=P(B|A i )·P(A i )/P(B) = P(B|A i )·P(A i )/

j

P(B|A j )P(A j )

2. 对Θ,Χ两个随机变量 ·条件概率密度

f(θ| x)=f(x |θ)f(θ)/f(x) ·在主观概率论中

π(θ| x)=f(x |θ)π(θ)/m(x) 其中:π(θ)是θ的先验概率密度函数

f(x |θ)是θ出现时,x 的条件概率密度,又称似然函数. m(x)是x 的边缘密度, 或称预测密度. m(x)=

Θ

?

f(x |θ)π(θ) d θ 或

i

p(x|θi )π(θi )

π(θ|x)是观察值为x 的后验概率密度。 例:A 坛中白球30%黑球70% B 坛中白球70%黑球30%

两坛外形相同,从中任取一坛,作放回摸球12次,其中白球4次,黑球8次,求所取为A 坛的概率.

解:设观察值4白8黑事件为x ,记取A 坛为 θ1, 取B 坛为θ2 在未作观察时,先验概率p(θ1)=p(θ2)=0.5 则在作观察后,后验概率 P(θ

1|x)=p(x|θ1)p(θ1)p(x|θ1)p(θ1)+p(x|θ2)p(θ2)

=034.×078.×0.5(034.×078.×0.5+074.×038.×0.5)

=074.(074.×034.)

=0.2401

0.2482

=0.967

显然, 通过试验、观察、可修正先验分布.

4 贝叶斯分析的正规型与扩展型

一、正规型分析

由Baysean 原则:先验分布为π(θ)时,最优的决策规则δ是贝叶斯规则δπ,使贝叶斯风险 r(π, δπ)=inf δ∈?

r(π,δ(x))

其中:r(π,δ(x))= E πR(θ,δ(x)) =E π[E x θ l(θ,δ(x)) =

θ

?x

?

l(θ,δ(x)) f(x |θ)dx π(θ) d θ (1)

据(1)式,选δπ使r(π,δ)达到极小,这就是正规型的贝叶斯分析。

在解实际问题时,求使(1)式极小的δ(x)往往十分困难,尤其在状态和观察值比较复杂时,Δ集中的策略数目很大,穷举所有的δ(x)有困难,且计算量颇大。实际上可用下法:

二、扩展型贝叶斯分析(Extensive Form Analysis)

在(1)式中因l(θ,δ)>-∞,f(x |θ),π(θ)均为有限值。 ∴由Fubini 定理,积分次序可换 即r(π,δ(x))=

θ

?x

?

l(θ,δ(x)) f(x |θ)dx π(θ) d θ

=

x

?

l(θ,δ(x)) f(x |θ)π(θ) d θdx (2)

显然,要使(2)式达到极小,应当对每个x ∈X ,选择δ, 使

θ

?

l(θ,δ(x)) f(x |θ)π(θ) d θ (2’)为极小

∵δ(x)=a ∴若对给定的x,选a ,使 θ

?

l(θ,δ(x)) f(x |θ)π(θ) d θ 为极小

亦即,

使

1

m x ()θ

?

l(θ,a) f(x |θ)π(θ) d θ

=

θ

?

l(θi ,a) π(θi |x) d θ 或

θi ∈∑

Θ

l(θi ,a)p(θi |x) (3) 达极小,

即可使(1)式为极小. ·结论:

对每个x ,选择行动a ,使之对给定x 时θ的后验分布π(θ|x)的期望损失为极小,即可求得贝叶斯规则。

这种方法叫贝叶斯分析的扩展型,由此确定的贝叶斯规则叫formal Bayesean Rule ——Raiffa Sehlaifer,1961年提出。 ·Note

·使(3)式达极小的行动可能不只一个,即可能有多个贝叶斯规则; ·扩展型比正规型更直观,也容易计算,故更常用; ·许多分析人员只承认扩型,理由是:

i ,π(θ|x)描述了试验后的θ的分布,比π(θ)更客观,因此,只要损失函数是由效用理论导出的(即考虑了DMer 的价值判断、风险偏好),在评价行动a 的优劣时就应当用后验期望损失。

ii, r(π,δ)是根据π(θ)求出的,而用先验分布π(θ)来确定行动a 并不一定适当。 从根本上讲,这种观点是正确的。

·无论从何种观点来进行贝叶斯分析,从理论上讲,结果是一样的,所以采用何种方法可视具体问题,据计算方便而定。

·已经证明,形式贝叶斯分析对一类非随机性决策规则是成立的,也可以证明它对随机性决策规则同样成立。使所有x上后验期望损失极小的贝叶斯规则也是随机性规则集Δ*中的Bayes规则,因此,总可以找到一验期望损失极小的非随机性规则。

三、例(先看无观察问题)

农民选择作物问题,设某地旱年θ

1占60%,正常年景θ

2

占40%; a

1

种植耐旱作物

a

2

种不耐旱作物,后果矩阵为:

a 1a 2

θ

1

20 0

θ

2

60 100

决策人的效用函数u(y)=

1

0865

.

(1-e y

-002

.)

解:i令:l(y)=1-u(y)

ii,作决策树:

a 1

a 2

πθ()

1

πθ()

1

πθ()

260 .81 .19

y u l

20 .38 .62

0 0 1

100 1 0

iii, 在无观察时, R=l, r=

11

=∑

n

l(θi ,a)π(θi )

r(π, a 1)=l(θ1,a 1)π(θ1)+l(θ2,a 1)π(θ2) =0.62 ×0.6+0.19 ×0.4 =0.448

r(π, a 2)= l(θ1,a 2)π(θ1)+l(θ2,a 2)π(θ2) =1.0 ×0.6+0 ×0.4 =0.6

风险r 小者优, ∴δ=a 1,是贝叶斯规则, 即贝叶斯行动.即应选择耐旱作物。

四、例(续上)

设气象预报的准确性是0.8,即p(x 1|θ1)=0.8 p(x 2|θ2)=0.8 其中,x 1预报干旱 x 2预报正常年景

则 m(x 1)=p(x 1|θ1)π(θ1)+p(x 1|θ2)π(θ2) =0.8 ×0.6+0.2 ×0.4=0.56 m(x 2)=0.44

π(θ1|x 1)=p(x 1|θ1)π(θ1)m(x 1) =0.8 ×0.6/0.56=0.86 π(θ1|x 2)=p(x 2|θ1)π(θ1)m(x 2) =0.2 ×0.6/0.44=0.27 π(θ2|x 1)=0.14 π(θ2|x 2)=0.73 1. 正规型分析

①策略δ1: a 1= δ1(x 1) a 2=δ1(x 2)

r(π, δ1)=

i

∑j

l (θi ,δ1(x j ))p(x j |θi )π(θi )

4-7

= l (θ1,a 1)p(x 1|θ1)π(θ1)+l (θ1,a 2)p(x 2|θ1)π(θ1) + l (θ2,a 1)p(x 1|θ2)π(θ2)+l (θ2,a 2)p(x 2|θ2)π(θ2)

=0.62×0.8×0.6+1.0 ×0.2×0.6+0.19 ×0.2×0.4+0.0× 0.8×0.4

=0.4328

②策略δ2: a 1=δ2(x 2) a 2=δ2(x 1) r(π, δ2)=

i

∑j

l (θi ,δ2 (x j ))p(x j |θi )π(θi )

= l (θ1,a 1)p(x 2|θ1)π(θ1)+l (θ1,a 2)p(x 1|θ1)π(θ1) + l (θ2,a 1)p(x 2|θ2)π(θ2)+l (θ2,a 2)p(x 1|θ2)π(θ2)

= 0.62×0.2×0.6+1.0×0.8×0.6+0.19×0.8× 0.4+0.0×0.8× 0.4 =0.6152

③策略δ3: a 1= δ3(x 1) a 1=δ3(x 2) r(π, δ3)=0.45

④策略δ4: a 2=δ4(x 1) a 2=δ4(x 2) r(π, δ4)=0.6

∵r(π, δ1) <r(π, δ3) <r(π, δ4) <r(π, δ2) ∴ δ1 δ3 δ4 δ2 δ1是贝叶斯行动。

4-82.扩展型之一:据(2’) :

θ

?

l(θ,δ(x)) f(x |θ)π(θ) d θ 记作r’

①给定x

1

(预报干旱):

采用a

1

r‘=

i

∑l (θi,a1)p(x1|θi)π(θi)

= l (θ

1,a

1

)p(x

1

1

)π(θ

1

) + l (θ

2

,a

1

)p(x

1

2

)π(θ

2

)

= 0.62×0.8×0.6+0.19 ×0.2×0.4 =0.3128

采用a

2r’= l (θ

1

,a

2

)p(x

1

1

)π(θ

1

) + l (θ

2

,a

2

)p(x

1

2

)π(θ

2

) =0.48

∵风险小者优∴给定x

1应选a

1

②给定x

2

(预报天气正常)

采用a

1r’= l (θ

1

,a

1

)p(x

2

1

)π(θ

1

) + l (θ

2

,a

1

)p(x

2

2

)π(θ

2

) =0.62×0.2×0.6 + 0.19×0.8×0.4

=0.135

采用a

2r’= l (θ

1

,a

2

)p(x

1

1

)π(θ

1

) + l (θ

2

,a

2

)p(x

1

2

)π(θ

2

) =1.0×0.2×0.6 + 0

=0.12

∴给定x

2应选a

2

由此得形式Bayes规则δπ: a

1

= δπ(x1) a2=δπ(x2)

3.扩展型之二:据(3)式即

θ?l(θ

i

,a) π(θ

i

|x) dθ或

θ

i

Θ

l(θ

i

,a)π(θ

i

|x)(记作r”)

①给定x

1

,

采用a

1

r”=

θi ∈

Θl(θ

i

,a

1

)π(θ

i

|x

1

)

= l(θ

1,a

1

)π(θ

1

|x

1

) + l(θ

2

,a

1

)π(θ

2

|x

1

)

=0.62 ×0.86 + 0.19 ×0.14 =0.56

采用a

2r”= l(θ

1

,a

2

)π(θ

1

|x

1

) + l(θ

2

,a

2

)π(θ

2

|x

1

) = 1.0 ×0.86 + 0×0.14

=0.86

∴给定x

1,应选行动a

1

.

②给定x

2

采用a

1

r”=

θi ∈

Θl(θ

i

,a

1

)π(θ

i

|x

2

)

= l(θ

1,a

1

)π(θ

1

|x

2

) + l(θ

2

,a

1

)π(θ

2

|x

2

)

=0.62 ×0.27 + 0.19 ×0.73 = 0.3061 采用a

2

r”=

θi ∈

Θl(θ

i

,a

2

)π(θ

i

|x

2

)

= l(θ

1,a

2

)π(θ

1

|x

2

) + l(θ

2

,a

2

)π(θ

2

|x

2

)

=1.0 ×0.27 + 0 ×0.73 =0.27

∴给定x

2应选择行动a

2

.

∴形式Bayes规则δπ: a

1

= δπ(x1) a2=δπ(x2)

5 非正常先验与广义贝叶斯规则

一、非正常先验(Improper Prior)

概率测度的三个条件:

i,规范性:P(Ω)=1

ii,非负性:0≤P(A)≤1

iii,可列可加性

在设定先验分布时,若不满足规范性,则称为非正常先验.

二、广义贝叶斯规则(General Bayesean Rule)

1.定义:

决策问题的损失函数为l(θ,a),π(θ)为非正常先验分布,对给定的θ

i

,使

i, θ?l(θ,δ(x)) f(x |θ)π(θ) dθ为极小,或者

ii, 0<m(x)<-∞时,使

θ?l(θ

i

,a) π(θ

i

|x) dθ为极小的策略(行动),构成广义贝叶斯规则.

2.Nole:①在许多重要场合,所有允许的都是GBR

②在无法得到正常先验时,除此别无良策;

③GBR不一定是最好的决策规则

6 一种具有部分先验信息的贝叶斯分析法

一、概述

1.思路:在部分先验信息难以唯一地确定π(θ)时,抛开唯一性要求,转而确定与已知先验信息相符的先验分布的集。

2.符号

i, Θ和A为有限集:Θ={θ

1,θ

2

,…,θn}

A={a

1,a

2

,…,a

m

}

损失矩阵L={l ij}n m?l ij=l (θ

i

,a j) ii,根据贝叶斯分析的扩展型

给定x,应从集合A中选一行动a

k

,使

q(a)=

i

l (θi ,a) p(x 1|θi )π(θi ) 为极小,亦即

a k = arg min a A

∈q(a) 或 q(a k )≤q(a j ) j=1,2,…,m (4) 则 a k 为贝叶斯行动.

记p(x 1|θi )为p i (x) , π(θi ) 为πi L k =[l k 1,l k 2,…,l nk ]T π={π1,π2,…,πn } 则

i

l (θi ,a) p(x 1|θi )π(θi )=L j T

[diag{p i (x) }π]

(4)式可表示成 L k T

[diag{p i (x)}π]≤L j T

[diag{p i (x) }π] i=1,2, …,n (5) j=1,2, …,m (5)式即 [ (L T -1 L k T

) diag{p i (x) }] π ≥0 (5’)

记 (L T

-1 L k T

) diag{p i (x) } 为D k (x), 式(5’)可表示为:

D k (x) π ≥0 (5”) 3. (5”)式的含义

(1)给定x ,先验分布为π时,应选 a k 使5(即5’, 亦即5”)式成立。 (2) 对给定的x ,要使 a k 成为贝叶斯行动,π应满足 5(即5’, 亦即5”)式. 由(2)可以定义

∏k (x)={ π∈Π| D k (x) π ≥0 ;π

i

i

=∑1, πi ≥0 }

式中, Π是先验分布的所有可能的集,

∏k (x) 是Π的一个子集,它能i,使 对给定x 为Bayes 行动 ii,满足规范性和非负性

二、分析步骤 1. 确定∏k (x)

2. 确定先验信息对先验分布π(θ)的约束: Q={ π∈Π| A π≥0,

π

i

i

=∑1, πi ≥0}

式中, A π≥0是先验信息对先验分布π(θ)的约束. 3.结论:

当 ∏k (x) 与Q 有非空交集时,a k 为Bayes 行动.

三、例

已知:i, Q={ π∈Π| π1≥0.5,π2 ≥π3, π3≥104

-,

π

i

i

=∑1}

ii,由已往的统计资料,三种病患者的白血球计数:

f(x| θ

1

)= N( 3000, 10002)

f(x| θ

2

)= N( 3000, 10002)

f(x| θ3)= N( 3000, 10002)

iii,观察:x=5000

要求判定:患者得什么病

解:p(x|θ

1)= p(5000|θ

1

)

=

4950

5050

?1

2

1

πσ

e-

-

()

σ

2

2

2dx 令x*=

x-μ

σ

1

1

=

195

205

.

.

?1

e--x

*2

2dx

=0.9798 - 0.9744 = 0.0054

同理可得:

p(x| θ

2

)=0.0091

p(x| θ3)=0.0000105

∵L=

011

101

110

?

?

?

?

?

?

?

?

?

?

, 1l T1= []

1

1

1

011

011

011

011

?

?

?

?

?

?

?

?

?

?

=

?

?

?

?

?

?

?

?

?

?

, ∴L T-1l T1=

000

110

101

--

--

--

?

?

?

?

?

?

?

?

?

?

,

diag{p

i (x)}=

5410110

0191110

0101017

.

...

..

?

?

?

?

?

?

?

?

?

?

D

1

=

000

54910

540017

-----

---

----

?

?

?

?

?

?

?

?

?

?

..

..

D

1(5000)·π≥0 即

-

-

-

?

?

?

?

?

?

?

?

?

?

5491

540017

12

3

..

..

ππ

ππ

?

?

?

?

?

?

?

?

?

?

∴∏

1(5000)= {π∈Π| π1-1.69π2≥0, π1-0.00315π3≥0, πi

i

=

∑1}

同理可得∏

2(5000)和∏

3

(5000)

三、几何意义

1.由πi

i =

∑1

2.Q: 由先验信息确定红框内为Q

3.从D

k (x) π≥0 得∏

1

,∏

2

, ∏

3

.

相关主题
相关文档
最新文档