不确定型决策问题与风险型决策问题
第四章贝叶斯分析
Bayesean Analysis
§4.0引言
一、决策问题的表格表示——损失矩阵
对无观察(No-data)问题 a=δ
(损失):
a
1
…a j…a m
π(θ
1)l
11
l
j1
l
m
1
…
π(θ
i )l
i1
l
ij
…
π(θ
n )l
m1
l
nm
或
π(θ
1)…π(θ
i
)…π(θ
n
)
a 1l
11
l
i1
l
n1
…
a
j l ij
…
a m l
m1
l
mn
损失矩阵直观、运算方便
二、决策原则
通常,要根据某种原则来选择决策规则δ,使结果最优(或满意),这种原则就叫决策原则,贝叶斯分析的决策原则是使期望效用极大。本章在介绍贝叶斯分析以前先介绍芙他决策原则。
三、决策问题的分类:
1.不确定型(非确定型)
自然状态不确定,且各种状态的概率无法估计.
2.风险型
自然状态不确定,但各种状态的概率可以估计.
四、按状态优于:
l ij ≤l
ik
I, 且至少对某个i严格不等式成立, 则称行动a
j
按状态优于a
k
§4.1 不确定型决策问题
一、极小化极大(wald)原则(法则、准则) a
1a
2
a
4
min
j max
i
l (θ
i
, a
j
) 或max
j
min
i
u
ij
例:
各行动最大损失: 13 16 12 14
其中损失最小的损失对应于行动a
3
.
采用该原则者极端保守, 是悲观主义者, 认为老天总跟自己作对.
二、极小化极小
min
j min
i
l (θ
i
, a
j
) 或max
j
max
i
u
ij
例:
各行动最小损失: 4 1 7 2
其中损失最小的是行动a
2
.
采用该原则者极端冒险,是乐观主义者,认为总能撞大运。
三、Hurwitz准则
上两法的折衷,取乐观系数入
min
j [λmin
i
l (θ
i
, a
j
)+(1-λ〕max
i
l (θ
i
, a
j
)]
例如λ=0.5时
λmin
i l
ij
: 2 0.5 3.5 1
(1-λ〕max
i l
ij
: 6.5 8 6 7
两者之和: 8.5 8.5 9.5 8其中损失最小的是:行动a
4
四、等概率准则(Laplace)
用
i
∑l ij来评价行动a j的优劣
选min
j
i
∑l ij
上例:
i
∑l ij : 33 34 36 35 其中行动a1的损失最小五、后梅值极小化极大准则(svage-Niehans)
定义后梅值s
ij =l
ij
-min
k
l
ik
其中min
k l
ik
为自然状态为θ
i
时采取不同行动时的最小损失.
构成后梅值(机会成本)矩阵 S={s
ij }
m n
?
,使后梅值极小化极大,即:
min max j i s ij
例:损失矩阵同上, 后梅值矩阵为:
3 1 0 2
3 0 8 1
1 4 0 2
0 3 2 4
各种行动的最大后梅值为: 3 4 8 4
其中行动a1 的最大后梅值最小,所以按后梅值极小化极大准则应采取行动1.
六、Krelle准则:
使损失是效用的负数(后果的效用化),再用等概率(Laplace)准则.
七、莫尔诺(Molnor)对理想决策准则的要求(1954)
1.能把方案或行动排居完全序;
2.优劣次序与行动及状态的编号无关;
3.若行动a
k 按状态优于a
j
,则应有a
k
优于a
j
;
4.无关方案独立性:已经考虑过的若干行动的优劣不因增加新的行动而改变;
5.在损失矩阵的任一行中各元素加同一常数时,各行动间的优劣次序不变;
6.在损失矩阵中添加一行,这一行与原矩阵中的某行相同,则各行动的优劣次序不变。
§4.2 风险型决策问题的决策原则
一、最大可能值准则
令π(θ
k )=maxπ(θ
i
)
选a
r 使 l(θ
k
,a
r
)=min
j
l(θ
k
,a
j
)
例:
π(θ
i )a
1
a
2
a
3
θ
1
0.27 6.56
θ
2
0.5345
θ
3
0.3410
π(θ
2
) 概率最大, 各行动损失为 3 4 5
∴应选行动a
1
二、贝叶斯原则
使期望损失极小:
min
j {
i
∑l(θi , a j) π(θi) }
上例中,各行动的期望损失分别为 4.1 3.6 3.7, 对应于a
2
的期望损失3.6最小
∴应选a
2
.
三、贝努利原则
损失函数取后果效用的负值,再用Bayes原则求最优行动.
四、E—V(均值—方差)准则
若Eπl
ij ≤Eπl
ik
且σσ
j k
≤则a
j
优于a
k
通常不存在这样的a
j
上例中:
a 1a
2
a
3
E 4.1 3.6 3.7
V(σ2) 2.29 3.79 5.967
不存在符合E—V准则的行动, 这时可采用f(μ,σ)的值来判断(μ为效益型后果的期望)
μ-ασ
f( μ,σ)=μ-ασ2
μ-α(μ2+σ2)
f越大越优.
五、不完全信息情况下的决策原则(Hodges-Lehmann原则)
状态概率分布不可靠时, 可采用:
φ(a
j )=λu
ij
i
i
∑?π + min
i
u
ij
i=1,2,… ,m j=1,2,…,n
φ越大越优.
§4.3贝叶斯定理
一、条件概率
1.A、B为随机试验E中的两个事件 P(A|B)=P(AB)/P(B)
由全概率公式: A j j=1,2,…,n 是样本空间的一个划分, P(B)=j
∑
P(B|A j )P(A j )
得Bayes 公式
P(A i |B)=P(B|A i )·P(A i )/P(B) = P(B|A i )·P(A i )/
j
∑
P(B|A j )P(A j )
2. 对Θ,Χ两个随机变量 ·条件概率密度
f(θ| x)=f(x |θ)f(θ)/f(x) ·在主观概率论中
π(θ| x)=f(x |θ)π(θ)/m(x) 其中:π(θ)是θ的先验概率密度函数
f(x |θ)是θ出现时,x 的条件概率密度,又称似然函数. m(x)是x 的边缘密度, 或称预测密度. m(x)=
Θ
?
f(x |θ)π(θ) d θ
或
i
∑
p(x|θi )π(θi )
π(θ|x)是观察值为x 的后验概率密度。 例:A 坛中白球30%黑球70% B 坛中白球70%黑球30%
两坛外形相同,从中任取一坛,作放回摸球12次,其中白球4次,黑球8次,求所取为A 坛的概率.
解:设观察值4白8黑事件为x ,记取A 坛为 θ1, 取B 坛为θ2 在未作观察时,先验概率p(θ1)=p(θ2)=0.5 则在作观察后,后验概率 P(θ
1|x)=p(x|θ1)p(θ1)p(x|θ1)p(θ1)+p(x|θ2)p(θ2) =034.×078.×0.5(034.×078.×0.5+074.×038.×0.5)
=074.(074.×034.)
=0.2401
0.2482
=0.967
显然, 通过试验、观察、可修正先验分布.
§4.4 贝叶斯分析的正规型与扩展型
一、正规型分析
由Baysean 原则:先验分布为π(θ)时,最优的决策规则δ是贝叶斯规则δπ,使贝叶斯风险
r(π, δπ)=inf δ∈?
r(π,δ(x))
其中:r(π,δ(x))= E πR(θ,δ(x)) =E π[E x θ l(θ,δ(x)) =
θ
?x
?
l(θ,δ(x)) f(x |θ)dx π(θ) d θ (1)
据(1)式,选δπ使r(π,δ)达到极小,这就是正规型的贝叶斯分析。 在解实际问题时,求使(1)式极小的δ(x)往往十分困难,尤其在状态和观察值比较复杂时,Δ集中的策略数目很大,穷举所有的δ(x)有困难,且计算量颇大。实际上可用下法:
二、扩展型贝叶斯分析(Extensive Form Analysis)
在(1)式中因l(θ,δ)>-∞,f(x |θ),π(θ)均为有限值。 ∴由Fubini 定理,积分次序可换 即r(π,δ(x))= θ?x
?
l(θ,δ(x)) f(x |θ)dx π(θ) d θ
=
x
?θ
?
l(θ,δ(x)) f(x |θ)π(θ) d θdx (2)
显然,要使(2)式达到极小,应当对每个x ∈X ,选择δ, 使 θ
?
l(θ,δ(x)) f(x |θ)π(θ) d θ (2’)
为极小
∵δ(x)=a ∴若对给定的x,选a ,使 θ
?
l(θ,δ(x)) f(x |θ)π(θ) d θ 为极小
亦即,
使
1
m x ()θ
?
l(θ,a) f(x |θ)π(θ) d θ
=
θ
?
l(θi ,a) π(θi |x) d θ 或
θi ∈∑
Θ
l(θi ,a)p(θi |x) (3) 达
极小,即可使(1)式为极小. ·结论:
对每个x ,选择行动a ,使之对给定x 时θ的后验分布π(θ|x)的期望损失为极小,即可求得贝叶斯规则。
这种方法叫贝叶斯分析的扩展型,由此确定的贝叶斯规则叫formal Bayesean Rule ——Raiffa Sehlaifer,1961年提出。 ·Note
·使(3)式达极小的行动可能不只一个,即可能有多个贝叶斯规则; ·扩展型比正规型更直观,也容易计算,故更常用; ·许多分析人员只承认扩型,理由是:
i ,π(θ|x)描述了试验后的θ的分布,比π(θ)更客观,因此,只要损失函数是由效用理论导出的(即考虑了DMer 的价值判断、风险偏好),在评价行动a 的优劣时就应当用后验期望损失。 ii, r(π,δ)是根据π(θ)求出的,而用先验分布π(θ)来确定行动a 并不一定适当。 从根本上讲,这种观点是正确的。
·无论从何种观点来进行贝叶斯分析,从理论上讲,结果是一样的,所以采用何种方法可视
具体问题,据计算方便而定。
·已经证明,形式贝叶斯分析对一类非随机性决策规则是成立的,也可以证明它对随机性决策规则同样成立。使所有x上后验期望损失极小的贝叶斯规则也是随机性规则集Δ*中的Bayes规则,因此,总可以找到一验期望损失极小的非随机性规则。
三、例(先看无观察问题)
农民选择作物问题,设某地旱年θ
1占60%,正常年景θ
2
占40%; a
1
种植耐旱作物
a
2
种不耐旱作物,后果矩阵为:
a 1a 2
θ
1
20 0
θ
2
60 100
决策人的效用函数 u(y)=
1
0865
.
(1-e y
-002
.)
解:i令:l(y)=1-u(y)
ii,作决策树:
a 1
a 2
πθ()
1
πθ()
1
πθ()
260 .81 .19
y u l
20 .38 .62
0 0 1
100 1 0
iii, 在无观察时, R=l, r=
11
=∑
n
l(θi ,a)π(θi )
r(π, a 1)=l(θ1,a 1)π(θ1)+l(θ2,a 1)π(θ2) =0.62 ×0.6+0.19 ×0.4 =0.448
r(π, a 2)= l(θ1,a 2)π(θ1)+l(θ2,a 2)π(θ2) =1.0 ×0.6+0 ×0.4 =0.6
风险r 小者优, ∴δ=a 1,是贝叶斯规则, 即贝叶斯行动.即应选择耐旱作物。
四、例(续上)
设气象预报的准确性是0.8,即p(x 1|θ1)=0.8 p(x 2|θ2)=0.8 其中,x 1预报干旱 x 2预报正常年景
则 m(x 1)=p(x 1|θ1)π(θ1)+p(x 1|θ2)π(θ2) =0.8 ×0.6+0.2 ×0.4=0.56 m(x 2)=0.44
π(θ1|x 1)=p(x 1|θ1)π(θ1)m(x 1) =0.8 ×0.6/0.56=0.86 π(θ1|x 2)=p(x 2|θ1)π(θ1)m(x 2) =0.2 ×0.6/0.44=0.27 π(θ2|x 1)=0.14 π(θ2|x 2)=0.73 1. 正规型分析
①策略δ1: a 1= δ1(x 1) a 2=δ1(x 2)
r(π, δ1)=
i
∑j
∑
l (θi ,δ1(x j ))p(x j |θi )π(θi )
4-7
= l (θ1,a 1)p(x 1|θ1)π(θ1)+l (θ1,a 2)p(x 2|θ1)π(θ1) + l (θ2,a 1)p(x 1|θ2)π(θ2)+l (θ2,a 2)p(x 2|θ2)π(θ2)
=0.62×0.8×0.6+1.0 ×0.2×0.6+0.19 ×0.2×0.4+0.0× 0.8×0.4 =0.4328
②策略δ2: a 1=δ2(x 2) a 2=δ2(x 1) r(π, δ2)=
i
∑j
∑
l (θi ,δ2 (x j ))p(x j |θi )π(θi )
= l (θ1,a 1)p(x 2|θ1)π(θ1)+l (θ1,a 2)p(x 1|θ1)π(θ1) + l (θ2,a 1)p(x 2|θ2)π(θ2)+l (θ2,a 2)p(x 1|θ2)π(θ2) = 0.62×0.2×0.6+1.0×0.8×0.6+0.19×0.8× 0.4+0.0×0.8× 0.4 =0.6152
③策略δ3: a 1= δ3(x 1) a 1=δ3(x 2) r(π, δ3)=0.45
④策略δ4: a 2=δ4(x 1) a 2=δ4(x 2) r(π, δ4)=0.6
∵r(π, δ1) <r(π, δ3) <r(π, δ4) <r(π, δ2) ∴ δ1
δ3
δ4
δ2 δ1是贝叶斯行动。
x 1
a 1
x 2
1
a 1
a
2
a
2
πθ(|)
11x πθ(|)
21x πθ(|)
21x πθ(|)
22x πθ(|)
22x πθ(|)
11x πθ(|)
12x πθ(|)11x πθ(|)
12x
4-82.扩展型之一:据(2’) :
θ?l(θ,δ(x)) f(x |θ)π(θ) dθ记作r’
①给定x
1
(预报干旱):
采用a
1
r‘=
i
∑l (θi,a1)p(x1|θi)π(θi)
= l (θ
1,a
1
)p(x
1
|θ
1
)π(θ
1
) + l (θ
2
,a
1
)p(x
1
|θ
2
)π(θ
2
)
= 0.62×0.8×0.6+0.19 ×0.2×0.4 =0.3128
采用a
2r’= l (θ
1
,a
2
)p(x
1
|θ
1
)π(θ
1
) + l (θ
2
,a
2
)p(x
1
|θ
2
)π(θ
2
)
=0.48
∵风险小者优∴给定x
1应选a
1
②给定x
2
(预报天气正常)
采用a
1r’= l (θ
1
,a
1
)p(x
2
|θ
1
)π(θ
1
) + l (θ
2
,a
1
)p(x
2
|θ
2
)π(θ
2
)
=0.62×0.2×0.6 + 0.19× 0.8× 0.4 =0.135
采用a
2r’= l (θ
1
,a
2
)p(x
1
|θ
1
)π(θ
1
) + l (θ
2
,a
2
)p(x
1
|θ
2
)π(θ
2
)
=1.0×0.2×0.6 + 0 =0.12
∴给定x
2应选a
2
由此得形式Bayes规则δπ: a
1= δπ(x
1
) a
2
=δπ(x
2
)
3.扩展型之二:据(3)式即
θ?l(θ
i
,a) π(θ
i
|x) dθ或
θ
i
∈
∑
Θ
l(θ
i
,a)π
(θ
i
|x)(记作r”)
①给定x
1
,
采用a
1
r”=
θi ∈
∑
Θl(θ
i
,a
1
)π(θ
i
|x
1
)
= l(θ
1,a
1
)π(θ
1
|x
1
) + l(θ
2
,a
1
)π(θ
2
|x
1
)
=0.62 ×0.86 + 0.19 ×0.14 =0.56
采用a
2r”= l(θ
1
,a
2
)π(θ
1
|x
1
) + l(θ
2
,a
2
)π(θ
2
|x
1
)
= 1.0 ×0.86 + 0× 0.14 =0.86
∴给定x
1,应选行动a
1
.
②给定x
2
采用a
1
r”=
θi ∈
∑
Θl(θ
i
,a
1
)π(θ
i
|x
2
)
= l(θ
1,a
1
)π(θ
1
|x
2
) + l(θ
2
,a
1
)π(θ
2
|x
2
)
=0.62 ×0.27 + 0.19 ×0.73 = 0.3061 采用a
2
r”=
θi ∈
∑
Θl(θ
i
,a
2
)π(θ
i
|x
2
)
= l(θ
1,a
2
)π(θ
1
|x
2
) + l(θ
2
,a
2
)π(θ
2
|x
2
)
=1.0 ×0.27 + 0 ×0.73 =0.27
∴给定x
2应选择行动a
2
.
∴形式Bayes规则δπ: a
1= δπ(x
1
) a
2
=δπ(x
2
)
§4.5 非正常先验与广义贝叶斯规则
一、非正常先验(Improper Prior)
概率测度的三个条件:
i,规范性:P(Ω)=1
ii,非负性:0≤P(A)≤1
iii,可列可加性
在设定先验分布时,若不满足规范性,则称为非正常先验.
二、广义贝叶斯规则(General Bayesean Rule)
1.定义:
决策问题的损失函数为l(θ,a),π(θ)为非正常先验分布,对给定的θ
i
,使
i,
θ?l(θ,δ(x)) f(x |θ)π(θ) dθ为极小,或者
ii, 0<m(x)<-∞时,使
θ?l(θ
i
,a) π(θ
i
|x) dθ为极小的策略(行动),构成广义贝叶
斯规则.
2.Nole:①在许多重要场合,所有允许的都是GBR
②在无法得到正常先验时,除此别无良策;
③GBR不一定是最好的决策规则
§4.6 一种具有部分先验信息的贝叶斯分析法
一、概述
1.思路:在部分先验信息难以唯一地确定π(θ)时,抛开唯一性要求,转而确定与已知先验信息相符的先验分布的集。
2.符号
i, Θ和A为有限集:Θ={θ
1,θ
2
,…,θn}
A={a 1,a 2,…,a m } 损失矩阵L={l ij }n m ? l ij =l (θi ,a j ) ii,根据贝叶斯分析的扩展型 给定x ,应从集合A 中选一行动 a k ,使 q(a)=
i
∑
l (θi ,a) p(x 1|θi )π(θi ) 为极小,亦即
a k = arg min a A
∈q(a) 或 q(a k )≤q(a j ) j=1,2,…,m (4) 则 a k 为贝叶斯行动.
记p(x 1|θi )为p i (x) , π(θi ) 为πi L k =[l k 1,l k 2,…,l nk ]T π={π1,π2,…,πn } 则
i
∑
l (θi ,a) p(x 1|θi )π(θi )=L j T
[diag{p i (x) }π]
(4)式可表示成 L k T
[diag{p i (x)}π]≤L j T
[diag{p i (x) }π] i=1,2, …,n (5) j=1,2, …,m
(5)式即 [ (L T -1 L k T
) diag{p i (x) }] π ≥0 (5’)
记 (L T
-1 L k T
) diag{p i (x) } 为D k (x), 式(5’)可表示为:
D k (x) π ≥0 (5”) 3. (5”)式的含义
(1)给定x ,先验分布为π时,应选 a k 使5(即5’, 亦即5”)式成立。 (2) 对给定的x ,要使 a k 成为贝叶斯行动,π应满足 5(即5’, 亦即5”)式. 由(2)可以定义
∏k (x)={ π∈Π| D k (x) π ≥0 ;π
i
i
=∑1, πi ≥0 }
式中, Π是先验分布的所有可能的集,
∏k (x) 是Π的一个子集,它能i,使 对给定x 为Bayes 行动 ii,满足规范性和非负性
二、分析步骤 1. 确定∏k (x)
2. 确定先验信息对先验分布π(θ)的约束: Q={ π∈Π| A π≥0,
π
i
i
=∑1, πi ≥0}
式中, A π≥0是先验信息对先验分布π(θ)的约束. 3.结论:
当 ∏k (x) 与Q 有非空交集时,a k 为Bayes 行动.
三、例
已知:i, Q={ π∈Π| π1≥0.5,π2 ≥π3, π3≥104-,
π
i
i
=∑1}
ii,由已往的统计资料,三种病患者的白血球计数: f(x| θ1)= N( 3000, 10002 ) f(x| θ2)= N( 3000, 10002 ) f(x| θ3)= N( 3000, 10002 ) iii,观察:x=5000 要求判定:患者得什么病 解:p(x|θ1)= p(5000|θ1)
=
4950
5050
?
121
πσe
-
-()x μσ22
2dx 令x *
=
x -μσ1
1
=
195
205
..?
1
2π
e --x *22
dx
=0.9798 - 0.9744 = 0.0054 同理可得:
p(x| θ2)=0.0091 p(x| θ3)=0.0000105
∵L=011101110??????
?
??? , 1 l T 1= []111011*********??????????=?????????? , ∴L T
-1 l T 1=000110101------?????????? ,
diag{p i (x)}=541011001911100101017......?????????? D 1= 00054910540017------------???????
???.... D 1(5000)· π≥0 即---??????????05491540017123....ππππ≥000???????
?
??
∴∏1(5000)= { π∈Π| π1-1.69π2 ≥0, π1-0.00315π3≥0, π
i
i
=∑1}
同理可得∏2(5000)和 ∏3(5000)
三、几何意义
1.由πi
i =
∑1
2.Q: 由先验信息确定红框内为Q
3.从D
k (x) π≥0 得∏
1
,∏
2
, ∏
3
.
确定型决策、不确定型决策、风险型决策的比较分析
确定型决策、不确定型决策、风险型决策的比较分析 叶伟 内容摘要:决策按照状态空间分类,可分为确定型决策、不确定型决策和风险型决策三类。 本文就这三种决策的基本概念、使用原则、适用范围和优缺点等几个方面进行了综合的比较 分析。 关键词:确定型决策不确定型决策风险型决策 Abstract:According to the state space, the decision-making may be divided into decision making under certainty , decision making under uncertainty and decision making under risk. This article has carried on the comparative analysis of their basic concept, their use principle, their applicable scope and their good and bad points and so on. Keywords:Decision-making under certainty Decision-making under uncertainty Decision-making under risk 1.引言 决策是理性人普遍从事的一种活动,也是极为重要的制胜手段。它的核心是,对未来活 动的多个目标及用途做出合理的选择,以寻求最满意的行动方案。决策具有以下特点:①面 对新问题和新任务做出科学决定,属于创造性的管理活动;②必须对实际行为有直接的指导 作用;③具有多因素、多目标、不要确定性与方案的多样性,以及决策影响的时效性和一次 性。 现代决策理论的主要特点在于,以概率和数理统计为基础,以统计判定理论和高等数 学为工具,广泛地收集和处理信号,考虑人的心理和外在环境、市场等应变因素,知道人们 把各类工程技术因素与经济效益统一起来做定量分析,并以电子计算机为辅助手段,研究决 策的性质和规律、模型与方法,以寻求整体的最优解或满意解。因此,决策具有目的性、信 息性、经济性和实践性四大基本水泥感。而应变性是最高层次的属性。 关于决策系统的目标、准则和属性的概念,国内外学者有大量的论述,又不尽相同。 下表给出了三者的对比。 目标、准则和属性概念 非程序化决策;从所涉及和影响的范围看,它分为战略、战役和战术决策;从问题描述的性 质看,它分为定量决策和定性决策;从目标数量和属性的多少看,它分为单目标、多目标决 策和单属性、多属性决策;从决策问题的考虑方式看,它分为动态决策和静态决策;从参与 决策人数多少看,它分为群决策和单一决策;本问研究的是从状态空间分类的确定型、不确
不确定型决策问题与风险型决策问题
第四章贝叶斯分析 Bayesean Analysis §4.0引言 一、决策问题的表格表示——损失矩阵 对无观看(No-data)问题 a=δ 可用表格(损失矩阵)替代决策树来描述决策问题的后果(损失): 或 损失矩阵直观、运算方便
二、决策原则 通常,要依照某种原则来选择决策规则δ,使结果最优(或中意),这种原则就叫决策原则,贝叶斯分析的决策原则是使期望效用极大。本章在介绍贝叶斯分析往常先介绍芙他决策原则。 三、决策问题的分类: 1.不确定型(非确定型) 自然状态不确定,且各种状态的概率无法可能. 2.风险型 自然状态不确定,但各种状态的概率能够可能. 四、按状态优于: l ij ≤l ik I, 且至少对某个i严格不等式成立, 则称行动a j 按状 态优于a k §4.1 不确定型决策问题 一、微小化极大(wald)原则(法则、准则) a 1a 2 a 4 min j max i l ( i , a j ) 或max j min i u ij
例: 各行动最大损失: 13 16 12 14 其中损失最小的损失对应于行动a 3 . 采纳该原则者极端保守, 是悲观主义者, 认为老天总跟自己作对. 二、微小化微小 min j min i l (θ i , a j ) 或max j max i u ij 例: 各行动最小损失: 4 1 7 2 其中损失最小的是行动a 2 . 采纳该原则者极端冒险,是乐观主义者,认为总能撞大运。 三、Hurwitz准则 3 / 24
上两法的折衷,取乐观系数入 min j [λmin i l (θ i , a j )+(1-λ〕max i l (θ i , a j )] 例如λ=0.5时 λmin i l ij : 2 0.5 3.5 1 (1-λ〕max i l ij : 6.5 8 6 7 两者之和: 8.5 8.5 9.5 8 其中损失最小的是:行动a 4 四、等概率准则(Laplace) 用 i ∑l ij来评价行动a j的优劣 选min j i ∑l ij 上例: i ∑l ij : 33 34 36 35 其中行动a1的损失最小 五、后梅值微小化极大准则(svage-Niehans) 定义后梅值s ij =l ij -min k l ik 其中min k l ik 为自然状态为θ i 时采取不同行动时的最小损失. 构成后梅值(机会成本)矩阵 S={s ij } m n ? ,使后梅值微小化极大, 即:
管理学风险型决策和不确定性决策方法 案例分析
课业6 风险型决策和不确定性决策方法 课业名称风险型决策和不确定性 决策方法应用 课业类型定量分析学生姓名:学号: 专业:电子商务班级071班 与本案例相关的知识概述1)期望值是一种方案的损益值与相应概率的乘积之和; 2)决策树就是用树枝分叉形态表示各种方案的期望值,剪掉期望值小的方案枝,剩下的最后的方案即是最佳方案; 3)悲观法即保守法,在方案取舍时,首先,取各方案在各种状态下的最小损益值(即最不利的状态发生),然后,在个方案的最小损益值中去最大值对应的方案; 4)乐观法即冒险法,在方案取舍时,首先取各方案在各种状态下的最大损益值(即最有利的状态发生),然后,在各方案的最大损益值中去最大值对应的方案; 5)后悔法,在方案取舍时,首先计算各方案在各自然状态下的后悔值(某方案在某自然状态下的后悔值=该自然状态下的最大收益-该方案在该自然状态下的收益),并找到个方案的最大后悔值,然后进行比较,吧最大后悔值最小的方案作为最终的选择;
案例一 案例一:某企业为了增加某种产品的生产能力,提出甲、乙、丙三个方案。甲方案是从国外引进一条生产线,需投资800万元;乙方案是改造原有生产车间,需投资250万元;丙方案是通过次要零件扩散给其它企业生产,实现横向联合,不需要投资。 根据市场调查与预测,该产品的生产有效期是6年,在6年内销路好的概率为,销路不好的概率为。在销路好的情况下,甲方案可以盈利430万元,乙方案可盈利210万元,丙方案可盈利105万元;在销路不好的情况下,甲方案将亏损60万元,乙方案可盈利35万元,丙方案可盈利25万元。问题:试用决策树法选择决策方案。 滞销 畅销 甲方案 -60万元 430万元 乙方案 35万元 210万元 丙方案 25万元 105万元 甲方案的期望值:-60 * + 430 * = 283万元 乙方案的期望值: 35 * + 210 * = 万元 丙方案的期望值: 25 * + 105 * = 81万元 所以采用甲方案; A B -60 430 35 210 25 105 方案 损益值 概率 市场 决策 C
不确定型决策方法及案例
不确定型决策方法 不确定型决策方法又称非确定型决策,非标准决策或非结构化决策,是指决策人无法确定未来各种自然状态发生的概率的决策。不确定型决策的主要方法有:等可能性法、保守法、冒险法、乐观系数法和最小最大后悔值法。 等可能性法 也称拉普拉斯决策准则。采用这种方法,是假定自然状态中任何一种发生的可能性是相同的,通过比较每个方案的损益平均值来进行方案的选择,在利润最大化目标下,选取择平均利润最大的方案,在成本最小化目标下选择平均成本最小的方案。 保守法 也称瓦尔德决策准则,小中取大的准则。决策者不知道各种自然状态中任一种发生的概率,决策目标是避免最坏的结果,力求风险最小。运用保守法进行决策时,首先在确定的结果,力求风险最小。运用保守法进行决策时,首先要确定每一可选方案的最小收益值,然后从这些方案最小收益值中,选出一个最大值,与该最大值相对应的方案就是决策所选择的方案。 冒险法 也称乐观决策法,大中取大的准则。决策者不知道各种自然状态中任一种可能发生的概率,决策的目标是选最好的自然状态下确保获得最大可能的利润。冒险法在决策中的体运用是:首先,确定每一可选方案的最大利润值;然后,在这些方案的最大利润中选出一个最大值,与该最大值相对应的那个可选方案便是决策选择的方案。由于根据这种准则决策也能有最大亏损的结果,因而称之冒险投机的准则。 乐观系数法 也称折衰决策法、赫威斯决策准则,决策者确定一个乐观系数ε(0.5,1),运用乐观系数计算出各方案的乐观期望值,并选择期望值最大的方案。 最小最大后悔值法
也称萨凡奇决策准则,决策者不知道各种自然状态中任一种发生的概率,决策目标是确保避免较大的机会损失。运用最小最大后悔值法时,首先要将决策矩阵从利润矩阵转变为机会损失矩阵;然后确定每一可选方案的最大机会损失,并计算出各方案的最大后悔值(后悔值=各个方案在该情况下的收益-该情况下该方案的收益);最后选择最大后悔值中的最小方案。
风险型决策方法及其现实运用
存档编号 赣南师范学院学士学位论文 风险型决策方法及其现 实应用 教学学院数学与计算机科学学院 届别 2012届 专业信息与计算科学 学号 080704020 姓名谢美贤 指导教师彭玉兵 完成日期 2012年5月
目录 内容摘要 (2) 关键词 (2) Abstract (2) Key words (2) 1. 概述 (3) 1.1 风险型决策问题的特点 (3) 1.2 风险型问题的提出 (3) 1.3风险型决策的基础和原则 (4) 1.4 风险型决策方法概述 (5) 2. 风险型问题决策方法 (6) 2.1 风险决策问题的决策方法 (6) 2.2风险型决策方法的应用 (13) 总结 (14) 参考文献 (15) 致谢 (16)
内容摘要:风险型决策在生产、农业、投资等许多领域有着广泛的运用,要做到科学决策就应该科学的选择决策方法。本文结合事例分析了具体情况如何选择合理的决策方法。本文主要以最大可能值法,期望值决策法,灵敏度分析以及效用分析几个方面进行了分析,给具体情况选择决策方法提供科学的依据。在此基础上,更进一步讲述了风险型决策方法的一些现实运用以及决策过程应该注意的一些问题。 关键词:风险型决策决策方法科学决策现实运用 Abstract:Risk decision-making in production, agricultural, investment, and many other areas have a wide range application,to do scientific decisions should be scientific choice decision-making method. This paper analyzes the concrete situation and uses example to show how to choose reasonable decision method. This paper main use the biggest possible value method,expectations decision,sensitivity analysis,utility analysis and so on to analysis.It provides scientific basis about how to choose decision methods.What's more,gives some examples in reality and shows some advices. Key words:Risk decision-making decision method scientific decision use in reality
(完整版)风险型决策3种方法和例题
一、乐观法 乐观法,又叫最大最大准则法,其决策原则是“大中取大”。 乐观法的特点是,决策者持最乐观的态度,决策时不放弃任何一个获得最好结果的机会,愿意以承担一定风险的代价去获得最大的利益。 假定某非确定型决策问题有m 个方案B 1,B 2,…,B m ;有n 个状态θ1,θ2,…,θn 。如果方案B i (i =1,2,…,m )在状态θj (j =1,2,…,n )下的效益值为V (B i ,θj ),则乐观法的决策步骤如下: ①计算每一个方案在各状态下的最大效益值 {V (B i ,θj )}; ②计算各方案在各状态下的最大效益值的最大值 {V (B i ,θj )}; ③选择最佳决策方案。如果 V (B i *,θj *)={V (B i ,θj )} 则B i *为最佳决策方案。 j max i max j max i max j max 例1:对于第9章第1节例1所描述的风险型决策问题,假设各天气状态发生的概率未知且无法预先估计,则这一问题就变成了表9.3.1所描述的非确定型决策问题。试用乐观法对该非确定型决策问题求解。 表9.3.1非确定型决策问题 极旱年旱年平年湿润年极湿年(θ1)(θ2)(θ3)(θ4)(θ5)水稻(B 1)1012.6182022小麦(B 2)252117128大豆(B 3)1217231711燕麦(B 4) 11.8 13 17 19 21 天气类型(状态) 各方案的收益值/千 元 解:(1)计算每一个方案在各状态下的最大收益值 =22(千元/hm 2) =25(千元/hm 2) =23(千元/hm 2) =21(千元/hm 2) ),(22,20,18,12.6,10max ),(max 511θθB V B V j j =}{=),(2,825,21,17,1max ),(max 12j 2j θθB V B V =}{=),(7,1112,17,23,1max ),(max 33j 3j θθB V B V =}{=),(9,2111,13,17,1max ),(max 544θθB V B V j j =}{= (2)计算各方案在各状态下的最大效益值的最大值 (3)选择最佳决策方案。因为 所以种小麦(B 2)为最佳决策方案。 =25(千元/hm 2) ) ,(122,25,23,2max ),(max max 2j j i j i B V B V θθ=}{=) ,(max max ),(12j i j i B V B V θθ= 二、悲观法 悲观法,又叫最大最小准则法或瓦尔德(Wold Becisia )准则法,其决策原则是“小中取大”。 特点是决策者持最悲观的态度,他总是把事情估计得很不利。
风险决策问题作业
风险决策问题作业文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)
习题:某农民拟在两种作物中选择一种。若旱年1θ占60%,正常年景2θ占40%;种植耐旱作物1a 以及种植不耐旱作物2a 的后果矩阵为(单位:万元): )1(156.1)(02.0y e y u --=(单位:万元),问该农民应该采取什么行动画出该决策问题的决策树。 2.设气象预报的准确性是,即 8.0)(8.0)(2211==θθx p x p 。 其中:1x 表示预报干旱;2x 表示预报正常年景。 ⑴ 画决策树; ⑵ 求后验概率; ⑶ 进行正规型贝叶斯分析,求贝叶斯规则; ⑷ 讨论两种扩展型贝叶斯分析; ⑸ 分析气象预报费用与是否进行气象预报的关系。 求解: 1. 设该农民的效用函数为)1(156.1)(0 2.0y e y u --=(单位:万元),问该农民应该 采取什么行动画出该决策问题的决策树。 解:已知农民的效用函数为)1(156.1)(02.0y e y u --=, 令:l(y)= 1-u(y),则损失函数 y y y e e e y l 02.002.002.0156.1156.0 156.1156.11)1(156.11)(---+-=+-=--= 其效用函数和损失函数图形如下所示。 在无观察时,l R =,)(),(),(1 1l n i l i a l a r θπθπ∑==,已知6.0)(1=θπ,4.0)(1=θπ,
则:)(),()(),(),(2121111θπθθπθπ?+?=a l a l a r = ×+×= = ×+0×= 风险r 小者优,所以1a =δ为贝叶斯规则, 即贝叶斯行动。 即应选择耐旱作物。 2.设气象预报的准确性是,即 8.0)(8.0)(2211==θθx p x p 。 其中:1x 表示预报干旱;2x 表示预报正常年景。 解:(1)画决策树 (2)求后验概率 已知8.0)(8 .0)(2211==θθx p x p ,则在状态1θ和2θ下出现1x 和2x 的条件概率 2,1,2,1),(==j k x p j k θ如下: 根据:∑= i i i k k x p x m )()()(θπθ, 得:)()|()()|()(2211111θπθθπθx p x p x m +== ,)(2x m = ; 其后验概率分别为: ⑶ 进行正规型贝叶斯分析,求贝叶斯规则; 根据:∑∑=j k j j k k i j i x p x l r )()())(,(),(θπθδθδπ 策略1δ:)(111x a δ=,)(212x a δ=。 =××+××+××+××
风险决策问题作业
习题:某农民拟在两种作物中选择一种。若旱年1θ占60%,正常年景2θ占40%;种植 耐旱作物1a 以及种植不耐旱作物2a 的后果矩阵为(单位:万元): 1.设该农民的效用函数为)1(156.1)(02.0y e y u --=取什么行动?画出该决策问题的决策树。 2 1. y y y e e e y l 02.002.002.0156.1156.0 156.1156.11)1(156.11)(---+-=+-=--= 其效用函数和损失函数图形如下所示。
, 2221212 =1.0×0.6+0×0.4=0.6 风险r 小者优,所以1a =δ为贝叶斯规则,即贝叶斯行动。 即应选择耐旱作物。 2.设气象预报的准确性是0.8,即8.0)(8 .0)(2211==θθx p x p 。 其中:1x 表示预报干旱;2x 表示预报正常年景。
解:(1)画决策树 其后验概率分别为: 86.056 .06 .08.0)()()/()|(111111=?== x m x p x θπθθπ 27.044 .06 .02.0)()()/()|(211221=?==x m x p x θπθθπ 14.0)|(156 .04 .02.0)()()/()|(11122112=-=?== x x m x p x θπθπθθπ
73.0)|(144 .04 .08.0)()()/()|(21222222=-=?== x x m x p x θπθπθθπ 2,1,2,1),(==j k x k j θπ =0.6152 策略3δ:)(131x a δ=,)(132x a δ=, ) ()(),()()(),( )()(),()()(),( ),(221222221211221111113θπθθθπθθθπθθθπθθδπx p a l x p a l x p a l x p a l r +++=