决策及博弈论

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“啤酒和热狗”信号博弈
支付的定性特征是,软弱型宁愿热狗,粗暴型 宁愿啤酒,两种类型都不愿意与接收者冲突,而接 收者宁愿与软弱型冲突,但不愿与粗暴型冲突。具 体地,对两种类型的发送者来说,偏好的早餐价 值 b0 ,不偏好的早餐价值为0,而避免冲突价 值 d 0 。对接收者来说,与软弱型(粗暴型)冲突 的支付为1(-1),所有其他支付为0。
它满足:
n
(i)a
(m)
arg
max aA
1
(
|
m)u2
(
,
m,
a)
((iiii)i)m((| m) )是a接rg收mm者aM使x 用u贝1(叶,斯m法, a则从(m先))验概率 p( )、观察
到的信号 m 和发送者的最优策略 m( )得到的(在可能的情况
下)。
( | m)
p( ) pS (m | )
9
不完全信息下的博弈与决策
市场进入博弈树
自然
在位者 L
进入者
O
E
H 自然
L 自然
在位者 H
自然
R
N
[0.4] [0.6]
(0,0)
(0,40)
R
N
R
N
RHale Waihona Puke Baidu
N
[0.4] [0.6]
[0.4] [0.6]
[0.4] [0.6]
(0,160)
(0,200) (-120,-80) (-80,-40) (40,40)
者的类型 ,n p( ) 1 ;
p( ),而告知发送者
,接收者不知道发送
1
(ii)发送者从信号集M [0, )中选择一信号m发送;
(iii)接收者观察到m后,从可行行动集A [0, )中选择行动a ;
(iv)发送者的效用函数为 或给出接收者的最优反应函数
u1
( , m, a,) 接收者的效用函数为 a( , m,) 两者为共同知识。
同均衡和准分离均衡。更加具体地,它们分别定义如下:
分离均衡(separating equilibrium) 这种均衡中,不同类型 的发送者以概率1选择不同的信号,也就是说,没有两种类型选 择同一信号。在分离均衡中,信号准确地表现类型,特定的类型 发送特定的信号。接收者完全可以通过信号准确判断出发送者的
在正常需求的情况下,如果进入者选择不进入,则进入者的支付 为0,在位者选择低价时的支付为40,选择高价时的支付为200;如果 进入者选择进入,则当在位者选择低价时,进入者的支付为-80,在位 者支付为-40,当在位者选择高价时,进入者和在位者各得支付80。在 萎缩需求时,在每种情况下,在位者的支付比正常情况少了40;而进 入者选择进入时,其支付比正常情况下也少了40。
类型,即后验概率 ( | m) 要么为0要么为1。
u1(i , mi , a(mi )) u1(i , mj , a(mj ))
2020/7/3
13
信号博弈的完美贝叶斯均衡
定义
混同均衡(pooling equilibrium)在这种均衡中,不同类型 的发送者选择了相同的信号,换句话说,没有任何类型选择与其 他类型不同的信号。这时,接收者无法从信号中得到新的信息, 也就无法对先验信念进行修正。因此,后验概率( | m) 等于自
2020/7/3
15
信号博弈的完美贝叶斯均衡
“啤酒和热狗”信号博弈
Cho和Kreps(1987)的“啤酒和热狗(beer and quiche”信号博弈中, 博弈顺序为 :
(i)自然从可行的类型集 {1,2} 中赋予发送者类型 的概率
为 p( ) 0 ,并将 p( )告知接收者,而将 告知发送者,接收者不 知道发送者的类型 ,p(1) 0.1且 p(2 ) 0.9 ;
(ii)发送者从信号集 M {B,Q}中选择一信号发送; (iii)接收者观察到信号后,从可行行动集A {D, N}中选择行动; (iv)发送者和接收者的效用见图4.2.1,两者为共同知识。
在博弈顺序中,类型1 代表软弱型(wimpy), 2 代表粗暴型 (surly);B代表啤酒,Q代表热狗;D代表与发送者冲突(duel), N代表不与发送者冲突。 [p]表示当接收者接收到信号 Q后,认为发 送者的类型为 1的概率,即 p (1 | Q) 。
2020/7/3
16
信号博弈的完美贝叶斯均衡
“啤酒和热狗”信号博弈
b,1
b+d,0 0,-1
d,0
D [p] Q
N
R D
[1-p] Q N
1
0.1
N
0.9
2
0,1 D B [q]
N d,0 R
D b,-1
B [1-q] N
b+d,0
图4.2.1 “啤酒和热狗”信号博弈
2020/7/3
17
信号博弈的完美贝叶斯均衡
第四章 不完全信息动态博弈
4.1.1 基本概念
不完全信息意味着至少有一个参与人拥有私人信息, 通常用类型表示拥有不同私人信息的参与人,类型由 “自然”或“上帝”给定。
博弈顺序: (1)“自然”选择参与人的类型,并 将类型告诉参与人自己,不告诉其他参与人,只将类型 分布告诉其他参与人;(2)参与人开始行动,参与人 的行动有先有后,后行动者能观察到先行动者的行动, 而不能观察到先行动者的类型。
2020/7/3
8
不完全信息下的博弈与决策
根据上面的的行动顺序,可以画出进入者的决策树 (decision tree),见图4.1.3。
进入者
O
E
0 自然
在位者
L
H
[0.5] [0.5]
自然
R
N
[0.4] [0.6]
-120
-80
R
N
[0.4] [0.6]
40
80
图4.1.3 市场进入决策树
2020/7/3
1
L
R
(2.5,3)
(2.5,3)
2
A
B
A
B
(1,1)
(1,2)
(2,1)
(3,3)
图4.1.1 海萨尼转换后的情形
2020/7/3
4
1
L
M
R
(2.5,3)
2
A
B
A
B
(1,1)
(1,2)
(2,1)
(3,3)
图4.1.2
2020/7/3
5
博弈有两个纯策略纳什均衡,(L, A)和(R, B)。 给定参与人1选择L,参与人2的信息集没有达到;给 定参与人2选择A,参与人1的最优选择是L,因此,
先行动者 的类型
行动 推断
后行 动者
2020/7/3
1
先行 动者
预测 信息
后行动者 的行动
后续博弈(continuation game): 从每一个信息集开始 的博弈的剩余部分。
与子博弈的区别:子博弈必须开始于单结信息集,并 且不能切割信息集,而后续博弈可以始于任何完全信息集 (不论是否为单结)。
2020/7/3
18
“啤酒和热狗”信号博弈
在啤酒和热狗博弈中,(Q |1, B |2)是发送者的一个分离策略,这里
Q |1 代表在发送者是软弱类型的情况下,选择热狗。如果 b d ,那 么,发送者的策略 (Q |1, B |2)和接收者的策略 (D | Q, N | B)以及后验概率
p 1 和 q 0是这个博弈的完美贝叶斯均衡。这里 D | Q 代表在发送 者选择热狗的情况下,接收者选择冲突,也可以类似地解释 N | B。
完美贝叶斯均衡要求:(1)在每一个信息集上,决策者 必须有一个定义在属于该信息集的所有决策结上的一个概率 分布(信念);(2)给定有关其他参与人类型的信念,参与 人的策略在每一个信息集开始的后续博弈上构成贝叶斯均衡; (3)在所有可能的情况下(贝叶斯法则能适用),参与人使 用贝叶斯法则修正有关其他参与人类型的信念。
n
p( ) pS (m | )
1
2020/7/3
12
信号博弈的完美贝叶斯均衡
定义
如果不知道接收者的效用函数,但知道完全信息下接收者
的最优反应函数,那么,定义4.2.1中的(i)用下面的(i´)代

n
(i´)a(m) E [a( , m)] ( | m)a( , m)
1
信号博弈的完美贝叶斯均衡可以分成三类:分离均衡、混
直观标准 如果m之后的信息集处于均衡路径之外,且m为类
型 的均衡劣信号,即均衡效用u( ) max u( , m, a( , m)) ,
则(在可能的情况下)接收者的推断 a( ,m) 。
( | m) 0
直观标准的含义是,在非均衡路径中,接收者认为发送者不 会选择无论接收者怎样采取行动发送者的效用总小于均衡时发送 者效用的信号。
因此,这个博弈的唯一完美贝叶斯均衡是
{R, B; q 0}
2020/7/3
7
4.1.2 不完全信息下的博弈与决策 服务行业的市场进入模型,博弈顺序为:
(i) 进入者决定进入(E)或不进入(O); (ii) 在位者选择高价(H)或低价(L); (iii)自然选择需求,正常需求(N)的概率为0.6,萎缩需求(R) 的概率为0.4;
(L, A)是一个纳什均衡。因为这个博弈只有一个子 博弈(从广义的角度看),即原博弈,所以(L, A) 和(R, B)都是子博弈完美均衡。完美纳什均衡(L, A) 依赖于一个不可置信的威胁:当参与人1偏离L而选择 其他行动时,参与人2的最优行动是选择B,所以, 参 与人1不应该相信参与人2会选择A。
例:在图4.1.1表示的博弈中,自然赋予参与人1两种类 型,L或H,将类型告诉参与人1,但只将参与人1的类型
分布告诉参与人2. 参与人1有两个行动L和R,参与人2有 行动A和B,参与人2能够观察到参与人1的行动,但是不知
道参与人1的类型(或自然的行动)。
2020/7/3
3
N
L[ P ]
1
L
R
H[1 P ]
u2 ( , m, a)
后验概率 ( | m)表示观察到信号m,接收者相信是 类型发送的概率。
2020/7/3
11
信号博弈的完美贝叶斯均衡
定义
定义4.2.1 信号博弈的完美贝叶斯均衡(perfect Bayesian
equilibrium)是策略组合(m( ),a(m)) 和后验概率 ( | m) 的结合,
时,软弱的发送者选择热狗得到的最低支付 b 超过选择啤酒时得
到的最高支付 d ,这样软弱型将不选择啤酒,发送者也许选择的
b,1
b+d,0 0,-1
d,0
D [p] Q
N
R D
[1-p] Q N
1
0.1
N
0.9
2
0,1 D B [q]
N d,0 R
D b,-1
B [1-q] N
b+d,0
2020/7/3
19
信号博弈的完美贝叶斯均衡
“啤酒和热狗”信号博弈
当 b d时,是否啤酒和热狗有其他完美贝叶斯均衡?发送者可能 选择的其他策略是 (Q |1,Q |2 ) 、(B |1,Q |2 )和 (B |1, B |2 ) 。当 b d
2020/7/3
2
完美贝叶斯均衡吸取了子博弈完美纳什均衡和贝叶 斯均衡的精华,是贝叶斯均衡、子博弈完美均衡和贝叶 斯推断的结合。
子博弈完美纳什均衡:策略不仅必须是整个博弈的 纳什均衡,还必须是其中每一个子博弈的纳什均衡。
完美贝叶斯均衡:策略不仅必须是整个博弈的贝叶 斯纳什均衡,而且还必须构成每一个后续博弈的贝叶斯 纳什均衡。
然赋给信号发送者类型 的概率 p( )。
在混同均衡中,对于任何类型的信号发送者,选择均衡信号
m比选择其他任何信号的效用都高,即
u1( , m, a(m)) u1( , m, a(m)) , , m m
准分离均衡(semi-separating equilibrium) 一些类型的发送 者随机地选择信号,另一些类型的发送者选择特定的信号。接收 者得到某些信号时能够准确地判断出发送者的类型,得到另外的 信号时尽管不能完全判断发送者的类型,但是能够修正自己的信 念。
(80,80)
4.1.4 市场进入博弈树
2020/7/3
10
信号博弈
4.2.1 信号博弈的完美贝叶斯均衡
信号博弈中有两个参与者,具有信息优势的一个称为信号发送者 (S),另一个称为信号接收者(R),博弈顺序为:
(i)自然从可行的类型集 {1,2,,n} 中赋予发送者类型 的先验概率
为 p( ) 0,并告知接收者
(L, A)的剔除:假设参与人2认为参与人1选择 M和R的概率分别为q和1-q。给定这个信念,参与人2
选择A的预期效用是 q1 (1 q)11,选择B的预期效用
是2q 3(1 q) 3 q 1 , 这样,参与人2一定会选择B.
2020/7/3
6
给定参与人1知道参与人2将选择B,参与人1的最
优选择是R。但给定R是参与人1的最优策略,当参与人 2观察到参与人1没有选择L时,他推断参与人1一定选择 了R,即q 0 。
2020/7/3
14
信号博弈的完美贝叶斯均衡
信号博弈的完美贝叶斯均衡中一般存在不可置信( (incredible)的 均衡,为了剔除之,可以采用Kreps(1984)或Cho和Kreps(1987)
的直观标准(intuitive criterion)。接收者对类型 发出的信号 m所采取的行动记为 a( , m),以替代效用函数中的a,下同。
相关文档
最新文档