博弈论7 不完全信息动态博弈
第5讲-不完全信息动态博弈

1.基本思路
• 在不完全信息动态博弈(dynamic game of incomplete information)中,“自然”首先选择 参与人的类型,参与人自己知道,其他参与人不 知道;在自然选择之后,参与人开始行动,参与 人的行动有先有后,后行动者能观测到先行动者 的行动,但不能观测到先行动者的类型。
第5讲 不完全信息动态博弈
不一样的。假定存在一个价格P*,只有低成本企业 才有利可图,而高成本企业司不敢模仿这个价格 的。 • 那么,精炼贝叶斯均衡是,低成本在位者选择P*, 高成本企业选择一个较高的垄断价格。如果进入 者观察到在位者选择了P*,这就推断其为低成本, 不进入;否则,就认为在位者是高成本,进入。 • 这就是由米尔格罗姆和罗伯茨于1982年提出的著 名的“垄断限价模型”。
马上认为这个人一定是好人,除非这件好事非常非常地好,因为否 则的话,坏人总是有积极性干件好事以使我们认为他是一个好人)。 当然,如果我们认为坏人干好事并不仅仅是为了假装好人,我们对 他的看法就不会改变,因为,根据贝叶斯法则:
第5讲 不完全信息动态博弈
ProbBP GT p*1 =1
q*0 P*1 这里,p>0是坏人干好事的概率,q>0好人干好事的概率。 从上面例子可以看到,我们如何改变对一个人的看法不仅依赖于我们 认为他是好人或坏人的先验概率,而且依赖于我们如何“认为”好人 干好事和坏人干好事的条件概率。
• 但是,因为参与人的行动是类型依存的,每个参 与人的行动都传递着有关自己类型的某种信息, 后行动者可以通过观察先行动者所选择的行动来
第5讲 不完全信息动态博弈
推断其类型或修正对其类型的先验信念(概率分 布),然后选择自己的最优行动。先行动者预测 到自己的行动将被后行动者所利用,就会设法选 择传递对自己最有利的信息,避免传递对自己不 利的信息。 • 因此,博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。
完全但不完美信息动态博弈博弈论

二手车交易
卖方
好
差
卖方
卖方
卖
买方
买
不卖 卖
不卖
(0,0)
买方 (0,0)
不买 买
不买
(2,1)
(0,0) (1,-1) (-1,0)
(2)信息集 information set
决策结:参与人采取行动的时点。 信息集:是决策结集合的子集,并满足以下
两个条件:
i 每一决策结是同一参与人的决策结; ii 该参与人知道博弈进入该集合的某个决策结, 但不
A不知道自然的选择;B不知道A的选择,知道自然的选择
房地产开发博弈
N
大
小
(1/2) (1/2)
A
A
开发
B
不开发 开发
BB
不开发
B
开
不开
不开
不开
不
(4,4) (8,0)(0,8)(0,0()-3,-3()1,0()0,1)(0,0)
A知道自然的选择;B知道A的选择,但不知道自然的选择
房地产开发博弈
Bayes法则正是人们根据新的信息从先验概率得 到后验概率的方法。
全概率公式和贝叶斯公式
设试验E的样本空间为s,A为E的事件,B1, B2,…,Bn为s的一个划分,且P(Bi)>0,则 全概率公式为:
P(A) P(A B1)P(B1) P(A B2)P(B2) P(A Bn)P(Bn)
贝叶斯公式为:
1
R
L(p)
M(1-p)
(1,3)
2
U
D
U
D
(2,1)
(0,0) (0,0) (0,1)
(3)(4)如何决定“判断”? 贝叶斯法则(这里不用即可判断出p=1) 要求3使均衡策略与合理判断形成一种相互依存的关系。
第三章信息经济学的研究方法—博弈论

第一节 概述-人生处处皆博弈
人生是永不停歇的博弈过程,博弈意 略达到合意的结果。
作为博弈者,最佳策略是最大限度地 利用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社 会整体福利增加。
一、博弈论的定义
博弈论(game theory,又译为对策论,游戏论)
定义:研究决策主体的行为在直接相互作用时,人们如 何进行决策、以及这种决策如何达到均衡。
五、博弈论与信息经济学
博弈论是给定信息结构求均衡结果,它实际上是一种均衡理论, 我们最终要找的是一个均衡的结果,博弈论是方法论导向的, 它实际上是一种解决问题的方法。它是一个实证的方法。
信息经济学是给定信息结构求契约的安排。它实际上是一种契 约设计理论,它是问题导向的。它是一个规范的方法。
石匠的决策与拳击手的决策的区别
一、博弈论的定义
2、理性人假设 理性人是指一个很好定义的偏好,在面临给定的约束条件下
最大化自己的偏好。
博弈论说起来有些绕嘴,但理解起来很好理解,那就是 每个对弈者在决定采取哪种行动时,不但要根据自身的利益 和目的行事,而且要考虑到他的决策行为对其他人可能的影 响,通过选择最佳行动计划,来寻求收益或效用的最大化。
(一)囚徒困境
假定: (1)每个局中人都知道博弈规则和博弈结果的支付
矩阵; (2)每个局中人都是理性的(个人理性和个人最优
决策); (3)不能“串通”
(一)囚徒困境——纳什均衡
囚徒A
坦白
坦白 囚徒 B
-8,-8
抵赖 -10,0
抵赖 0,-10 -1,-1
-8大于-10 0大于-1
(坦白,坦白)是纳什均衡
第三章 信息经济学的研究方法 ——博弈论
不完全信息动态博弈-精练贝叶斯纳什均衡

一 精练贝叶斯纳什均衡 基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡 二 信号传递博弈及其应用举例 三 博弈论概念简要总结
基本思路-不完全信息动态博弈
类型:自然首先选择参与人的类型,参与人自己知道,其 他参与人不知道。--不完全信息
行动:行动有先有后,后行动者能观测到先行动者的行动, 但不能观测到其类型。--动态博弈 但是,参与人是类型依存型的,每个参与人的行动都 传递有关自己类型的信息,后行动者可以通过观察先行动 者的行动来推断自己的最优行动。先行动者预测到自己的 行动被后行动者利用,就会设法传递对自己最有利的信息。
不完全信息动态博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。
[x]
高
T=2,如果进入者已进入,在位 者成本函数为共同知识,若在位 者为高成本,p=5时,每个企业 利润为3,扣除进入成本2,进入 者利润为1。若在位者为低成本, p=4,在位者利润是5,进入者成 本为1,扣除进入成本2,其利润 为-1。
P=6
进入者 进入 不进入 进入 不进入 进入 不进入 进入 不进入 进入
价格
在位者高成本时的利润 在位者低成5
6 9
P=6
7 8
基本思路-不完全信息动态博弈
进入者只有一种类型:进入成本为2,如果进入,生产成本函数与在 位者高成本函数相同。
T=2,如果进入者已进入,在位者成本函数为共同知识,若在位者为 高成本,企业企业成本函数相同,对称库诺特均衡产量下的价格p=5时, 每个企业利润为3,扣除进入成本2,进入者利润为1。若在位者为低成本, 两个企业成本函数不同,非对称库诺特均衡产量下的价格p=4,在位者利润 是5,进入者成本为1,扣除进入成本2,其利润为-1。
非完全信息动态博弈博弈论吉本斯.pptx

27
第28页/共59页
Example 1-厂商的分离均衡纯策略
•.
(保修,不保修)
(1,0.5) Y [1] 保修 厂商 不保修[0] Y (-1,1)
(0,0) N
H
[0.5]
N (0,0)
客户
自然
客户
(-1,-0.5)Y [0]
(0,0) N
保修
[0.5] L
不保修 [1] 厂商
Y (1,0.5) N (0,0)
19
第20页/共59页
Signaling game
• Sender和 Receiver 都有四个纯策略.
Sender的纯策略:
(m1,m1), (m1,m2), (m2,m1), (m2,m2)
(m1,m1), (m2,m2):混同(pooling strategies)策略
(m1,m2), (m2,m1):分离(separating strategies)策略
q1 1 1 q2
1
11
第12页/共59页
Requirement 4
• 要求 4. 对处于均衡路径之外的信息集, 推断由贝叶斯法则以及可能情况下的参与人的均衡策略给出. • 定义 .满足要求1到4的策略和推断构成博弈的完美贝叶斯均衡(perfect Bayesian equilibrium ).
17
第18页/共59页
Signaling game
•图
a1
m1
S
m2
a1
a2
t1 [p]
a2
R
N
R
a1
[1-p] a1
t2
a2
m1 S
m2
a2
完整版)博弈论知识点总结

完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。
该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。
博弈中涉及到的变量包括:参与人、行动、战略和信息。
完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。
不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。
博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。
博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。
与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。
扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。
战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。
博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。
根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。
根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。
根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。
不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。
Hotelling价格竞争模型是一种重要的扩展式博弈,用于描述两个企业在同一市场上的价格竞争。
相对应。
占有均衡是指在博弈中存在一组参与人的战略选择,使得每个参与人都无法通过改变自己的战略来提高自己的支付。
《经济博弈论》期末考试复习题及参考答案

经济博弈论复习题(课程代码262268)一、 名词解释混合战略纳什均衡;子博弈精炼纳什均衡:完全信息动态博弈:不完全信息动态博弈:完 全信息静态博弈:帕累托上策均衡;囚徒困境:纳什均衡:子博弈;完美信息动态博弈;颐 抖手均衡;柠檢原理:完美贝叶斯均衡二、 计算分析题1、 在市场进入模型中,市场需求函数为p=13-Q,进入者和在位者生产的边际成本都为1, 固泄成本为0,潜在进入者的进入成本为4。
博弈时序为:在位者首先决左产量水平;潜在 进入者在观察到在位者的产量水平之后决定是否进入:如果不进入,则博弈结束,如果进入, 则进入者选择产疑水平。
求解以上博弈精炼纳什均衡。
2、 考虑如下扰动的性别战略博弈,其中A 服从[0, 1]的均匀分布,Of£<l 山和匕是独 立的,匕是参与人i 的私人信息。
求出以上博弈所有纯战略贝叶斯均衡。
3、求下列信号传递模型的贝叶斯Nash 均衡(讨论分离均衡和混同均衡)(2.1)(6.2)(3.1)(4J)5、古诺IW 弈:市场反需求函数为P (Q )= a- Q,其中Q = q 】+q2为市场总产豊q :为企 业i (i = l, 2)的产量。
两个企业的总成本都为Ci (qJ = cqi 。
请您思考以下问题: 1)在完全信息静态条件下,这一博弈的纳什均衡是什么?2)假设这一阶段博弈重复无限次。
试问:在什么样的贴现条件下,证产量组合(響,響)是子博弈精炼纳什均衡的?6、考虑一卞工作申请的佔弈。
两个学生同时向两家企业申请工作,每家企业只有一个工作 岗位。
工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个 学生申请,该学生获得工作:如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。
现在假泄每家企业的工资满足:W 1/2<W :<2W 1,则问: a.写出以上博弈的战略式描述b.求出以上博弈的所有纳什均衡7、(差异价格竞争)假立两个寡头企业进行价格竞争,但产品并不完全相同,企业,的市场需求门厂)="-门+匕仏丿=1,2),两家企业的生产成本函数为 g 求两个寡头同 时选择价格时的纳什均衡。
博弈论与信息经济学-4.不完全信息动态博弈

I11
L
p
M
I21
R
1-p
1 3
U
2 1
B
0 0
U
0 2
B
0 1
根据局中人2的推断可知,局中人2选 R 的期望支付为 1 p ,选 U
的期望支付为
p 2(1 p) 2 p
①
L R
③
A D
I31
③
U
②
B
A
D
4 4 4
1 1 1
5 5 0
2 2 2
3 3 0
均衡(L,B,A)并不是一个合理的均衡。因为如果博 弈进入参与人2的信息集,参与人2应该选择U而不 是B。 不可能用子博弈精炼纳什均衡的概念剔除(L,B,A), 但可以使用精炼贝叶斯均衡剔除这个不合理的均衡。
( A, L, L' ) r1( A, L, L' ) r2 ( A, L, L' ) r3 ( A, L, L' )
r3 ( A, L, L' ) {L' , R'}
,
( A, L, L' ) 为纳什均衡。
{( A, L, L' ), p 0} 对于要求1与3的满足是显然的,现考虑要求2
给定局中人的推断,局中人的策略必须满足序贯理性的要求。即在每一信息
集中,应该行动的局中人(以及局中人随后的策略),对于给定的该局中人 的推断,以及其余局中人随后的策略(其中“随后的策略”是在达到给定的 信息集之后,包括了其后可能发生的每种情况的完全的行动计划)必须是最 优反应。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
给定参与者2的推断, 选择R ′的期望收益就等于p×0+(1-p)×1=1-p。 选择L′的期望收益等于p×1+(1-p) ×2=2-p。 由于对任意的p,都有2-p >l-p,要求2排除了2选 择R′的可能性。
R
(1,3) L 2 M
[p]
[1-p]
L′
R′
L′
R′
(2,1) (0,0)
如果我们将从每一个信息集开始的博弈 的剩余部分称为一个“后续博弈”(注 意与子博弈的不同:子博弈必须开始于 单结信息集),一个“合理”的均衡应 该满足: 给定每一个参与人有关其它参与人类型 的后验信息,参与人的战略组合在每一 个后续博弈上构成贝叶斯均衡。
精炼贝叶斯均衡是贝叶斯均衡、子博弈精练 均衡和贝叶斯推断的结合。它要求: (1) 在每一个信息集上,决策者必须有一 个定义在属于该信息集的所有决策结上的一 个概率分布(信念); (2) 给定该信息集上的概率分布和其他参 与人的后续战略,参与人的行动必须是最优 的; (3) 每一个参与人根据贝叶斯法则和均衡 战略修正后验概率。
参与人的行动是类型依存的,每个参与人的 行动都传递着有关自己类型的某种信息, 后行动者可以通过观察先行动者所选择的行 动来推断其类型或修正对其类型的先验信念 (概率分布),然后选择自己的最优行动。
先行动者预测到自己的行动将被后行动 者所利用,就会设法选择传递对自己最 有利的信息,避免传递对自己不利的信 息。 因此,博弈过程不仅是参与人选择行动 的过程,而且是参与人不断修正“信念” 的过程。
按照海萨尼转换,该博弈表示为:
N
t11
1
t12
[1 P]
[ P]
m1
2
m2
m1
a1
1 2
m2
a1
a1 a1
a2
a2
a2
Байду номын сангаас
a2
图7-2
注释: 参与人i对其他参与人的类型(私人信息)t-i的 信念 pi (ti | ti ) 称为先验概率。 当参与人 i在他的某个信息集h上观察到其他 h a n-1个参与人行动组合 i ,条件概率 h h i (ti | a p ) a , 是参与者i在观察到 i 的情况下, i 对参与者的类型t-i的修改,这个修正产生 h i (ti | a p i )的推断称为后验概率
在图7.3的子博弈精炼纳什均衡(L, L′)中,参与者2 的推断一定是 p=1 :给定参与者 1的均衡战略,参与者2 知道已经到了信息集中的哪一个节。作为要求3的另一种 说明,设想在图7.3中存在一个混合战略均衡,其中参与 者 1 选择 L 的概率为 q1 , M 的概率为 q2 ,选择 R 的概率为 1-q1-q2 。要求 3 则强制性规定参与者 2 的推断必须是 p= q1/( q1+ q2)。
在例1图7-1中,设R(t11),R(t12)是参与人1的 两个战略。从而该博弈表示为完全但不完美 的动态博弈图7-3 。
1
L
R(t11 )
[ P]
2
R(t12 )
[1 P]
2
(2, 2)
R
A
B
A
B
(0, 0)
(0,1) 图7-3
(1, 0)
(3,1)
参与人2
A
参 与 人 1
B
2,2 0,1
L
R(t11 )[ p]
R(t12 )[1 p]
2,2 0,0
1,0
3,1
对于参与人2的任何信念p2 ( p,1- p), 行动A都要弱劣与B, 因此均衡(L, A )是参与人2的不可信威胁:
但(L,A)又排除不掉,因为没有子博弈。 假设在参与人2的信息集h2上,观察到R产生 的后验概率为 p (t11 | R) q, p (t12 | R) 1 q,
例题1: 参与人i=1,2; 参与人1的行动空间A1={L,R} 参与人1的类型空间T1={t11,t12} 参与人2的行动空间A2={A,B} 参与人2的类型空间T2={t2},单点集,因此 参与人1对参与人2的信念p1=1; 参与人2对参与人1的信念p2=(p,1-p); 参与人1先行动,参与人2后行动。
(p 1 , p 2 ,, p n ) 和一个后验概率组合 p ,满足下列要求R1-R4:
要求1:在每一信息集中,应该行动
的参与者必须对博弈进行到该信息 集中的哪个节有一个推断。
对于非单节信息集,推断是在信息
集中不同节点的一个概率分布;对 于单节的信息集,参与者的推断就 是到达单一决策节的概率为1。
7.1.4 精炼贝叶斯均衡的等价定义
不完全信息静态博弈的海萨尼转换也适用 于不完全信息动态博弈,经过海萨尼转换的 不完全信息动态博弈与完全但不完美信息动 态博弈没有多少差别。
等价定义:精炼贝叶斯均衡是一个战略组合
s* (t ) (s*1 (t1 ), s2* (t2 ),, s*n (tn ))
(t11 | R) 0, p (t12 | R) 1, p
,所以就删掉了( L,A )
7.1 精炼贝叶斯纳什均衡
7.1.1后续博弈 引入精炼贝叶斯均衡的目的是:
为了进一步强化 ( 即加强对条件的要求 )
贝叶斯纳什均衡,这和子博弈精炼纳什 均衡强化了纳什均衡是相同的。
Pr ob{t k a h } p(a h t k ) p(t k ) Pr ob{a }
h
p(a h t k ) p(t k )
k 1
K
p(a h t k ) p(t k )
注意:精炼贝叶斯均衡假定参与人是
根据贝叶斯法则修正先验概率的。
不过,贝叶斯法则要求 Prob{ah}>0, 即参与人 i 必须以正的概率选择 ah ,
用更为广义的后续博弈的概念来代替子博弈,后续 博弈可开始于任何信息集(而不论是否单结)。
其后,进行相似的分析:如果参与者的战略要构成 为博弈的一个精练贝叶斯均衡,它不仅必须是整个 博弈的贝叶斯纳什均衡,而且必须构成每一个后续 博弈的贝叶斯均衡。
[ 例子 ] :市场进入博弈(该博弈的扩展式表述模型 见图7.2)
否则,后验概率没有定义。
如果 Prob{ah} = 0 ,允许 Prob{tk|ah} 在
[0,1] 区间取任何值,只要所取的值与 均衡战略相容。
在动态博弈中,Prob{ah}=0对应的是非
均衡路径上的信息集。
7.1.3精炼贝叶斯均衡
假定有 n 个参与人,参与人 i 的类型是是私 人信息, p(t-i|ti) 是属于类型 ti 的参与人认为其他 n-1 参与人属于类型t-i =(t1,…, ti-1, t i +1, …, tn) 的先验概率。
这时,参与者2选择A的期望收益为: 0*q+0*(1-q)=0 选择B的期望收益为: 1*q+1*(1-q)=1>0 所以参与人2一定会选择B.
参与人1知道理性的参与人2轮到他决策 的信息集h2上会选择B,因此参与人的最 优战略就是R(t12). 既然参与人1决定选择R(t12),因此参与 人2修正的信念推断是
7.1.2 贝叶斯法则
统计学上,修正之前的判断称为 “ 先 验概 率 ” , 修 正之 后 的判 断 称为 “后验概率”。贝叶斯法则是人们根据 新的信息从“先验概率”得到“后验概 率”的基本方法。
一个不完全信息博弈中,假定参与人的
类型是独立分布的,参与人 i 有 K 个可能 类型,有H个可能行动。
要求 2 :给定参与者的推断,参与者的战略必须满 足序贯理性的要求。 即在每一个信息集中应该行动的参与者(以及参与者 随后的战略),对于给定的该参与者在此信息集中的 推断,以及其他参与者随后的战略必须是最优反应。 要求1意味着如果博弈的进行达到参与者 2的非单节 信息集,则参与者2必须对具体到达哪一个节 ( 也就 是参与者1选择了L还是R)有一个推断。这样的推断 就表示为到达这两个节的概率p和1-p。
定义:精炼贝叶斯均衡s*(t)=( s*1 (t1), …, s*n
1 2 n
(tn))是一个战略组合,和一个后验概率组合 (p ,p ,, p ) ,满足: p (1) 对于所有的参与人i,在每一个信息集h,
si t i
i (ti aih )ui ( si , si , ti ) si* ( si , ti ) arg max p
第七章 不完全信息动态博弈
至少部分博弈方没有关于得益 全部信息的动态博弈,称“不完 全信息动态博弈”或“动态贝叶 斯博弈’。
在不完全信息动态博弈中,按照海萨尼转换, 博弈进行的先后顺序可以描述为: 首先,“自然” 选择参与人的类型,参与人 自己知道,其他参与人不知道; 其次,参与人开始行动,参与人的行动有先 有后,后行动者能观测到先行动者的行动, 但不能观测到先行动者的类型。
解:
(1)NE (A,L), (B,R). 具体 略 (2)无子博弈,因此为SPNE. (3)下面求PBNE. 按照PBNE的定义,需要满足条件: R1---R4. R1: 参与人1的信息集h1={x},显然信念 p1=1;参与人2的信息集h2={y1,y2}, 信念 p2=(p,1-p),其中0≤p≤1;
R2:给定参与人2的信念p2=(p,1-p),其中
0≤p≤1;参与人2选择L,M,R的期望收益 为: E2L=2*p+1*(1-p)=1+p E2M=1*p+0*(1-p)=p E2R=1*p+1*(1-p)=1 任意的0≤p≤1,都有E2M ≤ E2R ≤ E2L, 所以 参与人2的最优战略:s*2=L.