5不完全信息动态博弈

合集下载

第9章 不完全信息动态博弈

第9章 不完全信息动态博弈

第九章不完全信息动态博弈我们将介绍另一种新的均衡概念——完美贝叶斯均衡,就有了四个均衡概念:完全信息静态博弈中的纳什均衡、完全信息动态博弈中的子博弈完美纳什均衡、不完全信息静态博弈中的贝叶斯纳什均衡以及不完全信息动态博弈中的完美贝叶斯均衡。

表面上看好像对所研究的每一类型的博弈都发明出了一种新的均衡概念,但事实上这些概念是密切相关的。

随我们研究的博弈逐步复杂,我们对均衡概念也逐渐强化,从而可以排除复杂博弈中不合理或没有意义的均衡,而如果我们运用适用于简单博弈的均衡概念就无法区分。

在每一种情况下,较强的均衡概念只在应用于复杂的博弈时才不同于较弱的均衡概念,而对简单的博弈并没有区别。

引入完美贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡,这和子博弈完美纳什均衡强化了纳什均衡是相同的。

正如我们在完全信息动态博弈中加上了子博弈完美的条件,是因为纳什均衡无法包含威胁和承诺都应是可信的这一思想;我们在对非完全信息动态博弈的分析中将集中于完美贝叶斯均衡,是因为贝叶斯纳什均衡也存在同样的不足。

回顾前面讲过的,如果参与者的战略要成为一个子博弈完美纳什均衡,则它们不仅必须是整个博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。

如果参与者的战略要成为博弈的一个完美贝叶斯均衡,它们不仅必须是整个博弈的贝叶斯纳什均衡,而且还必须构成每一个后续博弈的贝叶斯纳什均衡。

完美贝叶斯均衡是对贝叶斯均衡的精炼,也是子博弈思想在不完全信息博弈中的推广,它本身是纳什均衡。

9.1 完美贝叶斯均衡定义为引进完美贝叶斯均衡概念,考虑如下完全但不完美信息动态博弈。

[例1]首先,参与者1在3个行动中进行选择——L、M及R,如果参与者1选择R,则博弈结束(不等参与者2行动);如果参与者1选择了L或M,则参与者2就会知道1没有选择R (但不清楚1是选择了L还是M),并在或L'或R'两个行动中进行选择,博弈随之结束。

第4章 不完全信息动态博弈

第4章 不完全信息动态博弈

精炼贝叶斯均衡
运用子博弈精炼均衡概念的逻辑,将从每一个 信息集开始的博弈的剩余部分称为一个“后续 博弈”(不同于子博弈,因为子博弈必须开始 于单结信息集,并且不能切割信息集), 一个“合理”的均衡要求,给定每一个参与人 有关其他参与人类型的后验信念,参与人的战 略组合在每一个后续博弈上构成贝叶斯均衡。 假定参与人(在所有可能的情况下)根据贝叶斯 法则修正先验信念,并且,每个参与人都假定 其他参与人选择的是均衡战略。
战略空间与支付函数
如果在位者是高成本,两个企业的成本函数相 同,对称库诺特均衡产量下的价格为p=5,每 个企业的利润是3,扣除进入成本2,进入者的 净利润是1; 如果在位者是低成本,两个企业的成本函数不 同,非对称库诺特均衡产量下的价格是p=4, 在位者的利润是5,进入者的利润是1,扣除进 入成本2,进入者的净利润是-1。
精炼贝叶斯均衡
精炼贝叶斯均衡是均衡战略和均衡信念的结 合 , 给 定 信 念 p = ( p1 , … , pn ) , 战 略 组 合
s*=(s*1, …, s*n)是最优的;给定战略s*=(s*1, …, ) s*=(s* s*n),信念p=(p1,…,pn)是使用贝叶斯法则从 均衡战略和所观测到的行动得到的பைடு நூலகம் 在精炼贝叶斯均衡中,后验概率依赖于均衡战 略,均衡战略依赖于后验概率,如果我们不知 道先行动者如何选择,我们就不可能知道后行 动者应该如何选择,必须使用前向法进行贝叶 斯修正。
不完全信息动态博弈 -市场进入阻挠
一个单阶段非最优价格会减少现期利润,但如 果它能阻止进入者进入,从而使在位者在第2 阶段得到垄断利润,而不是库诺特均衡利润, 如果垄断利润与库诺特均衡利润之间的差距足 够大,如果在位者有足够的耐心,选择一个单 阶段非最优价格可能是最优的。 在均衡情况下,在位者的价格选择不仅与其成 本函数有关,而且与进入者的后验概率有关; 不论先验概率µ为多少,单阶段最优垄断价格 不构成一个均衡。

不完全信息博弈

不完全信息博弈

(0.6)
不建厂
2,1
3 ,0
不完全信息静态下市场进入的博弈树
进入E 高建厂成本 [0.4] 建 (0,-1)
不进入D (2,0) E (2,1)
N○
[0.6]
1
低建厂成本
不建
建 不建
2
D
E
(3,0) (1,-1) (4,0) (1)
D E
D
(3,0)
不完全信息静态市场进入模型 --求解思路
不妨假设:
企业1的单位成本c1是共同信息,企业2的单位成本
c2 是其私人信息,它有高成本 c2H 和低成本 c2L两种情 形,设低成本的概率为p,它是双方的共同知识。
• 给定企业 2 知道企业 1 的成本时,企业 2 将最大化其利
润函数:
π2=q2(a-c2-q1-q2),
其中c2=c2H或c2L依赖于企业2的实际成本。 由此可得企业2的反应函数为: q2*(q1, c2)=(a-c2-q1)/2 它不但依赖于企业1的产量q1,而且依赖于自己的成本 c2。分别记q2L、q2H为企业2在低成本和高成本下的最 优反应产量,分别为:
不完全信息静态市场进入模型 --期望收益
• 在位者有两个信息集:高成本类型和低成本类型, 因而有4种纯策略;潜在进入者只有进入不进入两 种纯策略。 • 海萨尼转换后,支付矩阵变为: 潜在进入者 进入 不进入 0.6,-1 3.2,0 1.2,0.2 2.6,0 1.4,-0.2 3.6,0 2,1 3,0
图示——完全信息情形
q2
q1*(q2) 1/2 1/6 1/4 5/12
在完全信息情形下,满足以上条件时, 若企业2为低成本时,纳什均衡产量为 q1*=1/4,q2L*=1/2。 若企业2为高成本时,则企业1和2的纳 什均衡产量分别为5/12和1/6。 完全信息时的纳什均衡

第四章 不完全信息动态博弈

第四章 不完全信息动态博弈



~ (2) P 是先验概率 Pi ( i | i ) 的集合,即 P ,Pi Pi ( i | i ) , (P 1 ,, P n) ~ Pi 是第 i 个局中人在其进行行动选择的信息集上所有信念组成的组 ~ 为他在其第 个信息集上的信念;若局中人在信息集 上 合,记 P h h ih ~ ~ h 观察到的行动为 a h ,则记 P P ( | a ,, n 。 ih i i i ) ,i 1
博弈论
任课教师: 南京航空航天大学 经管学院
李帮义 教授
博弈论与信息经济学
——第四章 不完全信息动态博弈
1,信息传递:名牌效应;MBA学位 2,信息修正:黔之驴;约会 3,信息甄别:
目录
本章内容主要包括:
博弈时序与信息效应 不完全信息动态博弈 信号博弈 教育信号传递模型 KMWR声誉模型
博弈时序与信息效应
i
i
(i ), Si (i ) i ,i ) ,我们就可以类似于
i
i
i
i
i
i
i
i
i
i
不完全信息动态博弈
~ ~ 定义 在不完全信息动态博弈 G u1 ,, un , P 中,精炼贝 1 ,, P n , H1 ,, H n
* 叶斯纳什均衡是一个类型依赖的战略组合S ( ) (S1* (1 ),, Si* (i ),, Sn (n )) p 1, p 2 ,, p n ,它满足: 和一个后验概率组合 p * ( | )u ( S ( ), S ( ) , ) (1) S ( ) arg max P
( | ), i 1,, n , 当 i 是类型 i 时,其他 n 1个人是类型 i 的后验概率是 P i i i ( | )u (S ( ), S ( ) , ) 。另外,当 i 是类型 i 因此实际预期效用P i i i i i i i i i i

博弈论与信息经济学-4.不完全信息动态博弈

博弈论与信息经济学-4.不完全信息动态博弈

I11
L
p
M
I21
R
1-p
1 3
U
2 1
B
0 0
U
0 2
B
0 1
根据局中人2的推断可知,局中人2选 R 的期望支付为 1 p ,选 U
的期望支付为
p 2(1 p) 2 p

L R

A D
I31

U

B
A
D
4 4 4
1 1 1
5 5 0
2 2 2
3 3 0
均衡(L,B,A)并不是一个合理的均衡。因为如果博 弈进入参与人2的信息集,参与人2应该选择U而不 是B。 不可能用子博弈精炼纳什均衡的概念剔除(L,B,A), 但可以使用精炼贝叶斯均衡剔除这个不合理的均衡。
( A, L, L' ) r1( A, L, L' ) r2 ( A, L, L' ) r3 ( A, L, L' )
r3 ( A, L, L' ) {L' , R'}

( A, L, L' ) 为纳什均衡。
{( A, L, L' ), p 0} 对于要求1与3的满足是显然的,现考虑要求2

给定局中人的推断,局中人的策略必须满足序贯理性的要求。即在每一信息
集中,应该行动的局中人(以及局中人随后的策略),对于给定的该局中人 的推断,以及其余局中人随后的策略(其中“随后的策略”是在达到给定的 信息集之后,包括了其后可能发生的每种情况的完全的行动计划)必须是最 优反应。

不完全信息博弈

不完全信息博弈

不完全信息博弈不完全信息博弈(Incomplete information game / Imperfect information game),也称贝叶斯博弈(Bayesian game)[编辑]什么是不完全信息博弈不完全信息博弈是指对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。

博弈参与者对于对手的收益函数没有完全信息(incomplete information)。

在约翰·海萨尼的研究框架下,我们可以将自然(Nature)作为一个参与者引入到贝叶斯博弈中。

自然将一个随机变量赋予每个参与者。

这个随机变量决定了该参与者的类型(type),并且决定了各个类型出现的概率、或是概率密度函数。

在博弈进行过程中,根据每个参与者的类型空间所赋的概率分布,自然替每个参与者随机地选取一种类型。

海萨尼的这一方法将贝叶斯博弈从不完全信息转化为不完美信息(此时,有的参与者不知道该博弈的历史)。

参与者的类型决定了该参与者的收益函数。

在贝叶斯博弈中,不完全信息所指的是,至少存在一个参与者,他(她)不能确定其他某个参与者的类型,从而也不能确定其收益函数。

[编辑]不完全信息博弈动态、静态分析∙不完全信息动态博弈:精炼贝叶斯均衡精炼贝叶斯(纳什)均衡是不完全信息动态博弈的均衡概念。

在市场进入博弈中,精炼贝叶斯均衡是:在位企业产品定价较高,潜在企业推断其为高成本,选择进入;在位企业产品定价较低,潜在企业推断其为低成本,选择不进入。

∙不完全信息静态博弈:贝叶斯均衡贝叶斯均衡通常被描述为:在给定自己的类型和对手类型的概率分布的情况下,每个参与者的期望效用达到了最大化从而没有参与者愿意改变自己的行为或策略。

在下图的博弈中假定在位企业属于高成本类型的企业的概率大于0.2,潜在企业选择进入才是最优的。

博弈论基础(不完全信息博弈)



不完全信息动态博弈 3、举例:市场进入博弈 举例:
炸鸡翅的价格: 炸鸡翅的价格: 1元、3元、5元 元 元 元





不完全信息动态博弈
(1)进入者是否进入取决于对在位者类型的判断 ) (2)进入者将依据在位者的价格选择而修正对在位者类型的判 ) 断 (3)在位者需要考虑价格选择的信息效应,所以,在位者选择 )在位者需要考虑价格选择的信息效应,所以, 什么价格不仅与自身的成本函数有关, 什么价格不仅与自身的成本函数有关,而且与进入者的先 验概率及条件概率有关。 验概率及条件概率有关。 (4)若高成本的先验概率小于 ,则出现混同均衡:在位者不 )若高成本的先验概率小于1/5,则出现混同均衡: 论成本高低,都选择中等价格,进入者只有在观测到高价 论成本高低,都选择中等价格, 格时才选择进入 (5)若高成本的先验概率大于 ,则出现分离均衡:在位者在 )若高成本的先验概率大于1/5,则出现分离均衡: 低成本时,选择低价格,在高成本时,选择高价格, 低成本时,选择低价格,在高成本时,选择高价格,进入 者观测到低价格时选择不进入, 者观测到低价格时选择不进入,观测到中价格或高价格时 才选择进入。( 。(低成本在位者通过低价格显示自己是低成 才选择进入。(低成本在位者通过低价格显示自己是低成 此乃“认证费” 本,此乃“认证费”)
Prob(GT)=P(GT/GP)P(GP)+P(GT/BP)P(BP) ( ) ( ) ( ) ( ) ( )
(4)一个人做了好事是好人的概率
Prob(GP/GT)=P(GT/GP)P(GP)/ Prob(GT) ( ) ( ) ( ) ( )





不完全信息动态博弈

动态博弈的名词解释

动态博弈的名词解释动态博弈是一种经济学概念,用于描述决策参与者在不完全信息下采取策略并互相影响彼此行为的情况。

在一个动态博弈中,每个参与者的决策不仅会受到其他参与者当前的策略选择的影响,还会受到过去和未来的行动的影响。

这使得动态博弈比传统的静态博弈更加复杂和有趣。

在动态博弈中,参与者的决策是基于他们对其他参与者行为的预期,并且这些预期可能会随着博弈的进行而改变。

因此,动态博弈往往需要考虑时间的因素,以便能够洞察参与者在不同时间点上采取不同策略的动机。

这也与静态博弈的最优策略不同,因为动态博弈的最优策略通常是反应了参与者对未来选择的预期。

在动态博弈中,一个重要的概念是博弈的时间结构。

时间结构规定了参与者决策的先后顺序和博弈的重复次数。

博弈可以是一次性的,参与者只进行一轮决策,或者可以是重复的,参与者会在一段时间内进行多轮的决策。

重复的动态博弈往往会引发更丰富的策略性和合作行为,因为参与者的选择会影响未来回合的收益。

动态博弈中的一个经典案例是囚徒困境。

在这个博弈中,两名囚犯被独立审讯,他们可以选择合作或背叛对方。

如果两人都合作,他们会得到较轻的牢狱时间。

但如果其中一人选择背叛,而另一人选择合作,背叛者将获得自由而合作者将面临更严重的牢狱时间。

如果两人都选择背叛,那么他们将面临中等程度的处罚。

囚徒困境展示了在缺乏合作的情况下,个体追求自身利益可能导致无法最大化总体利益的结果。

在动态博弈中,一个重要的概念是策略的可观测性。

可观测性指的是参与者对其他参与者行为的观察程度。

如果参与者能够准确观察到其他参与者的策略选择,他们可以更有效地做出决策。

而如果参与者只能观察到有限信息,他们则需要通过推断和预测其他参与者的策略。

信息的不完全性会增加博弈的复杂性,因为参与者需要根据有限的信息做出决策。

动态博弈在许多领域都有应用,特别是在经济学和管理学中。

在经济学中,动态博弈常被用于研究市场竞争、公司战略和博弈理论。

在管理学中,动态博弈可以帮助解决企业战略决策和资源分配的问题。

第六章(完全但不完美信息动态博弈)


在该均衡策略组合下,博弈方2 的两节点信息集 是不在均衡路径上的信息集。 要求4要求博弈方 2此时在这个信息集的 “判断” 也要满足贝叶斯法则和双方的均衡策略。同要求 3, 贝叶斯法则仍然自动满足,因此我们只需要讨论博弈 方 2 的 “判断”与双方在此处可能有的均衡策略的 一 致性。 显然,到达这个信息集表明博弈方1 在第一阶段 偏离了上述均衡策略 R,按照前面的分析,博弈方2 一定会 “判断”博弈方1必然选择L策略(从得益分 布 情况可知)。
(2,1) (0,0) (1,-1) (-1,0)
图6-1 二手车交易扩展式表示
起始节点表示第一阶段卖方 (即博弈方1)对 如何使用汽车的选择,共有“好”和“差”两种可 能的 选择。 第二阶段卖方若选择 “不卖”,交易没有发生; 如果他选择“卖”,则进行到买方选择的第三阶段, 此时买方并不知道卖方的选择究竟是“好—卖”还 是 “差—卖”,用多节点信息集表示这种不完美性。 第三阶段买方不能直接作出针对性的选择,他 必须对这个多节点信息集中各节点出现的可能性做 出判断。
即对博弈方2来说,“判断” 是直接针对博弈方 1 的上期选择的,因此不存在条件概率问题,贝叶斯法 则自动满足。 再看博弈方2判断 判断是否符合各方的均衡策略,即 判断 看“判断” 是否符合博弈方1第一阶段的选择和博弈 方 2自己本阶段的选择。 由于博弈方1的均衡策略是在第一阶段选择L,因 此博弈方2只有判断 “博弈方1选择L的概率p=1” 才 与 博弈方1的策略相符合,而且这种判断也与博弈方2自 己在本阶段的选择U相符合,因此该 “判断”正是博 弈
1 ⋅ p + 0 ⋅ (1 − p ) = p
而选D的期望得益为:
0 ⋅ p + 1(1 − p) = 1 − p

博弈论四种博弈类型

华为在阿根廷电信设备市场上的竞争博弈华为技术有限公司是一家总部位于中国广东省深圳市的生产销售电信设备的员工持股的民营科技公司,经过数十年的发展,成为全球最大的电信网络解决方案提供商,全球第二大电信基站设备供应商,同时也是全球第六大手机厂商,其海外市场的利润占到其总利润的75%。

在华为进入阿根廷电信设备市场之前,阿根廷的电信设备市场由爱立信、阿尔卡特-朗讯以及阿根廷本土设备供应商三家共同分享市场份额,接下来,我们将分析其不同条件下的博弈结果:1、完全信息情况下的静态博弈A 、纳什均衡:我们将上述三家公司统称为原有垄断者,华为称为虎视眈眈的潜在进入者,原有垄断者想要保住自己现有的垄断地位,就会想要阻止潜在进入者进入,在这个博弈中,原有垄断者有两种选择:一是进行斗争,打价格战;二是不斗争,默许其进入从而共同竞争,具体的支付矩阵结果表示如下:原有垄断者潜在进入者 进入 不进入根据纳什均衡的定义:各个参与者所做的是在给定其他参与者的策略是所能够做出的最好的一组策略。

当潜在进入者选择进入时,原有垄断者的最优选择是不斗争,获得70单位的利润;同样的,原有垄断者选择不斗争的情况下,潜在进入者的最优选择是进入,获得20单位的利润,从而获得一个要求纳什均衡的均衡(进入,不斗争),同理可以得出另一个纳什均衡(不进入,斗争)。

B 、占优策略:现假设华为公司已经获得了阿根廷电信集团的经营许可证,在严格管制情况下二者都不能以低于成本的价格进行价格战,同时禁止出现单一寡头垄断的情形,(各自均有正的利润)在这两种情况下考虑两者是否进行价格战的情况,具体支付矩阵如下所示:原有垄断者 低价 高价潜在进入者低价 高价对于潜在进入者而言,不论原有垄断者是否进行价格战,潜在进入者的占优策略都是进行价格战,因为在原有垄断者定低价时,潜在进入者定低价可以获得额外的20单位利润,在原有垄断者定高价时,潜在进入者定低价可以获得额外的10单位利润,从而确定华为必将进行价格战,在完全信息情况下,原有垄断者会将自己置于潜在进入者的位置进行决策,从而决定自己也要进行价格战,否则会失去更多的利润。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基本思路基本思路-不完全信息动态博弈
一个非单阶段最优价格会减少现期利润,但如果它能阻止进入者进入 ,从而使在位者在第二阶段得到的是垄断利润而不是古诺均衡利润, 如果垄断利润与古诺均衡利润的差距足够大,如果在位者有足够的信 心选择一个非单阶段最优价格可能是最优的。(第一阶段损失,但第 二阶段保持垄断) 如果在位者有足够的耐心,选择一个非单阶段最优价格可能是最优的 。
LOGO
博弈论 The Game Theory
宾 宁 bn_gdut@
1
第五章 不完全信息动态博弈
一 精炼贝叶斯纳什均衡 基本思路 贝叶斯法则 完美贝叶斯纳什均衡
二 信号传递博弈
成语故事
黔驴技穷-驴虎博弈
毛驴刚到贵州时,老虎见它是个庞然大物,不知有多大本事 ,感到很“神奇”。给定这个“信念”,老虎躲在树林偷偷 地瞧毛驴就是一种最优选择。过了一阵子,老虎走出树林, 逐渐接近毛驴,想获得有关这个庞然大物的真实本领的信息 。有一天,毛驴突然大叫一声,老虎吓了一跳,急忙逃走, 这也是最优选择,因为毛驴的叫声是老虎意料之外的。又过 了一些天,老虎又来观看,发现毛驴并没有什么特别的本领 ,对毛驴的叫声也习以为常了,但老虎仍不敢下手,因为它 对毛驴的真实本领还没有完全了解。再后来,老虎对毛驴挨 得更近,往毛驴身上挤碰,故意冒犯它。毛驴在忍无可忍的 情况下,就用蹄子去踢老虎。这一踢向老虎传递的信息是“ 毛驴不过这点本事而已”,所以老虎反倒高兴了。到这时, 老虎对毛驴已有了完全的了解,所以就扑过去把它吃了。
P=4 进入者 不进入 进入
P=5
P=6
不进入 不进入 进入 不进入 进入 不进入 进入 进入
不进入
进入
(2,0)
(2,0)
(6,0)
(6,0)
(7,0)
(7,0)
(6,0)
(6,0)
(9,0)
(9,0) (8,0)
(8,0)
第一阶段 第二阶段
(3,1) (7,0) (3,1) (7,0) (3,1) (7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
价格 在位者高成本时的利润 在位者低成本时的利润 P=4 2 6 P=5 6 9 P=6 7 8
比如说,无论在何 种情况下 1. 低成本的在位者不会选择P=6 因为不希望进入者认为自己是高成本 2. 高成本的在位者也可能不会选择P=6 P=6 预测到选择P=6会招致进入者进入,尽管p=6是单阶段的最优垄断价 P=6 p=6 格。 3. 进入者观测到在位者选择了P=6,进入 可以推断在位者一定是高成本,选择进入是有利可图 4. 在位者必须考虑价格选择的信息效应: 不同的价格如何影响进入者的 后验概率从而影响进入者的进入决策。
第五章 不完全信息动态博弈
一 完美(精炼)贝叶斯纳什均衡
基本思路 贝叶斯法则 精炼贝叶斯纳什均衡
二 信号传递博弈
在日常生活中,当面临不确定时,我们对某事件发生的可 能性有一个判断,然后,会根据新的信息来修正这个判断 。 统计学上,修正之前的判断称为“先验概率” 修正后的判断称为“后验概率” 贝叶斯法则就是人们根据新的信息从先验概率得到后验概 贝叶斯法则 率的基本方法。
Pr ob{GP GT } ≡ p (GT GP) p (GP) Pr ob{GT }
Pr ob{GP GT } ≡
p(GT GP) p(GP) Pr ob{GT }
假定我们认为这个人是好人的先验概率是1/2,那么观测到他干了好 事之后,如何修正他是好人的先验概率依赖于他干的好事好到什么程度: 1、这是一件非常好的好事,坏人绝对不可能干,即p(GT|GP)=1, p(GT|BP)=0
市场进入博弈-2阶段不完全信息动态博弈
基本思路基本思路-不完全信息动态博弈
T=2, 企业的行动选择是一个简单的静态博弈决策问题,但在第一阶 段,情况要复杂得多: 进入者是否进入依赖于它对在位者成本函数的判断:给定在位者是 高成本时,进入者进入的净利润是1,低成本时进入者的利润是-1, 当只当进入者认为在位者是高成本的概率大于1/2时,进入者才选择 进入。 但与静态博弈不同的是,在观测到在位者第一阶段的价格选择后, 进入者可以修正对在位者成本函数的先验概率x,因为在位者的价格 可能包含其成本函数的信息。
Pr ob{GP GT } ≡
1× 1 / 2 2 = 1× 1 / 2 + 1 / 2 × 1 / 2 3
Pr ob{GP BT } ≡
p (GT GP ) p(GP) Pr ob{BT }
假定我们观测到他干了一件坏事,我们将如何改变对他的看法呢, 如果我们相信,好人绝对不会干坏事, 即p(BT|GP)=0,那么可以肯定他 绝对不是一个好人。
进入者只有一种类型:进入成本为2,如果进入,生产成本 函数与高成本在位者的成本函数相同。 T=2,如果进入者已进入,在位者成本函数为共同知识,若在位 者为高成本,两个企业成本函数相同,对称库诺特均衡产量下的 价格为p=5,每个企业利润为3,扣除进入成本2,进入者净利润 为1。若在位者为低成本,两个企业成本函数不同,非对称库诺特 均衡产量下的价格是p=4,在位者利润是5,进入者利润为1,扣除 进入成本2,进入者净利润为-1。 价格 在位者高成本时的利润 在位者低成本时的利润 p=4 2 6 p=5 6 9 p=6 7 8
Pr ob{GP GT } ≡ 1× 1 / 2 =1 1× 1 / 2 + 0 × 1 / 2
2、这是一件非常一般的好事,好人会干,坏人也会干,即p(GT|GP)=1 p(GT|BP)=1
Pr ob{GP GT } ≡
1× 1 / 2 1 = 1× 1 / 2 + 1× 1 / 2 2
3、介于上述两种情况之间:这件事好人肯定会干,但坏人可能干也可 能不干:p(GT|GP)=1 , p(GT|BP)=1/2
基本思路基本思路-不完全信息动态博弈
完全信息动态博弈中引入了子博弈完美纳什均衡的概念剔除那 些不可置信的威胁,在不完全信息动态博弈中,可以借用这一方 法逻辑。 将每个信息集开始的博弈的剩余部分称为一个“后续博弈”, 一个“合理”的均衡应该满足如下要求:给定每一个参与人有关 其他参与人类型的后验信念,参与人的战略组合在每一个后续博 弈上构成贝叶斯均衡。 剔除这种不可信行为的方式是:假定参与人(在所有可能情况 下)根据贝叶斯规则修正先验概念,并且,每个参与人都假定其 他参与人选择的是均衡战略。
基本思路基本思路-不完全信息动态博弈 精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼均衡和贝叶斯 推断的结合。它要求: 1、在每个信息集上,决策者必须有一个定义在属于该信 息集的所有决策结上的一个概率分布(信念); 2、给定该信息集上的概率分布和其他参与人的后续战略 ,参与人的行动必须是最优的; 3、每一个参与人根据贝叶斯法则和均衡战略修正后验概 率。
基本思路基本思路-不完全信息动态博弈
在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡概念没有规 定参与人如何修正自己的信念。但是,如果进入者可以任意修订自己 有关在位者成本函数的信念,上述不完全信息动态博弈可以有任意均 衡。 如假定x<1/2,下列战略组合是一个贝叶斯均衡:不论在位者选择什 么价格,进入者总认为在位者是高成本的概率为x*<1/2,总是选择不 进入;高成本在位者选择p=6,低成本在位者选择p=5。 但显然这个均衡是不合理的,因为它包含了一个不可置信威胁:进入 者不会修正对在位者成本函数的信念。 给定p=6不可能是低成本在位者的最优选择,如果在位者选择了p=6, 进入者为什么仍然认为在位者是高成本的概率小于1/2呢?
Pr ob{GP BT } ≡ 0 ×1 / 2 =0 0 ×1 / 2 + p ×1 / 2
这里p>0为坏人干这件坏事的概率。或者说,他肯定是一个坏人:
Pr ob{BP BT } ≡ p × 1/ 2 =1 0 ×1/ 2 + p × 1/ 2
在位者 进入者 进入者进入 1 在位者高成本时,均衡p=5 在位者高成本时,均衡 =5 3
在位者低成本时,均衡 =4 在位者低成本时,均衡p=4 5
-1
进入者只有一种类型: 进入成本为2,如果进入,生 产成本函数与在位者高成本函 数相同。
N 高 [x] 低 [1-x]
在位者 P=4
T=2,如果进入者已进入,在 位者成本函数为共同知识,若 在位者为高成本,p=5时,每 个企业利润为3,扣除进入成 本2,进入者利润为1。若在位 者为低成本,p=4,在位者利润 是5,进入者利润为1,扣除进 入成本2,其利润为-1。 在位者 P=5 P=6
Pr ob{θ k a h } ≡ p (a h θ k ) p (θ k ) Pr ob{a }
h

p(a h θ k ) p(θ k ) p (a h θ j ) p (θ j ) ∑
j =1 k
贝叶斯法则举例
人:好人(GP),坏人(BP) 事:好事(GT),坏事(BP) 一个人干好事的概率等于他是好人的概率p(GP)乘以好人干 好事的概率p(GT|GP),加上他是坏人的概率p(BP)乘以坏人 干好事的概率p(GT|BP): Prob{GT}= p(GT|GP)* p(GP)+ p(GT|BP)* p(BP) 假定观测到一个人干了一件好事,那么这个人是好人的后验 概率是:
市场进入博弈例子
参与人:在位者,进入者; 假定有两个时期,在T=1,市场上只有一个垄断企业—在位者, 一个潜在进入者考虑是否进入;如果进入者进入,两个企业进行 古诺特博弈;否则,在位者获得垄断利润。 类型:在位者有两种类型,高成本或低成本,进入者在博弈开始 时只知道在位者高成本的概率是x,低成本概率是1-x 。称为先验 信念。 对于在位者:要决定该时期的价格p,假定只有如下三种可能 价格 在位者高成本时的利润 在位者低成本时的利润 p=4 2 6 p=5 6 9 p=6 7 8
相关文档
最新文档