子博弈精炼纳什均衡+贝叶斯法则+信号博弈
四种纳什均衡的联系和区别

四种纳什均衡的联系和区别联系:纳什均衡、子博弈完美纳什均衡、贝叶斯纳什均衡、完美贝叶斯纳什均衡之间是密切相关的,他们都描述了在博弈中,所有参与者的战略组合,每个参与者的战略都是针对其他参与者的最优反应,在这种战略组合下没有参与者愿意背弃他选定的战略。
因此四种博弈都是纳什均衡,只不过在应用于更复杂的博弈时,我们引入更严格的限制条件来强化原来的均衡概念,每一个新的均衡概念的相继引入正是为了剔除依据原有概念可能得出的不合理的博弈结果,四种均衡概念的关系可以用下面的图表示:区别:1、四种均衡概念所适用的博弈类型不同:即完全信息静态博弈对应纳什均衡,完全信息动态博弈对应子博弈完美纳什均衡,不完全信息静态博弈对应贝叶斯纳什均衡,不完全信息动态博弈对应完美贝叶斯纳什均衡。
同时,适用于复杂博弈的纳什均衡适用于简单博弈,但适用于简单博弈的纳什均衡未必适用于复杂博弈。
2、四种均衡对应的策略选择不同,这与不同博弈中策略的不同定义相关:在完全信息静态博弈中,参与者的战略与其行动一致;在完全信息动态博弈中,后行动者的均衡战略是对应于先行动者的各种战略的最优反应,因此这种情况下后行动者的战略和行动概念就不一样了;在不完全信息静态博弈中,由于参与者不能完全了解对方的效用函数,因此引入了type的概念,相应的均衡策略要求对于每一可能出现的type,均需要给出相应的最优行动,即最优行动为type的函数;在不完全信息动态博弈中,引入了belief的概念,因此最终的纳什均衡不仅包括参与者的战略,还包括了参与者对信息集节点的belief。
3、四种博弈的限制条件不同,复杂博弈的限制条件更强在完全信息动态博弈,原来定义的纳什均衡未必合理,因为可能某些纳什均衡存在不可信的威胁或者承诺,所以在定义了子博弈完美纳什均衡后,将包含不可信威胁的纳什均衡给排除了;在不完全信息静态博弈中,由于我们引入了type的概念,因此为了得到针对其他参与者战略的最优反应,参与者的战略必须对应于自己的所有type;而在不完全信息动态博弈中,又强化了完全信息动态博弈子博弈的概念,将开始于单节信息集的子博弈扩展与可以开始于任何完全信息集,进而引入了belief的概念,不仅要求最优战略从给定的belief得出,belief也要符合贝叶斯规则,因此完美贝叶斯纳什均衡是限制条件最强的纳什均衡。
子博弈完美纳什均衡

子博弈完美纳什均衡
“子博弈精炼纳什均衡”的创立者是1994年诺贝尔经济学奖获奖者、莱茵哈德·泽尔腾。
泽尔腾则在60年代中期将纳什均衡概念引入动态分析。
在1965年发表《需求减少条件下寡头垄断模型的对策论描述》一文,提出了“子博弈精炼纳什均衡”的概念,又称“子对策完美纳什均衡”。
这一研究对纳什均衡进行了第一次改进,选择了更具说服力的均衡点。
海萨尼在60年代末把不完全信息引入博弈分析。
子博弈精炼纳什均衡用于区分动态博弈中的"合理纳什均衡"与"不合理纳什均衡",将纳什均衡中包含有不可置信威胁策略的均衡剔除出去,就是说,使最后的均衡中不再包含有不可置信威胁策略的存在。
第三章信息经济学的研究方法—博弈论

第一节 概述-人生处处皆博弈
人生是永不停歇的博弈过程,博弈意 略达到合意的结果。
作为博弈者,最佳策略是最大限度地 利用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社 会整体福利增加。
一、博弈论的定义
博弈论(game theory,又译为对策论,游戏论)
定义:研究决策主体的行为在直接相互作用时,人们如 何进行决策、以及这种决策如何达到均衡。
五、博弈论与信息经济学
博弈论是给定信息结构求均衡结果,它实际上是一种均衡理论, 我们最终要找的是一个均衡的结果,博弈论是方法论导向的, 它实际上是一种解决问题的方法。它是一个实证的方法。
信息经济学是给定信息结构求契约的安排。它实际上是一种契 约设计理论,它是问题导向的。它是一个规范的方法。
石匠的决策与拳击手的决策的区别
一、博弈论的定义
2、理性人假设 理性人是指一个很好定义的偏好,在面临给定的约束条件下
最大化自己的偏好。
博弈论说起来有些绕嘴,但理解起来很好理解,那就是 每个对弈者在决定采取哪种行动时,不但要根据自身的利益 和目的行事,而且要考虑到他的决策行为对其他人可能的影 响,通过选择最佳行动计划,来寻求收益或效用的最大化。
(一)囚徒困境
假定: (1)每个局中人都知道博弈规则和博弈结果的支付
矩阵; (2)每个局中人都是理性的(个人理性和个人最优
决策); (3)不能“串通”
(一)囚徒困境——纳什均衡
囚徒A
坦白
坦白 囚徒 B
-8,-8
抵赖 -10,0
抵赖 0,-10 -1,-1
-8大于-10 0大于-1
(坦白,坦白)是纳什均衡
第三章 信息经济学的研究方法 ——博弈论
博弈论术语

博弈论术语1. 占优策略占优策略就像是考试时那种不管别人怎么选,自己肯定是最优的选择。
比如说,在一场考试中,有一道选择题,A选项明显比其他选项都正确,不管其他同学怎么蒙,我选A就是最靠谱的,这就是我的占优策略。
2. 纳什均衡这纳什均衡啊,就好比一群人在跳舞。
我向左迈一步,你也会相应地调整你的步伐,最后大家达成一种平衡的状态。
像在市场竞争里,两家公司都在调整价格,当双方都觉得再调整也不会得到更多好处的时候,就达到了纳什均衡。
3. 囚徒困境哎囚徒困境可太折磨人了!就像两个小偷被抓了,分开审讯。
他们都可以选择坦白或者不坦白。
如果都不坦白呢,可能就判得很轻,但他们互相猜忌啊。
其中一个想:“要是他坦白了,我不坦白就惨了。
”于是都坦白了,结果都判得很重。
这就像我们在合作项目中,有时候因为不信任对方,结果都做出了对大家都不利的选择。
4. 混合策略混合策略有点像做菜的时候放盐。
有时候多放点,有时候少放点,没有一个固定的量。
在玩猜拳游戏的时候,我不能老是出剪刀,我得随机出拳,这就是混合策略。
我出剪刀、石头、布的概率不一样,这样对手就很难猜到我要出什么。
5. 零和博弈零和博弈就像抢一块蛋糕,我多吃一口,你就少吃一口。
我们之间的利益总和是零。
比如说在一场赌博中,我赢的钱就是你输的钱,没有双赢的可能,这真让人觉得有点残酷呢。
6. 正和博弈正和博弈就完全不一样啦,它就像大家一起做蛋糕,然后再分蛋糕。
我们合作,把蛋糕做得越来越大,每个人分到的都比以前多。
就像一个创业团队,大家齐心协力,最后赚得盆满钵满,这多让人高兴啊。
7. 负和博弈负和博弈就很惨啦。
就像两个人打架,都受伤了,不仅没得到什么好处,还都有损失。
比如说两个国家打仗,消耗了大量的人力物力,最后两败俱伤,这真是一种愚蠢的行为啊。
8. 策略空间策略空间就像是我的魔法口袋,里面装着各种各样我能采取的行动。
在一场棋局里,我的策略空间就是我可以走的每一步棋,每一种走法都是这个空间里的一个元素,这就看我怎么选择来应对对手啦。
智慧树知到《博弈策略与完美思维》章节测试答案

智慧树知到《博弈策略与完美思维》章节测试答案第一章1、博弈论中,参与人从一个博弈中得到的结果常被称为()。
A:效果B:支付C:决策D:利润正确答案:支付2、根据博弈的参与人之间是否达成具有约束力的契约来分,博弈可分为()。
A:静态博弈和动态博弈B:合作博弈和非合作博弈C:完全信息博弈和不完全信息博弈D:完全信息静态博弈和完全信息动态博弈正确答案:合作博弈和非合作博弈3、和威廉·维克瑞共同分享1996年诺贝尔经济学奖的是()。
A:泽尔腾B:谢林C:詹姆斯·莫里斯D:保罗·萨缪尔森正确答案:詹姆斯·莫里斯4、每一个参与者对所有其他参与人的特征、策略空间和支付函数有准确的认识,这样的博弈为()。
A:动态博弈B:合作博弈C:常和博弈D:完全信息博弈正确答案:完全信息博弈5、博弈的关键要素包括()。
A:战略B:参与人C:信息D:支付正确答案:战略,参与人,信息,支付第二章1、在具有占优战略均衡的囚徒困境博弈中()。
A:只有一个囚徒会坦白B:两个囚徒都没有坦白C:两个囚徒都会坦白D:任何坦白都被法庭否决了正确答案:两个囚徒都会坦白2、严格劣战略是指参与人的某一个战略()。
A:相对于本人其他所有战略,得分都是较低的B:相对于本人某个战略,得分是较低的C:相对于对手所有战略,得分都是较低的D:相对于对手某个战略,得分都是较低的正确答案:相对于本人某个战略,得分是较低的3、下列关于古诺模型的假设,说法正确的是()。
A:某产品市场上仅有两家企业,高进入壁垒阻止了其他企业进入B:两家企业生产不同价格的产品C:总成本等于0D:两家企业同时进入市场,就价格制定进行博弈正确答案:某产品市场上仅有两家企业,高进入壁垒阻止了其他企业进入4、下列说法正确的是()。
A:纳什均衡一定是占优策略均衡B:占优策略均衡一定是纳什均衡C:每个有限博弈都没有混合战略纳什均衡D:每个有限博弈都有混合战略纳什均衡正确答案:占优策略均衡一定是纳什均衡5、一个博弈如果有多个纳什均衡,我们一般如何来实现某个具体的纳什均衡?A:帕累托上策均衡B:风险上策均衡C:聚点均衡D:相关均衡正确答案:帕累托上策均衡,风险上策均衡,聚点均衡,相关均衡第三章1、下列描述哪个是正确的 ( )。
完整版)博弈论知识点总结

完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。
该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。
博弈中涉及到的变量包括:参与人、行动、战略和信息。
完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。
不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。
博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。
博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。
与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。
扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。
战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。
博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。
根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。
根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。
根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。
不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。
Hotelling价格竞争模型是一种重要的扩展式博弈,用于描述两个企业在同一市场上的价格竞争。
相对应。
占有均衡是指在博弈中存在一组参与人的战略选择,使得每个参与人都无法通过改变自己的战略来提高自己的支付。
博弈论第四章

4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。
参与人2 不知道t,但知道t的概率分布。
博弈的时序:(1)参与人1选择行动a1∈A1;(2)参与人2观察a1,选择a2∈A2博弈的收益:u1(a1, a2, t), u2(a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人 2L'R'L2,10,0参与人 1 M0, 20,1R1, 31, 3纯战略纳什均衡: (L,L'), (R,R')均为子博弈精炼纳什均衡(无子博弈)。
但是(R, R')不可信。
排除不可信的纳什均衡:要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义: 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下,博弈以正的概率到达该集.要求3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。
例要求3的说明参与人1的类型空间:{ t1,t2,t3,t4 }行动空间:A= { L,R}推断p i: 观察到L后,参与人1的类型是t i的概率。
推断q i: 观察到R后,参与人1的类型是t i的概率。
p1 + p2 + p3 + p4 = 1q1 + q2 + q3 + q4= 1N如果参与人1的战略: t 1选 L ,t 2选 L , t 3选R ,t 4 选R 。
参与人2对p i 与 q i 的推断:p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,例 3个参与人的博弈。
精炼贝叶斯均衡

子博弈精炼纳什均衡.但是,精炼纳什均衡(L,B)显然依赖于一个
不可置信的威胁:如果博弈进入参与人2的信息集,U严格优于B,选
择B不是序贯理性的;顺此,参与人1不应该相信参与人2会选择 B.尽
管子博弈精炼均衡不能剔除(L,B),我们可以使用精炼贝叶斯均衡
剔除(L,B)
博弈论与信息经济学 江西财经大学 陶长琪
精炼贝叶斯均衡要求,给定有关其他参与人的类型的信念,参与人的战 略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡;并且,在所 有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人的类型的 信念.
N
让我们再一次考虑市场进入的例子: 高 [u]
在位者
低 [1-u]
P=4
进入者
P=5
进入
不进入 进入
则要求Pr ob{ah} 0,即参与人i必须以正的概率选择 a h ,否则,后验概率没
有定义.如果 Pr ob{a h} 0 ,我们允许Pr ob{ah} 0 在[0,1]区间取任 何值,只要所取的值与均衡战略相容.在动态博弈中,Pr ob{ k | ah} 对应的是
非均衡中径上的信息集
(7,0)
(5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
博弈论与信息经济学 江西财经大学图4.陶1长市琪场进入博弈
4.1-1 基本思路
注意:进入者第一阶段的利润恒为0.我们省略了第二阶段博弈的扩展式,代 之以库诺特均衡支付向量和垄断利润.这样做的理由是,在博弈进入第二阶段后, 如果进入者已经进入,库诺特均衡产量(和对应的价格)是每个企业的最优选择;
赵乐如欢果制进作入者历没经有1进0入天,终单于阶段于垄2断0产05量.1(.1和1价日格凌)是晨在基位本者的完最成优,选非择。常感谢 刘艳精艳炼同贝学叶斯第均四衡章(p及er第fec六t B章ay,es第ian七eq章ui的libr文ium档)!是贝叶斯均衡、子博弈精炼
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一:子博弈精炼纳什均衡在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。
子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。
即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。
子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。
为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。
譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a 子博弈和图3.6b子博弈。
在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。
这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。
而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。
这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。
定义3.1:子博弈精炼纳什均衡(SPNE):扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。
如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足:在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
这也意味着原博弈的Nash均衡并不一定是子博弈精炼Nash均衡,除非它还对所有子博弈构成Nash均衡。
例如前文的煤电博弈,(提价,接受)和(不提价,接受)均为纳什均衡,但后者并未满足在整个动态博弈及它的所有子博弈中都构成纳什均衡这一要件,因而理性的煤炭企业一定会选择提价。
博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。
对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。
博弈论专家常常使用“序贯理性”(Sequential rationality):指不论过去发生了什么,参与人应该在博弈的每个时点上最优化自己的策略。
子博弈精炼纳什均衡所要求的正是参与人应该是序惯理性的。
对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。
因为有限完美信息博弈的每一个决策结都开始一个子博弈。
求解方法:最后一个结点上的子博弈(纳什均衡)→倒数第二个(纳什均衡)→ ······ → 初始结点上的子博弈(纳什均衡)。
上图摘自张维迎的《博弈论与信息经济学》(P 7)在此图中,我们可以看出博弈论大概分为四类,每种类别都有固定的纳什均衡。
这道题中所问的“如何分辨子博弈”,是求解子博弈精炼纳什均衡的基础。
而“贝叶斯法则”是求解精炼贝叶斯均衡的基础。
所以,如果扩展一下是属于如何求解完全信息动态博弈的子博弈精炼纳什均衡,以及如何求解不完全信息动态博弈的精炼贝叶斯纳什均衡。
在下面分开讨论。
一、完全信息动态的子博弈精炼纳什均衡完全信息动态一般用扩展式表述。
子博弈精炼纳什均衡要求(1)它在原博弈上是纳什均衡(2)它在每一个子博弈上都是纳什均衡。
所以,如何分辨一个扩展式有几个子博弈,关键在于看一个扩展式表述的博弈中有几个单节信息集。
同时,子博弈不能切割原博弈的信息集。
通过下面几个图来解释:图 1在此博弈中,有三个参与者,分别是A、N(自然)、B。
共有七个决策点,A有一个。
N有两个,B有四个。
这七个决策点分割成七个信息集,每个信息集都只包括一个决策点。
(表示,所有参与者在参与时准确知道自己处于哪个决策结。
)子博弈由每个决策结及其后续结构成,所以在图一中,共有七个子博弈。
(注意:任何博弈本身成为其自身的一个子博弈。
)图 2图2与图1相同,也有三个参与者,A、N(自然)、B。
不同的是,B在选择时并不知道N的选择,也就是说B知道A选择了开发或者不开发,但是不知道N选择了大还是小。
因为B不知道自己处在N选择了大还是小的决策结上,用虚线表示。
此时,B有两个信息集,但是每个信息集有两个决策点。
总结来说,在图2中,A有一个信息集,只包含一个决策结;N有两个信息集,各包含一个决策结;B有两个信息集,各包含两个决策结。
所以,图2共有三个单节信息集,那么也就可以判断图2有三个子博弈。
图 3在同样三个参与者的图中,图3代表A决策时不知道N决策的结果;B知道自然的选择,但是不知道A的选择。
在图3中,根据“子博弈不能切割原博弈信息集”的规则,图3只有一个子博弈就是原博弈本身。
图3的博弈还可以用另外的方式来表达,可能更容易理解。
图 4图4和图3代表的完全是同一个博弈。
A决策时不知道N决策的结果;B知道自然的选择,但是不知道A的选择。
在这个图中,根据之前的“有几个单节信息集就有几个子博弈”的判断方法,可以知道只有一个子博弈就是原博弈本身。
或者说,只有一个子博弈,即N有一个信息集只包含一个决策点。
二、贝叶斯法则的理解如何理解贝叶斯法则在博弈论中的应用,我觉得张维迎《博弈论与信息经济学》中举的一个例子很好,我先把这部分截图放在下面。
摘自张维迎《博弈论与信息经济学》P182~P183三:信号博弈及贝叶斯法则的运用信号博弈(Signaling game),是一种由一个发送者(S)和另一个接收者(R)所组成的动态博弈。
一开始这个发送者有一个给定的类型(t),接着发送者会观察这个没有其他人(好比说接收者)知道的类型,去从讯息堆M = {m1, m2, m3,..., mj} 中选择送出一个讯息(m),接着接收者会观察这个讯息后从他可行的动作中 A = {a1, a2, a3,...., ak} 选一个作为反应动作(a),这里要注意的是接收者除了讯息之外其他都无法得知(如发送者的类型t),接着根据(t, m, a)的组合来决定双方会获得的报酬或回报。
用贝叶斯法则求解精炼贝叶斯纳什均衡最典型的例子应该是用在信号博弈上。
可以参考罗云峰主编的《博弈论教程》,第十三章1、2小节。
我觉得这本书相对讲的清楚些。
这是之前上课用到的一个例子,把它放在下面。
首先,在这个博弈中,有三个参与者,分别是N、S、R。
Sender有两种类型,他是哪种类型是其私有信息。
也就是说,receiver不知道sender是哪种类型,知道的是1/2的可能性是t1,另外1/2的可能性是t2,同时Receiver可以根据Sender的行动来修正自己的判断。
Sender有两个行动的可能性,L或者R;Receiver有两个行动的可能性,u或者d。
1.假设无论是Sender t1,还是Sender t2,都会选择L。
这一假设条件可以表示为p(L︱t1)= p(L︱t2)= 1。
又知Sender 1/2的可能性是t1,另外1/2的可能性是t2,即p(t1)= p(t2)= 0.5 那么这个时候,根据贝叶斯法则。
他选择U,受益是1/2*3+1/2*4=3.5。
如果他选择d,收益是1/2*0+1/2*1=0.5。
所以,在Sender 选L的情况下,Receiver会选u。
在Receiver选U的情况下,Sender t1 选L的收益是1,Sender t2选L的收益是2.以上结论,建立在“无论是Sender t1,还是Sender t2,都会选择L,这一假设上,那么要使上述结论成立,首先这个假设要成立。
如何让这个假设成立呢?就需要保证,如果Receiver 选择u,那么无论对哪种类型的Sender来说,选L一定比选R好。
因此,当Sender选择R时,Receiver做出的反应使得任何类型Sender得到的收益,都小于其选择L得到的收益。
当Sender选择R时,只有Receiver选择d 才能保证任何类型的Sender收益都小于其选择L的收益。
所以,必须保证当Sender选择R时,Receiver一定选择d。
要想保证Receiver一定选择d 呢,则一定要使Sender选R时,Receiver选u的预期收益小于其选d的预期收益。
即q+(1-q)*0 < 0*q + 2(1- q), 即q < 2/3. 所以,这种情况下的精炼贝叶斯均衡是无论是Sender t1,还是Sender t2,都会选择L;当Sender选择L时,Receiver 选u,当Sender选R时,Receiver选d;p=0.5;q ≤2/32. 假设无论是Sender t1,还是Sender t2,都会选择R这一假设条件可以表示为p(R︱t1)= p(R︱t2)= 1。
又知Sender 1/2的可能性是t1,另外1/2的可能性是t2,即p(t1)= p(t2)= 0.5 那么这个时候,根据贝叶斯法则。
他选择u,受益是1/2*1+1/2*0=0.5。
如果他选择d,收益是1/2*0+1/2*2=1。
所以,在sender选L的情况下,Receiver会选d。
在Receiver选d 的情况下,sender t1 选R的收益是0,sender t2选R的收益是1。
如果Sender选择L,那么Receiver选择u总是优于其选择d,所以Receiver一定会选择u。
而当Receiver选择u是,sender t1 收益是1,sender t2的收益是2。
所以这种情况,Sender选L总是优于其选R。
与假设相悖,不存在均衡。
3.如果是Sender t1,会选择L:如果是Sender t2,会选择R。
在这种情况下,根据贝叶斯法则,p=1 q=0(如果Receiver发现Sender的选择是L,就会知道是Sender t1,如果发现选择的是R就能判断出是R)在Sender t1选择L时,Receiver会选择u,Sender获得收益1;当Sender t2选择R时,Receiver会选择d,Sender获得收益1。