博弈论期末复习题要点
(完整word版)经济博弈论期末复习资料(word文档良心出品)

经济博弈论复习资料一、名词解释1、零和博弈:是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作可能的博弈。
2、常和博弈:是指各博弈方的得益之和是一个非零常数的博弈。
常和博弈中各博弈方之间利益关系也是对立的,博弈方之间的基本关系也是竞争关系。
3、纳什均衡:在博弈G={}n n u u S S ,,;,,11 中,如果由各个博弈方的各一个策略组成的某个策略组合()**1,,n s s 中,任一博弈方i 的策略*i s ,都是对其余博弈方策略的组合()**1*1*1,,,,,ni i s s s s +- 的最佳对策,也即()()**1**1*1**1**1*1,,,,,,,,,,,,n i ij i i n i i i i s s s s s u s s s s s u +-+-≥ 对任意i ij S s ∈都成立,则称 ()**1,,n s s 为G 的一个纳什均衡。
4、混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。
5、纳什定理:在一个有n 个博弈方的博弈G={}n n u u S S ,,;,,11 中,如果n 是有限的,且i S 都是有限集(对i=1, ,n ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
(这个定理就是说,每一个有限博弈都至少有一个混合策略纳什均衡)6、帕累托上策均衡:是指帕累托效率意义上的优劣关系,因此用这种方法选择出来的纳什均衡,也称为“帕累托上策均衡”。
7、风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某一个纳什均衡,则该纳什均衡就是一个风险上策均衡。
8、子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息和进行博弈所需要的全部信息。
9、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略构成一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
(完整word版)博弈论期末复习题

一、支付矩阵1、试给出下述战略式表述博弈的纳什均衡BAU D解:由划线解得知有一个纯战略均衡(R D ,)再看看它是否有混合战略均衡 设B 以)1,(γγ-玩混合战略,则有 均衡条件:γγγ-=-+⋅=2)1(21)(U V A γγγ26)1(64)(-=-+⋅=D V A γγ262-=-得14>=γ,这是不可能的,故无混合战略均衡,只有这一个纯战略均衡。
2、试将题一中的支付作一修改使其有混合战略均衡解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。
BAU D将博弈改成上述模型,则)1(64)1(25γγγγ-+=-+ γγ2632-=+得 54=γ同样,设A 的混合战略为)1,(θθ-,则)1(25)1(16θθθθ-+=-⋅+ θθ3251+=+21=θ于是混合战略均衡为⎭⎬⎫⎩⎨⎧⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛51,54,21,21.二、逆向归纳法1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上,1认为2选a 的概率为P ,则1选L '的支付P P P 32)1(25+=-+=1选R '的支付P P P P 3233)1(36+>+=-+= 故1必选R '。
⇒ 给定1在第二个决策结上选R ',2在左边决策结上会选a ,故子博弈精炼均衡为{}),(,,d a R L '四、两个厂商生产相同产品在市场上进行竞争性销售.第1个厂商的成本函数为11q c =,其中1q 为厂商1的产量。
第2个厂商的成本函数为22cq c =,其中2q 为厂商2的产量,c 为其常数边际成本.两个厂商的固定成本都为零.厂商2的边际成本c 是厂商2的“私人信息”,厂商1认为c 在⎥⎦⎤⎢⎣⎡23,21上呈均匀分布。
《经济博弈论》期末考试复习题及参考答案

经济博弈论复习题(课程代码262268)一、名词解释混合战略纳什均衡;子博弈精炼纳什均衡;完全信息动态博弈;不完全信息动态博弈;完全信息静态博弈;帕累托上策均衡;囚徒困境;纳什均衡;子博弈;完美信息动态博弈;颤抖手均衡;柠檬原理;完美贝叶斯均衡二、计算分析题1、在市场进入模型中,市场需求函数为p=13-Q,进入者和在位者生产的边际成本都为1,固定成本为0,潜在进入者的进入成本为4。
博弈时序为:在位者首先决定产量水平;潜在进入者在观察到在位者的产量水平之后决定是否进入;如果不进入,则博弈结束,如果进入,则进入者选择产量水平。
求解以上博弈精炼纳什均衡。
2、考虑如下扰动的性别战略博弈,其中t i服从[0,1]的均匀分布,,t1和t2是独立的,t i是参与人i的私人信息。
求出以上博弈所有纯战略贝叶斯均衡。
S1S2足球芭蕾足球3+,1 ,,芭蕾0,0 1,3+3、求下列信号传递模型的贝叶斯Nash均衡(讨论分离均衡和混同均衡)4、考察如下完全信息静态博弈,求其全部纳什均衡:L M R U 0, 4 4, 0 5, 3M 4, 4 0, 4 5, 3D 3, 5 3, 5 6, 6表1 双人静态博弈5、古诺博弈:市场反需求函数为()P Q a Q =-,其中12Q = q q +为市场总产量,i q 为企业()i i 1,2=的产量。
两个企业的总成本都为()i i i c q cq =。
请您思考以下问题: 1) 在完全信息静态条件下,这一博弈的纳什均衡是什么?2)假设这一阶段博弈重复无限次。
试问:在什么样的贴现条件下,企业选择冷酷战略可保证产量组合()()()772424,a c a c --是子博弈精炼纳什均衡的?6、考虑一个工作申请的博弈。
两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。
工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。
博弈论重点

博弈论期末复习要点纳什均衡(P52):指的是参与人的这样一种策略组合,在该策略组合中,每个人的策略都是最优的,任何参与人单独改变策略都不会得到好处。
换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略。
完全信息(P34):各个博弈方都完全了解所有博弈方在各种情况下的得益状况。
上策均衡(P41):在某个博弈中,如果不管其他博弈方选择什么策略,一博弈方的某一个策略给他带来的收益始终高于其他策略,至少不低于其他策略。
帕累托上策均衡(P92):多个纳什均衡的某一个均衡策略给所有博弈方带来的得益都大于其他所有纳什均衡带来的得益,则各个博弈方都会倾向于此纳什均衡的策略,博弈能够实现帕累托效率。
聚点均衡(P97):在多重纳什均衡博弈中,双方同时会选择一个聚点构成的纳什均衡。
合并均衡(P268):具有完美信息的博弈方在博弈中,不管自己情况如何,都采取相同的市场均衡。
(在合并均衡中,完美信息博弈方的情况不同,并不会导致他们的行为不同,因此他们的行为不会给不完美信息的博弈方透露任何有用的消息)分开均衡(P268):在不同情况下,完美信息博弈方所采取完全不同的市场策略。
(在分开均衡中,由于博弈方的情况不同,采取的不同的市场策略,因此完美信息博弈方的策略可以完全反映他的情况,因此能够给不完美信息博弈方的“判断”提供充分的信息和依据)海萨尼转换(P292):将得益不了解转化为类型不了解的基础上,进一步将不完全信息静态博弈转化为完全但不完美信息动态博弈进行分析的思路。
完美信息(P34):动态博弈中在轮到行为时对博弈的进程完全了解的博弈。
不完美信息(P34):动态博弈中在轮到行为时对博弈的进程完全不了解的博弈。
混合策略(P72):博弈方以一定的概率分布在可选策略中随机选择的决策方式。
一致性预测(P53):如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略。
博弈期末考试总结

博弈与决策答案一、名词解释(每小题2分,共16分)1、博弈博弈是指一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以施,并从中各自取得相应结果或收益的过程,2、占优战略均衡占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的优策略的基础上达到均衡.3、重复博弈重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题,4、序列博弈序列博弈是指对局者选择策略有时问先后的顺序,某些对局者可能率先采取行动.序列博也是一种动态博弈.5、动态博弈动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动.6、占优战略均衡--占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的占优策略的基础上达到均衡.7、完全信息---完全信息是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息.8、得益得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西.9,博弈论:博弈论就是系统的研究各种各样的博弈问题,寻求各博弈方合理选择策略的情况下博弈的解,并对这些解进行讨论分析的理论。
10,纳什战略均衡:纳什战略均衡指在均衡中,每个博弈参与人都确信,在给定其他参与人选择的策略的情况下,该参与人选择了最优策略以回应对手的策略。
11,静态博弈:静态博弈是指在博弈中,参与人同时选择或非同时选择但后行动者并不知道先行动者采取了什么具体行动。
二、、简答题(每小题6分,共24分)1、占优战略均衡和纳什均衡的联系与区别如下:1)每一个占优战略均衡都是纳什均衡,而每一个纳什均衡却未必是占优战略均衡;2)用重复剔除严格劣战略方法,保留下的唯一的重复剔除的占优均衡,就是纳什均衡.3)纳什均衡,不会被重复剔除严格劣战略方法剔除掉(但弱劣战略剔除,可能会剔除纳什衡):4)经重复剔除严格劣战略之后,有不唯一的多个哉略组合保留,其中有的战略组合不一定纳什均衡.即重复剔除严格劣战略方法,无法确保将所有非纳什均衡战略剔除,没有被剔的战略组合不一定是纳什均衡.5)没有占优战略均衡的博弈,不能用重复剔除严格劣战略方法求解的博弈,可以有纳什均衡2,博弈的构成要素有哪些?并对其进行说明。
《经济博弈论》期末考试复习题及参考答案

《经济博弈论》期末考试复习题及参考答案经济博弈论期末考试复习题及参考答案本文为经济博弈论期末考试复习题及参考答案,旨在帮助读者复习和理解经济博弈论的相关知识。
文章将根据考试题目的要求,按照合适的格式进行撰写,内容排版整洁美观,语句通顺。
一、选择题1. 经济博弈论的基本假设是:A) 理性决策者B) 非合作C) 不确定性D) 所有选项都正确答案:D) 所有选项都正确解析:经济博弈论的基本假设包括理性决策者、非合作和不确定性等。
这些假设是经济博弈论分析的基础。
2. 下列哪个是经济博弈论的应用领域?A) 国际贸易B) 市场竞争C) 拍卖D) 所有选项都正确答案:D) 所有选项都正确解析:经济博弈论的应用领域包括国际贸易、市场竞争以及拍卖等。
经济博弈论可以用来研究各种经济行为和现象。
二、判断题1. 在博弈论中,合作是最优策略。
答案:错误解析:在博弈论中,最优策略取决于具体的博弈形式和博弈规则,有时候合作不是最优策略,而是采取非合作的策略更有利。
2. 零和博弈是一种非合作博弈。
答案:正确解析:零和博弈是一种非合作博弈,即参与者的利益完全相反,一方的获利必然导致另一方的损失。
三、问答题1. 解释什么是纳什均衡。
答案:纳什均衡是指在博弈过程中,所有参与者都选择了自己的最佳策略,没有任何一个参与者有动机改变自己的策略。
简而言之,纳什均衡是一种稳定状态。
2. 请举一个领域中应用博弈论分析的具体案例。
答案:拍卖是一个应用博弈论分析的具体案例。
在拍卖中,卖方和买方根据自己的利益选择出价和投标策略,博弈论可以用来分析参与者之间的竞争策略和最终成交价格等。
四、计算题1. 考虑一个两人零和博弈,支付矩阵如下所示:| | 策略A | 策略B ||-------|-------|-------|| 策略X | 2 | 0 || 策略Y | 1 | 3 |请计算纳什均衡解。
答案:策略X和策略B是一个纳什均衡解,因为在这个解中,第一个玩家选择策略X而第二个玩家选择策略B时,两个玩家都无动机改变自己的策略。
《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料第一章导论1.博弈的概念:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。
它包括四个要素:参与者,策略,次序和得益。
2.一个博弈的构成要素:博弈模型有下列要素:(1)博弈方。
即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。
即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。
各博弈方的策略选择范围称策略空间。
每个博弈方各选一个策略构成一个策略组合。
(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。
(4)得益。
各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。
3.合作博弈和非合作博弈的区别:合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。
主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。
假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。
如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。
合作博弈:团体理性(效率高,公正,公平)非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率)4.完全理性和有限理性:完全理性:有完美的分析判断能力和不会犯选择行为的错误。
有限理性:博弈方的判断选择能力有缺陷。
区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。
所以不能简单地假设各博弈方都完全理性。
5.个体理性和集体理性:个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。
第一章课后题:2、4、56.设定一个博弈模型必须确定哪几个方面?设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。
博弈论的复习资料精品文档7页

名词解释:1,共同知识:是指所有当事人对该事件都知道,并且也所有当事人都知道其他当事人也知道这一事件,并且所有当事人都知道所有当事人都知道这一事件。
那么该事件就是共同知识。
2,先动优势:在序贯情侣博弈中,任何一方率先采取行动可能得到的好处,都比他或她后行动可能得到的好处大。
这种局中人先动得益大于后行得益的情况,叫做先动优势。
3,后动优势:后行动的得益比先行动的得益大的情况4,信息集:我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集。
•单点集:我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位,称为单点集。
•触发策略:即只要他的对手在博弈中一直采取合作策略,则该局中人也会在博弈中继续采取合作策略;但是,一旦对手在某一个阶段采取背叛策略,将会触发该局中人在往后的一段时期内采取不合作策略,甚至永远采取不合作策略,从而对对手实施惩罚。
•冷酷策略:双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛。
即任何局中人的一次性不合作将触发永远不合作。
•礼尚往来策略:开始的时候和冷酷策略一样,即双方从合作开始,在以后的每个阶段,如果你的对手在最近的一次博弈中还是采取合作策略,则你继续跟他合作;如果你的对手在上一阶段的博弈中采取背叛策略,则你在下次的博弈中采取背叛策略惩罚他,但是如果你的对手在下一次博弈中改邪归正,采用合作策略,则你在下次继续博弈中还是跟他合作。
触发策略是带有奖励和惩罚措施的一种博弈机制。
在这个机制中,惩罚措施是其中的关键。
注意:(1),一个信息集罩住的必须是同一个局中人的决策点。
•必须是同一个局中人在同一个时点的决策节点。
同时,即使是同一个人在同一时点进行决策,也不一定构成一个信息集,他还必须满足:在每一个决策点他的行动选择集合必须是相同的。
因为局中人在做行动选择时并不知道自己位于哪个决策点,因此,他不可能做出不同的行动选择。
简答题:1,博弈的构成要素:•局中人决策主体,目的是通过选择行动(或策略)以最大化自己的支付(效用、得益)水平。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、支付矩阵1、试给出下述战略式表述博弈的纳什均衡BAU D解:由划线解得知有一个纯战略均衡(R D ,)再看看它是否有混合战略均衡 设B 以)1,(γγ-玩混合战略,则有 均衡条件:γγγ-=-+⋅=2)1(21)(U V A γγγ26)1(64)(-=-+⋅=D V A γγ262-=-得14>=γ,这是不可能的,故无混合战略均衡,只有这一个纯战略均衡。
2、试将题一中的支付作一修改使其有混合战略均衡解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。
BAU D将博弈改成上述模型,则)1(64)1(25γγγγ-+=-+ γγ2632-=+ 得 54=γ 同样,设A 的混合战略为)1,(θθ-,则)1(25)1(16θθθθ-+=-⋅+θθ3251+=+ 21=θ 于是混合战略均衡为⎭⎬⎫⎩⎨⎧⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛51,54,21,21。
二、逆向归纳法1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上,1认为2选a 的概率为P ,则1选L '的支付P P P 32)1(25+=-+=1选R '的支付P P P P 3233)1(36+>+=-+=故1必选R '。
⇒ 给定1在第二个决策结上选R ',2在左边决策结上会选a ,故子博弈精炼均衡为{}),(,,d a R L '四、两个厂商生产相同产品在市场上进行竞争性销售。
第1个厂商的成本函数为11q c =,其中1q 为厂商1的产量。
第2个厂商的成本函数为22cq c =,其中2q 为厂商2的产量,c 为其常数边际成本。
两个厂商的固定成本都为零。
厂商2的边际成本c 是厂商2的“私人信息”,厂商1认为c 在⎥⎦⎤⎢⎣⎡23,21上呈均匀分布。
设市场需求函数为214q q P --=,其中P 为价格,两个厂商都以其产量为纯战略,问纯战略贝叶斯均衡为何?解:给定2q ,厂商1的问题是12111)14( )1(max 1q q q q P q ---=-=π因)(22c q q =。
厂商1不知道c ,故目标函数为⎥⎦⎤⎢⎣⎡--=---⎰⎰2/3212112/3121211211)(3max )1)(4(max dc c q q q q dcq c q q q q一阶条件: 0)(232/32121=--⎰dc c q q得 ⎰-=2/32121)(2123dc c q q (1)厂商2的问题是:2221222122)4( )4( )(max 2q q q q c q c q q q c P q ---=---=-=π一阶条件:02)4(21=---q q c得 24)(12q c c q --=(2) 代入式(1):43 2123814423 41242123 24212312212/32/312/311212121q q cdcq dc q c q +=⎥⎥⎦⎤⎢⎢⎣⎡⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛+--=+--=---=⎰⎰⎰得11=q 代入式(2): 23)(2cc q -=若1=c ,则121==q q121==ππ若信息是完全的且1=c ,则古诺博弈均衡为15321<==q q ,1252721>==ππ。
这说明信息不完全带来的高效率。
2、完美信息动态博弈。
会用策略式表达、扩展式表达。
用方框找纳什均衡,用树找子博弈精炼均衡。
讲理由,看例题。
该博弈中有三个纳什均衡: 不进入,(进入,进入) 进入,(不进入,进入)进入,(不进入,不进入)前两个均衡的结果(进入,不进入),即A进入,B不进入;第二个均衡结果是(不进入,进入),即A不进入,B进入如果理论得到这样的结果,无助于预测博弈参与人的行为。
此外,纳什均衡假定,每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最优反应,即参与人并不考虑自己的选择对其他人选择的影响,因而纳什均衡很难说是动态博弈的合理解。
必须在多个纳什均衡中剔除不合理的均衡解,即所谓“不可置信威胁”。
子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。
它的目的是把动态博弈中的“合理纳什均衡”与“不合理纳什均衡”分开。
正如纳什均衡是完全信息静态博弈解的基本慨念一样,子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。
①{不进入,(进入,进入)}②{进入,(不进入,进入)}③{进入,(不进入,不进入)}前边得到的三个纳什均衡中,均衡①意味着当A不进入时,B选择进入;而当A选择进入时,B仍选择进入(B威胁无论如何都要进入市场)。
显然,当A选择进入时,B仍选择进入是不合理的,如果A进入市场,B选择“不进入”比选择“进入”收益要更大,理性的B不会选择进入,而A知道B是理性的,因此也不会把该战略视为B会选择的战略。
因此,B的战略(进入,进入)是不可置信威胁。
①{不进入,(进入,进入)}②{进入,(不进入,进入)}③{进入,(不进入,不进入)}均衡③意味着当A进入时,B选择不进入;而当A 选择不进入时,B 仍选择进入(B 威胁无论如何都不进入市场)。
显然,当A 选择不进入时,B 仍选择不进入是不合理的,B 的战略是不可置信的。
只有均衡②是合理的:如果A 进入,B 不进入;如果A 不进入,B 进入。
因为A 是先行动者,理性的A 会选择“进入”(他知道B 是理性的,B 不会选择“进入”),而理性的B 选择“不进入”。
观察博弈树上的三个均衡中,B 的不可置信战略中的反应,在第二阶段B 开始行动的两个子博弈中不是最优;而合理的纳什均衡中,B 的战略在所有子博弈中都是最优的,与A 的第一阶段可能选择的行动构成该子博弈的纳什均衡。
五、试给出下述信号博弈的纯战略均衡中的混同均衡和分离均衡(8,1) (1,2)4,1)(7,3) (3,7)解:有四种可能:混同均衡 11m t →,12m t → 21m t →,22m t → 分离均衡 11m t →,22m t → 21m t →,12m t → 设)(i m u 为接收者看见i m 时 认为发送者是1t 的后验概率。
看11m t →,12m t →则5.0)(1=m u ,非均衡路径上]1,0[)(2=m u当接收者看见1m ,选1a 的支付为 5.115.025.0=⨯+⨯选2a 的支付为5.15.775.085.0>=⨯+⨯ 故选2a 。
当接收者看见2m ,选1a 的支付为)(455))(1(1)(222m u m u m u -=⨯-+⨯ 选2a 的支付为)(433))(1(7)(222m u m u m u +=⨯-+⨯当1t 选1m ,接收者会选2a ,1t 得支付10,要求1t 不选2m ,对)(2m u 无要求,因1t 总会选1m 。
当2t 选1m ,接收者会选2a ,2t 得支付3,要求2t 不选2m 是不可能的,因2t 选2m 是占优于选1m 的,故此混同均衡11m t →,12m t →不存在。
再看混同均衡 21m t →,22m t →此时]1,0[)(1=m u 为非均衡路径上的后验概率,5.0)(2=m u当接收者看见2m ,选1a 的支付为355.015.0=⨯+⨯ 选2a 的支付为3535.075.0>=⨯+⨯ 故接收者必选2a 。
当接收者看见1m 时,选1a 的支付为 )(11)(1(2)(111m u m u m u +=⋅-+⋅选2a 的支付为)(1)(77)(1(8)(1111m u m u m u m u +>+=⋅-+⋅ 故必选2a 。
这样,无论发送者发出1m 或2m 信号,接收者总选2a ,⇒给定接收者总是选2a 。
1t 会选1m ,2t 会选2m 。
⇒故21m t →,22m t →不是混同均衡。
看分离均衡11m t →,22m t → 1)(1=m u ,0)(2=m u 接收者看见1m 时,必选2a 接收者看见2m 时,必选1a 此时,1t 选1m ,2t 选2m⇒故11m t →,22m t →是一个分离均衡。
最后看分离均衡21m t →,12m t → 0)(1=m u ,1)(2=m u 接收者看见1m 时,必选2a 接收者看见2m 时,必选2a⇒给定接收者总选2a11m t →,22m t →⇒故21m t →,12m t →不是分离均衡。
故只有一个纯战略子博弈精炼分离均衡 11m t → 22m t → 鹰-鸽(Hawk-Dove)博弈(1) 参与人:争食的两只动物-动物1和动物2。
动物1和动物2的行动空间都是一样的,即:Ai={鹰,鸽} i=1,2 支付矩阵如下:(2) 此博弈属于完全信息静态博弈,根据奇数定理知道共有三个纳什均衡,两个纯策略纳什均衡和一个混合策略纳什均衡。
两个纯策略纳什均衡是:(鹰,鸽)和(鸽,鹰)。
混合策略纳什均衡是:动物1和动物2分别以50%的概率随机地选择鹰(象鹰一样行动)或者鸽(象鸽一样行动)。
纯策略纳什均衡可以用划线法或箭头法求解。
混合策略纳什均衡则可根据无差异原则求解概率分布,即:首先,动物1应该以q的概率选择鹰,以1-q的概率选择鸽,使得动物2在鹰或者鸽之间无差异,那么可得q*:由4(1-q) = q+3(1-q) 得q*=50%;其次,动物2应该以a的概率选择鹰,以1-a的概率选择鸽,使得动物1在鹰或者鸽之间无差异,那么可得a*:由4(1-a) = a+3(1-a) 得a*=50%。
(3) 此博弈实际就是一个斗鸡博弈,在现实生活许多现象都与此类似,如市场进入、前苏联与美国在世界各地争抢地盘等。
七、狩猎博弈此博弈同样是一个完全信息静态博弈,参与人是两个猎人,他们的行动是选择猎鹿或者猎兔。
支付矩阵如下:根据划线或箭头法我们可以很容易地知道此博弈有两个纯策略纳什均衡,即:(鹿,鹿)和(兔,兔),也就是两个猎人同时猎鹿或同时猎兔都是纯策略纳什均衡。
由于存在两个纯策略纳什均衡,现实中究竟哪个均衡会出现就是一个问题,这是多重纳什均衡下的困境。
但是,比较两个纳什均衡,很容易发现两人都猎鹿帕累托优于两人都猎兔,所以,对两个猎人而言,都猎鹿是一个“更好”的纳什均衡,因此,在现实中两个人都决定猎鹿的可能性要更大一些。
然而,正如卢梭所言,如果一只野兔碰巧经过他们中的一个人附近,那么也许这个人会去猎兔而使猎鹿失败,因为两个人都猎兔也是一个纳什均衡,这就是人的自私性。
此外,在多个纳什均衡下,博弈之外的其他因素有助于我们判断哪个均衡会出现。
比如,两个猎人是好朋友,经常合作,那么我们几乎可以100%的肯定他们都会同时选择猎鹿。