完整word版,博弈论期末复习题
(完整word版)经济博弈论期末复习资料(word文档良心出品)

经济博弈论复习资料一、名词解释1、零和博弈:是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作可能的博弈。
2、常和博弈:是指各博弈方的得益之和是一个非零常数的博弈。
常和博弈中各博弈方之间利益关系也是对立的,博弈方之间的基本关系也是竞争关系。
3、纳什均衡:在博弈G={}n n u u S S ,,;,,11 中,如果由各个博弈方的各一个策略组成的某个策略组合()**1,,n s s 中,任一博弈方i 的策略*i s ,都是对其余博弈方策略的组合()**1*1*1,,,,,ni i s s s s +- 的最佳对策,也即()()**1**1*1**1**1*1,,,,,,,,,,,,n i ij i i n i i i i s s s s s u s s s s s u +-+-≥ 对任意i ij S s ∈都成立,则称 ()**1,,n s s 为G 的一个纳什均衡。
4、混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。
5、纳什定理:在一个有n 个博弈方的博弈G={}n n u u S S ,,;,,11 中,如果n 是有限的,且i S 都是有限集(对i=1, ,n ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
(这个定理就是说,每一个有限博弈都至少有一个混合策略纳什均衡)6、帕累托上策均衡:是指帕累托效率意义上的优劣关系,因此用这种方法选择出来的纳什均衡,也称为“帕累托上策均衡”。
7、风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某一个纳什均衡,则该纳什均衡就是一个风险上策均衡。
8、子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息和进行博弈所需要的全部信息。
9、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略构成一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
(完整word版)博弈论期末复习题

一、支付矩阵1、试给出下述战略式表述博弈的纳什均衡BAU D解:由划线解得知有一个纯战略均衡(R D ,)再看看它是否有混合战略均衡 设B 以)1,(γγ-玩混合战略,则有 均衡条件:γγγ-=-+⋅=2)1(21)(U V A γγγ26)1(64)(-=-+⋅=D V A γγ262-=-得14>=γ,这是不可能的,故无混合战略均衡,只有这一个纯战略均衡。
2、试将题一中的支付作一修改使其有混合战略均衡解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。
BAU D将博弈改成上述模型,则)1(64)1(25γγγγ-+=-+ γγ2632-=+得 54=γ同样,设A 的混合战略为)1,(θθ-,则)1(25)1(16θθθθ-+=-⋅+ θθ3251+=+21=θ于是混合战略均衡为⎭⎬⎫⎩⎨⎧⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛51,54,21,21.二、逆向归纳法1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上,1认为2选a 的概率为P ,则1选L '的支付P P P 32)1(25+=-+=1选R '的支付P P P P 3233)1(36+>+=-+= 故1必选R '。
⇒ 给定1在第二个决策结上选R ',2在左边决策结上会选a ,故子博弈精炼均衡为{}),(,,d a R L '四、两个厂商生产相同产品在市场上进行竞争性销售.第1个厂商的成本函数为11q c =,其中1q 为厂商1的产量。
第2个厂商的成本函数为22cq c =,其中2q 为厂商2的产量,c 为其常数边际成本.两个厂商的固定成本都为零.厂商2的边际成本c 是厂商2的“私人信息”,厂商1认为c 在⎥⎦⎤⎢⎣⎡23,21上呈均匀分布。
博弈论复习题及答案

博弈论判断题(每小题1分,共15分)囚徒困境说明个人的理性选择不一定是集体的理性选择。
(√)子博弈精炼纳什均衡不是一个纳什均衡。
(×)若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。
()博弈中知道越多的一方越有利。
(×)纳什均衡一定是上策均衡。
(×)上策均衡一定是纳什均衡。
(√)在一个博弈中只可能存在一个纳什均衡。
(×)在一个博弈中博弈方可以有很多个。
(√)在一个博弈中如果存在多个纳什均衡则不存在上策均衡。
(√)在博弈中纳什均衡是博弈双方能获得的最好结果。
(×)在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。
(×)上策均衡是帕累托最优的均衡。
(×)因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。
(×)在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。
(×)在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。
囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
(×)纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。
(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。
(√)多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。
(√)如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t<T,在t阶段的结局并不是G的Nash均衡。
博弈论期末复习题及答案

博弈论期末复习题乩设古诺模型中有丹ST厂商。
6为厂商j的产■念=如+…+幺为市场总产为市场出清价格,且己知P = P[Q) = Q_ 0(当时.否ffl'J P= OJo假设厂商f生产缶产■的总成本他"也就是说没有定成本且各厂商的边际成本都相同,为常数c(c <a人假设各厂商同时选择产■,该模型的纳什均衡是什么?当n趙向于无穷大时博弈分析是否仍然有效?(】)报据问题的假设可知各厂底的利润函数为;略=阿,f 5 * (农—比—工一〔G其中1=1,…,叽将利润函数对$求导并令其为0得:帶=& _ _ F _如=0%==(“—另野一门/2根据可个厂商之闾的对称性,可知g;=嘖=…=q:必然成立o 代入上述反应函数可解得:打十i因趾该博弈的纳什均術是所有用个厂商都生产产重—H+1(2)当川趙于无穷時,所分折的市场不再是一个寡头市场而是完全竞争市场』匕肘上述博弈分桁方法其实杲不适用的.史两if获古诺模型屮(a)= “一o等与上题相同,但两个厂商的边际成本不同■分别为G和6心如果。
<心<血2,问纳什均衡产■各为笫少?如果豺<衍<6怛2心>。
+眄•则纳忡均衡产■又为赛少?泰考答案丁(1)两个厂海的利润函数为:九=Z —5一(饶—0 —①)q f—厂忌将利润函数对产皐求导并令开为0得:—=a —7, ~ C, —2q, —0解得两个厂商的反应函数为:。
@ —如—(\ )/2或貝体芻成】Qi ==(吃—G —)/2仗=仏一q、G)/2(2)0 <G <:a/2时*我们粮据上述两个厂商的反应函数、直接求出两个厂商的纳什均衡产量分别为£灯—2门十C:曲-------- 3—a +<1 —2。
毎-一§—■(3)当G V-但2c,>a+c}时,粮据反应函数求出来的厂商2产毘小<0.这倉味晋厂裔2不矣生产”这时厂商1虑了垄断厂裔*厂商1的戢优产量选择是利润最大化的垄断产量,_ ◎—G因此这种情况下前纳什均衡为[3 —门)/2. 0]&=(10°_ % 一仇_ g』)® _ 2® =廻号——5勳=(100 _ Qi ~ Qi — qj)g7—2q2 = —_萇 --- 业血分别对务和他求偏导数并令为0得:说98 —£八矿一^一的"联立两个方稈可解得$ = g =98/3e再代入厂商3的反应函数得缶—(98 —g〔一如)/2 = 98/6o把三个厂商的产量代入各口的利润函数,可得三个厂商的利润分别为4 802/9、4 802/9 和2 401/9°乩三專头垄断帝场有倒转的需求函数为P(Q)=a-e.其中Q =弘+% +如皿是厂商i的产■态一个厂商生产的边际成本为常数耳没有固定成本。
博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】一、名词解释(每题7分,共28分)1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。
2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。
用策略性思维来分析问题,从中找出合理策略,实现目标最优。
3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。
4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。
5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。
每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。
博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。
2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。
3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。
4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。
博弈论复习题及答案DOC

可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:(1)双方都不涨价,各得利润10单位;(2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)双方都涨价,可口可乐利润140,百事可乐利润35;画出两企业的损益矩阵求纳什均衡。
9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。
如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。
如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。
(1)将这一市场用囚徒困境的博弈加以表示。
(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。
答:(1)用囚徒困境的博弈表示如下表:(2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。
若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。
由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。
12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:(1)有哪些结果是纳什均衡?(2)两厂商合作的结果是什么?答(1)(低价,高价),(高价,低价)(2)(低价,高价)13、A、B两企业利用广告进行竞争。
若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。
博弈论试题及答案

诚信考试沉着应考杜绝违纪《博弈论》试卷课堂周四(7/8)院系专业万方电气系通信工程学号余数 0姓名河南理工大学2010–2011学年第1学期《博弈论》课程期末考试试卷开课学院:经济管理学院,考试形式:开卷,允许带___________入场考试时间:2010年12月25日-12月25日, 所需时间:周考生姓名:学号:专业:1、第一题:(10分)(1)举一个你所经历情侣博弈的情形,在实际博弈中你采取什么行动让自己收益最大;答:作为一个男生,我想很多机会都是把握在自己手中的,情侣博弈有二个“纳什均衡”,一次博弈的结局究竟落到哪一个“纳什均衡”,关键就是要看遇事时自己如何去选择了。
例如:周末和女朋友去逛商场,应该客观地按照需求去采购,在了解女朋友的爱好的前提下,想办法引导她去看性价比最高的商品,并给予一定建议。
遇到她特别喜欢的衣服或饰物,只要价格合理,又能满足生活需要,在对方征求意见时应该支持购买并给予肯定答复;当遇到不合理的购买选择时,应简明扼要地说出其不适之处,并建议对方到其它她喜欢的物品处,挑选令其满意的商品。
购物中间一旦遇到对方生气或者发火,可以宽容地对待对方,以显示出自己的城府,若对方为无理取闹,应该坦诚地向对方说明情况,让对方明白自己在为她考虑,说明都说清楚了事情也就简化了。
另外,在购物结束前,可以给女朋友买些她喜欢的零食,或者一起去对方喜欢的餐饮店,休息的同时也可调节一下情调,让双方都能够感觉到两个人在一起的幸福与甜蜜。
总结一下,在这场情侣博弈中,要想让自己获得最大收益,必须努力做到认真、善意、宽容、强硬、简单明了各种措施相结合。
2、第二题:(20分)请举例说明下列说法是否正确,构造博弈模型具体说明,阐述原因。
(1)判断分析“先下手为强”答:“先下手为强”并不满足所有的情形。
博弈中,在有多个"纳什均衡"的情况下,常常是先动手的一方会占一些优势,这和课例中“囚徒困境”情形类似,有一个最佳策略,古代的很多例子也证明了此点,如:诸葛亮先下手为强,占据荆州要势;日本先下手为强,偷袭美国的珍珠港,不然就不会有第二次世界大战;三国曹操先下手为强,迎接汉献帝,后挟天子以令诸侯等。
博弈论期末复习题

一、支付矩阵1、试给出下述战略式表述博弈的纳什均衡BAU D解:由划线解得知有一个纯战略均衡(R D ,)再看看它是否有混合战略均衡 设B 以)1,(γγ-玩混合战略,则有 均衡条件:γγγ-=-+⋅=2)1(21)(U V A γγγ26)1(64)(-=-+⋅=D V A γγ262-=-得14>=γ,这是不可能的,故无混合战略均衡,只有这一个纯战略均衡。
2、试将题一中的支付作一修改使其有混合战略均衡解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。
BAU D将博弈改成上述模型,则)1(64)1(25γγγγ-+=-+ γγ2632-=+ 得 54=γ 同样,设A 的混合战略为)1,(θθ-,则2)1(25)1(16θθθθ-+=-⋅+θθ3251+=+ 21=θ 于是混合战略均衡为⎭⎬⎫⎩⎨⎧⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛51,54,21,21。
二、逆向归纳法1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上,1认为2选a 的概率为P ,则1选L '的支付P P P 32)1(25+=-+=1选R '的支付P P P P 3233)1(36+>+=-+=3故1必选R '。
⇒ 给定1在第二个决策结上选R ',2在左边决策结上会选a ,故子博弈精炼均衡为{}),(,,d a R L '四、两个厂商生产相同产品在市场上进行竞争性销售。
第1个厂商的成本函数为11q c =,其中1q 为厂商1的产量。
第2个厂商的成本函数为22cq c =,其中2q 为厂商2的产量,c 为其常数边际成本。
两个厂商的固定成本都为零。
厂商2的边际成本c 是厂商2的“私人信息”,厂商1认为c 在⎥⎦⎤⎢⎣⎡23,21上呈均匀分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、支付矩阵1、试给出下述战略式表述博弈的纳什均衡BAU D解:由划线解得知有一个纯战略均衡(R D ,)再看看它是否有混合战略均衡 设B 以)1,(γγ-玩混合战略,则有 均衡条件:γγγ-=-+⋅=2)1(21)(U V A γγγ26)1(64)(-=-+⋅=D V A γγ262-=-得14>=γ,这是不可能的,故无混合战略均衡,只有这一个纯战略均衡。
2、试将题一中的支付作一修改使其有混合战略均衡解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。
BAU D将博弈改成上述模型,则)1(64)1(25γγγγ-+=-+ γγ2632-=+ 得 54=γ 同样,设A 的混合战略为)1,(θθ-,则)1(25)1(16θθθθ-+=-⋅+θθ3251+=+ 21=θ 于是混合战略均衡为⎭⎬⎫⎩⎨⎧⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛51,54,21,21。
二、逆向归纳法1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上,1认为2选a 的概率为P ,则1选L '的支付P P P 32)1(25+=-+=1选R '的支付P P P P 3233)1(36+>+=-+=故1必选R '。
⇒ 给定1在第二个决策结上选R ',2在左边决策结上会选a ,故子博弈精炼均衡为{}),(,,d a R L '四、两个厂商生产相同产品在市场上进行竞争性销售。
第1个厂商的成本函数为11q c =,其中1q 为厂商1的产量。
第2个厂商的成本函数为22cq c =,其中2q 为厂商2的产量,c 为其常数边际成本。
两个厂商的固定成本都为零。
厂商2的边际成本c 是厂商2的“私人信息”,厂商1认为c 在⎥⎦⎤⎢⎣⎡23,21上呈均匀分布。
设市场需求函数为214q q P --=,其中P 为价格,两个厂商都以其产量为纯战略,问纯战略贝叶斯均衡为何?解:给定2q ,厂商1的问题是12111)14( )1(max 1q q q q P q ---=-=π因)(22c q q =。
厂商1不知道c ,故目标函数为⎥⎦⎤⎢⎣⎡--=---⎰⎰2/3212112/3121211211)(3max )1)(4(max dc c q q q q dcq c q q q q一阶条件: 0)(232/32121=--⎰dc c q q得 ⎰-=2/32121)(2123dc c q q (1)厂商2的问题是:2221222122)4( )4( )(max 2q q q q c q c q q q c P q ---=---=-=π一阶条件:02)4(21=---q q c得 24)(12q c c q --=(2) 代入式(1):43 2123814423 41242123 24212312212/32/312/311212121q q cdcq dc q c q +=⎥⎥⎦⎤⎢⎢⎣⎡⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛+--=+--=---=⎰⎰⎰得11=q 代入式(2): 23)(2cc q -=若1=c ,则121==q q121==ππ若信息是完全的且1=c ,则古诺博弈均衡为15321<==q q ,1252721>==ππ。
这说明信息不完全带来的高效率。
2、完美信息动态博弈。
会用策略式表达、扩展式表达。
用方框找纳什均衡,用树找子博弈精炼均衡。
讲理由,看例题。
该博弈中有三个纳什均衡: 不进入,(进入,进入) 进入,(不进入,进入)进入,(不进入,不进入)前两个均衡的结果(进入,不进入),即A进入,B不进入;第二个均衡结果是(不进入,进入),即A不进入,B进入如果理论得到这样的结果,无助于预测博弈参与人的行为。
此外,纳什均衡假定,每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最优反应,即参与人并不考虑自己的选择对其他人选择的影响,因而纳什均衡很难说是动态博弈的合理解。
必须在多个纳什均衡中剔除不合理的均衡解,即所谓“不可置信威胁”。
子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。
它的目的是把动态博弈中的“合理纳什均衡”与“不合理纳什均衡”分开。
正如纳什均衡是完全信息静态博弈解的基本慨念一样,子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。
①{不进入,(进入,进入)}②{进入,(不进入,进入)}③{进入,(不进入,不进入)}前边得到的三个纳什均衡中,均衡①意味着当A不进入时,B选择进入;而当A选择进入时,B仍选择进入(B威胁无论如何都要进入市场)。
显然,当A选择进入时,B仍选择进入是不合理的,如果A进入市场,B选择“不进入”比选择“进入”收益要更大,理性的B不会选择进入,而A知道B是理性的,因此也不会把该战略视为B会选择的战略。
因此,B的战略(进入,进入)是不可置信威胁。
①{不进入,(进入,进入)}②{进入,(不进入,进入)}③{进入,(不进入,不进入)}均衡③意味着当A进入时,B选择不进入;而当A 选择不进入时,B 仍选择进入(B 威胁无论如何都不进入市场)。
显然,当A 选择不进入时,B 仍选择不进入是不合理的,B 的战略是不可置信的。
只有均衡②是合理的:如果A 进入,B 不进入;如果A 不进入,B 进入。
因为A 是先行动者,理性的A 会选择“进入”(他知道B 是理性的,B 不会选择“进入”),而理性的B 选择“不进入”。
观察博弈树上的三个均衡中,B 的不可置信战略中的反应,在第二阶段B 开始行动的两个子博弈中不是最优;而合理的纳什均衡中,B 的战略在所有子博弈中都是最优的,与A 的第一阶段可能选择的行动构成该子博弈的纳什均衡。
五、试给出下述信号博弈的纯战略均衡中的混同均衡和分离均衡(8,1) (1,2)4,1)(7,3) (3,7)解:有四种可能:混同均衡 11m t →,12m t → 21m t →,22m t → 分离均衡 11m t →,22m t → 21m t →,12m t → 设)(i m u 为接收者看见i m 时 认为发送者是1t 的后验概率。
看11m t →,12m t →则5.0)(1=m u ,非均衡路径上]1,0[)(2=m u当接收者看见1m ,选1a 的支付为 5.115.025.0=⨯+⨯选2a 的支付为5.15.775.085.0>=⨯+⨯ 故选2a 。
当接收者看见2m ,选1a 的支付为)(455))(1(1)(222m u m u m u -=⨯-+⨯ 选2a 的支付为)(433))(1(7)(222m u m u m u +=⨯-+⨯当1t 选1m ,接收者会选2a ,1t 得支付10,要求1t 不选2m ,对)(2m u 无要求,因1t 总会选1m 。
当2t 选1m ,接收者会选2a ,2t 得支付3,要求2t 不选2m 是不可能的,因2t 选2m 是占优于选1m 的,故此混同均衡11m t →,12m t →不存在。
再看混同均衡 21m t →,22m t →此时]1,0[)(1=m u 为非均衡路径上的后验概率,5.0)(2=m u当接收者看见2m ,选1a 的支付为355.015.0=⨯+⨯ 选2a 的支付为3535.075.0>=⨯+⨯ 故接收者必选2a 。
当接收者看见1m 时,选1a 的支付为 )(11)(1(2)(111m u m u m u +=⋅-+⋅选2a 的支付为)(1)(77)(1(8)(1111m u m u m u m u +>+=⋅-+⋅ 故必选2a 。
这样,无论发送者发出1m 或2m 信号,接收者总选2a ,⇒给定接收者总是选2a 。
1t 会选1m ,2t 会选2m 。
⇒故21m t →,22m t →不是混同均衡。
看分离均衡11m t →,22m t → 1)(1=m u ,0)(2=m u 接收者看见1m 时,必选2a 接收者看见2m 时,必选1a 此时,1t 选1m ,2t 选2m⇒故11m t →,22m t →是一个分离均衡。
最后看分离均衡21m t →,12m t → 0)(1=m u ,1)(2=m u 接收者看见1m 时,必选2a 接收者看见2m 时,必选2a⇒给定接收者总选2a11m t →,22m t →⇒故21m t →,12m t →不是分离均衡。
故只有一个纯战略子博弈精炼分离均衡 11m t → 22m t → 鹰-鸽(Hawk-Dove)博弈(1) 参与人:争食的两只动物-动物1和动物2。
动物1和动物2的行动空间都是一样的,即:Ai={鹰,鸽} i=1,2 支付矩阵如下:(2) 此博弈属于完全信息静态博弈,根据奇数定理知道共有三个纳什均衡,两个纯策略纳什均衡和一个混合策略纳什均衡。
两个纯策略纳什均衡是:(鹰,鸽)和(鸽,鹰)。
混合策略纳什均衡是:动物1和动物2分别以50%的概率随机地选择鹰(象鹰一样行动)或者鸽(象鸽一样行动)。
纯策略纳什均衡可以用划线法或箭头法求解。
混合策略纳什均衡则可根据无差异原则求解概率分布,即:首先,动物1应该以q的概率选择鹰,以1-q的概率选择鸽,使得动物2在鹰或者鸽之间无差异,那么可得q*:由4(1-q) = q+3(1-q) 得q*=50%;其次,动物2应该以a的概率选择鹰,以1-a的概率选择鸽,使得动物1在鹰或者鸽之间无差异,那么可得a*:由4(1-a) = a+3(1-a) 得a*=50%。
(3) 此博弈实际就是一个斗鸡博弈,在现实生活许多现象都与此类似,如市场进入、前苏联与美国在世界各地争抢地盘等。
七、狩猎博弈此博弈同样是一个完全信息静态博弈,参与人是两个猎人,他们的行动是选择猎鹿或者猎兔。
支付矩阵如下:根据划线或箭头法我们可以很容易地知道此博弈有两个纯策略纳什均衡,即:(鹿,鹿)和(兔,兔),也就是两个猎人同时猎鹿或同时猎兔都是纯策略纳什均衡。
由于存在两个纯策略纳什均衡,现实中究竟哪个均衡会出现就是一个问题,这是多重纳什均衡下的困境。
但是,比较两个纳什均衡,很容易发现两人都猎鹿帕累托优于两人都猎兔,所以,对两个猎人而言,都猎鹿是一个“更好”的纳什均衡,因此,在现实中两个人都决定猎鹿的可能性要更大一些。
然而,正如卢梭所言,如果一只野兔碰巧经过他们中的一个人附近,那么也许这个人会去猎兔而使猎鹿失败,因为两个人都猎兔也是一个纳什均衡,这就是人的自私性。
此外,在多个纳什均衡下,博弈之外的其他因素有助于我们判断哪个均衡会出现。
比如,两个猎人是好朋友,经常合作,那么我们几乎可以100%的肯定他们都会同时选择猎鹿。