博弈论复习题答案
![博弈论复习题答案](https://img.360docs.net/img1c/13bys8zhv3vi7hcpi2g9q8xskbpxubrz-c1.webp)
![博弈论复习题答案](https://img.360docs.net/img1c/13bys8zhv3vi7hcpi2g9q8xskbpxubrz-82.webp)
囚徒困境说明个人的理性选择不一定是集体的理性选择。(√)
子博弈精炼纳什均衡不是一个纳什均衡。(×)
若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×)
纳什均衡一定是上策均衡。(×)
上策均衡一定是纳什均衡。(√)
在一个博弈中只可能存在一个纳什均衡。(×)
在一个博弈中博弈方可以有很多个。(√)
在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√)
在博弈中纳什均衡是博弈双方能获得的最好结果。(×)
在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×)
因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。
(×)
在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×)
在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。
囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
(×)
纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√)
多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√)
如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t 零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。(√)(或:零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。(×)) 原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。(√) 原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一的纳什均衡不是效率最高的战略组合,存在潜在合作利益的囚徒困境博弈。(√)(或:原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战 略组合,符合各局中人最大利益,不存在潜在合作利益的囚徒困境博弈。(×))根据参与人行动的先后顺序,博弈可以划分为静态博弈(static game)和动态博弈(dynamic game)。 如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博弈完美结局:在每一阶段取G的Nash均衡策略。(√) 1、无限次重复博弈与有限重复博弈的区别: a.无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中, 存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互 制约关系,使重复博弈无法实现更高效率均衡的关键问题。 b.无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题, 必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必 须以平均得益或总得益的现值为根据。 c.无限次重复博弈与有限次重复博弈的共同点:试图“合作”和惩 罚“不合作”是实现理想均衡的关键,是构造高效率均衡战略的 核心构件。 4、根据两人博弈的支付矩阵回答问题: a b A B (1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈(6分) (2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。 (3)求出该博弈的混合策略纳什均衡。(7分) (1)策略 甲:AB 乙:ab 博弈树(草图如下: (2)Pure NE (A, a); (B, b) 都是Pareto有效,仅(B, b)是K-H有效。 (3)Mixed NE ((2/5, 3/5); (2/3, 1/3)) 5、用反应函数法求出下列博弈的所有纯战略纳什均衡。 参与人2 a b c d A 参与人 B 1 C D 解答: 纯策略纳什均衡为(B ,a )与(A ,c ) 分析过程:设两个参与人的行动分别为12a a 和, player1的反应函数221222,,(),B a a B a b R a A a c C a d =?? =?=?=??=?如果如果如果或者D,如果 player2的反应函数112111 ,,(),D c a A a a B R a c a C c a =?? =?=?=? ?=?如果如果如果,如果 交点为(B ,a )与(A ,c ),因此纯策略纳什均衡为(B ,a )与(A ,c )。 6、(entry deterrence 市场威慑)考虑下面一个动态博弈:首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。 . 左图:温柔型 右图:残酷型 (1) 找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均 -10,25) 10,20) 20,30) -10,0) 衡(12分) (2) 已有企业为温柔型的概率至少多少时,新企业才愿意进入(8分) (1) 温柔 NE (in, accommodate) 和 (out, fight)。 SPNE 为(in, accommodate) 残酷 NE (out, fight). SPNE 同理 (2) 2010(1)0p p -->= 1/3p >=得到 8、博弈方1 和博弈方 2就如何分 10,000 元钱进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额 A 和 B ,0≤A ,B ≤10,000。如果 A+B ≤10,000,则两博弈方的要求得到满足,即分别得 A 和 B ,但如果 A+B>10,000,则该笔钱就没收。问该博弈的纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额?为什么? 答十、纳什均衡有无数个。最可能的结果是(5000,5000)这个聚点均衡。 9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。 (1)将这一市场用囚徒困境的博弈加以表示。 (2)解释为什么均衡结果可能是两家公司都选择竞争性策略。 答:(1)用囚徒困境的博弈表示如下表: (2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。 12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位: 万元)由下图的得益矩阵给出: (1)有哪些结果是纳什均衡? (2)两厂商合作的结果是什么? 答(1)(低价,高价),(高价,低价) (2)(低价,高价) 13、A、B两企业利用广告进行竞争。若A、B两企业都做广告,在未来销售中, A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B 企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。 (1)画出A、B两企业的支付矩阵。 (2)求纳什均衡。 3. 答:(1)由题目中所提供的信息,可画出A、B两企业的支付矩阵(如下表)。 (2)因为这是一个简单的完全信息静态博弈,对于纯策纳什均衡解可运用划横线法求解。 如果A厂商做广告,则B厂商的最优选择是做广告,因为做广告所获得的利润8大于不做广告获得的利润2,故在8下面划一横线。如果A厂商不做广告,则B厂商的最优选择也是做广告,因为做广告获得的利润为12,而不做广告的利润为6,故在12下面划一横线。 如果B厂商做广告,则A厂商的最优选择是做广告,因为做广告获得的利润20大于不做广告所获得的利润10,故在20下面划一横线。如果B厂商不做 广告,A 厂商的最优选择是不做广告,因为不做广告获得的利润30大于做广告所获得的利润25,故在30下面划一横线。 在本题中不存在混合策略的纳什均衡解,因此,最终的纯策略纳什均衡就是A 、B 两厂商都做广告。 15、求出下面博弈的纳什均衡(含纯策略和混合策略)。 乙 L R 甲 U D 由划线法易知,该矩阵博弈没有纯策略Nash 均衡。 可得如下不等式组 Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1 可得混合策略Nash 均衡((9 8 91,),(7 374,) 16、 某产品市场上有两个厂商,各自都可以选择高质量,还是低质量。相应的利润由如下得益矩阵给出: (1) 该博弈是否存在纳什均衡?如果存在的话,哪些结果是纳什均衡? 参考答案: 由划线法可知,该矩阵博弈有两个纯策略Nash 均衡,即(低质量, 高质量), (高 质量,低质量)。 乙企业 高质量 低质量 甲企业 高质 量 低质 量 该矩阵博弈还有一个混合的纳什均衡 Q=a+d-b-c= -970,q=d-b= -120,R= -1380,r= -630,可得138 63 y ,9712x = = 因此该问题的混合纳什均衡为))138 75 ,13863(),9785,9712((。 17、甲、乙两企业分属两个国家,在开发某种新产品方面有如下收益矩阵表示的博弈关系。试求出该博弈的纳什均衡。如果乙企业所在国政府想保护本国企业利益,可以采取什么措施? 乙企业 开发 不开发 甲企 业 开发 不开 发 解:用划线法找出问题的纯策略纳什均衡点。 ?? ????--0,0100,00,10010,10 所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。 该博弈还有一个混合的纳什均衡(( 111,1110),(11 1 ,1110))。 如果乙企业所在国政府对企业开发新产品补贴a 个单位,则收益矩阵变为: ?? ????++--0,0a 100,00,100a 10,10,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需 a>10。 此时乙企业的收益为100+a 。 18、博弈的收益矩阵如下表: (1)如果(上,左)是占优策略均衡,则a 、b 、c 、d 、e 、f 、g 、h 之间必然满足哪些关系?(尽量把所有必要的关系式都写出来) (2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足? (3)如果(上,左)是占优策略均衡,那么它是否必定是纳什均衡?为什么? (4)在什么情况下,纯战略纳什均衡不存在? 答:(1)e a >,g c >,d b >,h f >。本题另外一个思考角度是从占优策略均衡的定义出发。对乙而言,占优策略为),(),(h d f b >;而对甲而言,占优策略为 ),(),(g e c a >。综合起来可得到所需结论。 (2)纳什均衡只需满足:甲选上的策略时,d b >,同时乙选左的策略时, e a >。故本题中纳什均衡的条件为:d b >,e a >。 (3)占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什 均衡的条件。 (4)当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。 19、Smith 和John 玩数字匹配游戏,每个人选择1、2、3,如果数字相同, John 给Smith 3美元,如果不同,Smith 给John 1美元。 (1)列出收益矩阵。 (2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少? 答:(1)此博弈的收益矩阵如下表。该博弈是零和博弈,无纳什均衡。 (2)Smith 选(1/3,1/3,1/3)的混合概率时, John 选1的效用为:3 1131131)3(31 1-=?+?+-?=U John 选2的效用为:3 1131)3(311312-=?+-?+?=U John 选3的效用为:3 1)3(311311313-=-?+?+?=U 类似地,John 选(1/3,1/3,1/3)的混合概率时, Smith 选1的效用为:3 1)1(31)1(31331'1=-?+-?+?=U Smith 选2的效用为:3 1)1(31331)1(31 '2=-?+?+-?=U Smith 选3的效用为:3 1331)1(31)1(31'3=?+-?+-?=U 因为321U U U ==,'3 '2'1U U U ==,所以: ?? ????)31,31,31(),31,31,31(是纳什均衡,策略值分别为John :31-=U ;Smith :31' =U 。 20、假设双头垄断企业的成本函数分别为:1120Q C =,2222Q C =,市场需求曲线为Q P 2400-=,其中,21Q Q Q +=。 (1)求出古诺(Cournot )均衡情况下的产量、价格和利润,求出各自的反应和等利润曲线,并图示均衡点。 (2)求出斯塔克博格(Stackelberg )均衡情况下的产量、价格和利润,并以图形表示。 (3)说明导致上述两种均衡结果差异的原因。 答:(1)对于垄断企业1来说: 2 19020)](2400max[211 121Q Q Q Q Q Q -= ?-+- 这是垄断企业1的反应函数。 其等利润曲线为:21211122380Q Q Q Q --=π 对垄断企业2来说: 4 502)](2400max[122 2 221Q Q Q Q Q Q -=?-+- 这是垄断企业2的反应函数。 其等利润曲线为:22212242400Q Q Q Q --=π 在达到均衡时,有: ???==?? ?? ?? --=30 80245019021 11Q Q Q Q 均衡时的价格为:180)3080(2400=+?-=P 两垄断企业的利润分别为: 12800802308028038021=?-??-?=π 3600304308023040022=?-??-?=π 均衡点可图示为: (2)当垄断企业1为领导者时,企业2视企业1的产量为既定,其反应函数为: 4/5012Q Q -= 则企业1的问题可简化为: ???==?-????????? ?? -+-3 /803/280204502400max 21 1 111Q Q Q Q Q Q 均衡时价格为:16038032802400=??? ? ?+-=P 利润为:3/392001=π,9/256002=π 该均衡可用下图表示: 企业2领先时可依此类推。 (3)当企业1为领先者时,其获得的利润要比古诺竞争下多。而企业2获得的利润较少。这是因为,企业1先行动时,其能考虑企业2的反应,并以此来制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的产出,这是一种“先动优势” 21、在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q 1-q 2-q 3,这里q i 是企业i 的产量。每一企业生产的单位成本为常数c 。三企业决定各自产量的顺序如下:(1)企业1首先选择q 1≥0;(2)企业2和企业3观察到q 1,然后同时分别选择q 2和q 3。试解出该博弈的子博弈完美纳什均衡。 答:该博弈分为两个阶段,第一阶段企业1选择产量q 1,第二阶段企业2和3观测到q 1后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。 (1)假设企业1已选定产量q 1,先进行第二阶段的计算。设企业2,3的利润函数分别为: 223212cq q )q q q a (----=π 323213cq q )q q q a (----=π 由于两企业均要追求利润最大,故对以上两式分别求一阶条件: 023212 2 =----=??c q q q a q π (1) 0c q 2q q a q 3213 3 =----=?π? (2) 求解(1)、(2)组成的方程组有: 3 c q a q q 1* 3*2--= = (3) (2)现进行第一阶段的博弈分析: 对与企业1,其利润函数为; 113211cq q )q q q a (----=π 将(3)代入可得: 3 ) c q a (q 111--= π (4) 式(4)对q 1求导: 0c q 2a q 11 1 =--=?π? 解得: )c a (2 1 q *1-= (5) 此时,2* 1 )c a (12 1 -=π (3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡: )c a (21q *1-= ,)c a (6 1q q * 3*2-== 25、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍, 市场需求函数为Q=200-P 。 求(1)若两个厂商同时决定产量,产量分别是多少? (2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何? 答:(1)分别求反应函数,180-2Q1-Q2=0,180-Q1-2Q2=0,Q1=Q2=60 (2)200-2Q=20,Q=90,Q1=Q2=45 26、一个工人给一个老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于50 元的负效用,老板想克扣工资则总有借口扣掉60 元工资,工人不偷懒老板有150 元产出,而工人偷懒时老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况双方都知道。请问: (1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示 该博弈并作简单分析。 (2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示该博 弈并作简单分析。 (1)完全信息动态博弈。 博弈结果应该是工人偷懒,老板克扣。 (2)完全信息静态博弈,结果仍然是工人偷懒,老板克扣。 28、给定两家酿酒企业A、B的收益矩阵如下表: 表中每组数字前面一个表示B企业的收益,后一个数字表示B企业的收益。 (1)求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡? (2)存在帕累托改进吗?如果存在,在什么条件下可以实现?福利增量是多少? (3)如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡?如何改变上述A、B企业的收益才能使该博弈不存在均衡? 答:(1)有两个纳什均衡,即(啤酒,白酒)、(白酒,啤酒),都是纳什均衡而不是占优策略均衡。 (2)显然,(白酒,啤酒)是最佳均衡,此时双方均获得其最大收益。若均衡解为(啤酒,白酒),则存在帕累托改善的可能。方法是双方沟通,共同做出理性选择,也可由一方向另一方支付报酬。福利由800+900变为900+1000,增量为200。 (3)如将(啤酒,白酒)支付改为(1000,1100),则(啤酒,白酒)就成为占优策略均衡。比如将(啤酒,白酒)支付改为(800,500),将(白酒,啤酒)支付改为(900,500),则该博弈就不存在任何占优策略均衡或纳什均衡。