博弈论复习题及答案完整版

合集下载

“博弈论”习题及参考答案

《博弈论》习题一、单项选择题1.博弈论中，局中人从一个博弈中得到的结果常被称为（）。

A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容，除了（）。

A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中（）。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中，每一个博弈者努力（）。

A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中，直接决定局中人支付的因素是（）。

A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言，无论对手作何选择，其总是拥有惟一最佳行为，此时的博弈具有（）。

A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作，博弈者就在现期合作；但如果另一个博弈者在前一期违约，博弈者在现期也违约的策略称为（）。

A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中，合作策略会导致（）。

A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候，囚徒困境式博弈均衡最可能实现（）。

A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致，这种策略是一种（）。

A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈，正确的说法是（）。

A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的（）：A. 策略是局中人选择的一套行动计划；B. 参与博弈的每一个局中人都有若干个策略；C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的；D. 策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身。

博弈论考试题及答案

博弈论考试题及答案一、选择题（每题2分，共20分）1. 博弈论中的“囚徒困境”是指什么？A. 两个囚犯相互合作B. 两个囚犯相互背叛C. 两个囚犯中一个合作一个背叛D. 两个囚犯相互猜疑答案：B2. 以下哪个不是博弈论中的基本概念？A. 策略B. 收益C. 公平D. 纳什均衡答案：C3. 在零和博弈中，一个玩家的损失等于另一个玩家的收益，这意味着：A. 总收益为零B. 总收益为正C. 总收益为负D. 总收益不确定答案：A4. 博弈论中的“混合策略”是指：A. 玩家随机选择策略B. 玩家固定选择一种策略C. 玩家根据对手的策略选择策略D. 玩家不使用策略答案：A5. 以下哪个是博弈论中的“完全信息”博弈？A. 拍卖博弈B. 石头剪刀布C. 桥牌D. 信息不对称博弈答案：C6. 博弈论中的“重复博弈”指的是：A. 博弈只进行一次B. 博弈进行多次C. 博弈进行无限次D. 博弈进行有限次但次数未知答案：B7. 以下哪个是博弈论中的“动态博弈”？A. 零和博弈B. 非零和博弈C. 同时博弈D. 顺序博弈答案：D8. 在博弈论中，如果一个策略组合是纳什均衡，那么：A. 每个玩家都有动机单方面改变策略B. 每个玩家都满足于当前策略C. 至少有一个玩家不满意当前策略D. 所有玩家都不满意当前策略答案：B9. 博弈论中的“合作博弈”是指：A. 玩家之间可以形成联盟B. 玩家之间不能形成联盟C. 玩家之间只能通过竞争来获得收益D. 玩家之间只能通过合作来获得收益答案：A10. 以下哪个是博弈论中的“公共知识”？A. 每个玩家的收益函数B. 每个玩家的策略选择C. 每个玩家的偏好D. 每个玩家的个人信息答案：A二、简答题（每题10分，共30分）1. 简述博弈论中的“纳什均衡”概念。

答案：纳什均衡是指在一个博弈中，每个玩家都选择了自己的最优策略，并且没有玩家能够通过单方面改变策略来提高自己的收益。

在纳什均衡状态下，每个玩家的策略是对其他玩家策略的最优反应。

博弈论考试题及答案

博弈论考试题及答案一、单项选择题（每题2分，共20分）1. 博弈论中的“纳什均衡”是由哪位经济学家提出的？A. 亚当·斯密B. 约翰·纳什C. 约翰·梅纳德·凯恩斯D. 弗里德里希·哈耶克答案：B2. 在博弈论中，零和博弈是指：A. 所有参与者的收益总和为零B. 所有参与者的损失总和为零C. 所有参与者的收益和损失总和为零D. 所有参与者的收益总和不为零答案：A3. 以下哪个不是博弈论中的基本概念？A. 参与者B. 策略C. 收益D. 概率答案：D4. 博弈论中的“囚徒困境”说明了什么？A. 合作总是最优的B. 个体理性行为可能导致集体非理性结果C. 个体非理性行为可能导致集体理性结果D. 集体理性行为总是最优的答案：B5. 在博弈论中，完全信息博弈是指：A. 所有参与者对博弈的结构和收益都有完全的了解B. 所有参与者对博弈的结构和收益都没有了解C. 只有部分参与者对博弈的结构和收益有了解D. 参与者对博弈的结构和收益的了解程度不同答案：A6. 博弈论中的“混合策略”是指：A. 参与者在博弈中随机选择策略B. 参与者在博弈中固定选择一种策略C. 参与者在博弈中选择多种策略的组合D. 参与者在博弈中不选择任何策略答案：A7. 以下哪个不是博弈论中的均衡概念？A. 纳什均衡B. 子博弈完美均衡C. 贝叶斯均衡D. 帕累托最优答案：D8. 在博弈论中，如果一个策略组合在给定其他参与者的策略时，没有任何一个参与者能通过单方面改变策略来提高自己的收益，那么这个策略组合被称为：A. 帕累托最优B. 纳什均衡C. 子博弈完美均衡D. 贝叶斯均衡答案：B9. 博弈论中的“承诺”是指：A. 参与者在博弈中做出的不可撤销的决策B. 参与者在博弈中做出的可撤销的决策C. 参与者在博弈中做出的无约束力的声明D. 参与者在博弈中做出的有约束力的声明答案：A10. 在博弈论中，如果一个参与者的策略只依赖于其他参与者的策略，而不考虑其他参与者的收益，那么这个策略被称为：A. 纯策略B. 混合策略C. 贝叶斯策略D. 纳什策略答案：A二、多项选择题（每题3分，共15分）11. 以下哪些是博弈论中的基本要素？A. 参与者B. 策略C. 收益D. 规则E. 信息答案：A, B, C, D, E12. 以下哪些是博弈论中的均衡概念？A. 纳什均衡B. 子博弈完美均衡C. 贝叶斯均衡D. 帕累托最优E. 动态均衡答案：A, B, C, E13. 在博弈论中，以下哪些因素会影响参与者的策略选择？A. 参与者的收益B. 参与者的信息C. 参与者的偏好D. 博弈的结构E. 博弈的历史答案：A, B, C, D, E14. 以下哪些是博弈论中可能的结果？A. 合作B. 竞争C. 混合D. 帕累托最优E. 纳什均衡答案：A, B, C, D, E15. 在博弈论中，以下哪些是动态博弈的特点？A. 参与者的行动有先后顺序B. 参与者的行动同时进行C. 参与者可以观察到其他参与者的行动D. 参与者不能观察到其他参与者的行动E. 参与者的收益只取决于自己的策略答案：A, C, D三、判断题（每题2分，共20分）16. 博弈论只适用于经济领域。

《经济博弈论》期末考试复习题及参考答案

《经济博弈论》期末考试复习题及参考答案一、单项选择题1、博弈论中，参与人的策略有（）A 有限的B 无限的C 有限和无限两种情况D 以上都不对参考答案：C解释：在博弈论中，参与人的策略可以是有限的，也可以是无限的，具体取决于博弈的类型和设定。

2、下列属于完全信息静态博弈的是（）A 囚徒困境B 斗鸡博弈C 市场进入博弈D 以上都是参考答案：D解释：囚徒困境、斗鸡博弈和市场进入博弈都属于完全信息静态博弈。

3、在一个两人博弈中，如果双方都知道对方的策略空间和收益函数，这被称为（）A 完全信息博弈B 不完全信息博弈C 静态博弈D 动态博弈参考答案：A解释：完全信息博弈意味着博弈中的参与人对彼此的策略空间和收益函数都有清晰的了解。

4、占优策略均衡一定是纳什均衡，纳什均衡（）是占优策略均衡。

A 一定B 不一定C 一定不D 以上都不对参考答案：B解释：占优策略均衡是一种更强的均衡概念，占优策略均衡一定是纳什均衡，但纳什均衡不一定是占优策略均衡。

5、对于“囚徒困境”博弈，（）A 双方都独立依照自身利益行事，结果限于最不利的局面B 双方都独立依照自身利益行事，导致最好的选择C 双方进行合作，得到了最好的结果D 以上说法都不对参考答案：A解释：在“囚徒困境”中，每个囚徒都从自身利益出发选择坦白，最终导致双方都受到较重的惩罚，这是一种个体理性导致集体非理性的结果。

二、多项选择题1、以下属于博弈构成要素的有（）A 参与人B 策略C 收益D 信息E 均衡参考答案：ABCDE解释：博弈的构成要素通常包括参与人、策略、收益、信息和均衡等。

参与人是进行博弈的主体；策略是参与人在博弈中可选择的行动方案；收益是参与人采取不同策略所得到的结果；信息是参与人对博弈局面的了解程度；均衡是博弈的稳定状态。

2、常见的博弈类型有（）A 完全信息静态博弈B 完全信息动态博弈C 不完全信息静态博弈D 不完全信息动态博弈参考答案：ABCD解释：这四种博弈类型是根据信息是否完全和博弈的进行时态来划分的。

博弈论复习题及答案

可口可乐与百事可乐（参与者）的价格决策：双方都可以保持价格不变或者提高价格（策略）；博弈的目标和得失情况体现为利润的多少（收益）；利润的大小取决于双方的策略组合（收益函数）；博弈有四种策略组合，其结局是：（1）双方都不涨价，各得利润10单位；（2）可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润-30；（3）可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润30；（4）双方都涨价，可口可乐利润140，百事可乐利润35；画出两企业的损益矩阵求纳什均衡。

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。

如果它们合作，各获得500000元的垄断利润，但不受限制的竞争会使每一方的利润降至60000元。

如果一方在价格决策方面选择合作而另一方却选择降低价格，则合作的厂商获利将为零，竞争厂商将获利900000元。

（1）将这一市场用囚徒困境的博弈加以表示。

（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。

；若新华航空公司选择合作，北方航空公司仍会选择竞争（900000>500000）。

若北方航空公司选择竞争，新华航空公司也将选择竞争（60000>0）；若北方航空公司选择合作，新华航空公司仍会选择竞争（900000>0）。

由于双方总偏好竞争，故均衡结果为两家公司都选择竞争性策略，每一家公司所获利润均为600000元。

12、设啤酒市场上有两家厂商，各自选择是生产高价啤酒还是低价啤酒，相应的利润（单位：万元）由下图的得益矩阵给出：（1）有哪些结果是纳什均衡（2）两厂商合作的结果是什么答（1）（低价，高价），（高价，低价）（2）（低价，高价）13、A、B两企业利用广告进行竞争。

若A、B两企业都做广告，在未来销售中，A企业可以获得20万元利润，B企业可获得8万元利润；若A企业做广告，B企业不做广告，A 企业可获得25万元利润，B企业可获得2万元利润；若A企业不做广告，B企业做广告，A企业可获得10万元利润，B企业可获得12万元利润；若A、B两企业都不做广告，A 企业可获得30万元利润，B企业可获得6万元利润。

博弈论复习题及答案

博弈论题型一：纯策略纳什均衡1、猪圈里有一头大猪和一头小猪，猪圈的一头有一个饲料槽，另一头装有控制饲料供应的按钮。

按一下按钮就会有10个单位饲料进槽，但谁按谁就要付出2个单位的成本。

谁去按按纽则谁后到；都去按则同时到。

若大猪先到，大猪吃到9个单位，小猪吃到一个单位；若同时到，大猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃六个单位，小猪吃4个单位。

各种情况组合扣除成本后的支付矩阵可如下表示（每格第一个数字是大猪的得益，第二个数字是小猪的得益）：小猪按等待大猪按 5，1 4，4等待 9，-1 0，0求纳什均衡。

在这个例子中，我们可以发现，大猪选择按，小猪最好选择等待，大猪选择不按，小猪还是最好选择等待。

即不管大猪选择按还是不按，小猪的最佳策略都是等待。

也就是说，无论如何，小猪都只会选择等待。

这样的情况下，大猪最好选择是按，因为不按的话都饿肚子，按的话还可以有4个单位的收益。

所以纳什均衡是（大猪按，小猪等待）。

题型二：混合策略的纳什均衡2、求出下面博弈的纳什均衡(含纯策略和混合策略)。

乙甲U D 可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1可得混合策略Nash 均衡((9891,),(7374,)据说是去年考了的原题！3、Smith 和John 玩数字匹配游戏，每个人选择1、2、3，如果数字相同， John 给Smith 3美元，如果不同，Smith 给John 1美元。

（1）列出收益矩阵。

（2）如果参与者以1/3的概率选择每一个数字，证明该混合策略存在一个纳什均衡，它为多少？答：（1）此博弈的收益矩阵如下表。

该博弈是零和博弈，无纳什均衡。

（2）Smith 选（1/3，1/3，1/3）的混合概率时，John 选1的效用为：31131131)3(311-=⨯+⨯+-⨯=U John 选2的效用为：31131)3(311312-=⨯+-⨯+⨯=U John 选3的效用为：31)3(311311313-=-⨯+⨯+⨯=U 类似地，John 选（1/3，1/3，1/3）的混合概率时， Smith 选1的效用为：31)1(31)1(31331'1=-⨯+-⨯+⨯=U Smith 选2的效用为：31)1(31331)1(31'2=-⨯+⨯+-⨯=U Smith 选3的效用为：31331)1(31)1(31'3=⨯+-⨯+-⨯=U因为321U U U ==，'3'2'1U U U ==，所以： ⎥⎦⎤⎢⎣⎡)31,31,31(),31,31,31(是纳什均衡，策略值分别为John ：31-=U ；Smith ：31'=U 。

博弈论复习题及答案

可口可乐与百事可乐参与者的价格决策：双方都可以保持价格不变或者提高价格策略；博弈的目标和得失情况体现为利润的多少收益；利润的大小取决于双方的策略组合收益函数；博弈有四种策略组合,其结局是：1双方都不涨价,各得利润10单位；2可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30；3可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30；4双方都涨价,可口可乐利润140,百事可乐利润35；画出两企业的损益矩阵求纳什均衡;9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场;如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元;如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元;1将这一市场用囚徒困境的博弈加以表示;2解释为什么均衡结果可能是两家公司都选择竞争性策略;答：1用囚徒困境的博弈表示如下表：北方航空公司合作竞争合作500000,500000 0,900000新华航空公司竞争900000,0 60000,60000 2如果新华航空公司选择竞争,则北方航空公司也会选择竞争60000>0；若新华航空公司选择合作,北方航空公司仍会选择竞争900000>500000;若北方航空公司选择竞争,新华航空公司也将选择竞争60000>0；若北方航空公司选择合作,新华航空公司仍会选择竞争900000>0;由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元;12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润单位：万元由下图的得益矩阵给出：1有哪些结果是纳什均衡2两厂商合作的结果是什么答1低价,高价,高价,低价2低价,高价13、A、B两企业利用广告进行竞争;若A、B两企业都做广告,在未来销售中,A 企业可以获得20万元利润,B企业可获得8万元利润；若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润；若A企业不做广告,B 企业做广告,A企业可获得10万元利润,B企业可获得12万元利润；若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润;1画出A、B两企业的支付矩阵;2求纳什均衡;3. 答：1由题目中所提供的信息,可画出A、B两企业的支付矩阵如下表;2因为这是一个简单的完全信息静态博弈,对于纯策纳什均衡解可运用划横线法求解;如果A厂商做广告,则B厂商的最优选择是做广告,因为做广告所获得的利润8大于不做广告获得的利润2,故在8下面划一横线;如果A厂商不做广告,则B 厂商的最优选择也是做广告,因为做广告获得的利润为12,而不做广告的利润为6,故在12下面划一横线;如果B厂商做广告,则A厂商的最优选择是做广告,因为做广告获得的利润20大于不做广告所获得的利润10,故在20下面划一横线;如果B厂商不做广告,A 厂商的最优选择是不做广告,因为不做广告获得的利润30大于做广告所获得的利润25,故在30下面划一横线;在本题中不存在混合策略的纳什均衡解,因此,最终的纯策略纳什均衡就是A、B两厂商都做广告;假定两家企业A与B之间就做广告与不做广告展开博弈,它们的报酬矩阵如下：企业B 做广告不做广告企业 A 做广告 100,100 300,0 不做广告 0,300 200,200 1、这是不是一个“囚犯的困境” 2、如果该对局只进行一次,其纳什均衡是什么 3.、如果博弈是重复的,但我们不考虑无限次的情形,假设只进行10次对局;再假定企业A 采取的是“以牙还牙”的策略,并在第一次对局中不做广告,企业B 也将采取“以牙还牙”的策略;对企业B,考虑两种不同的情况：在第一次做广告或第一次不做广告,分别计算这两种情况下企业B 的累计利润,试问企业 B 将如何行动1、是囚徒困境;虽然两人都不做广告都能获得较高的收益,但是两人为了各自的利益而不是整体的利益考虑时都会选择做广告;2、企业B 做广告时,企业A 做广告的收益100大于不做广告的收益0；企业B 不做广告时,企业A 做广告的收益300大于不做广告的收益,所以对于企业A 做广告时它的严格优势策略,企业B 同理,即无论对方选择什么策略,做广告都是对自己最好的策略;该博弈的纳什均衡结果是两企业都选择做广告,双方各获利100,局中人单独改变策略没有好处;3、假如B 在第一次做广告,则B 获利300A 获利为0,企业A 采取“以牙还牙”的策略在第二次对局中也做广告,则两者的获利各为100,因为企业A 已经做广告此时企业B 不能以降低利润为代价不做广告,所以企业B 累计利润300+1009=1200；企业B 第一次不做广告,在理性人的假设下两者在今后会出现追求私利的现象,有限次数的重复博弈不能改变囚徒困境原来的均衡结果,企业B 的累计利润可能为200+1009=1100;16、某产品市场上有两个厂商,各自都可以选择高质量,还是低质量;相应的利润由如下得益矩阵给出：1 该博弈是否存在纳什均衡如果存在的话,哪些结果是纳什均衡参考答案：由划线法可知,该矩阵博弈有两个纯策略Nash 均衡,即低质量, 高质量, 高质量,低质量;乙企业高质量低质量甲企业高质量低质量该矩阵博弈还有一个混合的纳什均衡Q=a+d-b-c= -970,q=d-b= -120,R= -1380,r= -630,可得13863y ,9712x == 因此该问题的混合纳什均衡为))13875,13863(),9785,9712((;17、甲、乙两企业分属两个国家,在开发某种新产品方面有如下收益矩阵表示的博弈关系;试求出该博弈的纳什均衡;如果乙企业所在国政府想保护本国企业利益,可以采取什么措施乙企业开发不开发甲企业开发不开发解：用划线法找出问题的纯策略纳什均衡点;⎥⎦⎤⎢⎣⎡--0,0100,00,10010,10所以可知该问题有两个纯策略纳什均衡点开发,不开发和不开发,开发; 该博弈还有一个混合的纳什均衡111,1110,111,1110; 如果乙企业所在国政府对企业开发新产品补贴a 个单位,则收益矩阵变为：⎥⎦⎤⎢⎣⎡++--0,0a 100,00,100a 10,10,要使不开发,开发成为该博弈的唯一纳什均衡点,只需a>10;此时乙企业的收益为100+a ;18、博弈的收益矩阵如下表：1如果上,左是占优策略均衡,则a 、b 、c 、d 、e 、f 、g 、h 之间必然满足哪些关系尽量把所有必要的关系式都写出来2如果上,左是纳什均衡,则1中的关系式哪些必须满足3如果上,左是占优策略均衡,那么它是否必定是纳什均衡为什么4在什么情况下,纯战略纳什均衡不存在答：1e a >,g c >,d b >,h f >;本题另外一个思考角度是从占优策略均衡的定义出发;对乙而言,占优策略为),(),(h d f b >；而对甲而言,占优策略为),(),(g e c a >;综合起来可得到所需结论;2纳什均衡只需满足：甲选上的策略时,d b >,同时乙选左的策略时,e a >;故本题中纳什均衡的条件为：d b >,e a >;3占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件;4当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在;19、Smith 和John 玩数字匹配游戏,每个人选择1、2、3,如果数字相同, John 给Smith 3美元,如果不同,Smith 给John 1美元; 1列出收益矩阵;2如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少答：1此博弈的收益矩阵如下表;该博弈是零和博弈,无纳什均衡;2Smith 选1/3,1/3,1/3的混合概率时, John 选1的效用为：31131131)3(311-=⨯+⨯+-⨯=U John 选2的效用为：31131)3(311312-=⨯+-⨯+⨯=U John 选3的效用为：31)3(311311313-=-⨯+⨯+⨯=U 类似地,John 选1/3,1/3,1/3的混合概率时, Smith 选1的效用为：31)1(31)1(31331'1=-⨯+-⨯+⨯=U Smith 选2的效用为：31)1(31331)1(31'2=-⨯+⨯+-⨯=U Smith 选3的效用为：31331)1(31)1(31'3=⨯+-⨯+-⨯=U因为321U U U ==,'3'2'1U U U ==,所以： ⎥⎦⎤⎢⎣⎡)31,31,31(),31,31,31(是纳什均衡,策略值分别为John ：31-=U ；Smith ：31'=U ;20、假设双头垄断企业的成本函数分别为：1120Q C =,2222Q C =,市场需求曲线为Q P 2400-=,其中,21Q Q Q +=;1求出古诺Cournot 均衡情况下的产量、价格和利润,求出各自的反应和等利润曲线,并图示均衡点;2求出斯塔克博格Stackelberg 均衡情况下的产量、价格和利润,并以图形表示;3说明导致上述两种均衡结果差异的原因; 答：1对于垄断企业1来说：219020)](2400max[211121Q Q Q Q Q Q -=⇒-+- 这是垄断企业1的反应函数;其等利润曲线为：21211122380Q Q Q Q --=π 对垄断企业2来说：4502)](2400max[1222221Q Q Q Q Q Q -=⇒-+- 这是垄断企业2的反应函数;其等利润曲线为：22212242400Q Q Q Q --=π 在达到均衡时,有：⎩⎨⎧==⇒⎪⎭⎫ ⎝⎛--=308024501902111Q Q Q Q 均衡时的价格为：180)3080(2400=+⨯-=P 两垄断企业的利润分别为：12800802308028038021=⨯-⨯⨯-⨯=π3600304308023040022=⨯-⨯⨯-⨯=π均衡点可图示为：2当垄断企业1为领导者时,企业2视企业1的产量为既定,其反应函数为：4/5012Q Q -=则企业1的问题可简化为：⎩⎨⎧==⇒-⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛-+-3/803/280204502400max 211111Q Q Q Q Q Q均衡时价格为：16038032802400=⎪⎭⎫⎝⎛+-=P 利润为：3/392001=π,9/256002=π 该均衡可用下图表示：企业2领先时可依此类推;3当企业1为领先者时,其获得的利润要比古诺竞争下多;而企业2获得的利润较少;这是因为,企业1先行动时,其能考虑企业2的反应,并以此来制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的产出,这是一种“先动优势”21、在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q 1-q 2-q 3,这里q i 是企业i 的产量;每一企业生产的单位成本为常数c;三企业决定各自产量的顺序如下：1企业1首先选择q 1≥0；2企业2和企业3观察到q 1,然后同时分别选择q 2和q 3;试解出该博弈的子博弈完美纳什均衡;答：该博弈分为两个阶段,第一阶段企业1选择产量q 1,第二阶段企业2和3观测到q 1后,他们之间作一完全信息的静态博弈;我们按照逆向递归法对博弈进行求解;1假设企业1已选定产量q 1,先进行第二阶段的计算;设企业2,3的利润函数分别为：223212cq q )q q q a (----=π 323213cq q )q q q a (----=π由于两企业均要追求利润最大,故对以上两式分别求一阶条件：0232122=----=∂∂c q q q a q π 10c q 2q q a q 32133=----=∂π∂ 2 求解1、2组成的方程组有：3cq a q q 1*3*2--== 3 2现进行第一阶段的博弈分析：对与企业1,其利润函数为； 113211cq q )q q q a (----=π 将3代入可得：3)c q a (q 111--=π 4式4对q 1求导：0c q 2a q 111=--=∂π∂ 解得：)c a (21q *1-=5 此时,2*1)c a (121-=π 3将式5代回3和4有该博弈的子博弈完美纳什均衡：)c a (21q *1-=,)c a (61q q *3*2-==25、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍, 市场需求函数为Q=200-P;求1若两个厂商同时决定产量,产量分别是多少2若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何答：1分别求反应函数,180-2Q1-Q2=0,180-Q1-2Q2=0,Q1=Q2=60 2200-2Q=20,Q=90,Q1=Q2=4526、一个工人给一个老板干活,工资标准是100元;工人可以选择是否偷懒,老板则选择是否克扣工资;假设工人不偷懒有相当于 50 元的负效用,老板想克扣工资则总有借口扣掉60 元工资,工人不偷懒老板有 150 元产出,而工人偷懒时老板只有 80元产出,但老板在支付工资之前无法知道实际产出,这些情况双方都知道;请问：1如果老板完全能够看出工人是否偷懒,博弈属于哪种类型用得益矩阵或扩展形表示该博弈并作简单分析;2如果老板无法看出工人是否偷懒,博弈属于哪种类型用得益矩阵或扩展形表示该博弈并作简单分析;1完全信息动态博弈;博弈结果应该是工人偷懒,老板克扣;2完全信息静态博弈,结果仍然是工人偷懒,老板克扣;28、给定两家酿酒企业A、B的收益矩阵如下表：A企业白酒啤酒白酒700,600 900,1000 B企业啤酒800,900 600,800 表中每组数字前面一个表示B企业的收益,后一个数字表示B企业的收益;1求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡2存在帕累托改进吗如果存在,在什么条件下可以实现福利增量是多少3如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡如何改变上述A、B企业的收益才能使该博弈不存在均衡答：1有两个纳什均衡,即啤酒,白酒、白酒,啤酒,都是纳什均衡而不是占优策略均衡;2显然,白酒,啤酒是最佳均衡,此时双方均获得其最大收益;若均衡解为啤酒,白酒,则存在帕累托改善的可能;方法是双方沟通,共同做出理性选择,也可由一方向另一方支付报酬;福利由800+900变为900+1000,增量为200;3如将啤酒,白酒支付改为1000,1100,则啤酒,白酒就成为占优策略均衡;比如将啤酒,白酒支付改为800,500,将白酒,啤酒支付改为900,500,则该博弈就不存在任何占优策略均衡或纳什均衡;30、在纳税检查的博弈中,假设A为应纳税款,C为检查成本,F是偷税罚款,且C<A+F；S为税务机关检查的概率,E为纳税人逃税的概率；不存在纯战略纳什均衡;1写出支付矩阵;2分析混合策略纳什均衡;答：1该博弈的支付矩阵如下表：2先分析税收检查边际：因为S为税务机关检查的概率,E为纳税人逃税的概率;给定E,税收机关选择检查与否的期望收益为：CAEFECAEFCAEK-+=--++-=)1)(()(),1()1()1(),0(EAEAEEK-+-+⨯=解),0(),1(EKEK=,得：)/(FACE+=;如果纳税人逃税概率小于E,税收机关的最优决策是不检查,否则是检查;再分析逃税边际：给定S,纳税人选择逃税与否的期望收益是：SFASSFASK)()1()()1,(+-=-⨯+--=ASAASSK-=--+-=)1)(()0,(解)0,()1,(SKSK=,得：)/(FAAS+=;即如果税收机关检查的概率小于S,纳税人的最优选择是逃税,否则是交税;因此,混合纳什均衡是S,E,即税收机关以S的概率查税,而纳税人以E的概率逃税;34、假设古诺的双寡头模型中双寡头面临如下一条线性需求曲线：P=30-Q其中Q为两厂商的总产量,即Q=Q1+Q2;再假设边际成本为零,即MC1=MC2=0解释并讨论此例的纳斯均衡,为什么其均衡是一种囚徒困境;厂商1的总收益TR1由下式给出：厂商1的边际收益MR1为：MR1=30-2Q1-Q2利用利润最大化条件MR1=MC1=0,得厂商1的反应函数reaction function或反应曲线为：Q 1=15-0.5Q26-12121111QQQQ30Q)Q30(PQTR--=-==2 121111Q QQQ30Q)Q30(PQTR--=-==同理可得厂商2的反应曲线为：Q 2=15-0.5Q16-2均衡产量水平就是两反应曲线交点Q1和Q2的值,即方程组6-1和6-2的解;可以求得古诺均衡时的均衡产量水平为：Q1=Q2=10;因此,在本例中,两个寡头的总产量Q为Q1+Q2=20,均衡价格为P=30-Q=10;刚才我们讨论了两寡头厂商相互竞争时的均衡产量;现在我们放松第6条不能串谋的假设,假定两寡头可以串谋;它们能共同确定产量以使总利润最大化;这时,两厂商的总收益TR为：TR=PQ=30-=30Q-Q2其边际收益MR为：MR=30-2Q根据利润最大化条件MR=MC=0,可以求得当Q=15时总利润最大;如果两厂商同意平分利润,每个寡头厂商将各生产总产量的一半,即Q1=Q2=7.5;其实,任何相加为15的产量Q1和Q2的组合都使总利润最大化,因此,把Q1+Q2=15称为契约曲线,而Q 1=Q2=7.5是契约曲线上的一个点;我们还可以求得当价格等于边际成本时,Q1=Q2=15,各厂商的利润为零;35、两家电视台竞争周末黄金时段晚8点到10点的收视率,可选择把较好的节目放在前面还是后面;他们决策的不同组合导致收视率如下：1如果两家是同时决策,有纳什均衡吗有前面,后面2如果双方采用规避风险的策略,均衡的结果是什么此题应用的思想是最大最小收益法：也就是说,在对手采取策略时,所获得的最小收益中的最大值;电视台1：对方采取前面战略的最小收益为18对方采取后面战略的最小收益为16固电视台1 会选择收益为18的战略——前面电视台2：前面的策略是一个优超策略——前面策略均衡为前面,前面3如果电视台1先选择,结果有什么若电视台2先选择呢4如果两家谈判合作,电视台1许诺将好节目放在前面,这许诺可信吗结果能是什么电视台1 许诺将好节目放在前面的许诺不可信; 因为电视台2,前面为占优策略,而在电视台2 ,选择前面的时候,电视台1 选择后面的收益要大于前面的收益; 所以,最终结果为前面,后面36、如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ;试问δ应满足什么条件,才存在子博弈完美纳什均衡参考答案：由划线法求得该博弈的纯策略纳什均衡点为不坦白,不坦白,均衡结果为1,1,采用触发策略,局中人i 的策略组合s 的最好反应支付)s ,s (P max )s (i i i S s i ii -∈=φ=5,P i s=4,P i s c=1;若存在子博弈完美纳什均衡,必须满足：411545)s (P )s ()s (P )s (c i *i *i *i =--=-φ-φ≥δ,即只有当贴现因子δ>1/4时,才存在子博弈完美纳什均衡;37、在Bertrand 价格博弈中,假定有n 个生产企业,需求函数为P=a-Q,其中P 是市场价格,Q 是n 个生产企业的总供给量;假定博弈重复无穷多次,每次的价格都立即被观测到,企业使用“触发策略”一旦某个企业选择垄断价格,则执行“冷酷策略”;求使垄断价格可以作为完美均衡结果出现的最低贴现因子δ是多少;并请解释δ与n 的关系;分析：此题可分解为3个步骤1n个企业合作,产量总和为垄断产量,价格为垄断价格,然后平分利润;2其中一个企业采取欺骗手段降价,那个这家企业就占有的全部市场,获得垄断利润3其他企业触发战略,将价格降到等于边际成本,所有的企业利润为零;参考答案：1设每个企业的边际成本为c,固定成本为0P=a-QTR=PQ=a-MR=a-2Q因为：MR=MCa-2Q=c则:Q=a-c/2P=a+c/2π=P-cQ=a-c2/4每家企业的利润为a-c2/4n2假设A企业自主降价,虽然只是微小的价格调整,但足以占领整个市场 ,获得所有的垄断利润——a-c2/43其他企业在下一期采取冷酷策略,使得所有企业的利润为0考虑：A企业不降价： a-c2/4n, a-c2/4n, ……A企业降价： a-c2/4, 0, ……使垄断价格可以作为完美均衡结果,就要使得不降价的贴现值大于等于降价的贴现值;设贴现因子为δA 不降价的贴现值： a-c2/4n1/1- δ A 降价的现值： a-c2/4 于是：a-c2/4n1/1- δ≥ a-c2/4 解得： δ≥1-1/n一、若你正在考虑收购一家公司的一万股股票,卖方的开价是2元/股;根据经营情况的好坏,该公司股票的价值对你来说有1元/股和5元/股两种可能,但只有卖方知道经营的真实情况,你只知经营好、坏的概率各为0.5;如果公司经营不好时,卖方做到使你无法识别真实情况的“包装”费为5万元,你是否会按卖方的价格买下这些股票如果“包装”费仅为0.5万元,你会如何选择答：当卖方使买房无法识别真实情况的包装费为5万元时,买方的股票价值期望值为 E=0.5 ×﹙1-5﹚+0 .5×5=0.5元/股在这种情况下,无法接受卖方给出的价格当卖方的包装费为0.5万元时,买方的股票价值期望值为E=0.5 ×﹙1-0.5﹚+0 .5×5=2.75元/股在这种情况下,接受卖方给出的价格二、现实生活中常常是既有部分卖假冒伪劣产品的厂商会打出“质量三包”、“假一罚十”等旗号,也有一些卖假冒伪劣产品的厂商声明“售出商品概不退换”;问这两类厂商有什么不同,他们各自战略的根据是什么答：第一类厂商实行战略的根据是：“最大最小战略”,根据无限次重复博弈中的子博弈精炼纳什均衡实际上是参与人相互合作的结果,要使合作成功,其战略中必须要有惩罚措施;所谓最小最大战略是指当违规者不采取合作行为而对他进行惩罚时,违规者可能得到的最严厉的制裁的战略;第二类厂商采取战略的根据是：“冷酷战略”,任何为了短期利益的背叛行为的所得对长期利益而言都是微不足道的,且会遭到对方一直背叛的冷酷打击,故参与人有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的背叛行为;三、在有两个投标者的暗标拍卖中,投标者的估价独立分布于0,1且两人的估价相同,则贝叶斯纳什均衡是什么博弈的结果是什么如果两投标者知道他们的估价是相同的,结果会发生什么变化解：两个人投标人为i,j,投标者i 的支付如下：最终解得,拍卖的对称贝叶斯均衡战略为∶同理可得,对投标人j 也可得到相同的结论⎪⎩⎪⎨⎧<=->-=ji j i i i ji i i i j i i s s s s s s s s s s u ,0,)(),(θθθ；2/*i i s θ=即,在只有两个投标人时,这个博弈的贝叶斯均衡是,每个投标人的出价是其实际价值的一半; 如果两个投标者知道他们的估价相同,即信息是完全的,买者之间的竞争将使卖者得到买者价值的全部;在一个长长的沙滩上,姑且将沙滩的长度定为 1,有许多游泳和享受日光浴的游客,平均分布在这个沙滩上; 张三和李四在沙滩上卖矿泉水, 假设每个游客只到离自己最近的摊位购买且仅购买一瓶矿泉水;现在,将沙滩的左端尽头定为 0,那么沙滩的右边就是 1,请问张三和李四应当如何布置他们的矿泉水摊才可以最大化自己的销售量2/*j j s θ=两次重复下面这个得益矩阵表示的两人静态博弈;问能否有一个精炼纳什均衡战略组合,实现第一阶段的得益是4,4 如能,给出双方的战略,如不能,证明为什么不能;如果战略组合x3,y1的得益改为1,5,会发生什么变化,至少能在部分阶段实现4,4的条件是什么答：1该博弈有两个纯战略纳什均衡X1,Y1X2,Y2,支付函数分别为3,1和1,2,但对双方均有利的战略组合X3,Y3不是纳什均衡,因此在一次博弈中不可能出现;2采用“触发战略”,即首先试探合作,如果对方合作,则给予奖励；如果对方不合作,则给予惩罚;我们先假设这种触发策略可行,则第一阶段合作两方的策略为X3,Y3,支付为4,4,第二阶段合作双方的策略为X1,Y1或X2,Y2,此时支付分别为3,1和1,2达到纳什均衡;采用触发战略的两个参与人的战略是：参与人X的战略：第一次选X3,则参与人Y为了收益最大必定会选择Y3,此时的策略为X3,Y3;在种情况下,Y的收益总和分别为4+2=6或4+1=5参与人Y的战略：第一次选择Y3,如果第一次的结果是X3, Y3,则第二次选择Y1,相当于参与人给X第一次采取合作态度的奖励；如果参与人X在第一次选择X1,则第二次选择Y2,相当于给参与人X在第一次选择不合作态度给予惩罚;这两种情况下X的收益总和分别为：4+3=7 5+1=6选择合作可以使得X两次收益总和最大,所以X会选择合作;3综上所述,存在着精炼的纳什均衡使得第一个阶段的得意时4,44若战略组合x3,y1的得益改为1,5,即支付矩阵如下：此时,采用触发战略的两个参与人的战略是：参与人X的战略：第一次选X3,若参与人为了收益最大会Y1,此时的策略为X3,Y1,则X在第二阶段选X1以报复Y,在种情况下,Y的收益总和分别为5+1=6；若Y 选择合作,则第一阶段策略组合为X3,Y3,参与人X第二将诶段选择X1以对Y进行报复,此时参与人Y两阶段的收益总和为4+1=5,小于不合作时的收益总和,因此参与人Y不会选择合作,而会选择不合作;参与人Y的战略：第一次选择Y3,如果第一次的结果是X3, Y3,则第二次选择Y1,相当于参与人给X第一次采取合作态度的奖励；如果参与人X在第一次选择X1,则第二次选择Y2,相当于给参与人X在第一次选择不合作态度给予惩罚;这两种情况下X的收益总和分别为：4+3=7 5+1=6,选择合作可以使得X两次收益总和最大,所以X会选择合作;与未改变前情况相同因此,实现第一阶段得益4,4的精炼纳什均衡战略组合不存在;5至少能在部分阶段实现4,4的条件是：设x3,y1的得益改为1,a,则有a+1<5,即a<4;。

博弈论复习题及答案

的知识；支付(payoff)函数
是参与人从博弈中获得的效用水平，它是所有参与人策略或行动的函数，是每个参与人很关心的东西；结果(outcome) 是指博弈分析者感兴趣的要素的集合，常用支付矩阵或收益矩阵来表示；均衡(equilibrium) 是所有参与人的最优策略或行动的组合。静态博弈指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动；动态博弈指参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。博弈就是一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。零和博弈：也称“严格竞争博弈”。博弈方之间利益始终对立，偏好通常不同变和博弈：零和博弈和常和博弈以外的所有博弈。合作利益存在，博弈效率问题的重要性。完全信息静态博弈
l已知q1ac在前面我们分析同时行动的古诺博弈中得出的r2q1和上式完全一致两者的不同之处在于这里的r2q1是企业2对企业1已观测到的产量的真实反应而在古诺的分析中r2q1是企业2对假定的企业1的产量的最优反应且企业1的产量选择是和企业2同时作出的
博弈论
判断题（每小题1分，共15分）
囚徒困境说明个人的理性选择不一定是集体的理性选择。（√ ）子博弈精炼纳什均衡不是一个纳什均衡。（× ）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（ ×）纳什均衡一定是上策均衡。（× ）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√ ）在博弈中纳什均衡是博弈双方能获得的最好结果。（× ）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（× ）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】一、名词解释（每题7分，共28分）1、逆向选择：逆向选择源于事前的信息不对称，经典例子就是“柠檬市场”——二手车市场，它使得市场资源逐渐流向低质量的产品或要素，最后形成劣货驱逐良货的局面，这种现象称之为“逆向选择”。

2、策略互动：所谓策略互动，就是参与人之间的策略相互影响、相互作用和相互制约。

用策略性思维来分析问题，从中找出合理策略，实现目标最优。

3、纳什均衡：对于博弈方而言，互为最优的策略选择就是纳什均衡。

4、信号发送：是指信息优势方不断发出信息的行为，就叫信号发送。

5、博弈论：研究人们如何进行决策，以及这种决策如何达到均衡（合理策略）的问题。

每个博弈者在决定采取何种行动时，不但要根据自身的利益和目的行事，还必须考虑到他的决策行为对其他人的可能影响，以及其他人的反应行为的可能后果，通过选择最佳行动计划，来寻求收益或效用的最大化。

二、简要回答问题（每题10分，共40分）1、博弈的基本要素有哪些?基本特点是什么？答：博弈的基本要素有：参与人、策略、行动顺序、信息、收益等五个要素。

博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响，并从中选择出对自身最有利的方案决策，从而达到收益和效用最大化。

2、什么是性别战博弈？请求出其中的纳什均衡？答：性别战博弈是不可调和的博弈，双方只有一方选择满足另外一方的要求才能达成均衡，也就是混合策略纳什均衡；故性别战博弈的纳什均衡会有两种情况，分别是：男生陪女生看电影以及女生陪男生看足球的两种选择。

3、猎鹿博弈反映的基本思想是什么？答：反应的基本思想是需要沟通和互相协调，因为只有合作才能猎到所需猎物。

4、什么是道德风险？有什么办法可以解决道德风险问题？答：道德风险是指委托-代理框架中，由于委托人无法直接观察代理人行动，造成信息不对称，从而出现代理人选择不利于委托人的行为的一种现象；解决道德风险的方法可以用签订合同、派人监督，以及采用激励等方式来进行解决，约束和激励机制。

三、计算题（16分）1、求解下列博弈中的纳什均衡（包括混合策略纳什均衡）。

F 2 B 2F 1B 1略的纳什均衡：分别是H 选择F1和N 选择F2，以及H 选择B1和N 选择B22、A 、B 两者博弈：A 首先行动，可以选择“左”或者“右”的行动；B 后行动，有“L ”和“R ”的行动，其收益如下：当A 选左，B 选L 时，A 的收益为2 ，B 的收益为3；当A 选左，B 选R 时，A 的收益为1 ，B 的收益为4；当A 选右，B 选L 时，A 的收益为3 ，B 的收益为1；当A 选右，B 选R 时，A 的收益为0 ，B 的收益为2。

请画出该博弈的博弈树，并求出该博弈的均衡解。

四、论述题（16分）1、请结合你的工作或生活，谈谈对行动的可信性的理解，有什么方法可以建立可信的策略行动。

答：每一种策略性行动都面临着可信性的问题，人们不一定相信策略性行动的提出者会实施其行动。

因此提出者必须做一些辅助工作让人相信他会在第二阶段实施他已宣布的事。

比如，工作中管理者对员工上班时间玩游戏的态度有所不同。

一些管理者对员工很宽容，并不惩罚玩游戏的员工。

另一些管理者则十分严厉，会处罚玩游戏的员工。

一些管理者虽然说了会处罚的承诺，但禁不住员工的好话及其它员工的求情，就原谅了员工。

从博弈论角度分析，假设三种管理者手下的员工各方面都相同，哪一种管理者将得到最高的支付呢？管理者NH对玩游戏的态度可以是“处罚”或“原谅”，员工可以“玩游(4,3)，最不好的结果就是(1,1);余下的两个策略，因管理者希望员工不玩游戏，故(3,2)好于(2,4)。

员工最喜欢(4,3),最不好的结果也是(1,1)，余下的，员工(2,4)好于(3,2)。

在此博弈中，若同时行动，或者是管理者后行动，与处罚带来的1和3的支付相比，原谅能带来2和4，是占优策略。

此时，员工则会选择玩游戏。

最终，均衡的结果是（2,4）。

而如果管理者一开始就承诺“处罚”的话，员工会发现不玩游戏会更好，于是管理者得到了支付3。

但是如果有员工曾被管理者原谅，可能他就会认为管理者心软，不相信管理者做出的“处罚”承诺，从而玩游戏。

此时，就会得到一个最坏的结果，即（处罚，玩游戏），其支付仅为（1,1）。

通过采取某种行动，改变博弈以得到更好的结果，这就是策略行动。

策略行动分：承诺、威胁及许诺。

这三种策略性行动最重要的，是必须让博弈的其他参与人相信策略性行动的提出者在第二阶段中确实会做其在第一阶段中宣布的事。

而在此每一种策略行动都面临着可信性的问题，人们不一定相信策略行动的提出者会实施其行动。

因此仅仅宣布是不够的。

在第一阶段，提出者必须做一些辅助工作让人相信其会在第二阶段做已宣布的事。

上述博弈中涉及的是管理者对玩游戏员工“处罚”态度的承诺。

在这个事件中，管理者为了从策略行动中获得好处，他所做的承诺不能和同时行动博弈的均衡策略一样，因此管理者选择了“处罚”的承诺，这个策略行动改变了员工的期望和行动。

一旦员工相信这种承诺，则他们会不玩游戏，从而得到（3，2）的支付。

如果员工们尝试玩一次游戏，管理者可能会原谅他们，理由是“只此一次”，这里就存在了使策略性行动不付诸实践的诱惑，使得承诺的可信性下降。

如果最终员工不再相信“处罚”的承诺，则他们会玩游戏，从而最终管理者和员工只得到（1,1）的支付，双方利益均受损。

这就是管理者铁石心肠的原因。

因为他清楚破例原谅员工一次的危险性。

因此，管理者需要做一些事情来确立他策略行动的可信性，即让其他参与人相信他们的行动如违背你的承诺，你将一定会付诸实践，而不会因人情等引诱而放弃。

避免危险的办法通常只有一个，那就是绝不越雷池半步。

并且管理者们需要找到某些方法使其的拒绝合理可信，同时提高其策略行动的可信性。

第一、通过减少未来行动的自由，排除引诱行动，只能实施策略行动中所确定的行动。

例如，管理者可以拿规章制度或工作纪律做挡箭牌，这些制度纪律一旦制定则个别管理者就不能在任何特殊情况下破例。

这样做，就等于将“原谅”行动从他们的选择组合中剔除了，因此他只能实施“处罚”的承诺。

规则的存在让员工相信管理者不可能再改变想法，所以此时管理者“处罚”的承诺就是可信的了。

第二、改变未来的支付，减少引诱行动的支付使实施策略行动成为最佳行动。

管理者可以通过几次毫不让步的处罚建立起严厉的声誉，虽然毫不让步的处罚可能不是一件愉快的事，也可能违背管理者的本意，但这在漫长的工作生涯中是有好处的。

因为如果一个管理者被认为非常严厉，就没有员工想用借口搪塞他，而他也就减少了拒绝员工的不愉快。

如果管理者在一个博弈里未能兑现他的承诺，他的声誉将受到损害，这也就导致他在其他的博弈里得到低的支付。

由此观之，提高策略行动的可信性将有助于提高策略性博弈中获得的支付。

因此，学会运用坚守原则、提高声誉等方法增强自己行为的可信性，能帮助我们在今后的生活中选择最佳行为，获得更高的收益。

2、中国的外交政策一贯坚持和平外交，因此，中国一直不断裁军，但中国同时也拥有一定数量的核武器。

请用所学的博弈理论分析这一现象。

答：以博弈论着名的案例“囚徒困境”为例：警察抓到两个纵火案犯罪嫌疑人，然后将它们隔离关押起来，并要求他们坦白交代。

假定：如果两人都承认纵火，每人将被判刑3年；如果都不承认，每人将被判刑1年；如果一个不承认而另一个坦白并作证，那么抵赖者将被判刑5年，坦白者将被释放。

这两个囚徒将做出怎样的选择呢？显然，在以上假定中，最好的结果是双方都选择抵赖，结果是大家都只被判刑1年。

但是，由于两个囚徒在理论上都是从利已的目的出发进行决策的所谓“理性行为者”，在无法获取对方的完全信息并给予对方充分信任的情况下，每一个人大概都会选择似乎对自己最有利的策略，即选择坦白。

出现了个体理性（都选择坦白，各被判3年）与集体理性（都不承认，各被判1年）的冲突。

国与国之间的扩军、裁军也是这样一种“囚徒困境”，在双方信息沟通不畅的情况下，就会导致双方不能达成合作，一国的个体理性导致了国与国之间的集体非理性，没有实现相互之间的利益最大化。

我国一贯坚持和平外交，同时拥有一定数量的核武器，并且承诺不首先使用核武器，这就避免为了达到先发制人的目的，而不得不投巨资花大钱在军备上以确保己方克敌制胜的能力。

我国这样的核战略，一方面降低了我国在其他核大国眼中威胁，另一方面保证我们可以把更多的钱用在社会经济建设和综合国力提升上。

有了最低限度核威慑战略（一报还一报的最优策略）的保障，再通过充分的信息沟通，就可以打破国与国之间在军备竞赛中的囚徒困境。

以中美、中俄为例，我们主动释放善意，不断裁军，同时，着力提升我国综合国力，加大中美、中俄双边经济、社会、文化、军事方面的交流沟通，使得博弈双方认识到博弈的各种可能结果，从而超越“你死我活”的“零和对局”，而实现“双赢”乃至于“多赢”，进而实现集体理性。

3、我们经常在报纸上看到很多企业（比如家电企业）经常希望建立价格联盟，但往往是无功而返。

即使价格联盟成立了，也很快就破裂了。

请用囚徒困境的思想进行解释。

有什么办法可以让联盟达成。

答：假设两囚徒被指控是一宗罪案的同案犯。

他们被分别关在不同的牢房无法互通信息。

各囚徒都被要求坦白罪行。

如果两囚徒都坦白，各将被判入狱5年；如果两人都不坦白，两囚徒可以期望被从轻发落入狱2年；如果一个囚徒坦白而另一个囚徒不坦白，坦白的这个囚徒就只需入狱1年，而不坦白的囚徒将被判入狱10年。

囚徒困境的策略矩阵表。

每个囚徒都有两种策略：坦白或不坦白。

通过划线法可知：在囚徒困境这个模型中，纳什均衡就是双方都“坦白”。

给定甲坦白的情况下，乙的最优策略是坦白；给定乙坦白的情况下，甲的最优策略也是坦白。

这里双方都坦白不仅是纳什均衡，而且是一个上策均衡，即不论对方如何选择，个人的最优选择是坦白。

其结果是双方都坦白。

市场上的价格战也是一场囚徒博弈，在国内的家电大战中，虽然不是两个对手之间的博弈，但由于在众多对手当中每一方的都很大，每一个主体人的行为后果受对手行为的影响都很大，因此，其情景大概也是如此。

如果清楚这种前景，双方勾结或合作起来，都制定比较高的价格，那么双方都可以因为避免价格大战而获得较高的利润。

但是往往这些联盟处于利益驱动的“囚徒困境”，各个厂商为了追求自身的市场份额，都有背叛价格联盟和针对它的竞争者削价的动机，致使双赢成泡影。

让联盟达成的办法就是合作策略行为，它注重团体理性，在人所不欲勿施于我的前提下，己所不欲勿施于人，实质是串谋。

同时，也应采取富有竞争力的价格定位和价格策略，将自己的策略向竞争对手示明：不要轻易降价，一旦对手降价就打破了原有的成文或不成文协议；再以跟进战略，迅速向对手表达这样的市场信号；希望对手并没有在实施大规模的市场份额争夺战，而只是出于试操性的降价，经过几次定价回合使双方的合作承诺在某种程度上达成，实现合作双赢局面。