博弈论谢识予第四五章参考标准答案

博弈论谢识予第四五章参考标准答案
博弈论谢识予第四五章参考标准答案

博弈论谢识予第四五章参考答案

————————————————————————————————作者:————————————————————————————————日期:

2

第四章参考答案

2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。

3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。

从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次

16

重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。

从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。

最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。

上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。

我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。

如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。

双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。

当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。

8、

可以消去,消去博弈方1的D策后四个策略组合中不存在纯策略纳什均衡。根据混合策略纳什均衡的计算方法,不难算出混合策略纳什均衡为:博弈方1概率分布(1/2,1/2)在T和M中随机选择,博弈方2则以概率分布(1/3,2/3)在L 和R中随机选择。

由于上述静态博弈是没有纯策略纳什均衡的严格竞争博弈,因此在有限次重复博弈和无限次重复博弈中,两博弈方的均衡策略都是简单复重原博弈的混合策略纳什均衡。补充习题:

1. 判断下列表述是否正确,并简单讨论:

a) 有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的

一个纳什均衡。

参考答案:正确。因为最后一次重复就是动态博弈的最后一个阶段,根据子博弈完美纳什均衡的要求,博弈方在该阶段的选择必须构成纳什均衡。因为最后一次重复就是原博弈本身,因此该纳什均衡就是原博弈的一个纳什均衡。b) 无限次重复博弈均衡解的得益一定优于原博弈的均衡解的得益。参考答案:

错误。对于严格竞争的零和博弈,或者不满足合作条件的其它许多博弈来说,无限制重复博弈并不意味着效率的提高,得益不一定高于原博弈的得益。

2. 寡头的古诺产量博弈中,如果市场需求P=130-Q,边际成本c=30且没有固定成本,贴现因子δ=0.9,如果该市场有长期的稳定性,问两个厂商能否维持垄断产量?

参考答案:因为市场有长期稳定性,因此可以把两寡头之间的产量博弈看作无限次重复博弈,讨论能否构造双方在垄断产量上合作的子博弈完美纳什均衡。首先分析上述产量博弈的一次性博弈的纳什均衡。根据假设,两个厂商

的利润函数为:

利用反应函数法不难求出纳什均衡产量(古诺产量)为

此时两个厂商的利润为

现在分析垄断产量。市场总利润函数是:

很容易求得市场总利润最大化的总产量是:

垄断利润为

由于市场是长期稳定的,因此我们把两个厂商的产量博弈看作无限次重复博弈。假设两厂商都采用开始时生产垄断产量的一半,一旦一方偏离就永远生产古诺产量的触发策略。这样如果两个厂商都坚持合作,那么两个厂商每阶段各得1250,

长期总利润的现在值是:

如果有一个厂商(设为厂商1)偏离,那么因为它的利润函数为:

因此它会产生产量:

而此后每阶段都只能产生古诺产量和得到利润10000/9。因此偏离的长期总利润现在值为:

因此12500>11406.25,因此坚持垄断产量显然是正确的选择。这说明在模型假设下,双方都采用上述触发策略是本博弈的子博弈完美纳什均衡,长期维持垄断产量是可能的。

第六章补充习题

1. 判断下列表述是否正确,并简单分析:

a) 完全不完美信息动态博弈中各博弈方都不清楚博弈的得益。

b) 在完全但不完美信息博弈中,若不存在混合策略,并且个博弈方都是主

动选择且行为理性的,则不完美信息从本质上说是假的。c) 子博弈可以从一个多节点信息集开始。

参考答案:

a) 错误。不完美信息博弈中不一定所有博弈方都不清楚博弈进程,只要部

分或者一个博弈方不完全清楚其行为之前的博弈进程,就是不完美信息动态博弈。

b) 正确。因为对于只包含理性博弈方的主动选择行为,利益结构明确,而

且不同路径有严格优劣之分,从不需要用混合策略的动态博弈来说,所有博弈方选择的路径都可以通过分析加以确定和预测,根本无须观察。从这个意义上说,这个博弈的不完美信息实际上都是“假的”。

c) 错误。在一个子博弈中出现的信息集必须是完整的,由于从多节点信息集开始的博弈必须分割一个信息集,因此不可能是一个子博弈。

2. 如果一种商品的质量很难在购买时正确判断,出售在这种商品的卖方又可以“售出商品,概不退换”。问这种商品的市场最终会趋向于怎样的情况?参考答案:从短期市场均衡的角度,如果消费者对商品质量缺乏判断能力,而且厂商又不提供任何质量保证,那么消费者是否会购买取决于购买的期望利益。如果商品对消费者来说并不是必需品,市场上劣质品比例很高,而且买到劣质品损失很大,从而购买的期望利益、效用很小,还不如不买,那么短期均衡中消费者就不会选择购买。这是市场短期中就会崩溃。长期中只有厂商的经营策略和市场情况改善以后才可能重新恢复和发展。如果反过来商品对消费者来是必须的,消费效用比较大,买到劣质商品的损失也不是很大,或者市场上劣质品的比例不大,从而购买的期望利益、效用比较大,那么消费者在短期均衡终会选择购买,市场能够存在。但能够短期存在不等于能够长期维持和发展。事实上,除非该商品市场是消费需求严重缺乏弹性,市场结构又属于完全垄断的极端情况,否则是总部对消费者做出质量承诺的厂商和市场肯定是不能长期维持的,否则会走向消亡,被其它商品、其它厂商所替代。

3. 假设在一价二手车模型中V=5000元,W=1000元,P=3000元,差车的概率是0.6。再假设政府可以控制厂商的伪装成本C,但每一单位C政府自己有0.5单位成本,而政府的效用是交易中卖方的利益减去政府自己的成本。问该博弈的完美贝叶斯均衡是什么?参考答案:为了简单期间我们仍然根据只有买方卖方两个博弈方的一价模型的扩展形进行分析。

根据上述扩展形我们不难清楚,假设政府选择的C<3000,那么买卖双方博弈的市场均衡一定是市场失败类型或接近失败的,因此差车伪装出售有利可图,而在好车差车都卖的情况下买方选择买的期望利益为0.4×2000+0.6×(-2000)=-400<0。在市场完全失败时因为买方的利益为0,因此政府的效用肯定是非正的;在市场接近失败时买方的利益(期望得益)同样也是0,因此政府的效用肯定也是非正的。

现在假设政府选择的C正好满足C>3000,例如3001等。这时候买卖双方的博弈均衡是市场完全成功类型的,也就是好车全卖,差车不会卖,买方则会买。这时候交易买方的利益是2000,而政府提高C的成本只需要1500左右,因此政府有正的效用。

根据上述分析不难得出结论,在上述存在政府选择的二手车交易模型中,政府选择把C提高到3000以上,好车的卖方选择卖,差车的卖方选择不卖,买方选择买,构成该博弈的一个市场完全成功类型的完美贝叶斯均衡。

4、简述完全但不完美信息动态博弈的完美贝叶斯均衡必须满足的要求。参考答案:完美贝叶斯均衡必须满足下列四个要求:要求1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”。要求2:给定各博弈方的“判断”,他们的策略必须是“序列理性”的。要求3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策略所决定。要求4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方在

此处可能有的均衡策略所决

定。

不完全信息部分

1.直接机制在拍卖规则没计中有什么意义?(7--3)

2.古玩市场的交易中买卖双方的后悔都来自于自己对古玩价值判断的失误,若

预先对价值的判断是正确的,那么交易者肯定不会后悔。

3.从不完全信息博弈的角度,从高到低叫价的荷兰式拍卖和暗标拍卖之间是否有相似性?

4.运用海萨尼转换以后,不完全信息动态博弈与完全但不完美信息动态博弈基本上是相同的吗?

5.在位者公司和可能进入者的盈利矩阵如下:

将其进行Harsanyi转换。并求在高成本概率为1/3时,该博弈的Nash均衡。6.两户居民同时决定是否维护某合用的设施。如果只要有一户人家维护,两户人家就都能得到1单位好处;没有人维护则两户人家均没有好处。设两户人家维护的成本不同,分别为C1和C2。(1)如果假设C1和C2分别是0.1和0.5,该博弈的纳什均衡是什么?博弈结果会如何?

(2)如果C1和C2都是独立均匀分布在[0,1]上的随机变量,且真实水平只有每户人家自己知道,该博弈的贝叶斯纳什均衡是什么?

7.(7--7)若(1)“自然”以均等的概率决定得益是下述得益矩阵1的情况还是得益矩阵2的情况,并让博弈方1知道而不让博弈方2知道;(2)博弈方1在T 和B中选择,同时博弈方2在L和R中进行选择。找出该静态贝叶斯博弈的所有纯策略贝叶斯纳什均衡。

8.双寡头古诺产量竞争模型中厂商i的利润函数为)(jiiiiqqtq??=π,i=1,2。若11=t是两个厂商的共同知识,而2t则是厂商2的私人信息,厂商1只知道2t为3/4或4/5,且2t取这两个值的概率相等。若两个厂商同时选择产量,请找出该博弈的纯策略贝叶斯均衡。参考答案:

1.答:直接机制在拍卖规则设计个最大的意义在于可以简化拍卖规则的设计。因为理论证明任何一个贝叶斯纳什均衡都可以用一个说实话购直接机制取代表(揭示原理),而任何拍卖规则对应的拍卖博弈都可以用贝叶斯纳什均衡进行分析和预测,这说明任何拍卖规则实现的结果肯定能用直接机制加以实现,这可以在很大程度上简化拍卖规则设计。

进一步在理论上,直接机制及其与拍卖博弈贝叶斯纳什均衡之间的关系,也揭示了在拍卖博弈或其他包含激励问题的机制设计问题中,通过机制设计所能达到效

果的最大限度。因为说实话的直接机制包含获取信息的成本(鼓励激励对象揭示真实情况的代价),拍卖博弈等的贝叶斯纳什均衡与一个说实话的直接机制等价,说明任何拍卖规则或其他激励机制设计能达到的最理想效果,就是激励对象的真实情况所决定的最大潜在出价或努力,减去上述信息成本。

2.不正确。即使自己对古玩价值的判断是完全正确的,仍然有可能后悔。因为古玩交易的价格和利益不仅取决于古玩的实际价值和自己的估价,还取决对于对方的估价和园艺接受的成交价格,因此仅仅自己做出正确的估价并不等于实现了最大的潜在利益。

3.解答:从不完全信息博弈的角度,荷兰式拍卖与无底价的暗标拍卖其实基本上是相同的。因为虽然荷兰式拍卖的公开叫价与暗标拍卖的密封标书拍卖在形式上有较大差异,但这两种拍卖方式中各个博弈方的信息状态是相同的,最高价中标的拍卖规则也是相同的,而且荷兰式拍卖中各个竞拍者在参与竞拍时事实上事先必须有一个心理价位,这个价值与暗标拍卖中密封在信封中的标价应该相同,得到的最终结果也相同。因此从不完全信息博奔的角度,荷兰式拍卖与暗标拍卖实质上是相同的。这两种拍卖方式的主要不同是适用的拍卖标的物不同,附加规则、条件的难易程度不同,以及不同的形式和现场气氛对参加者会产生不同的心理作用等。

4.引入“自然”,Harsanyi转换如下

(不扩展,扩展)表示当成本为高时在位者采取不扩展而当成本低时在位者采取扩展行动,这是在位者的严格占优策略。当高成本的概率为1/3时,进入者的期望得益为1/3×1+2/3×(-1)=-1/3,不进入的期望得益为0。所以{不进入,(不扩展,扩展)}是博弈的纳什均衡。

5.正确。事实上,不完全信息动态博弈与不完美信息动态博弈本质上常常是相同的,是一种博弈问题的两种不同的理解方法,而将他们联系起来的桥梁正是海萨尼转换。

6.(1)这是完全信息的情况,得益矩阵如下:

根据矩阵中的得益情况容易得出该博弈有两个纯策略纳什均衡,(提供,不提供)和(不提供,提供),还有一个混合策略纳什均衡。在这几个纳什均衡中第一个的效率是最高的,而且也是所有策略织合中总得益最高的,因此双方都采用这个均衡结果最理想。但因为这时候第—户人家没有实现最大得益,而且相对得益反而比对方差,因此属于能者多劳、吃亏的不合理情况。这种均衡在现实中并不总是很容易实现,除非居民之间能够发展出一种补偿机制给第—户居民合理的补偿。(2)对于C1和C2都是独立均匀分布在[0,1]上的情况,假设居民1采用如下的临界值策略:当ω<1c时采用“提供”策略;当ω>1c时采用“不提供”策略。

23

假设居民2采用如下的临界值策略:当tc<2时采用“提供”策略;当tc>2时采用“不提供”策略。此时居民1提供的概率是ω,不提供的概率是1-ω;厂商2提供的概率是t,下提供的概率是1-t。

从居民1的角度来看,选择提供和不提供的期望得益分别为:

1111)1)(1()1(cctct?=??+?和ttt=??+?0)1(1

当提供的期望得益大于不提供的期望得益时,居民1才会采用提供。也就是tc?<11时会提供,由此得到临界值:t?=1ω。

从居民2的角度来看,选择提供和不提供的期望得益分别为:2221)1)(1()1(ccc?=??+?ωω和ωωω=??+?0)1(1

当提供的期望得益大于不提供的期望得益时,居民2才会采用提供。也就是ω?<12c时会提供,由此得到临界值:ω?=1t。

结合上述两个临界值公式得,满足1=+ωt时上述临界值策略组合都是这个博弈的贝叫期纳什均衡。因此这个博弈有无数的均衡解。

7.假设厂商l的产量是1q,厂商2在2t=3/4和2t=5/4时的产量分别是l q2和hq2,则厂商2在两种情况下的得益函数分别为:

厂商1的期望函数为:

用反应函数法,将上述得益和期望得益函数分别对lq2、h

q2和1q求一阶偏导

并令为0,解得反应函数后再联立可解得:

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论谢识予第四五章参考标准答案

博弈论谢识予第四五章参考答案

————————————————————————————————作者:————————————————————————————————日期: 2

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。 从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。 最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。 上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。 我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。 如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。 当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。

博弈论基础作业及答案【最新资料】

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

博弈论作业及答案 浙江财经大学 张老师作业答案

第1次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:W1/2

张维迎《博弈论与信息经济学》部分答案

张维迎《博弈论与信息经济学》部分习题答案 如果图片不显示,用打印预览就可以了。 P127 第一题:领悟精神就可以了,而且每本书上都有这些例题,不找了。 第二题: UMD 为参与人1的战略,LMR 为参与人2的战略。前面的数字代表参与人1的得益,后面的代表参与人2的得益。 参与人2的R 战略严格优于M 战略,剔除参与人2的M 战略,参与人1的U 战略优于M 战略,剔除参与人1的M 战略,参与人1的U 战略优于D 战略,剔除参与人1的D 战略,参与人2的L 战略优于R 战略,剔除参与人2的R 战略。最后均衡为U ,L (4,3)。这样可能看不清,按照步骤一步步画出图就好多了。 第三题:恩爱型 厌恶型 用划线法解出,恩爱的都活着或者都死,厌恶的或者受罪,死了对方另一个人开心的不得了。 第四题:没有人会选择比原来少的钱,战略空间为{原来的钱,比原来多的钱}。支付为{0,原来的钱,比原来多的钱}。纳什均衡为选择原来的钱。要画图自己画画。 第五题:n 个企业,其中的一个方程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n =(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。

第六题:在静态的情况下,没有一个企业愿意冒险将定价高于自己的单位成本C ,最终P=C ,利润为0。因为每个参与人都能预测到万一自己的定价高于C ,其他人定价为C 那么自己的利益就是负的(考虑到生产的成本无法回收)。就算两个企业之间有交流也是不可信的,最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争,一定会取得一个P 1=P 2=P 均衡。此时利润不为零,双方将不在进行价格竞争。 第七题:设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。 π1=(P 1-C)(a-P 1+P 2),π2=(P 2-C)(a-P 2+P 1)。一阶最优:a-2P 1+C+P 2=0,a-2P 2+C+P 1=0。 解得:P 1=P 2=a+C ,π1=π2=a 2。 第八题:不会! 到纳什均衡为(A,A,A),(A,B,A),(B,B,B),(A,C,C),(C,C,C)。 第十题: 无纯战略纳什均衡,设参与人1为P 1~P 4,参与人2为Q 1~Q 4。 得到:-Q 2+Q 4=Q 1-Q 3=Q 2-Q 4=-Q 1+Q 3,推出:Q 1=Q 2=Q 3=Q 4=1/4。同理P 1=P 2=P 3=P 4=1/4。以上述的概率在杆子,老虎,鸡,虫子中选择一个。

博弈论谢识予第四五章参考答案

第四章参考答案 、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次 重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。 从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。 最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。 上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。、用画线法容易找出该博弈的两个纯策略纳什均衡(,)和(,)。这两个纳什均衡的得益都帕累托劣于(,)。一次性博弈中效率较高的(,)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(,),提高博弈的效率。 我作为博弈方会采用这样的触发策略:第一次重复采用;第二次重复时,如果前一次的结果是(,),则采用,如果前一次的结果是其他,则采用。 如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用;第二次重复时,如果前一次的结果是(,),则采用,否则采用。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(,),提高了博弈的效率。 当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。 、

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论第4章答案

R R M 4.1.a 标准式 1↖2 L ’ R ’ 4,1 0,0 3,0 0,1 2,2 2,2 纯战略纳什均衡:( L, L ’ ) ( R, R ’ ) 子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ ) 精炼贝叶斯纳什均衡:( L, L ’ ) 4.1.b 标准式 1↖2 L ’ M ’ R ’ 1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4 纯战略纳什均衡:( R, M ’ ) 子博弈精炼纳什均衡:( R, M ’ ) 精炼贝叶斯均衡: 没有 4.2 标准式 1↖2 L ’ R ’ 2,2 2,2 3,0 0,1 0,1 3,0 六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。 求混合战略精炼贝叶斯均衡: 设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p ?? 参与者2选择L ’和R ’的概率分别为,(1)q q ? 在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212 120*1*1*0*p p p p p p +=+?= 给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则: 121212 12[3*0*(1)][0*3*(1)]2*(1) 41:**,*112 p q q p q q p p p p p p q +?=+?=??=== =又 联立得 所以 L L M L L M L R L

4.3答案(见4.5) 4.4 表示方法 第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号; 第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a ) [(,),(,),1/2] [(,),(,),1/2] [(,),((1),),1/2][(,),(,),1,0] R R u u p R R d u p R R d u u p L R u d p q αα><+?=== (b ) [(,),(,),1/2,2/3] [(,),(,),1,0][(,),(,),0,1] L L u u p q L R d u p q R L u d p q =<==== 中文版习题4.5答案 (a ) [(,),(,),1/3,1/2]R R u d p q >= (b ) 12121212[(,,),(,),1/3,1/2] [(,,),(,),1/2,0] L L L u u p p q q L L R u d p p q q ==+<==+=

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

博弈论基础作业及答案

博弈论基础作业及答案 Company number:【0089WT-8898YT-W8CCB-BUUT-202108】

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论与信息经济学答案

第一章 5. n 个企业,其中的一个方程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n=(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。 6.假定消费者从价格低的厂商购买产品,如果两企业价格相同,就平分市场,如果企业i 的价格高于另一企业,则企业i 的需求量为0,反之,其它企业的需求量为0。因此,企业i 的需求函数由下式给出: i i i i i i i i p pi p p p p 0)/2Q(p ) Q(p q --->=c 那么每家企业的利润02 i i j i p c q ππ-== >,因此,企业i 只要将其价格略微低于其它企业就将获得整个市场的需求,而且利润也会上升至()()22 i i i i p c p c Q p Q p εε---->,()0ε→。同样, 其它企业也会采取相同的策略,如果此下去,直到每家厂商都不会选择降价策略,此时的均衡结果只可能是p i =p j =c 。此时,企业i 的需求函数为2 i a c q -= 。 在静态的情况下,没有一个企业愿意冒险将定价高于自己的单位成本C ,最终P=C ,利润为0。因为每个参与人都能预测到万一自己的定价高于C ,其他人定价为C 那么自己的利益就是负的(考虑到生产的成本无法回收)。就算两个企业之间有交流也是不可信的,最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争,一定会取得一个P 1=P 2=P 均衡。此时利润不为零,双方将不在进行价格竞争。 7.设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。

博弈论基础作业及答案

博弈论基础作业 、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1. 举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2. 请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大

经济博弈论论文

博弈论及其在现代经济生活中的应用 工造3班 魏XX [摘要]:本文从“囚徒困境模型”和“智猪博弈模型”两个方面来阐述博弈论及其 在现代经济生活中的运用。 [关键词]:博弈论囚徒困境模型智猪博弈模型应用 [正文]: 有一个典型的案例:甲乙两人合伙作案,结果被警察抓了起来,分别被隔离 审讯。在不能互通信息的情形下———也就是不知道对方是坦白还是缄默的前提 下,每个嫌疑犯都可以作出自己的选择:或者供出同伙,即与警察合作,从而背 叛同伙;或者保持沉默,也就是与同伙合作,而不是与警察合作。这样会出现以 下几种情况:如果两人都不坦白,警察会因证据不足而将两人各判刑! 年;如果 一人招供而另外一人不招,坦白者作为证人将不会被起诉,另一人将会被重判!" 年;如果两人都招供,则会因罪名成立各判!# 年。这两个嫌疑犯该怎么办呢? 是选择合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这 样对他们整体而言是最好的结果———都只判!年。但是他们不得不仔细考虑对 方可能采取的选择。问题就这样开始了,两个人都十分精明,而且只关心减少自 己的刑期,并不会在乎对方被判多少年。每个人都会这样推理:假如对方不招, 我只要一招供,马上可以获得自由,而不招却要坐牢! 年,显然招比不招好;假 如对方招了,我若不招,则要坐牢!" 年。招了只要坐牢!# 年,显然还是招更好 些。可见,对方无论招或者不招,我的最佳选择都是招认。两个人都会基于同样 的想法作出招供的选择,这对他们个人来说都是最佳策略,但对整体而言却是一 个最差的结果。 这就是博弈论的一个经典模型———“囚徒困境模型”。作为一种关于决策和 策略的理论,博弈论其实就在我们身边,它研究的许多例子来自于日常生活和经 济活动中的游戏和事物。 博弈的英文即,中文译为“博弈”是非常传神和贴切的,因为中国古代称下棋 为“弈”,“博”则含有争斗的意思。在下棋这样的游戏中有一个重要的特点:即策 略在其中起着举足轻重的影响和作用。精明慎重的棋手们相互揣摩、相互牵制, 人人争赢,布每一个棋子时,都必须考虑到对手的策略选择,从而选择自己的最 佳策略。这也就是博弈的核心问题:决策主体的一方行动后,参与博弈的其他人 将会采取什么行动?参与人为取得最佳效果应采取怎样的对策?我们可以将博 弈论定义为:一些个人、一些团队或其他组织,面对一定的环境条件,在一定的 规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的 行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。博弈 论是(# 世纪四五十年代发展起来的。美国经济学家冯?诺依曼与奥斯卡?摩根斯特 恩于!)**年合著的《博弈论与经济行为》被公认为博弈论诞生的标志。 博弈论可以分为合作博弈理论和非合作博弈理论。前者主要强调的是集体理 性;而后者主要研究人们在利益相互影响的局势中如何选择策略使自己的收益最 大,强调的是个人理性。所谓“个人理性”是反映个体的行为始终都是以实现自身 的最大利益为惟一目标,除非是为了实现自身利益的需要,否则不会考虑其他的 个体或社会利益这样一种决策原则。非合作博弈要求各参与人之间不能存在任何

博弈论复习题及答案

名词解释(每题7 分,共 2 8 分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10 分,共40 分) 1、博弈的基本要素有哪些? 基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。

3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能 猎到所 需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题? 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代 理人行 动,造成信息不对称,从而出现代理人选择不利于委托人的行 为的一种现 象;解决道德风险的方法可以用签订合同、派人监督,以 及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 H B i 答:根据上方的矩阵图, 我们可得出其博弈中存在两种策略的纳 什均衡:分别是 H 选择F1和N 选择F2,以及H 选择B1和N 选择 B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和R ”的行动,其收益如下:当 A 选左,B 选L 时,A 的收益为2,B 的收益为3 ;当A 选左,B 选R 时,A 的收益为1 , B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1 ; 当A 选右,B 选R 时,A 的收益为0,B 的收益为2。请画出该博弈 的博弈树,并求出该博弈的均衡解。 四、论述题(16分) 1、请结合你的工作或生活,谈谈对行动的可信性的理解,有什么方 法可以建立可信的策略行动。 答:每一种策略性行动都面临着可信性的问题, 人们不一定相信 策略性行动的提出者会实施其行动。 因此提出者必须做一些辅助工作 F 2 B 2

博弈论练习2答案

111111111111111111 博弈论练习题(四) 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我” 个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题? 答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。 (2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。 精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。 四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发? 答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。 五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:

相关文档
最新文档