博弈论第四章习题

合集下载

博弈论与经济分析(不完全信息静态)

博弈论与经济分析（不完全信息静态）第四章不完全信息静态博弈不完全信息意味着至少有一个参与者不能确定另一个参与者的收益函数，或者说类型。

我们用一个例子来引入要讨论的问题：例：信息不对称条件下的古诺模型市场：P(Q)=a-Q ，Q=q1+q2 企业1：C1(q1)=cq1企业2：以θ的概率为高成本，即222()H C q c q =；以1θ-的概率为低成本，即222()L C q c q =。

当然，H L c c >。

信息不对称：企业2知道自己的成本，也知道企业1的成本；企业1知道自己的成本，但是只知道企业2成本状况的概率分布。

以上都是公共信息，即企业1知道企业2享有信息优势，企业2知道企业1知道，企业1也知道企业2知道企业1知道……如此等等。

解题：企业1会预测企业2在不同情况下的最优选择：当企业2为高成本时2122max[()]H q a q q c q *---当企业2为低成本时2122max[()]L q a q q c q *---既然企业只知道企业2成本情况的概率分布，则企业1只能根据上述预测最大化自己的期望收益：1121121max [(())](1)[(())]H L q a q q c c q a q q c c q θθ**---+----以上三个优化问题的一阶条件为：12()2H H a q c q c **--=12()2LL a q c q c **--=221[()](1)[()]2H L a q c c a q c c q θθ***--+---=联立求解：221()()36H H H L a c c q c c c θ*-+-=+-22()()36L L H L a c c q c c c θ*-+=-- 12(1)3H L a c c c q θθ*-++-=比较该结果与“完全信息条件”条件下结果的不同。

作业：说明企业2在两种成本下是否因为“信息优势”得到了好处？是应该巩固该优势还是向企业1公开信息？一、静态贝叶斯博弈的标准表述完全信息静态：G={S1,…Sn;u1,…,un}在静态博弈条件下，策略S 就是一个行动A （当然，动态博弈则不同），于是我们可以写作G={A1,…An;u1,…,un}。

博弈论谢识予第四五章参考答案

第四章参考答案2、火车站和机场餐饮商业服务的顾客往往都是一次性的，回头客、常客比较少，这些经济交易具有一次性博弈的特征，它们的价格总是较高而质量又会差一些，顾客也会尽量不在这些地方购买商品和消费。

在一般商业区和居民区的餐饮商业服务则回头客和常客较多，有明显的重复博弈特征，在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格，还能得到较好的服务，甚至有些还可以信用消费（赊账），因此消费者一般会比较放心地消费。

这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。

3、从研究对象和问题特征看，有限次重复博弈研究的主要是有明确结束时间的（合作、竞争等）关系，无限次重复博弈研究的主要是没有明确结果时间，或者较长期的关系。

从分析方法的角度，动态博弈和重复博弈分析中常用的逆推归纳法在无限次16重复博弈中无法直接运用，因为没有最后一次重复。

因此无限次重复博弈分析的主要方法是构造法，即根据特定效率意义等构造了博弈完美纳什均衡。

此外，也可以运用某些技巧解决问题，如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。

从博弈的结果看，无限次重复博弈的效率往往高于有限次重复博弈，有些在有限次重复博弈中无法实现的效率较高的结果，在无限次重复博弈中有可能实现。

例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。

两类重复博弈民间定理的差异也说明了这一点。

最后，在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题，在我限次重复博弈问题中这是必须考虑的。

上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别，区分研究这两类博弈问题是非常重要的，在实践方面的主要启发是促进和保持经济关系的长期稳定性，对于提高社会经济效率等常常有非常重要的意义。

6、用画线法容易找出该博弈的两个纯策略纳什均衡（T，L）和（M，R）。

这两个纳什均衡的得益都帕累托劣于（B，S）。

一次性博弈中效率较高的（B，S）不可能实现。

博弈论基础讲义-第四章

第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子：一般计算2.例子：分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的，即在给定信念的条件下，以及其他参与人的选择条件下，自身选择是最优的例1：子博弈最优——纳什均衡(,)L l是否合理？——如果参与人2有机会选择，肯定选r而不是l；——(,)L l不是子博弈精炼纳什均衡。

例2：单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡；——但如果参与人2有机会选择，但肯定选择d；——(,,)D a l不满足单点信息集理性。

例3：多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡；——(,)A r不满足多点信息集理性。

2.一致信念例1：与客观事实一致u=是否合理？——参与人2的信念2/3——2/3u=是不合理的，因为任何到达参与人2信息集都不可能产生此后验概率；——后验信念必须与先念信念保持一致。

例2：前后信念一致——参与人2的第2个信息集上的信念，是否合理？——不合理，给定参与人战略和第1个信息集的信念，利用贝叶斯法则计算信念与此不一致；——参与人前后信念保持一致。

例3：独立偏离——参与人3的信念0.9u =是否合理？——参与人1和参与人3的偏离是独立的，所以参与人3的合理信念为0.1u =；——不同参与人之间的偏离是独立的总结，一致信念要求：参与人偏离最小化,，参与人之间偏离是独立的；二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性；——定义信息集1.3和2.2的信念？2.定义a.行为战略：参与人在某个信息集到行动集映射，——如果某个状态真正发生，参与人如何决策；——序贯理性是否满足？b.序贯理性：在任何信息集上，参与人在给定信念和所有后续行为战略，选择自身行为战略最大化预期效用。

王则柯博弈论4序贯决策博弈

• 试验表明，在分别判断的情况下（也就是人们不能把这两杯冰淇淋放在一起比较），人们反而愿意为冰淇淋A多付钱。结果显示，人们愿意花2.26美元买冰淇淋A，却只愿意用1.66美元买冰淇淋B。 • 说明：人们在作决策的时候，不是象传统经济学那样判断一个物品的真正价值，而是根据一些比较容易评价的线索来判断。 • 引申：在送礼物的时候，礼物在它所属的类别里面是不是昂贵很重要。
n人序贯博弈的博弈树的主要特征
• 对于表达有n个局中人P1，P2，…，Pn参与的一个序贯博弈的博弈树：
1. 在树的每一个非末端节点上，都只有一个局中人进行决策； 2. 在树的每一个末端节点上，都指派了一个n维的 “支付”向量p(v)＝(p1(v)，p2(v)，…，p3(v))，这里v是这个末端节点的相应的策略表达．而1， 2，…n是博弈参与人首次决策的自然顺序。
• 博弈树必须说明在每一个决策节点上相应的局中人能够采取的所有可能的选择。 • 一些博弈树可能包含“不做任何决策”的决策节点。每一个决策节点都有至少一条棱从它那里出发往后延伸，但是没有最大延伸数量的限制。 • 对于不是根的每个节点，只能有来自别的节点的唯一的棱指向它这个节点。
• 博弈树并不要求每个局中人必须在至少一个非末端节点上进行决策。即，可能会出现某些局中人并不在任何一个非末端节点上进行决策的情形。
• 策略组合
• 策略组合星号简示法 : ( U ,{ U’ , * } )2 • 策略组合的节点表示法: ( { U / D }, { U’ / D’ , U’’ / D’’ })8
4-4 倒推法（逆向推导法）
• 在序贯博弈中，由于均衡与结果是两个不同的概念，所以求解纳什均衡的虚线排除确定法，并不适用于求解序贯博弈的结果。一般使用倒推法（逆向推导法）求序贯博弈的结果。

博弈论课后习题答案

博弈论课后习题答案第四部分课后习题答案1. 参考答案:括号中的第一个数字代表乙的得益，第二个数字代表甲的得益，所以a表示乙的得益，而b表示甲的得益。

在第三阶段，如果，则乙会选择不打官司。

这时逆推回第二阶段，甲会选择a,0不分，因为分的得益2小于不分的得益4。

再逆推回第一阶段，乙肯定会选择不借，因为借的最终得益0比不借的最终得益1小。

在第三阶段，如果，则乙轮到选择的时候会选择打官司，此时双方得益是(a,b)。

a,0逆推回第二阶段，如果，则甲在第二阶段仍然选择不分，这时双方得益为(a,b)。

b,2在这种情况下再逆推回第一阶段，那么当时乙会选择不借，双方得益(1，0)，当a,1时乙肯定会选择借，最后双方得益为(a,b)。

在第二阶段如果，则甲会选择a,1b,2分，此时双方得益为(2，2)。

再逆推回第一阶段，乙肯定会选择借，因为借的得益2大于不借的得益1，最后双方的得益(2，2)。

根据上述分析我们可以看出，该博弈比较明确可以预测的结果有这样几种情况:(1)，此时本博弈的结果是乙在第一阶段不愿意借给对方，结束博弈，双方a,0得益(1，0)，不管这时候b的值是多少;(2)，此时博弈的结果仍然012,,,ab且是乙在第一阶段选择不借，结束博弈，双方得益(1，0);(3)，此时博ab,,12且弈的结果是乙在第一阶段选择借，甲在第二阶段选择不分，乙在第三阶段选择打，最后结果是双方得益(a,b);(4)，此时乙在第一阶段会选择借，甲在第二阶段会选择分，ab,,02且双方得益(2，2)。

要本博弈的“威胁”，即“打”是可信的，条件是。

要本博弈的“承诺”，即a,0“分”是可信的，条件是且。

a,0b,2注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况，因为这些时候博弈方的选择很难用理论方法确定和预测。

不过最终的结果并不会超出上面给出的范围。

2. 参考答案:静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。

博弈论课后习题

第一章导论1、什么是博弈博弈论的主要研究内容是什么2、设定一个博弈模型必须确定哪几个方面3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

4、“囚徒的困境”的内在根源是什么举出现实中囚徒的困境的具体例子。

5、博弈有哪些分类方法，有哪些主要的类型6、你正在考虑是否投资100万元开设一家饭店。

假设情况是这样的：你决定开，则的概率你讲收益300万元（包括投资），而的概率你将全部亏损；如果你不开，则你能保住本钱但也不会有利润，请你（a）用得益矩阵和扩展形式表示该博弈；（b）如果你是风险中性的，你会怎样选择（c）如果你是风险规避的，且期望得益的折扣系数为，你的策略选择是什么(d)如果你是风险偏好的，期望得益折算系数为，你的选择又是什么7、一逃犯从关押他的监狱中逃走，一看守奉命追捕。

如果逃犯逃跑有两条可选择的路线，看守只要追捕方向正确就一定能抓住逃犯。

逃犯逃脱可以少坐10年牢，但一旦被抓住则要加刑10年；看守抓住逃犯能得到1000元奖金。

请分别用得益矩阵和扩展形式表示该博弈，并作简单分析。

第二章完全信息静态博弈1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么2、为什么说纳什均衡是博弈分析中最重要的概念3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。

4、多重纳什均衡是否会影响纳什均衡的一致预测性质，对博弈分析有什么不利影响5、下面的得益矩阵表示两博弈方之间的一个静态博弈。

该博弈有没有纯策略纳什均衡博弈的结果是什么6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。

7、博弈方1和2就如何分10 000元进行讨价还价。

假设确定了以下规则：双方同时提出自己要求的数额S1和S2，0≤s1,s2≤10000,如果s1+s2≤10 000，则两博弈方的要求都得到满足，即分别得到s1和s2，但如果是s1+s2＞10 000,则该笔钱就被没收。

问该博弈的纯策略纳什均衡是什么如果你是其中一个博弈方，你会要求什么数额，为什么8、设古诺模型中有n家厂商、qi 为厂商i的产量，Q=q1+…+qn 为市场总产量、P为市场出清价格，且已知P=P(Q)=a-Q(当Q＜a时，否则P=0)。

博弈论第四章

4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。

参与人2 不知道t，但知道t的概率分布。

博弈的时序：（1）参与人1选择行动a1∈A1;（2）参与人2观察a1，选择a2∈A2博弈的收益：u1(a1, a2, t), u2(a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人 2L'R'L2，10，0参与人 1 M0, 20，1R1, 31, 3纯战略纳什均衡: (L，L'), (R，R')均为子博弈精炼纳什均衡(无子博弈)。

但是(R, R')不可信。

排除不可信的纳什均衡：要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义: 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下，博弈以正的概率到达该集.要求3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。

例要求3的说明参与人1的类型空间：{ t1，t2，t3，t4 }行动空间：A= { L，R}推断p i: 观察到L后，参与人1的类型是t i的概率。

推断q i: 观察到R后，参与人1的类型是t i的概率。

p1 + p2 + p3 + p4 = 1q1 + q2 + q3 + q4= 1N如果参与人1的战略： t 1选 L ，t 2选 L ， t 3选R ，t 4 选R 。

参与人2对p i 与 q i 的推断：p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,例 3个参与人的博弈。

策略博弈习题部分解答

博弈论与政治第三小组作业第二章名词解释：1、理性行为（rational behavior）：参与人精于算计并严格按照其最优策略行事。

其中理性有两个重要的内涵：一个人对自己的利益完全了解，并能完美地计算出何种行动可以最大化其利益。

2、不完美信息(imperfect information)：在博弈的每一个行动时点上，参与人可能无法获悉决策所需的全部信息。

这包括相关的外部环境——比如天气——的不确定性，以及对方先前或当前的行动。

这类情况称为不完美信息。

3、不完全信息(incomplete information):当一个参与人比另一个参与人了解更多信息时，阴谋诡计就会产生。

这类情况称为不完全信息。

4、合作博弈(cooperative game)：博弈论使用两个专门术语来区分协议具有强制力和不具有强制力的情况。

若协议对参与人行为具有强制力，则称此类博弈为合作博弈。

5、非合作博弈(noncooperate game):个体参与人可根据其利益采取行动，则称此类博弈为非合作博弈。

第三章名词解释：1、中间评估函数(intermediate valuation function)：赋予非终点结支付的规则被称为中间评估函数。

2、先动优势(firstmover advantage)：在博弈的过程中先做决策带来的优势。

先动优势来自于将其自身置于一个优势地位以及迫使其他参与人接受它的承诺能力。

后动优势(second-mover advantage)：在博弈的过程中后做决策带来的优势。

后动优势源于自己可对他人选择做出的灵活性。

第四章名词解释：1、占优策略(dominant strategy)、劣策略(dominated strategy):每一个博弈中的参与者通常都拥有不止一个竞争策略，其所有策略的集合构成了该企业的策略集。

在参与者各自的策略集中，如果存在一个与其他竞争对手可能采取的策略无关的最优选择，则称其为占优策略(Dominant Strategy)，与之相对的其他策略则为劣势策略。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第四章习题
一、如果T次重复齐威王田忌赛马，双方在该重复博弈中的策略是什么？博弈结果如何？
答：因为这是零和博弈，结论比较具体。

重复Nash 均衡，均以1/6的概率选择各个策略，期望收益分别为1和-1。

因为这是竞争性的零和博弈，无论是有限次重复博弈还是无限次的重复博弈，均不能达成合作的条件。

二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。

答：火车站和机场餐饮业的服务的顾客往往是一次性的，回头客和常客也比较少，价格高，质量差，一次性博弈。

效率也比较低。

商业区和居民区的餐饮业和商业服务业，回头客和常客比较多，比较注重信誉，质优、价廉，重复博弈。

效率也比较高。

三、有限次重复博弈和无限次重复博弈有什么区别？这些区别对我们有什么启发？
答：动态博弈的逆向归纳法可以用于有限次重复博弈，但不能用于无限次重复博弈，主要用逆向归纳法。

无限次重复博弈的效率往往高于有限次重复博弈。

当重复次数较少不一定考虑贴现问题，但无限次重复博弈必须考虑贴现问题。

启发：重视有限次与无限次的区别，区分和研究这两类博弈，在实践方面重要启发是促进和保持经济的长期稳定和可持续发展，提高社会经济效率是非常有意义的。

四、判断下列表述是否正确，并作简单讨论：
（1）有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。

答：不一定。

对于有两个以上纯策略纳什均衡的条件下就不一定。

如“触发策略”就不是。

（2）有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。

答：是，根据子博弈完美纳什均衡的要求，最后一次必须是原博弈的一个纳什均衡。

（3）无限次重复博弈均衡解的得益一定优于原博
弈均衡解的得益。

答：错。

如严格竞争的零和博弈就不优于。

（4）无限次重复古诺产量博弈不一定会出现合谋生产垄断产量的现象。

答：正确。

合谋生产垄断产量是有条件的，由贴现率来反映，当不满足条件时，就不能构成激励。

（5）如果博弈重复无限次或者每次结束的概率足够小，而得益的时间贴现率充分接近1，那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。

答：这就是无限次重复博弈的民间定理。

（6）触发策略所构成的均衡都是子博弈完美纳什均衡。

答：错误。

触发策略本身并不能排除重复博弈中不可信的威胁和承诺，因此由触发策略构成的不一定是子博弈完美纳什均衡。

五、为什么消费者偏好去大商店买东西而不太信赖走街穿巷的小商贩？
答：去大商店买东西，重复博弈——合作诚信问题；走街穿巷的小商贩，一次性博弈——没有合作的必要，存在不诚信和欺诈。

建立信用制度和诚信档案的必要性。

六、寡头的古诺产量博弈中，如果市场需求130P Q =-，边际成本30C =且没有固定成本，贴现因子0.9δ=。

如果该市场有长期稳定性，问两个厂商能否维持垄断产量？
解：⎩⎨⎧---=
---=222121121130)13030)130q q q q q q q q （（ππ，古诺产量 3100*2
*
1==q q ，利润为：910000*2*1==ππ 垄断产量q q q 30)130--=（π，
250050==⇒m m q π，市场长期稳定的，
12502=m π 1250011250112502=-=+++δ
δδ）（，9.0=δ 如果一厂商偏离：111130)25130q q q ---=
（π，5.371=⇒q ，25.1406**1=π 那么：）
（）（δδδδ-+=+++191000025.140691000025.14062 1250025.114061000025.1406《=+=
因此，坚持垄断产量是明智的。

七、如果上一题厂商1的边际成本该为10，厂商2的边际成本仍然是30。

假设市场仍然是长期稳定的，而且两个厂商已经达成了厂商1生产3/4，厂商2生产1/4的垄断产量分配协议，问这种协议是否能够长期维持？
解：⎩⎨⎧---=
---=222121121130)13010)130q q q q q q q q （（ππ，古诺产量 3803140*2*1==q q ，，利润为：9
6400919600*2*1==ππ，垄断产量Q Q Q Q 3025.01075.0)130⨯-⨯--=（π，
2115Q Q -=，
5.57=⇒m Q ，产量分别为：125.43，375.14；9375.6103125.269521==m m ππ，
如果两个厂商均不偏离：375.610919375.610125.2695313125.2695=-=-δ
δ，厂商1偏离：
2111111625.10510)375.14130q q q q q -=---=（π，
8125.521=q ，16.27891=π
1960016.27899
1960016.27892+=+++）（ δδ 125.2695316.22389<=不偏离
厂商2偏离：
222230)125.43130q q q ---=（π，4375.282=q ，
6914
.8082=π
64006914.8089
64006914.8082+=+++）（ δδ 375.61096914.7208>=偏离
还可以计算出不同的δ，可以进一步讨论。

八、两个人合作开发一项产品，能否成功与两个人的工作态度有关，设成功概率如下：
再假设成功时每人有4单位的利益，失败则双方都没有利益，偷懒本身有1单位的利益。

问该博弈无限次重复博弈的均衡是什么？
解：根据问题的假设，该博弈的得益矩阵如下：
一次性博弈显然是囚徒困境式博弈，唯一的纳什均衡两人都偷懒，双方的期望得益都是2。

在无限次重复博弈中，假设双方为了在共同努力方面实现合作采取如下的触发策略：开始时努力，一旦发现对方不努力，则自己也偷懒。

我们可以分析当
贴现因子
δ符合什么条件时，该策略构成子博弈完美纳什均衡。

不偏离：）
（）（δδδ-=+++149149
2 偏离：）
（）（δδδ-+=+++12212252 当满足：）（）（δδ-+≥-1221149，也就是2
1≥δ时采取这种触发策略是正确的，否则，偏离是正确的。

当2
1≥δ时，两博弈方都采用这样的触发策略是本博弈的子博弈完美纳什均衡；如果21<δ，则上述触发策略组合不是子博弈完美纳什均衡，两人都会采取偷懒的策略。

（注：文档可能无法思考全面，请浏览后下载，供参考。

可复制、编制，期待你的好评与关注！）。