北大光华考研辅导班讲义笔记资料-博弈论经典试题

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料第一章导论 1.博弈的概念：博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，并从中各自取得相应结果的过程。它包括四个要素：参与者，策略，次序和得益。 2.一个博弈的构成要素：博弈模型有下列要素：(1)博弈方。即博弈中决策并承但结果的参与者．包括个人或组织等：(2)策略。即博弈方决策、选择的内容，包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序：次序不同一般就是不同的博弈，即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果，可以是经济利益，也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别：合作博弈：允许存在有约束力协议的博弈；非合作博弈：不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时，当事人能否达成一个具有约束力的协议。假设博弈方是两个寡头企业，如果他们之间达成一个协议，联合最大化垄断利润，并且各自按这个协议生产，就是合作博弈。如果达不成协议，或不遵守协议，每个企业都只选择自己的最优产品（价格），则是非合作博弈。合作博弈：团体理性（效率高，公正，公平）非合作博弈：个人理性，个人最优决策（可能有效率，可能无效率） 4.完全理性和有限理性: 完全理性：有完美的分析判断能力和不会犯选择行为的错误。有限理性：博弈方的判断选择能力有缺陷。区分两者的重要性在于如果决策者是有限理性的，那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距，以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性：个体理性：以个体利益最大为目标；集体理性：追求集体利益最大化。第一章课后题：2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方，即博弈中进行决策并承担结果的参与者;(2)策略(空间)，即博弈方选择的内容，可以是方向、取舍选择，也可以是连续的数量水平等;(3)得益或得益函数，即博弈方行为、策略选择的相应后果、结果，必须是数量或者能够折算成数量;(4)博弈次序，即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构，即博弈方相互对其他博弈方行为或最终利益

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×） ~ 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√） — 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t

博弈论期末习题

《博弈论》期末习题专业：经济学学号：2 ；姓名：王兆丽一、试写出掷硬币博弈的局中人及其策略与得益函数，并写出双变量得益矩阵。答：局中人：盖硬币者和猜硬币者。策略：有正面和反面两种可选择策略，若猜对，猜者得１盖者－１.否则猜者－１盖者１.由于每一方都不会让对方在选择之前知道自己的决策，所以可以看做是同时做决策的。双变量得益矩阵；猜硬币方二、试举生活中的一例，说明囚徒困境是如何产生的？并试分析可能走出囚徒困境的途径。答：例子：中国移动和中国联通之间的价格战。产生原因：囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现整体、个体利益共同的最优。简单的说，囚徒困境问题都是个体理性与集体理性的矛盾引起的。可能走出的囚徒困境途径：(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚，那么就会制止这种现象发生。（2）忠诚文化。有时候，建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中，团体产生所面临的囚徒困境问题的轻重程度是不同的，这种差异的根本来源就是各个组织有自己的文化。（3）长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复，如果这个“多次”足够长，那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财，合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。答：1、该博弈共包括四个子博弈：（1）从博弈方1选择R 以后博弈方2的第二阶段选择开始的三阶段动态博弈；（2）从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈；（3）第三阶段博弈方1选择A 以后博弈方2 的单人博弈；（4）第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中任何一个的得益都相同，因此在这阶段随意选择一个都可以。倒退回第三阶段，博弈方1选择ＡＢ中任何一个都可以。再推回第二阶段，博弈方２选择Ｌ将得到３选择Ｒ得到２，因此选择Ｌ；最后回到第一阶段，博弈方１选择Ｌ得到２选择Ｒ得到３,。所以该博弈的子博弈完美纳什均衡为：博弈方１第一阶段选择Ｒ，博弈方２第二阶段选择Ｌ，即（３,１）是该博弈的完美纳什均衡。四、两个寡头企业进行价格竞争博弈，企业1的利润函数是 q c aq p ++--=21)(π，企业2的利润函数是p b q +--=22)(π，其中p 是企业1 的价格，q 是企业2的价格。求： 1．两个企业同时决策的纯战略纳什均衡；两个企业同时定价。根据两个企业的得益函数，很容易导出它们各自的反应函数：απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

博弈论的考试复习资料

一、简答题 2、什么是信号传递博弈？请举例说明。信号传递博弈是一种比较简单但有广泛应用意义的不完全信息动态博弈。在这个博弈中，有两个参与人，i=1、2，参与人成为信号发送者，参与2称为信号接收者；参与人1的类型是私人信息，参与人2的类型是公共信息（即只有一个类型）。举例：（1）“市场进入阻挠”是产业经济学中的一个典型例子。设想有一个垄断企业已在市场上(称为“在位者”)处于优势地位,另一个企业虎视眈眈谋求进入(称为“进入者”)。在位者若要保持自己的垄断优势,就会想方设法阻挠进入者进入。动态博弈通常用博弈树表示,如下图中,进入者先选择行动(进入或不进),在位者然后默许或斗争,最后的数字是支付水平。如进入者选择“进入”,在位者选择默许,支付水平分别为40和50。用不完全信息动态博弈分析“市场进入”例子。在这个博弈中,在位者可能是低成本,也可能是高成本,进入者无法得知。假设在位者先行动———比如说定价。用P表示价格,那么,P 本身可能包含有关在位者成本函数的信息,因为不同成本函数下的最优价格是不一样的。假定存在一个价格P3,只有低成本企业才有利可图,而高成本企业是不敢模仿这个价格的。那么,精炼贝叶斯均衡是,低成本在位者选择P3,高成本企业选择一个较高的垄断价格;如果进入者观察到在位者选择了P3,就推断其为低成本,不进入;否则,就认为在位者是高成本,进入。这就说著名的“垄断限价模型”。

这里，在位者是信号发送者，进入者是信号接受者。当在位者选择价格时，他知道进入者将根据自己选择的价格判断自己是高成本还是低成本的概率；进入者确实是根据观测到的价格修正对在位者类型的判断，然后选择进入还是不进入。 3、“在动态博弈中，因为后行动的博弈方可以观测到先行动方的选择，因此，总是有利的。”此说法正确吗？为什么？不正确，因为在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业可能具有先动优势。 4、简述不完全信息静态博弈由哪些要素构成？

完整word版,博弈论期末复习题

一、支付矩阵 1、试给出下述战略式表述博弈的纳什均衡 B A U D 解：由划线解得知有一个纯战略均衡（R D ,）再看看它是否有混合战略均衡设B 以)1,(γγ-玩混合战略，则有均衡条件： γγγ-=-+?=2)1(21)(U V A γγγ26)1(64)(-=-+?=D V A γγ262-=- 得14>=γ，这是不可能的，故无混合战略均衡，只有这一个纯战略均衡。 2、试将题一中的支付作一修改使其有混合战略均衡解：由奇数定理，若使它先有两个纯战略均衡，则很可能就有另一个混合战略均衡。 B A U D 将博弈改成上述模型，则 )1(64)1(25γγγγ-+=-+ γγ2632-=+ 得 5 4 = γ 同样，设A 的混合战略为)1,(θθ-，则

)1(25)1(16θθθθ-+=-?+ θθ3251+=+ 2 1= θ 于是混合战略均衡为? ???????? ????? ??51,54,21,21。二、逆向归纳法 1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡 1 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上，1认为2选a 的概率为P ，则1选L '的支付P P P 32)1(25+=-+= 1选R '的支付P P P P 3233)1(36+>+=-+=

故1必选R '。 ? 给定1在第二个决策结上选R '，2在左边决策结上会选a ，故子博弈精炼均衡为 {}),(,,d a R L ' 四、两个厂商生产相同产品在市场上进行竞争性销售。第1个厂商的成本函数为 11q c =，其中1q 为厂商1的产量。第2个厂商的成本函数为22cq c =，其中2q 为厂商 2的产量，c 为其常数边际成本。两个厂商的固定成本都为零。厂商2的边际成本c 是厂商2的“私人信息”，厂商1认为c 在?? ????2 3,21上呈均匀分布。设市场需求函数为 214q q P --=，其中P 为价格，两个厂商都以其产量为纯战略，问纯战略贝叶斯均衡为何？解：给定2q ，厂商1的问题是 1 211 1)14( )1(max 1 q q q q P q ---=-=π 因)(22c q q =。厂商1不知道c ，故目标函数为 ?? ????--=---??2 /3212 112 /31212112 11 )(3max )1)(4(max dc c q q q q dc q c q q q q 一阶条件： 0)(232 /3212 1 =- -? dc c q q 得 ?-=2 /3212 1)(2123dc c q q （1）厂商2的问题是： 22 2122212 2)4( )4( )(max 2 q q q q c q c q q q c P q ---=---=-=π 一阶条件： 02)4(21=---q q c

博弈论经典案例分析

博弈论经典案例分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

博弈论基础复习

《博弈论基础》主要知识点一、名词解释（5×2＝10分）策略型博弈它是由三个部分组成，即局中人、策略和各种策略组合中所得到的利益。纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。混合策略局中人的混合策略是其纯策略空间上的一种概率分布，表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。扩展型博弈博弈存在着局中人行动的先后次序，是对具有动态结构的决策形式进行研究的规范分析工具。博弈树对于任何一种双人完备博弈，都可以用一个博弈树来描述，并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。完美信息博弈是指一次只有一个局中人在行动，而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时，从最后一个子博弈开始逆推上。冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。类型 :一般地，将一个参与人所拥有的所有私人信息称为他的类型。信号博弈是研究具有信息传递作用的信号机制的一般博弈模型，其基本特征是两个博弈方，分别称为信号发出方和信号接收方。分离均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者以概率1选择不同的信号，接收者完全可以通过信号来准确判断出发送者的类型。混同均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者选择了相同的信号，接收者无法从信号中得到新的信息，无法对先验信念进行修正。特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益，也就是给出了一种集合函数，称为特征函数。联盟

博弈论经典案例与分析

案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。价格战案例：假设市场中仅有A 、B 两家企业，每家企业可采取的定价策略都是10元或15元，我们可以得出得益矩阵如下：分析：无论对企业A 还是企业B 来说，低价都是他们的占优战略。从表可见，企业A 的占优战略是10元，因为无论B 采取什么战略，企业A 都能获取比定价15元更多的利润。如果企业B 定价10元，企业A 定价10元能够获利80万元，而定价15元只能获得30万元；如果企业B 定价15元，企业A 定价10元可获利170万元，而定价15元却只能获利120万元。同样地，企业B 的占优战略也是定价10元的策略。企业B 男

博弈期末考试总结

博弈与决策答案一、名词解释（每小题2分，共16分） 1、博弈博弈是指一些个人、团队或其他组织，面对一定的环境条件，在一定的规则约束下，依靠掌握的信息，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以施，并从中各自取得相应结果或收益的过程， 2、占优战略均衡占优战略均衡是指在博弈中，如果所有参与人都有占优策略存在，博弈将在所有参与人的优策略的基础上达到均衡． 3、重复博弈重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题， 4、序列博弈序列博弈是指对局者选择策略有时问先后的顺序，某些对局者可能率先采取行动．序列博也是一种动态博弈． 5、动态博弈动态博弈是指在博弈中，参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动． 6、占优战略均衡--占优战略均衡是指在博弈中，如果所有参与人都有占优策略存在，博弈将在所有参与人的占优策略的基础上达到均衡． 7、完全信息---完全信息是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息． 8、得益得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西． 9，博弈论：博弈论就是系统的研究各种各样的博弈问题，寻求各博弈方合理选择策略的情况下博弈的解，并对这些解进行讨论分析的理论。 10，纳什战略均衡：纳什战略均衡指在均衡中，每个博弈参与人都确信，在给定其他参与人选择的策略的情况下，该参与人选择了最优策略以回应对手的策略。 11，静态博弈：静态博弈是指在博弈中，参与人同时选择或非同时选择但后行动者并不知道先行动者采取了什么具体行动。二、、简答题（每小题6分，共24分） 1、占优战略均衡和纳什均衡的联系与区别如下： 1)每一个占优战略均衡都是纳什均衡，而每一个纳什均衡却未必是占优战略均衡； 2)用重复剔除严格劣战略方法，保留下的唯一的重复剔除的占优均衡，就是纳什均衡． 3)纳什均衡，不会被重复剔除严格劣战略方法剔除掉（但弱劣战略剔除，可能会剔除纳什衡）： 4)经重复剔除严格劣战略之后，有不唯一的多个哉略组合保留，其中有的战略组合不一定纳什均衡．即重复剔除严格劣战略方法，无法确保将所有非纳什均衡战略剔除，没有被剔的战略组合不一定是纳什均衡． 5)没有占优战略均衡的博弈，不能用重复剔除严格劣战略方法求解的博弈，可以有纳什均衡2，博弈的构成要素有哪些？并对其进行说明。 2、博弈一般由以下几个要素组成，包括：参与人、行动、信息，策略、得益、结果、均衡等．

博弈论考试试题

博弈论考试试题你有三个小时考试时间。回答所有问题。考试内容比较多，我在认为最难的问题旁边标注了星号，如果你担心不够时间，可以把这些带星号的问题留到最后才做。 1．（55分钟—36分）简略回答下面每个子问题。请写出你的计算过程，并在你不能给出正式结论时，提供大概的解释，那样我可以给你部分分数。（a）尽可能给出正式的说明，指出一个观察到的行为是无穷连续的多级博弈意味什么？给出一个不是无穷连续博弈的例子。（b）尽可能给出正式的说明，指出一个一般性支持的性质意味着什么？在课上我们看到什么理论关于一般性支持的性质？（c）课堂上，在说明带有可观察行为的有限扩展型博弈和无限期多级博弈时，我不同地详细讲述了支付函数。支付函数范畴是如何不同？为什么我做出这个改变？（d）在扩展型博弈中给出一个策略的正式定义。（e）给出一个博弈的例子，其中一个看起来不合理的结果在一个子博弈完美均衡里变成可能。（f）下面显示的扩展型博弈里，博弈者1有多少个纯策略？写出正常形式的支付矩阵。这个博弈有多少子博弈？（g）找出下面博弈中全部的纳什均衡。

（h ）找出二阶段博弈的子博弈完美均衡，博弈者在成本a/16处选择a ，于是博弈者1和2同时行动进行博弈，如下面所示。（i ）找出同时行动博弈中的纳什均衡，其中博弈者1选择1a ∈?，博弈者2选择2a ∈?，支付是，

考虑如下的关于信任的博弈，这在很多试验中都做过。试验者从给博弈者1$10和给博弈者2$0开始。然后试验者问博弈者1愿意将多少美元给博弈者2来帮助他。如果他选择给x美元给试验者，则试验者给博弈者2 *3x。随后，博弈者2有机会将一些或全部（或没有）他获得的钱给博弈者1。（a）假定这两个博弈者都是风险中性的，仅关心他们自己的支付，找出这个博弈的子博弈完美均衡。（顺便说明，子博弈完美均衡不像在试验中出现。通常博弈者1给出一些，但不会把全部的钱给回试验者） (b) 这个博弈有博弈者获得更高支付的纳什均衡吗？（c）假定我们修改了博弈，以致在上述的两阶段后，博弈者1有机会打博弈者2。假定这将减少博弈者1的效用1美元，减少博弈者2的效用5美元。这将改变你们在（a）和（b）中的答案吗？如果我们在第二阶段后有如下显示的博弈会怎么样呢？作个你认为合理的预测。（d*）对这个试验结果的另一个解释是，博弈者可以是无私心的。说明无私心的最简单表达——每个博弈者最大化他自己的美元支付和其他博弈者美元支付的权重和——除了权重上一个特别（非强迫）的选择，不能解释试验规则性。你能想出可能被用来说明试验结果的效用函数吗？

博弈论经典模型全解析

博弈论经典模型全解析（入门级） 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不

会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。 2. 智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是

博弈论试题及答案

诚信考试沉着应考杜绝违纪《博弈论》试卷课堂周四（7/8）院系专业万方电气系通信工程学号余数 0 姓名

河南理工大学2010–2011学年第1学期《博弈论》课程期末考试试卷开课学院：经济管理学院，考试形式：开卷，允许带___________入场考试时间：2010年12月25日－12月25日, 所需时间：周考生姓名：学号：专业：题序一二三四五六七八总分得分评卷人 1、第一题：（10分）（1）举一个你所经历情侣博弈的情形，在实际博弈中你采取什么行动让自己收益最大；答：作为一个男生，我想很多机会都是把握在自己手中的，情侣博弈有二个“纳什均衡”，一次博弈的结局究竟落到哪一个“纳什均衡”，关键就是要看遇事时自己如何去选择了。例如：周末和女朋友去逛商场，应该客观地按照需求去采购，在了解女朋友的爱好的前提下，想办法引导她去看性价比最高的商品，并给予一定建议。遇到她特别喜欢的衣服或饰物，只要价格合理，又能满足生活需要，在对方征求意见时应该支持购买并给予肯定答复；当遇到不合理的购买选择时，应简明扼要地说出其不适之处，并建议对方到其它她喜欢的物品处，挑选令其满意的商品。购物中间一旦遇到对方生气或者发火，可以宽容地对待对方，以显示出自己的城府，若对方为无理取闹，应该坦诚地向对方说明情况，让对方明白自己在为她考虑，说明都说清楚了事情也就简化了。另外，在购物结束前，可以给女朋友买些她喜欢的零食，或者一起去对方喜欢的餐饮店，休息的同时也可调节一下情调，让双方都能够感觉到两个人在一起的幸福与甜蜜。总结一下，在这场情侣博弈中，要想让自己获得最大收益，必须努力做到认真、善意、宽容、强硬、简单明了各种措施相结合。 2、第二题：（20分）请举例说明下列说法是否正确，构造博弈模型具体说明，阐述原因。（1）判断分析“先下手为强” 答：“先下手为强”并不满足所有的情形。博弈中，在有多个"纳什均衡"的情况下,常常是先动手的一方会占一些优势，这和课例中“囚徒困境”情形类似，有一个最佳策略，古代的很多例子也证明了此点，如：诸葛亮先下手为强，占据荆州要势；日本先下手为强，偷袭美国的珍珠港，不然就不会有第二次世界大战；三国曹操先下手为强，迎接汉献帝，后挟天子以令诸侯等。要指出的是，“动态博弈”中也是有很多后动优势的情形，一般是在方案已经制定，自身实力比较弱，需要选择决策的时候，主动放弃先发权利，变先动劣势为后动优势。如：三人参加选举，支持率分别为15%，35%，50%，这个时候，如果15%者先采取行动，可能会立刻被强敌灭掉，所以他必须保存实力，保持低调，不介入强者的争斗，由另两位先动手，争取灭掉一方后均分失败者的支持率，虽然这样扔处于劣势，但比最初情况要好很多。所以，在面对选择

博弈论复习讨论题

1、人与人之间的博弈是什么关系？既可以是竞争关系，也可以是合作关系 2、因为博弈论的研究而获得1994年诺贝尔经济学奖的是泽尔腾、海萨尼、纳什 3、学习博弈论的目的只是为了在今后与他人的博弈中能够打败对手（×） 4、博弈是指在一定的游戏规则约束下，基于（直接）相互作用的环境条件，各参与人依据所掌握的信息，选择各自的策略（行动），以实现利益最大化的过程。 5、如果博弈前的损益总和与博弈后的损益总和相等，该博弈称为零和博弈 6、策略具有以下特性：完整性、不可观察性、多样性 7、人在博弈中并不是完全理性的（√） 8、博弈论的建立基于两大假设，其中除了人的理性以外，还有一个是（人的认知） 9、囚犯困境的根本原因在于个人行为的负外部性（私人成本与社会成本的差异） 10、在囚犯困境的博弈中，事先订立攻守同盟一定是有用的（×） 11、（占优）策略是指无论其他参与者采取什么策略，某参与者采用该策略的结果都优于或不劣于其他策略。 12、以下现象哪些明显属于“囚犯困境”？价格战、公地悲剧、环境污染 13、“好货不便宜、便宜没好货”其实是一个“智猪博弈”，这是因为不懂行的人占了懂行的人的便宜 14、之所以会出现“万元陷阱”，是因为：不懂得止损、沉没成本 15、智猪博弈是一个搭便车的博弈。一方付出了相应的代价，双方共享了所得到的收益。（√） 16、人在“亏损”的情况下，会从一个风险（厌恶）者变成了风险偏好者。 17、以下哪些博弈不属于竞争关系？同学聚会 18、哪些行业是赢者通吃的？演艺界、搜索引擎、门户网站 19、杭州试行的“谦让牌”之所以没效果，是因为宣传力度不够（×） 20、汇合点（Meeting point）必须是（共同）知识才有用 21、以下是某教授和学生张三之间的策略表达式：教授选择放过该学生的概率是多少？50% 22、以下是某教授和学生张三之间的策略表达式：张三选择平时勤快的概率是多少？20% 23、纯策略是指如果一个策略要求参与者在每一个给定信息情况下只选择一种特定的行动（√）

博弈论的经典案例与分析

博弈论的经典案例与分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

博弈论经典案例《智猪博弈》

在经济学中，在经济学中，智猪博弈”(PigS ' PayoffS(BoXed PigS) 是一个著名博弈论例子。这个例子讲的是：猪圈里有两头猪，一头大猪，一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。那么，两只猪各会采取什么策略？答案是：小猪将选择搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的事物数量和踏板与投食口之间的距离。如果改变一下核心指标，猪圈里还会出现同样的小猪躺着大猪跑”的景象吗？试试看。改变方案一：减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡

献食物，所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。改变方案二：增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的共产主义”社会，所以竞争意识却不会很强。对于游戏规则的设计者来说，这个规则的成本相当高（每次提供双份的食物）；而且因为竞争不强烈，想让猪们去多踩踏板的效果并不好。改变方案三：减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小猪和大猪都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费宀完。对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。原版的智猪博弈”故事给了竞争中的弱者（小猪）以等待为最佳策略的启发。但是对于社会而言，因为小猪未能参与竞争，小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。而能否完全杜绝搭便车”现象，就要看游戏规则的核心指标设置是否合适了。

博弈论案例分析

博弈论案例分析一、经济学中的“智猪博弈” (Pigs’payoffs) 故事背景:猪圈里有一头大猪和一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。那么，两只猪各会采取什么策略,答案是:小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边; 而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在,因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。如果改变一下核心指标，猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗,试试看。改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完;大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会，所以竞争意识却不会很强。对于游戏规则的设计者来说，这个规则的成相当高(每次提供双份的食物) ;而且因为竞争不强烈，想让猪们去多踩踏板的

博弈论试题

杭州师范大学2010-2011学年第二学期通识课程期末考试《博弈论与企业管理》试卷一、单项选择题（本大题共12题，每题3分，共36分） 1. 下列关于优势策略均衡和纳什均衡的描述正确的是（） A 优势策略均衡肯定是纳什均衡； B 纳什均衡都是优势策略均衡； C 纳什均衡是特殊的优势策略均衡； D 以上三种情况都有可能 2. 以下关于承诺的描述不准确的是（） A 承诺使威胁可置信； B 承诺往往对自己构成约束； C 承诺往往不需要成本； D 承诺往往会给自己带来成本，但最终结果使自己有利 3. 对于以下报酬矩阵，哪个命题是正确的（） A 甲和乙都有占优策略； B 只有甲有占优策略； C 只有乙有占优策略； D 两人都没有占优策略 4. 对于如下报酬矩阵，乙的占优策略是（） A 上； B 中； C 左； D 右

5. 对于题4的报酬矩阵，以下哪个是纳什均衡（） A （上，左）；B （上，右）；C （下，右）；D （上，中） 6. 对于题4的报酬矩阵，如果乙先走一步，并且知道甲再作决策时已经知道乙的决策，那么，乙将采取（） A 左；B 中； C 右；D 上 7. 交易双方信息不对称，比如买房不知道卖方的一些情况，是由于（） A 卖方故意隐瞒自己的一些情况； B 买方自身的认识能力有限； C 买方掌握完全信息的成本太高； D 以上三种情况都有可能 8. 面对不对称信息，下列哪一项不能为消费者减少信息不对称（） A 品牌；B 低价格 C 产品保证 D 长期质量保证书 9. 下列哪一项不是高质量的信号（） A 产品保证； B 延长的质量保单； C 暂时的经营场所； D 被认可的品牌 10.在二手市场上，（） A 买主知道商品的质量，而卖主不知道； B 买主不知道商品的质量，而卖主知道； C 卖主和买主都知道商品的质量是低的； D 卖主和买主都不知道商品的质量是低的 11.一个有效的激励机制必须能够（） A 使代理人参与工作的净收益不低于不工作也能得到的收益； B 使代理人让委托人满意的努力水平也是给代理人带来最大净收益的努力水平； C 尽可能地减少或消除代理人的目标函数与委托人的目标函数之间的冲突； D 以上都是 12.在信息不对称的劳动力市场，效率最低的激励机制是（） A 固定工资；B 效率工资；C 利润分享； D 提成二、简答题（本大题共6题，第1、2、3题每题4分，第4、5、6题每题6分，共30分） 1.一个博弈如果出现两败俱伤的结果，这样的博弈一定是非合作的零和博弈吗 2.两个罪犯只打算合伙犯罪一次，所以被捕后出现了囚徒困境的情况。如果这两个罪犯准备合伙犯罪30次，那么在开始的犯罪活动中如果被捕，还会出现囚徒困境吗 3.请举例分析说明在什么条件下博弈者采取威胁对方的策略可以奏效。 4.某博弈的报酬矩阵如下：（1）如果（上，左）是优势策略均衡，那么a ，b ，c ，d 应满足什么条件（2）如果（上，左）是纳什均衡，那么，又应该满足什么条件（3）如果（上，左）是优势策略均衡，那么，它是否必定是纳什均衡为什么

博弈论复习题及答案

博弈论判断题（每小题1分，共15分）囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t