习题课3-任

博弈论期末习题

《博弈论》期末习题专业：经济学学号：2 ；姓名：王兆丽一、试写出掷硬币博弈的局中人及其策略与得益函数，并写出双变量得益矩阵。答：局中人：盖硬币者和猜硬币者。策略：有正面和反面两种可选择策略，若猜对，猜者得１盖者－１.否则猜者－１盖者１.由于每一方都不会让对方在选择之前知道自己的决策，所以可以看做是同时做决策的。双变量得益矩阵；猜硬币方二、试举生活中的一例，说明囚徒困境是如何产生的？并试分析可能走出囚徒困境的途径。答：例子：中国移动和中国联通之间的价格战。产生原因：囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现整体、个体利益共同的最优。简单的说，囚徒困境问题都是个体理性与集体理性的矛盾引起的。可能走出的囚徒困境途径：(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚，那么就会制止这种现象发生。（2）忠诚文化。有时候，建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中，团体产生所面临的囚徒困境问题的轻重程度是不同的，这种差异的根本来源就是各个组织有自己的文化。（3）长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复，如果这个“多次”足够长，那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财，合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。答：1、该博弈共包括四个子博弈：（1）从博弈方1选择R 以后博弈方2的第二阶段选择开始的三阶段动态博弈；（2）从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈；（3）第三阶段博弈方1选择A 以后博弈方2 的单人博弈；（4）第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中任何一个的得益都相同，因此在这阶段随意选择一个都可以。倒退回第三阶段，博弈方1选择ＡＢ中任何一个都可以。再推回第二阶段，博弈方２选择Ｌ将得到３选择Ｒ得到２，因此选择Ｌ；最后回到第一阶段，博弈方１选择Ｌ得到２选择Ｒ得到３,。所以该博弈的子博弈完美纳什均衡为：博弈方１第一阶段选择Ｒ，博弈方２第二阶段选择Ｌ，即（３,１）是该博弈的完美纳什均衡。四、两个寡头企业进行价格竞争博弈，企业1的利润函数是 q c aq p ++--=21)(π，企业2的利润函数是p b q +--=22)(π，其中p 是企业1 的价格，q 是企业2的价格。求： 1．两个企业同时决策的纯战略纳什均衡；两个企业同时定价。根据两个企业的得益函数，很容易导出它们各自的反应函数：απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

博弈论第三章习题

问题1：如果开金矿博弈中第三阶段乙选择打官司后的结果尚不能肯定，即下图中a 、b 数值不确定。试讨论本博弈有哪几种可能的结果。如果本博弈中的“威胁”和“承诺”是可信的，a 或b 应满足什么条件？ ①0a <，不借—不分—不打； ②01a <<，且2b >，借—不分—打； ③1a >，且2b >，借—不分—打(,)a b ； ④0a >，且2b <，借—分—（2，2）问题2：三寡头市场需求函数Q P -=100，其中Q 是三个厂商的产量之和，并且已知三个厂商都有常数边际成本2而无固定成本。如果厂商1和厂商2同时决定产量，厂商3根据厂商1和厂商2的产量决策，问它们各自的产量和利润是多少？ 1123111231(100)2(98)q q q q q q q q q π=----=--- 2123221232(100)2(98)q q q q q q q q q π=----=--- 3123331233(100)2(98)q q q q q q q q q π=----=--- 33123 0,(98)/2q q q q π?=?=--? （a ，b ）（0，4）

代入，11212122(98)/2,(98)/2q q q q q q ππ=--=-- 1212 0,0q q ππ??==??，得***12398/3,49/3q q q === ***1234802/9,2401/9πππ===。问题3：设两个博弈方之间的三阶段动态博弈如下图所示。（1）若a 和b 分别等于100和150，该博弈的子博弈完美纳什均衡是什么？（2）T N L --是否可能成为该博弈的子博弈完美纳什均衡路径，为什么？（3）在什么情况下博弈方2会获得300单位或更高的得益？（1）博弈方1在第一阶段选择R ，在第三阶段选择S ，博弈方2在第二阶段选择M 。（2）不可能。T N L --带来的利益50明显小于博弈方1在第一阶段R 的得益300；无论a 和b 是什么数值，该路径都不能构成Nash 均衡，不能成为子博弈完美Nash 均衡。（a ，b ） 50，300

博弈论经典例子

博弈论经典例子篇一:《博弈论三大经典案例》经典的囚徒困境 1950年，由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论，后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述，并命名为"囚徒困境"。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检举对方(相关术语称"背叛"对方)，而对方保持沉默，此人将即时获释，沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作")，则二人同样判监半年。若二人都互相检举(互相"背叛")，则二人同样判监2年。用表格概述如下：甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者(即"囚徒")都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为"严格劣势"，理性的参与者绝不会选择。另外，没有任何

其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁，并不知道对方选择;而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境：一名经理，数名员工;前提，经理比较苛刻; 如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人

博弈论第七章习题

第七章习题一、判断下列表述是否正确，并作简单分析（1）海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈，说明有了海萨尼转换，不完全信息静态博弈和一般的不完美信息动态博弈是等同的，不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。答：错误。即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈，也是一种特殊的有两个阶段同时选择的不完美信息动态博弈，对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。（2）完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。答：正确。完全信息静态博弈中的混合策略博弈几乎总是可以解释成一个有少量不完全信息的近似博弈的一个纯策略Bayes—Nash均衡。夫妻之争的混合策略Nash均衡可以用不完全信息夫妻之争博弈的Bayes—Nash均衡表示就是一个例证。（3）证券交易所中的集合竞价交易方式本质上就是一种双方报价拍卖。答：正确。我国证券交易中运用的集合竞价确定开盘价的方式就是一种双方报价拍卖。与一般双方报价拍卖的区别只是交易对象，标的不是一件而是有许多件。（4）静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型，都设定行为选择，而不是只针对实际类型设定行为选择，是因为能够迷惑其他博弈方，从而可以获得对自己更有利的均衡。

答：错误。不是因为能够迷惑其他博弈方，而是其他博弈方必然会考虑这些行为选择并作为他们行为选择的依据。因为只根据实际类型考虑行为选择就无法判断其他博弈方的策略，从而也就无法找出自己的最优策略。其实，在这种博弈中一个博弈方即使自己不设定针对自己所有类型的行为选择，其他博弈方也会替他考虑。因为设定自己所有类型下的行为，实际上是要弄清楚其他博弈方对自己策略的判断。（5）“鼓励—响应”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。答：错误。“鼓励—响应”机制也就是说真话的直接机制，实际上只保证博弈方揭示，也就是说出自己的真实类型。博弈方不直接选择行为，也不保证根据真实类型行为，更谈不上一定能实现最理想的结果。因为直接机制的结果常常是带有随机选择机制的，并不一定理想。实际上对所有博弈方都理想的结果在静态贝叶斯博弈中本身不一定存在。二、双寡头古诺模型，倒转的需求函数为 ()P Q a Q =-，其中12Q q q =+为市场总需求，但a 有h a 和l a 两种可能的情况，并且厂商1知道a 究竟是h a 还是l a ，而厂商2只知道h a a =的概率是θ， l a a =的概率是1θ-，这种信息不对称情况双方都是了解的。双方的总成本仍然是i i i c q cq =。如果两厂商同时选择产量，问双方的策略空间是什么？本博弈的贝叶斯纳什均衡是什么？解：设厂商1已知h a a =时的产量为11()h q a q =，已知l a a =时的产量是11()l q a q =；再假设厂商2的产量是 2q ，这两个函数关系就是两个厂商的策略空间。 11211()h h h h h a q q q cq π=---

公需课《大国博弈中的全球产业链分化重构》课后习题及答案

大国博弈中的全球产业链分化重构总分：100 及格分数：60 单选题（共7题，每题5分） 1、亚特兰大的产业领域有四个特点：洗你胃、洗你脑、让你睡、生产杀人武器。其中，（）表明是洗你脑。 A、将假日酒店集团总部设在亚特兰大 B、通过CNN向世界人民输出美国价值观 C、向全世界生产一些攻击性的武器装备 D、通过可乐改变全世界人民的饮食文化 2、根据本讲，国家之间的行为方式如果相互有影响，在这种情况下，国家之间这种互动、影响的静态或动态过程的表现类型就叫（）。 A、发展 B、竞争 C、制约 D、博弈 3、价值链是从（）层面讲，企业在市场上提供商品和服务，通过不同的生产流程创造价值。 A、商品 B、企业 C、国家 D、服务 4、中国的GDP未来肯定要超过美国，支撑中国GDP超越美国的一个重要基础是（）。 A、在大国博弈过程中，尽快建立盟友体系 B、在大国博弈过程中，尽快瓦解以欧美为代表的一些西方发达国家形成的盟友体系 C、在大国博弈过程中，提高外汇储备 D、在大国博弈过程中，产业链结构重组

5、1719年是我们国家最强盛的一个封建王朝（），当时是中国GDP产量全球最高的一个时代。。 A、文景之治 B、开元盛世 C、康乾盛世 D、贞观之治 6、大国之间博弈最为激烈的是在（） A、制度文化领域 B、军事安全领域 C、产业科技领域 D、文化教育领域 7、现在，出外旅行的中国人越来越多，购买能力越来越强。对一些不友好的地区，游客不愿意去。这种变化会导致（）。 A、全球需求链重组 B、全球供应链重组 C、全球产业链重组 D、全球分布链重组多选题（共6题，每题5分） 1、全球治理机制变革的最终目标是（）。 A、实现全人类的利益共同体 B、使全人类从全球化的治理变革中享受到好处、优势 C、发展以中国为代表的新兴国家力量 D、瓦解以欧美为代表的一些西方发达国家形成的一些盟友体系 E、规避或消除传统治理机制带来的风险、冲突和矛盾 2、根据本讲，未来全球治理机制变革的理念是（）。 A、共同商量

博弈论经典案例分析

博弈论经典案例分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

博弈论复习题及标准答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（ ) 博弈中知道越多的一方越有利。( ×）纳什均衡一定是上策均衡。(×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×) 在一个博弈中博弈方可以有很多个。(√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。 (×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×) 在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如:在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√ ) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√ ) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√) 如果阶段博弈G={Ａ1, A2,…,An; u1, ｕ2,…,un)具有多重Nash均衡，那么可能(但不必)存在重复博弈Ｇ(T)的子博弈完美均衡结局，其中对于任意的t

博弈论第七章习题复习课程

博弈论第七章习题

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是：每一个局中人选择一个策略，由所有局中人的策略构成了一个策略组合；在其它局中人选定策略不变的情况下，若某一个局中人单独地违背自己已选的策略，那么他的收益只会下降（或收益不会增加）。这样的策略组合构成一个均衡局势，并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时，就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈中，若均为G 的其纳什均衡，若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?，0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡； (2)至少有两个纳什均衡，并且其中之一是帕累托占优均衡。（1 ）不存在纯策略的纳什均衡：该博弈不存在纯策略的纳什均衡（2）该博弈有三个纳什均衡：（战争，战争）、（和平，和平）和一个混合策略纳什均衡。很显然，（和平，和平）是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业，它们的成本函数分别为： TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品，其市场需求函数为：Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。解：由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争和平国家 1战争-5，-58，-10和平-10，810，10

博弈论案例分析

(1)失火了，你往哪个门跑失火了，你往哪个门跑——这就是博弈论一天晚上，你参加一个派对，屋里有很多人，你玩得很开心。这时候，屋里突然失火，火势很大，无法扑灭。此时你想逃生。你的面前有两个门，左门和右门，你必须在它们之间选择。但问题是，其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的，那么你将因人多拥挤、冲不出去而烧死；相反，如果你选择的是较少人选择的，那么你将逃生。这里我们不考虑道德因素，你将如何选择？这就是博弈论！你的选择必须考虑其他人的选择，而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付，不仅取决于你的行动选择——博弈论称之为策略选择，同时取决于他人的策略选择。你和这群人构成一个博弈（game）。上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型，被称之为少数者博弈或少数派博弈（Minority Game）。当然，原来的博弈形式不是这么简单，这里我把它简化了，我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。生活中博弈的案例很多，你会见到很多例子。只要涉及到人群的互动，就有博弈。什么叫博弈？博弈的英文为game，我们一般将它翻译成“游戏”。而在西方，game的意义不同于汉语中的游戏。在英语中，game即是

人们遵循一定规则下的活动，进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中，game有竞赛的意思，进行game的人是很认真的，不同于汉语中游戏的概念。在汉语中，游戏有儿戏的味道。因此将关于game的理论，即game theory翻译成博弈论或者对策论，是恰当的。本书下面统称game theory为博弈论。博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦，他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家，他同时对计算机的发明作出了巨大贡献，他去世时博弈论还未对经济学产生广泛影响，否则经济学的诺贝尔奖肯定有他的名字，因为诺贝尔奖有规定，只颁发给在世的学者。谈到博弈论，不能忽略博弈论天才纳什（John Nash）。纳什的开创性论文《n人博弈的均衡点》（1950）、《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。博弈论对于社会科学有着重要的意义，它正成为社会科学研究范式中的一种核心工具，以至于我们可称博弈论是“社会科学的数学”，或者说是关于社会的数学。从理论上讲，博弈论是研究理性的行动者（agents）相互作用的形式理论，而实际上它正深入到经济学、政治学、社会学等等，被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家：纳什、塞尔屯、哈桑尼（），而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南，1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论课后习题

第一章导论 1、什么是博弈？博弈论的主要研究内容是什么？ 2、设定一个博弈模型必须确定哪几个方面？ 3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。 4、“囚徒的困境”的内在根源是什么？举出现实中囚徒的困境的具体例子。 5、博弈有哪些分类方法，有哪些主要的类型？ 6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的：你决定开，则 0.35的概率你讲收益300万元（包括投资），而 0.65的概率你将全部亏损；如果你不开，则你能保住本钱但也不会有利润，请你（a）用得益矩阵和扩展形式表示该博弈；（b）如果你是风险中性的，你会怎样选择？（c）如果你是风险规避的，且期望得益的折扣系数为 0.9，你的策略选择是什么？(d)如果你是风险偏好的，期望得益折算系数为 1.2，你的选择又是什么？ 7、一逃犯从关押他的监狱中逃走，一看守奉命追捕。如果逃犯逃跑有两条可选择的路线，看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢，但一旦被抓住则要加刑10年；看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈，并作简单分析。第二章完全信息静态博弈 1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么？ 2、为什么说纳什均衡是博弈分析中最重要的概念？

3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。 4、多重纳什均衡是否会影响纳什均衡的一致预测性质，对博弈分析有什么不利影响？ 5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡？博弈的结果是什么？ 6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 7、博弈方1和2就如何分100元进行讨价还价。假设确定了以下规则：双方同时提出自己要求的数额S1和S2，,如果s1+s2≤10 000，则两博弈方的要求都得到满足，即分别得到s1和s2，但如果是s1+s2＞100,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么？如果你是其中一个博弈方，你会要求什么数额，为什么？ 8、设古诺模型中有n家厂商、qi 为厂商i的产量，Q=q1+…+qn为市场总产量、P为市场出清价格，且已知P=P(Q)=a-Q(当Q＜a时，否则P=0)。假设厂商i 生产qi产量的总成本为Ci=Ci（qi）=cqi,也就是说没有固定成本且各厂商的边际成本都相同，为常数c(c＜a).假设各厂商同时选择产量，该模型的纳什均衡是什么？当n趋向于无穷大时博弈分析是否仍然有效？ 9、两寡头古诺模型，P(Q)=a-Q等与上题相同，但量厂商的边际成本不同，分别为c1和c2。如果0＜ci＜a/2,问纳什均衡产量各为多少？如果c1＜c2＜a,但2c2＞a+c1,则纳什均衡产量又为多少？ 10、甲乙两公司分属两个国家，在开发某种新产品方面有下面得益矩阵表示的博弈关系（单位：百万美元）。该博弈的纳什均衡有哪些？如果乙公司所在国政府想保护本国公司利益，有什么好的办法？ 11、设一个地区选民的观点标准分布于【0,1】上，竞选一个公职的每个候选人同时宣布他们的竞选立场，即选择0到1之间的一个点。选民将观察候选

博弈论经典案例与分析

案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。价格战案例：假设市场中仅有A 、B 两家企业，每家企业可采取的定价策略都是10元或15元，我们可以得出得益矩阵如下：分析：无论对企业A 还是企业B 来说，低价都是他们的占优战略。从表可见，企业A 的占优战略是10元，因为无论B 采取什么战略，企业A 都能获取比定价15元更多的利润。如果企业B 定价10元，企业A 定价10元能够获利80万元，而定价15元只能获得30万元；如果企业B 定价15元，企业A 定价10元可获利170万元，而定价15元却只能获利120万元。同样地，企业B 的占优战略也是定价10元的策略。企业B 男

博弈论的经典案例与分析

博弈论的经典案例与分析囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判0年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A 来说，囚徒B 有坦白和不坦白两种可能的选择，假设囚徒B 的选择是不坦白，则对囚徒A 来说，不坦白得益为-1，坦白得益为0，他应该选择坦白；假设囚徒B 选择的是坦白，则囚徒A 不坦白得益为-8，坦白得益为-5，他还是该选择坦白。因此，在此博弈中，无论囚徒B 采取何种策略囚徒A 的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：性格大战案例：一对恋人准备在周末晚上一起出去，男的喜欢看足球，但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。分析：可以看出，分开将使他们两人得不到任何满足，只要在一起，不管是看时装表演还是看足球，两人都会得到一定的满足。但看足球将使男的得到更大的满足，看时装表演则使女的得到更大的满足。在这样的一个对局中，男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。因此，如果男的已经买好了足球的门票，女的当然就不再反对；反之，如果女的已经买好了时装表演票，男的也就会与她一起看时装表演。 1，1 8， 0 不坦白 0，8 5，5 坦白嫌疑犯乙不坦白坦白嫌疑犯甲 1，2 -1， -1 时装 0，0 2，1 足球男时装足球女

博弈论习题及解答

※第一章绪论 §1.2 1. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?（见教材） 2. 分别用规范式和扩展式表示下面的博弈。两个相互竞争的企业考虑同时推出一种相似的产品。如果两家企业都推出这种产品，那么他们每家将获得利润400万元；如果只有一家企业推出新产品，那么它将获得利润700万元,没有推出新产品的企业亏损600万元；如果两家企业都不推出该产品，则每家企业获得200万元的利润。 3. 什么是特征函数? （见教材） 4. 产生“囚犯困境”的原因是什么？你能否举出现实经济活动中囚徒困境的例子？原因：个体理性与集体理性的矛盾。例子：厂商之间的价格战，广告竞争等。

※第二章完全信息的静态博弈和纳什均衡 1. 什么是纳什均衡? （见教材） 2. 剔除以下规范式博弈中的严格劣策略，再求出纯策略纳什均衡。先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。然后用划线法求出该矩阵博弈的纯策略Nash均衡。 3. 求出下面博弈的纳什均衡。由划线法易知，该矩阵博弈没有纯策略Nash均衡。由表达式(2.3.13)~(2.3.16)可得如下不等式组 Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1 将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。解：设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)} 令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x) 作出三条直线，如下图，图中粗的折线，就是F(x)的图象

博弈课

提要从全球几次重要的气候谈判大会的博弈进程来看,气候变化的全球政策国际谈判折射出南北矛盾、发达国家内部矛盾、发展中国家的内部分歧和针对排放大国的矛盾。虽然各方针对全球温室气体减排的有关政策签订了多个致力于合作解决气候问题的国际公约及其议定书,但真正的全球合作存在相当的难度,这是当前一系列气候变化全球政策国际博弈反映出来的严峻现实。气候变化正成为国际社会面临的最严重挑战,国际社会期望在制定气候变化全球政策的核心内容上达成一致协议,就温室气体减排的额度、分配及补偿作出规定,以共同遏制全球变暖。但由于气候变化全球政策既是一个“环境规则”履行公约,也是一个“经济权利”分配公约,是一个跨期国际协同行动的问题,需要将一系列错综复杂的价值追求、环境义务、经济权利、国家主权、利益分配等问题置于一种制度安排之下,其在目标的具体制定和实施上不仅涉及全球发展与公平性问题,而且影响各国的经济发展利益。因此各国基于自身利益的考虑,在全球气候变化政策的核心内容上存在巨大分歧,历次气候大会实质上均是各个国家复杂的利益博弈。一、全球气候变化谈判大会历程回顾 1992年,联合国里约地球峰会上签订了《联合国气候变化框架公约》(简称公约)。该公约最重要的是确定了“共同但有区别的责任”原则,在碳减排上对发达国家和发展中国家规定了不同的义务,要求发达国家承担明确的大幅度减排义务,同时向发展中国家提供资金和技术,以帮助后者应对气候变化。 2005年2月,第一个全球温室气体减排的国际行动方案《京都议定书》(简称议定书)生效。该议定书设定了国际社会应对气候变化在2008~2012年问的减排目标,就减排途径提出了国际排放贸易、联合履行和清洁发展机制三种灵活减排机制,并根据公约“共同但有区别的责任”的原则不要求发展中国家承担减排义务。 2007年12月,巴厘岛联合国气候变化会议着重讨论了《京都议定书》第一承诺期在2012年到期后应对气候变化的措施安排,并通过了“巴厘岛路线图”。但路线图没有明确规定2012年后发达国家减排温室气体的明确目标,在是否能有效向发展中国家转让和推广相关技术方面也有很大不确定性。 2009年12月,在哥本哈根举行了《联合国气候变化框架公约》第15次缔约方会议。在会议上发达国家试图抛弃“共同但有区别的责任”的原则,脱离双轨制而谋求单轨制,在不愿承诺大规模量化减排的同时,要求发展中国家的减排目标应该受到国际监督,做到“可测量、可报告、可核查”。会议上还出现了代表发达国家利益的“丹麦草案”,该草案意图摈弃《联合国气候变化框架公约》和《京都议定书》,试图就一套新的公约体系和议定书进行重新谈判。草案一经提出,立即激起了发展中国家的强烈不满。最终各国经协商,就应对气候问题达成一项《哥本哈根协议》(简称协议),该协议保留了发达国家和发展中国家不同碳排放要求的双轨制,在一个文件中明确提出一个可预期的资金数额。协议在一定程度上维护了发展中国家的发展权益,但协议没定下任何具体减排目标,且不具有法律效力。二、气候变化政策谈判中的利益博弈根源所有的政策规则都是非中性的,统一的政策和规则对不同的参与方会带来不同的影响。

习题课1答案

1.金属电阻应变片与半导体材料的电阻应变效应有什么不同? 答：金属电阻的应变效应主要是由于其几何形状的变化而产生的，半导体材料的应变效应则主要取决于材料的电阻率随应变所引起的变化产生的。 2.直流测量电桥和交流测量电桥有什么区别? 答：它们的区别主要是直流电桥用直流电源，只适用于直流元件（电阻），交流电桥用交流电源，适用于所有电路元件（电阻、电容、电感等）。 3.采用阻值为120Ω灵敏度系数K =2.0的金属电阻应变片和阻值为120Ω的固定电阻组成电桥，供桥电压为4V ，并假定负载电阻无穷大。当应变片上的应变分别为1和1 000时，试求单臂、双臂和全桥工作时的输出电压，并比较三种情况下的灵敏度。解：单臂时04K U U e =，所以应变为1时6 60421021044K U U e --创= == V ，应变为1000时应为3 30421021044 K U U e --创=== V ；双臂时02K U U e =，所以应变为1时6 60421041022K U U e --创=== V ，应变为1000时应为3 30421041022 K U U e --创=== /V ；全桥时0U K U e =，所以应变为1时 60810U -= /V ，应变为1000时应为30810U -= /V 。从上面的计算可知：单臂时灵敏度最低，双臂时为其两倍，全桥时最高，为单臂的四倍。 4.采用阻值R =120Ω灵敏度系数K =2.0的金属电阻应变片与阻值R =120Ω的固定电阻组成电桥，供桥电压为10V 。当应变片应变为1000时，若要使输出电压大于10mV ，则可采用何种工作方式（设输出阻

博弈论三大经典案例

经典的囚徒困境 1950年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择： ?若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。 ?若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。 ?若二人都互相检举（互相“背叛”），则二人同样判监2年。用表格概述如下：甲沉默（合作）甲认罪（背叛）乙沉默（合作）二人同服刑半年甲即时获释；乙服刑10年乙认罪（背叛）甲服刑10年；乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择： ?若对方沉默、背叛会让我获释，所以会选择背叛。 ?若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境：一名经理，数名员工; 前提，经理比较苛刻; 如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人都超负荷工作如果某人不听从吩咐，其他人听从吩咐，则此人下岗。其他人继续工作如果所有人都不听从经理吩咐，则经理下岗但是，由于员工之间信息是不透明的，而且，都担心别人听话自己不听话而下岗，所以，大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

博弈论复习题及答案

博弈论判断题（每小题1分，共15分）囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t