博弈论基础

博弈论基础
博弈论基础

博弈论浅谈

博弈论浅谈 在查找博弈论课题资料的过程中,不禁发现自己已经深深地被这门数学分支吸引住了。我想,这门学问的魅力主要在于它的实用性,数学中很少有一个方面能够被如此广泛地应用到实际生产实践、解释自然界的现象当中。而博弈论无疑是这其中一个既吸引数学家也吸引着数学“门外汉”的“大众科学”了。 博弈论又称对策论,主要研究斗争性或竞争性现象的理论解决方法,是现代数学的分支,也是运筹学的一部分。博弈论会考虑竞争过程中的个体的预测行为和实际行为,并研究它们的优化以达到最优化策略。一般以1928年数学家、计算机专家冯·诺依曼证明了博弈论的基本原理这一事件作为博弈论正式诞生的标志。发展至今已经渐趋完善,此过程中有许多优秀的学者如冯·诺伊曼、约翰·纳什等为之作了卓越贡献。由于博弈论与经济学类相关甚紧,博弈论中某一理论的研究常常会带来经济学领域的一大突破,正如1994年约翰·纳什作为数学家获诺贝尔经济学奖所体现的一样,这种跨学科的效应在博弈论学中淋漓尽致地体现了出来。 “博弈论”该词在现代社会可以说是脍炙人口,在各种大型讲演和授课中经常能听到,但我个人觉得这个词的翻译不如它的英文源词“Game Theory”一样直白。“Game Theory”如果理解为“游戏的理论”更能够清晰地向一位不了解博弈论的人介绍这门科学。至于上升

到“博弈”的层次当然也是有其原因的。“Games”在当代早已将其内涵和外延延伸至社会科学、自然科学的方方面面,已经不仅仅停留在“游戏”的层面上。广义上来说,一个结构中的群体之间的相互作用构成一个博弈。狭义一点,社会中人群之间或集团之间的合作、承诺、互相利用等也是博弈论的体现。从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,因为博弈论的基本假定是博弈各方的行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。博弈论研究的是理性的博弈方之间如何进行策略选择的。由此可知,大到社会的发展、生物的繁衍,小至下棋打牌都可以看作是博弈。这么说来博弈论对于我们来说一点也不陌生,这些不正是与我们息息相关的日常事务?中国人对博弈论自古代就有深入的了解,甚至有将其理论系统化。比如《三十六计》就将当时军事上使用的计谋等集中收集到了一起,这种“计谋”其实就是指导人们的博弈理论。 作为数学的一个分支,且不论博弈论对自然科学的重要性,它还对社会科学有着重要的意义,是社科研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。它还深刻地改变着人们的思维,如人们熟知的“囚徒困境”“海盗分宝石”等问题已经作为经济学、心理学的经典案例;成功企业中的高管与智囊团因善于博弈、制定正确的发展战略而使公司利于不败之地;政府公务员在制订法律、颁布政策时也需要不断利用博弈理论,站在人民的角度看问题从而进一步完善规章制度以促进外

博弈论的基础知识(doc 21页)

博弈论的基础知识与应用(转) 1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括: 1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略

性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是 博弈论的基础知识与应用(转) 1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括: 1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

博弈论作业及答案 浙江财经大学 张老师作业答案

第1次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:W1/2

博弈论的基本概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

博弈论的理论精华及其现实意义

48 [收稿日期]2002-02-25 [作者简介] 胡希宁(1952-),男,安徽芜湖人,中共中央党校经济学教研部教授;贾小立(1970-),男,山西洪洞人,中共 中央党校研究生院硕士研究生。 博弈论的理论精华及其现实意义 胡希宁 1 贾小立 2 (1.中共中央党校经济学教研部,北京100091; 2.中共中央党校研究生院,北京100091) [摘要]经济博弈论以贴近现实的方式,揭示了现代经济活动的内在规律。它的发展过程是 纳什均衡从提出到改进的过程。无论在理论上还是在实践上,博弈论都具有重要的现实意义。 [关键词] 博弈论;纳什均衡;信息经济学 [中图分类号] F062.5 [文献标识码]A [文章编号]1007-5801(2002)02-0048-06 第6卷第2期 2002年5月 中共中央党校学报 Journal of the Part y School of the Central Committee of the C.P.C. Vol.6,No.2Ma y .,2002 博弈论(Game Theor y )研究的是,各个理性决策个体在其行为发生直接相互作用时的决策及决策均衡问题。冯?诺伊曼(John Von Neumann )与摩根斯坦恩(Oskar Mor g enstern )合作出版的《博弈论与经济行为》(1944)一书第一次系统地将博弈论引入经济学中。到20世纪50年代,合作博弈发展到鼎盛期,非合作博弈也开始产生。纳什 (Nash ,J.F.)的《N 人博弈的均衡点》(1950)、《非 合作博弈》(1951)明确提出了“纳什均衡”(Nash E q uilibrium ),图克(Tucker )则定义了“囚徒困境”(Prisoners’Dilemma ,1950)。两人的著作奠定了 现代非合作博弈论的基石。泽尔滕(R.Seleten , 1965)首次将动态分析引入博弈论,提出了纳什均 衡的第一个重要改进概念———“子博弈精炼纳什均衡”(Sub g ame Perfect Nash E q uilibrium )和相应 的求解方法———“逆向归纳法”(Bakeward Induction )。豪尔绍尼(J. C.Harsan y i ,1967)首次 把信息不完全性引入博弈分析,定义了“不完全信息静态博弈”(Static Games of Incom p lete information )的基本均衡概念———“贝叶斯-纳什 均衡” (Ba y esian -Nash E q uilibrium ),构建了不 完全信息博弈的基本理论。之后,不完全信息动态博弈(d y namic g ames of incom p lete information ) 得到迅速发展,弗得伯格和泰勒尔(Furdenber g and Tirole ,1991)定义了它的基本均衡概念——— “精炼贝叶斯—纳什均衡”(Perfect Ba y esian -Nash E p uilibrium )。70年代以后,博弈论形成了一个完整的体系;大体从80年代开始,博弈论逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础。1994年诺贝尔经济学奖被授予纳什、豪尔绍尼和泽尔滕三人,以表彰他们在博弈论的发展及应用中所作出的开创性贡献。 一经济博弈论的基本理论———基本博弈结构、纳什均衡及其改进 这里,我们以完全信息静态、完全信息动态、不完全信息静态、不完全信息动态四种博弈结构为主线,对纳什均衡及其改进进行概括,以阐明经济博弈论的主要思想内涵。 (一)完全信息静态博弈———纳什均衡 纳什均衡是完全信息静态博弈的基本均衡概念。完全信息静态博弈(Static Games of Com p lete Information )是指,博弈的每个局中人(参与竞争的具有不同利益的行为主体或决策者)对所有其他局中人的特征(策略空间、支付函数等,前者指可供局中人选择的策略组合,后者指决定局中人损益得失的函数)有完全的了解;所有局中人同时选择行

张维迎《博弈论与信息经济学》部分答案

张维迎《博弈论与信息经济学》部分习题答案 如果图片不显示,用打印预览就可以了。 P127 第一题:领悟精神就可以了,而且每本书上都有这些例题,不找了。 第二题: UMD 为参与人1的战略,LMR 为参与人2的战略。前面的数字代表参与人1的得益,后面的代表参与人2的得益。 参与人2的R 战略严格优于M 战略,剔除参与人2的M 战略,参与人1的U 战略优于M 战略,剔除参与人1的M 战略,参与人1的U 战略优于D 战略,剔除参与人1的D 战略,参与人2的L 战略优于R 战略,剔除参与人2的R 战略。最后均衡为U ,L (4,3)。这样可能看不清,按照步骤一步步画出图就好多了。 第三题:恩爱型 厌恶型 用划线法解出,恩爱的都活着或者都死,厌恶的或者受罪,死了对方另一个人开心的不得了。 第四题:没有人会选择比原来少的钱,战略空间为{原来的钱,比原来多的钱}。支付为{0,原来的钱,比原来多的钱}。纳什均衡为选择原来的钱。要画图自己画画。 第五题:n 个企业,其中的一个方程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n =(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。

第六题:在静态的情况下,没有一个企业愿意冒险将定价高于自己的单位成本C ,最终P=C ,利润为0。因为每个参与人都能预测到万一自己的定价高于C ,其他人定价为C 那么自己的利益就是负的(考虑到生产的成本无法回收)。就算两个企业之间有交流也是不可信的,最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争,一定会取得一个P 1=P 2=P 均衡。此时利润不为零,双方将不在进行价格竞争。 第七题:设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。 π1=(P 1-C)(a-P 1+P 2),π2=(P 2-C)(a-P 2+P 1)。一阶最优:a-2P 1+C+P 2=0,a-2P 2+C+P 1=0。 解得:P 1=P 2=a+C ,π1=π2=a 2。 第八题:不会! 到纳什均衡为(A,A,A),(A,B,A),(B,B,B),(A,C,C),(C,C,C)。 第十题: 无纯战略纳什均衡,设参与人1为P 1~P 4,参与人2为Q 1~Q 4。 得到:-Q 2+Q 4=Q 1-Q 3=Q 2-Q 4=-Q 1+Q 3,推出:Q 1=Q 2=Q 3=Q 4=1/4。同理P 1=P 2=P 3=P 4=1/4。以上述的概率在杆子,老虎,鸡,虫子中选择一个。

博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

博弈论基础复习

《博弈论基础》复习大纲 一、名词解释(5×2=10分) 策略型博弈 它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡 指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略 局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈 博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树 对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈 是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈 指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。 行为策略 是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法 逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略 又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 一般地,将一个参与人所拥有的所有私人信息称为他的类型。 静态贝叶斯均衡 是一种与类型有关的策略组合,其中每个局中人在给定自己类型和其它局中人策略的情况下最大化自己的期望效用函数。

信号博弈 是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡 信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡 信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 联盟 设},,2,1{I =ζ为局中人集合,则其中任意一非空子集ζ?S 为一个联盟。 特征函数 特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 核 多人合作博弈中所有不被超优的分配的集合。 核仁 合作博弈核仁解所依据的基本思想是:在分配属于核仁的条件下,最不理想的联盟也要优于任何其它分配向量的最不理想的联盟。 二、 判断题(5×1=5分) 三、 简答题(4×7=28分) 策略型博弈的基本要素。 策略型博弈的基本要素有: 局中人:即博弈的参与者,可以是自然人﹑企业﹑政府﹑社团等。 策略:指每个局中人在博弈中可选择采用的行动方案。 支付:指每个局中人从各种策略组合中获得的收益。 什么是纳什均衡?你是如何理解的? 纳什均衡及其理解: 在一个博弈过程中,无论其它局中人的策略选择如何,局中人都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,局中人谁都没有动机单方面偏离该状态,那么这个组合就被定义为纳什均衡。 1.是完全信息静态博弈的解的一般概念。 2.每一个严格占优战略均衡一定是纳什均衡,反之不然。

博弈论理论经典讲解

博弈论经典案例 冰晶淩(杂物区)2010-04-09 22:31:28 阅读258 评论0 字号:大中小订阅 引用 光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什,泽尔腾和海萨尼.而博弈论可以划分为合作博弈和非合作博弈.那三位博弈论专家的贡献主要是在非合作博弈方面,而且现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈.合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有,就是合作博弈;反之,就是非合作博弈.非合作博弈强调的是个人理性,个人最优决策,其结果可能是有效率的,也可能是无效率的.而合作博弈强调的是团体理性.下面是我收集的张维迎教授的几个有关博弈论的经典 案例. <案例一:囚徒困境> 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里审讯.警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(或许因证据不足);如果其中一人坦白一人抵赖,坦白的放出去,不坦白的判刑10年(这有点'坦白从宽,抗拒从严'的味道).这里,每个囚徒都有两种战略:坦白或抵赖.表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是第一个囚徒的支付,第二个数字为第二个囚徒的支付.战略形式又称标准形式,是博弈的两种表述形式之一,它特别方便于静态博弈分析. 在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白.事实上,这里,(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡.就是说,不论对方如何选择,个人的最优选择是坦白.比如说,如果B不坦白,A坦白的话被放出来,不坦白的话判1年,所以坦白比不坦白好;如果B坦白,A坦白的话判8年,不坦白的话判10年,所以,坦白还是比不坦白好。 这样,坦白就是A占优战略;同样,坦白也是B的占优战略.结果是,每个人都选择坦白,各判刑8年. <案例二:智猪博弈> 这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮需要付2个单位的成本.若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。表中第一格表示两猪同时按按钮,因而同时走到猪食槽,大猪吃7个,小猪吃3个,扣除2个单位的 成本,支付水平分别为5和1.其他情形可以类推. 在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择"按"还是"等待",小猪的最优选择均是"等待".比如说给定大猪按,小猪也按时得到1个单位,等待则得到4个单位;给定大猪等待,小猪按得到-1单位,等待则得0单位,所以,"等待"是小猪的占优战略.给定小猪总是选择"等待",大猪的最优选择只能是"按".所以,纳什均衡就是:大猪按,小猪等待,各得4个单位.多劳者不多得! <案例三:性别战>

博弈论基础

ECON 40050 Game Theory Exam 1- Answer Key Instructions: 1) You may use a pen or pencil, a hand-held nonprogrammable calculator, and a ruler. No other materials may be at or near your desk. Books, coats, backpacks, etc... must be placed against the wall. No electronic communication devices may be used. 2) As soon as the instruction to begin the test is given, please check that you have 10 numbered pages. 3) Be sure to show all of your work. Answers without supporting calculations will receive zero credit. You will receive credit only for the answers and supporting calculations that appear in this test packet. 4) All exams must be turned in by 1:45 pm. No extensions will be granted. 5) Be sure to read each question in its entirety before beginning your analysis. 6) The time estimates at the beginning of each question are only suggestions to help you manage your time. NAME ____________________________________________ Question 1 (10 minutes)_______ (15 points) Question 2 (10 minutes)_______ (15 points) Question 3 (10 minutes)_______ (15 points) Question 4 (15 minutes)_______ (15 points) Question 5 (20 minutes)_______ (20 points) Total: (65 minutes)_______ (80 points)

吉本斯博弈论课后答案第4章

R R M 4.1.a 标准式 1↖2 L ’ R ’ 4,1 0,0 3,0 0,1 2,2 2,2 纯战略纳什均衡:( L, L ’ ) ( R, R ’ ) 子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ ) 精炼贝叶斯纳什均衡:( L, L ’ ) 4.1.b 标准式 1↖2 L ’ M ’ R ’ 1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4 纯战略纳什均衡:( R, M ’ ) 子博弈精炼纳什均衡:( R, M ’ ) 精炼贝叶斯均衡: 没有 4.2 标准式 1↖2 L ’ R ’ 2,2 2,2 3,0 0,1 0,1 3,0 六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。 求混合战略精炼贝叶斯均衡: 设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p ?? 参与者2选择L ’和R ’的概率分别为,(1)q q ? 在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212 120*1*1*0*p p p p p p +=+?= 给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则: 121212 12[3*0*(1)][0*3*(1)]2*(1) 41:**,*112 p q q p q q p p p p p p q +?=+?=??=== =又 联立得 所以 L L M L L M L R L

4.3答案(见4.5) 4.4 表示方法 第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号; 第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a ) [(,),(,),1/2] [(,),(,),1/2] [(,),((1),),1/2][(,),(,),1,0] R R u u p R R d u p R R d u u p L R u d p q αα><+?=== (b ) [(,),(,),1/2,2/3] [(,),(,),1,0][(,),(,),0,1] L L u u p q L R d u p q R L u d p q =<==== 中文版习题4.5答案 (a ) [(,),(,),1/3,1/2]R R u d p q >= (b ) 12121212[(,,),(,),1/3,1/2] [(,,),(,),1/2,0] L L L u u p p q q L L R u d p p q q ==+<==+=

博弈论知识点总结完整版

博弈论 (一):基本知识 1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。 1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。 合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。 博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈: a、完全信息静态博弈,纳什均衡,Nash(1950) b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965) c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968) d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form) 1.6占优均衡: a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 对于所有的s-i,si*称为参与人 i的严格占优战略,如果满足: ui(si*,s-i)>ui(si',s-i) ?s-i, ?si' ?si* b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡: a、“严劣”和“弱劣”的含义: 设s i’和s i’’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。 上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’’。 b、定义:重复剔除严格策略就是 各参与人在其各自策略集中, 不断剔除严劣策略…如果最终 各参与人仅剩下一个策略,则 该策略组合就被称为重复剔除 严劣策略均衡。 (二):纳什均衡(Nash Equilibrium) 2.1纳什均衡定义:对于一个策略式表述的博弈G={N,S i, u i,i∈N},称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡,如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i 的最优策略(经济理性策略),即:u i(s i*, s-i*)

博弈论基础

博弈论 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。参见:行为生态学(behavioral ecology)。 约翰·冯·诺依曼 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。 1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的 策墨洛(Zermelo) 基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出

博弈论与信息经济学答案

第一章 5. n 个企业,其中的一个方程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n=(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。 6.假定消费者从价格低的厂商购买产品,如果两企业价格相同,就平分市场,如果企业i 的价格高于另一企业,则企业i 的需求量为0,反之,其它企业的需求量为0。因此,企业i 的需求函数由下式给出: i i i i i i i i p pi p p p p 0)/2Q(p ) Q(p q --->=c 那么每家企业的利润02 i i j i p c q ππ-== >,因此,企业i 只要将其价格略微低于其它企业就将获得整个市场的需求,而且利润也会上升至()()22 i i i i p c p c Q p Q p εε---->,()0ε→。同样, 其它企业也会采取相同的策略,如果此下去,直到每家厂商都不会选择降价策略,此时的均衡结果只可能是p i =p j =c 。此时,企业i 的需求函数为2 i a c q -= 。 在静态的情况下,没有一个企业愿意冒险将定价高于自己的单位成本C ,最终P=C ,利润为0。因为每个参与人都能预测到万一自己的定价高于C ,其他人定价为C 那么自己的利益就是负的(考虑到生产的成本无法回收)。就算两个企业之间有交流也是不可信的,最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争,一定会取得一个P 1=P 2=P 均衡。此时利润不为零,双方将不在进行价格竞争。 7.设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。

相关文档
最新文档