论纳什均衡及其启示

装订处

论纳什均衡及其启示

摘要: 纳什是一个非常天才的数学家,他发现了—非合作博弈的均衡,即“纳什均衡”理论。这个理论给我们的启示是:合作是有利的“利己策略”。

关键词：利己策略；纳什

纳什是一个非常天才的数学家,他天才地发现了—非合作博弈的均衡,即“纳什均衡”理论。纳什20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他作出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

一、囚犯的两难处境

博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点JL东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。

但是,如果你们两人都坦白交代,那么,你们都要被判五年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择—坦白或抵赖。显然最好的策略是

纳什均衡

纳什均衡简介纳什均衡，又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略，那么这个组合就被定义为纳什均衡。一个策略组合被称为纳什均衡，当每个博弈者的均衡策略都是为了达到自己期望收益的最大值，与此同时，其他所有博弈者也遵循这样的策略。纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是约翰·纳什在普林斯顿大学攻读博士学位时完成的。实际上，博弈论的研究起始于1944年冯·诺依曼（ Von Neumann）和奥斯卡·摩根斯坦（Oscar Morgenstern）合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，证明了纳什均衡在n人有限博弈中的普遍存在性，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而对“合作博弈（Cooperative Game）”和“ 非合作博弈”做了明确的区分和定义。阿尔伯特·塔克（Albert tucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。在概念和方法两方面，该论文都是作者的独立创造。” 纳什均衡例子博弈论中一个著名的例子就是囚徒困境。囚徒困境是一个非零和博弈，说的是两个嫌疑犯甲和乙私人民宅联手作案，被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被判刑3个月，对方将被判刑10年；若两人都不招供则因未获证据但私人民宅将各拘留1年；如果两人均招供，每人将被判刑5年。于是，两个人同时陷入招供还是不招供的两难处境。结果是，尽管甲不知乙是否招供，但他认为自己选择“招供”最好，因而甲会选择“招供”，同样乙也会选择“招供”，两人各判5年。而两人都选择不招供，虽证据不足但因私人民宅将各拘留1年的结果是不会出现的。博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年；乙判刑三个月不招供

纳什均衡的重要影响及其问题局限

研究领域：微观经济学纳什均衡的重要影响及其问题局限高红阳（东北师范大学传媒科学学院，吉林长春 130117；吉林大学管理学院博士生，吉林长春 130022）摘要：纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础，其对经济学以及其他社会科学甚至自然科学产生了重要影响。尽管纳什均衡理论及其应用得到了空前的肯定，但近年来纳什均衡分析却遭到了前所未有的质疑。论文从理性前提、犯错误、多重性、静态分析、动态分析、期望效用等六个角度论述了目前理论所存在的问题局限，而且将学界尝试解决上述问题的有限理性、好像理性、颤抖手均衡、聚焦均衡、风险占优均衡、帕累托最优均衡、防联盟均衡、相关均衡等方法一并加以讨论阐述。关键词：纳什；纳什均衡；局限博弈论（game theory）研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，纳什均衡（Nash Equilibrium）是博弈解的一般名称，是当前博弈理论体系的核心概念。从1994年纳什（Nash）、泽尔腾（Selten）和海萨尼（Harsanyi）三位博弈论专家获得诺奖，博弈论一直是十余年来学界最活跃的研究领域之一，被经济学、政治学、生物学、军事学等许多学科奉为重要的方法论基础。 1纳什均衡的重要影响 1.1纳什及纳什均衡的得来纳什1928年生于美国西弗吉尼亚州。关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是纳什在普林斯顿大学攻读博士学位时完成的。实际上，博弈论的研究起始于1944年冯·诺依曼（Von Neumann）和奥斯卡·摩根斯坦（Oscar Morgenstern）合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，证明了纳什均衡在n人有限博弈中的普遍存在性，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而对“合作博弈（Cooperative Game）”和“非合作博弈”做了明确的区分和定义。图克（Tucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。在概念和方法两方面，该论文都是作者的独立创造。” 1.2纳什均衡的重要影响纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础，正如克瑞普斯（Kreps，1990）在《博弈论和经济建模》一书的引言中所说，“在过去的一二十年内，经济学在方法论以及语言、概念等方面，经历了一场温和的革命，非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面（谢识予，1999）：（1）改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等，均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域，改变了这些学科领域的内容和结构，成为这些学科领域的基本研究范式和理论分析工具，从而改变了原有经济学理论体系中各分支学科的内涵。（2）扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济

纳什均衡

1.纳什均衡：给出对方的策略，你所选的是最优的（至少不比其它策略差），如果每个局中人都是这样，那么所构成的策略组合（对局），就称为纳什均衡。 2.效用：消费者偏好与收入之间的相互作用导致人们做出消费选择，效用则是人们从这种消费选择中所获得的愉悦或满足。 3.边际产量：当其他要素不变时，可变要素增加一个单位所带来的总产量的增加量。 4.生产成本：经营一个企业，为达到利润最大化，必须支付一些资金来维持运营，如建造厂房，采购机器及原料，雇用员工等支出都可视为厂家的生产成本。 5.帕累托标准：如果一种变化可以改善某些人的处境，同时对其他人都没有伤害。则这种变化是好事，应该给予实行。 6.恩格尔系数：是食品支出总额占个人消费支出总额的比重。一个家庭收入越少，家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大，随着家庭收入的增加，家庭收入中或者家庭支出中用来购买食物的支出将会下降。恩格尔系数是用来衡量家庭富足程度的重要指标。 7.效用：消费者偏好与收入之间的相互作用导致人们做出消费选择，效用则是人们从这种消费选择中所获得的愉悦或满足。 8.价格管制：是指政府对新药定价以及上市药品价格上涨实施严格的管制，企业不能自由定价，而是由政府和制药企业谈判决定新药的价格。 9.软着陆：当一个国家经过强劲的经济增长后，仍维持缓和的增长，并未因此转入衰退，即使“软着陆”。 10.硬着陆：一个国家的经济在高速增长的同时伴随着高度通货膨胀，使得经济迅速从增高长直接走入低增长甚至衰退。 11.通货膨胀：平均物价水平持续上扬的状态，通货膨胀率通常是以消费者物价指数（CPI）的变化率来表示。指数上升→物价上升，货币购买力下降。 12.再贴现率：一般商业银行可以直接向中央银行借贷的利率。所谓“贴现”：通过一定的方式把发生在未来（或不同时间）的费用和效益转化为现值的方式就叫贴现。 13.机会成本：在资源一定的情况下，多生产一个单位的某种产品，就要以少生产若干单位的另一种产品为代价。这种放弃若干单位另一种产品生产的代价，就是生产某种成品的机会成本。 14.需求价弹性价格：指在市场需求曲线的任何一点，价格每变动1%所导致的需求量变动的百分比。它是衡量产品需求量对产品价格变动的敏感指标。 15.生产函数（生产成本）：企业在每个时期投入的各种生产要素的数量与获得的产出品的数量之间的关系。 16.均衡及均衡价格：均衡：供给和需求达到平衡的状态。均衡价格：供需平衡时的价格。有时被称为市场出清价格。 17.资源的概念及分类：指用于生产能满足人类需要的东西的那些物品或劳务。分类：自由资源和经济资源 18.恩格尔曲线：某种商品的均衡购买量与消费者货币收入之间的关系。 1.药物需求与供给的特征：需求的特征：需求的不确定性、需求的最高优先性、需求的不可替代性、需求的外部效应性、需求缺乏弹性、需求的被动性、独特的需求三方结构供给的特征：高质量性、高技术性、高投入性、高风险性、高回报性、高度集中性 2.影响药品需求的因素有哪些：（一）一般经济学因素：1.经济发展水平；2.价格水平（1）是否实施医疗保障制度（2）医疗保障制度下保障的范围（3）医疗保障制度的报销制度和自付比例等（二）社会人口学因素（三）流行病学因素（四）临床医生和药师因素（五）医药技

第二卷智猪博弈案例

第二卷智猪博弈案例在博弈论经济学中，有一个博弈叫“智猪博弈”，“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的：假设猪圈里有一头大猪、一头小猪，猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，我们来分析一下，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；大猪，小猪同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。从中我们可以看出，在两头猪都有智慧的前提下，最好的结果是小猪选择等待。 1 在博弈论经济学中，有一个博弈叫“智猪博弈”，“智猪博弈”是一个著名的纳什均衡的例子。其内容是这样的：假设猪圈里有一头大猪、一头小猪，猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，我们来分析一下，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；大猪，小猪同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。从中我们可以看出，在两头猪都有智慧的前提下，最好的结果是小猪选择等待。实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪也行动的话，小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本，以下纯收益计算相同)，而小猪等待的话，则可以获得4个单位的纯收益，等待优于行动；在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果小猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡在纳什均衡中，你不一定满意其他的策略，但你的策略是回馈对手招数的最佳策略。从囚徒困境中我们会发现，作为博弈各方的行动就是针对对方行动而确定的最佳对策，而一旦知道对方在做什么，就没人愿意改变自己的做法。博弈论学把这么一个结果称为均衡。这个概念是有普林斯顿大学数学家约翰·纳什提出的，因此被称为纳什均衡。诺贝尔经济学奖获得者萨缪尔森有句名言，你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词，供给与需求。博弈论专家坎多瑞引申说：“要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是纳什均衡”。 1950年，还是一名研究生的纳什写了一篇论文，题为《n人博弈的均衡问题》，该文只有短短一页纸，可就这短短一页纸成了博弈论的经典文献。纳什的贡献是，他证明了在这一类的竞争中，在很广泛的条件下是有稳定解存在的，只要是别人的行为确定下来，竞争者就可以有最佳的策略。那么，什么纳什均衡呢？简单说，就是一策略组合中，所有的参与者面临这样的一种情况：给定你的策略，我的策略是我最好的策略。给定我的策略，你的策略也是你最好的策略，即双方在对方给定的策略下不愿意调整自己的策略。纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具，所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展，甚至说是一场革命。纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战，按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果，

从纳什均衡引出一个悖论：从利己的目的触发，结果损人不利己。“囚徒困境”就是如此，从这个意义说，纳什均衡提出的悖论实际上动摇了西方经济学的基石。纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。这个法则如下：走完寻找优势策略和剔除劣势策略的捷径之后，下一步就是寻找这个博弈的均衡。所谓博弈均衡，它是一稳定的博弈结果。均衡是博弈的一结果，但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的，因而是可以预测的。在囚徒困境中存在唯一的纳什均衡点，即两个囚犯均选择“招认”，这是唯一稳定的结果。有些博弈的纳什均衡点不止一个，如下述夫妻博弈中有两个纳什均衡点。丈夫和妻子商量晚上的活动，丈夫喜欢看拳击，而妻子喜欢欣赏歌剧，但两个人都希望在一起度过夜晚。在这个夫妻博弈中有两个纳什均衡点：要么一同去看歌剧，要么一同去看拳击。在有两个或两个以上纳什均衡点的博弈中，其最后的结果难以预测。在夫妻博弈中，我们无法知道，最后结果是一同欣赏歌剧还是一同看拳击。是不是所有的博弈均存在纳什均衡点呢？不一定存在纯策略纳什均衡点，但至少存在一个混合策略均衡点。这里所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略，所谓混合策略是指参与者采取的不是唯一的策略，而是其策略空间上的概率分布。我们下面将在警察与小偷的博弈中给出混合策略的说明。在西部片里，我们常能看到这样的故事：某个小镇上只有一名警察，他要负责整个镇的治安，现在我们假定，小镇的一头有一家酒馆，另一头有一家银行，再假定该地有一个小偷，要实施偷盗。因为分身乏术，警察一次只能在一个地方

博弈论与纳什均衡

《博弈论与纳什均衡理论》姓名张贺祺学号 2010010404 专业政治经济学指导老师张秉云

摘要博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法，也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。关键字：博弈论；纳什均衡；合作博弈；非合作博弈

目录摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) （一）博弈论的主要思想 (4) （二）博弈论的分类 (5) 三、经典案例 (7) （一）博弈论的经典案例 (7) （二）纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) （一）博弈论的重要影响 (8) （二）纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论一、引言近代对于博弈论的研究，开始于策墨咯（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。 1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。博弈论（Game Theory）:亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：（Nash equilibrium）又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。二、博弈论与纳什均衡的主要内容（一）博弈论的主要思想一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P：为局中人，博弈的参与者，也称为博弈方，局中人是能够独立决策，独立承担责任的个人或组织，局中人以最终实现自身利益最大化为目标。决策人：在博弈中率先做出决策的一方，这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者：在博弈二人对局中行动滞后的那个人，与决策人要做出基本反面的决定，并且他的动作是滞后的、默认的、被动的，但最终占优。他的策略可能依赖于决策人劣势的策略选择，因此对

纳什均衡的应用

纳什均衡的应用 1．考虑不对称的古诺双头垄断，市场反需求函数为Q p -=115，A 企业生产的固定成本为1000，B 企业没有固定成本，A 和B 两个企业的可变成本分别为2a q 和2b q 。（1）请写出A 公司的古诺反应函数的表达式。（2）请写出B 公司的古诺反应函数的表达式。（3）请求出纳什均衡时两个企业的产量和利润。 2．在贝特兰德模型中，假定每个企业的最大生产能力是K ，单位生产成本为c ＝10，需求为100，如果两个企业的价格相同，市场需求在二者之间平分；如果j i P P < (i ，j ＝1，2，i ≠j)，企业i 产量为Min{100-P i ，K}，企业j 的产量为Min[Max(0，100-P i -K)，K](即只有低价企业不能满足需求时，高价企业才生产，并且产量不超过生产能力)。 (1)求企业的得益函数； (2)假定300，即两国税收的替代系数。假定两国是同时决策，征税的边际成本为c 1，c 2>0，无固定成本。试求解该博弈问题的纳什均衡。 7．五户居民都可以在一个公共的池塘里放养鸭子。每只鸭子的收益v 是鸭子总数N 的函数，并取决于N 是否超过某个临界值N ；如果N N <，收益N N v v -==50)(；如果N N ≥时，0)(=N v 。再假设每只鸭子的成本为c ＝2元。若所有居民同时决定养鸭的数量，问该博弈的纳什均衡是什么？ 8．一群渔夫在一个特定有限的区域内集体作业。该区域捕鱼的回报依赖于整体的总作业时

纳什均衡不动点

纳什均衡的存在性与多重性对于数学家来说，一个数学概念的存在性与唯一性是特别需要加以关注的。这是因为，从形式逻辑角度看，如果某个事物并不存在，那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的，因为对于不存在的事物来说，任何关于它的陈述或判断都不可能加以证伪。所以，倘若某个概念所对应的事物并不存在。那么，关于这个概念所给出的研究结论都必然不存在被证伪的可能。因而根据波普尔的证伪主义观点，这样的研究不具备科学上的意义。所以，我们在对任何新提出来的数学概念加以系统研究之前，首先需要弄清楚所研究的对象事物是否存在。有许多被称为伪科学的东西，它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。譬如，所谓的特异功能或“超灵学”并未得到证实，而UFO研究迷们至今也未能拿出一件存在球外生命的证据，所以，特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。除了存在性之外，概念事物的唯一性也是数学家们所关心的问题。从纯理论的兴趣上看，数学家们更多地是从审美的角度上看待概念的唯一性，但从波普尔的证伪主义哲学看，模型均衡解的唯一性关系到模型的预测功能，从而是科学理论应基本具有的特征。我们在第二章中曾指出，理论的预测功能是判别理论的科学性的准绳，而在第三章中，我们提出用纳什均衡作为模型的预测结果。按照这样的逻辑，一个自然的推论就是：模型能否具有科学意义取决于纳什均衡的唯一性。因为倘若纳什均衡不是唯一的，那么就难以根据模型对即将出现的结果加以预测，这种不确定性对于科学理论来说是不存在的。再加上前面谈到的存在性问题，我们可以这样说，模型能否具有科学意义取决于纳什均衡的存在性和唯一性，因为这正是科学理论所具有的基本性质。博弈论目前发展的情况是这样的：已经证明在非常一般的情况下，纳什均衡是存在的，这是一个好的结果；但是，在许多情形，模型的纳什均衡解不是唯一的，这被称为纳什均衡的多重性问题。纳什在1950年代证明了纳什均衡的存在性定理，为非合作博弈打下了重要基础。纳什的工作不仅解决了存在性问题，而且还为其后的博弈论研究提供了一整套方法论工具，即运用不动点定理(fixed point theorem)这一强有力的数学工具进行博弈论数学分析，这对后来的博弈论甚至数理经济学的发展产生了很大的影响。纳什均衡的多重性问题至今仍是困扰博弈论学者的一个主要问题。为了攻克这一问题，博弈论专家已经做出了许多贡献，如聚点均衡、相关均衡，子博弈精炼纳什均衡，颤抖手均衡，序贯均衡等概念的提出。但不幸的是，这类努力还未使得多重均衡问题完全得到解决，许多博弈论专家正在这一领域进行着不懈的工作。本章将给出纳什均衡的存在性定理和讨论存在多重均衡情况下的均衡选择问题。

纳什均衡点

纳什均衡点纳什均衡点纳什均衡点（港译：纳殊均衡点），又称为非合作博弈均衡点，是博弈论的一个重要概念，以约翰·纳什命名。如果某情况下无一参与者可以独自行动而增加收益，则此策略组合被称为纳什均衡点[1]。 [编辑本段]例子经典的例子就是囚徒困境，囚徒困境是一个非零和博弈。大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被判刑一年，而对方将被判刑十年；如果两人均招供，将均被判刑五年。于是，两人同时陷入招供还是不招供的两难处境。如果两人均不招供，将最有利，只被判刑三年。但两人无法沟通，于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳氏均衡点。这时，个体的理性利益选择是与整体的理性利益选择不一致的。囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年；乙判刑一年不招供甲判刑一年；乙判刑十年甲判刑三年基于经济学中Rational agent的前提假设，两个囚犯符合自己利益的选择是坦白招供，原本对双方都有利的策略不招供从而均被判刑三年就不会出现。事实上，这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”（也叫非合作均衡），换言之，在此情况下，无一参与者可以“独自行动”（即单方面改变决定）而增加收获。 [编辑本段]学术争议和批评第一，纳什（Nash）的关于非合作（non-cooperative）博弈论的平衡不动点解（equilibrium/fixpoint）学术证明是非构造性的（non-constructive），就是说纳什用角谷静夫不动点定理（Kakutani fixed point theorem）证明了平衡不动点解是存在的，但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发

博弈论基础作业及答案

博弈论基础作业一、名词解释纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。囚徒困境的例子：军备竞赛；中小学生减负；几个大企业之间的争相杀价等等；以中小学生减负为例：在当前的高考制度下，给定其他学校对学生进行减负，一个学校最好不减负，因为这样做，可以带来比其他学校更高的升学率。给定其他学校不减负，这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此，不论其他学校如何选择，这个学校的最佳选择都是不减负。每个学校都这样想，所以每个学校的最佳选择都是不减负，因此学生的负担越来越重。请用同样的方法分析其他例子。智猪博弈的例子：大企业开发新产品；小企业模仿；股市中，大户搜集分析信息，散户跟随大户的操作策略以股市为例：给定散户搜集资料进行分析，大户的最佳选择是跟随。而给定散户跟随，大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随，散户的最佳选择都是跟随。因此如果大户和散户是聪明的，并且大户知道散户也是聪明的，那么大户就会预见到散户会跟随，而给定散户跟随，大户只有自己分析。请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。破釜沉舟是一个承诺行动。目的是要断绝自己的退路，让自己无路可退，让自己决一死战变得可以置信。也就是说与敌人对决时，只有决一死战，这样才可以取得胜利。否则，如果不破釜沉舟，那么遇到困难时，就很有可能退却，也就无法取得胜利。穷寇勿追就是要给对方一个退路，由于有退路，对方就不会殊死抵抗。否则，对方退无可退，只有坚决抵抗一条路，因而必然决一死战。自己也会付出更大的代价。

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡 1．假设厂商A 与厂商B 的平均成本与边际成本都是常数，10A MC =，8B MC =，对厂商产出的需求函数是 50020D Q p =- （1）如果厂商进行Bertrand 竞争，在纳什均衡下的市场价格是多少？（2）每个厂商的利润分别为多少？（3）这个均衡是帕累托有效吗？解：（1）如果厂商进行Bertrand 竞争，纳什均衡下的市场价格是10B p ε=-，10A p =，其中ε是一个极小的正数。理由如下：假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ，那么必有10A p ≥，8B p ≥，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，A p 和B p 都不会严格大于10。否则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足10A p ≤，10B p ≤。但是由于A p 的下限也是10，所以均衡时10A p =。给定10A p =，厂商B 的最优选择是令10B p ε=-，这里ε是一个介于0到2之间的正数，这时厂商B 可以获得整个市场的消费者。综上可知，均衡时的价格为10A p =，10B p ε=-。（2）由于厂商A 的价格严格高于厂商B 的价格，所以厂商A 的销售量为零，从而利润也是零。下面来确定厂商B 的销售量，此时厂商B 是市场上的垄断者，它的利润最大化问题为： max pq cq ε>- ① 其中10p ε=-，()5002010q ε=-?-，把这两个式子代入①式中，得到： ()()0 max 1085002010εεε>----???? 解得0ε=，由于ε必须严格大于零，这就意味着ε可以取一个任意小的正数，所以厂商B 的利润为：()()500201010εε-?--????。（3）这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本，所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格，那么厂商B 的利润和消费者的剩余就都可以得到提高，同时又不损害厂商A 的剩余（因为A 的利润还是零）。 2．（单项选择）在下面的支付矩阵（表10-1）中，第一个数表示A 的支付水平，第二个数表示B 的支付水平，a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”，那么：表10-1 博弈的支付矩阵

团队管理中的纳什均衡

团队管理中的纳什均衡众所周知，团队就是由每一位个体员工和管理者个体组成的一个共同体，该共同体能够集中每个个体的知识、智慧和技能优势，促进个体之间的高度互补与工作协调，并形成团队优质，解决问题，实现共同目标，而纳什均衡则是指定博弈、对策和游戏中的一种情形，一种给定博弈、对策和游戏对手的最佳选择，自己的最佳选择，即每个人都从利己的角度出发做出最佳选择，选择对自己最有利的策略，而不考虑社会福利或其他对手的利益，这种策略组合由所有局中人的最佳策略组合构成，在缺乏有效外力推动的情况下，没有人会主动改变自己的策略以便获得更大利益。在团队管理中，如果团队成员之间的选择是在非完全信息对称的情况下做出的，则团队建设就很有可能遇到纳什均衡。下面我们试分析之。企业文化与个人追求企业文化是作为一个组织的企业内部的全体员工的共同价值观和道德准则，共同的精神追求和行为规范，从人本逻辑上来讲，企业文化则是企业家文化，而企业家文化的形成和确定，则必然打上企业家个人的价值取向烙印，即企业家自己的所谓最有利的选择。而团队成员在某种特定的企业文化氛围里边也有着每个人的追求，即所谓的

他所做的对自己最有利的选择，如果团队成员的选择与企业家的选择是一致的，这构成一种合作均衡，否则，团队成员的选择与企业的选择不同甚至完全相反，这就形成了纳什均衡。如在市场经济条件下，一家企业文化的价值追求体系是效率公平，则每一个团队在这种特定选择中，彼此的最佳选择就是追求效益最大化，更快更好地完成团队目标，其结果是企业目标的顺利实现；相反如果一家企业文化的价值追求体系是伦理公平，讲求平均主义，则每一个团队及其成员则会在这种给定选择中，彼此的最佳选择就是追求不劳而获，减少劳动量，甚至是高效能人才的大量流失和闲置，其结果是企业目标的落空。团队精神与团队冲突团队精神要求团队每个成员的行为能够积聚团队的整体优势，形成合力，解决问题，向团队目标迈进，而团队冲突则是由于团队成员在交往中产生意见与分歧，出现分歧，对抗导致彼此间关系紧张的局面，如果团队成员都能把团队精神视作其他成员的行为出发点和落脚点，那么该成员则也会做好他的最佳选择－－做团队精神的捍卫者和实践者，从而达成每一个成员的最佳选择；相反如果团队成员认为其他成员完全站在对抗和竞争的立场上与之对话，那么该成员也必然会站在同样的立场上做出选择，其结果导致团队冲突升级，如果在冲突升级过程中没有任何成员做出重新的以团队精神为导向的选择，那么团队精神就会沦为乌有，团队也会走向解体。职责分工与利益分配在团队管理中，进行岗位的职责分工并进行相对应的利益分配是

智猪博弈

在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈很长，一头有一踏板，另一头是饲料的出口和食槽。猪每踩一下踏板，另一边就会有相当于10份的猪食进槽，但是踩踏板以后跑到食槽所需要付出的“劳动”，加起来要消耗相当于2份的猪食。问题是踏板和食槽分置笼子的两端，如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候，坐享其成的另一头猪早已吃了不少。 “笼中猪”博弈的具体情况如下：如果两只猪同时踩踏板，同时跑向食槽，大猪吃进7份，得益5份，小猪吃进3份，实得1份；如果大猪踩踏板后跑向食槽，这时小猪抢先，吃进4份，实得4份，大猪吃进6份，付出2份，得益4份；如果大猪等待，小猪踩踏板，大猪先吃，吃进9份，得益9份，小猪吃进1份，但是付出了2份，实得-1份；如果双方都懒得动，所得都是0。利益分配格局决定两头猪的理性选择：小猪踩踏板只能吃到一份，不踩踏板反而能吃上4份。对小猪而言，无论大猪是否踩动踏板，小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边，这是最好的选择。现在来看大猪。由于小猪有“等待”这个优势策略，大猪只剩下了两个选择：等待，一份也得不到；踩踏板得到4份。所以“等待”就变成了大猪的劣势策略，当大猪知道小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。启示在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种明智的选择。这时候有所不为才能有所为！高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。如果再加上一些更为实际的条件，假设大猪小猪分别具有M、m饲料相当的能量，在等待一个单位时间内，两猪会同时消耗1份饲料相当的能量，且当消耗的能量大于一定比例后会虚弱。此时大猪完全可以等待。这样符合一些情况下的市场竞争原则。当然如果要考虑其他更复杂的因素，比如说大猪小猪单位时间消耗的能量不同，这又得考虑最佳能量比。所以智猪博弈只能在一些特殊环境下应用。带给企业的启示

纳什均衡的启示及其应用

纳什均衡的启示及其应用【摘要】本文介绍了博弈论中的纳什均衡——非合作博弈的概念、进化、原理和现象，并列举了纳什均衡理论在社会生活、经济生活以及企业管理等方面的应用和作用机理，从而论证了纳什均衡的理论研究意义和其在实践中的价值。【关键词】纳什均衡企业人才流失商业价格竞争环境污染贸易壁垒 “博弈”一词是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语。天才数学家纳什深入研究了非合作领域的博弈现象，对博弈论做出了杰出的贡献。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡是完全信息静态博弈解的一般概念，是最常见的均衡，是非合作对策中的一种自然趋向解。纳什均衡理论彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石。一、纳什均衡的进化 “纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。著名的“囚徒故事”中两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此，从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲，勿施于我。其次，“纳什均衡”是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展，甚至可以说是一场革命。从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。博弈论在现实中的应用很多。首先，它是一种数学理论，可以用于经济学等领域；再者，它作为一种理论，并非产生直接

智猪博弈理论

智猪博弈理论在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。目录介绍博弈与制度由智猪博弈故事得到的启示编辑本段介绍实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪也行动的话，小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本，以下纯收益计算相同)，而小猪等待的话，则可以获得4个单位的纯收益，等待优于行动；在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果大猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择：小猪行动等待大猪行动5,14,4 等待9,-10,0 　从矩阵中可以看出，当大猪选择行动的时候，小猪如果行动，其收益是1，而小猪等待的话，收益是4，所以小猪选择等待；当大猪选择等待的时候，小猪如果行动的话，其收益是-1，而小猪等待的话，收益是0,所以小猪也选择等待。综合来看，无论大猪是选择行动还是等待，小猪的选择都将是等待，即等待是小猪的占优策略。

在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种明智的选择。这时候有所不为才能有所为！高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。编辑本段博弈与制度由智猪博弈故事得到的启示在这个例子中，对小猪而言，无论大猪是否踩动踏板，不去踩踏板总比踩踏板好。反观大猪，明知小猪不会去踩踏板，但是去踩踏板总比不踩强，所以只好亲历亲为了。这个案例令我们不得不思考—— 【博弈与制度】 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中，每一方都要想方设法攻击对方、保护自己，最终取得胜利；但同时，对方也是一个与你一样理性的人，他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学，博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说，博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问，因此也有人把它称为“对策论”。对于企业经营者来说，如何理解博弈论，如何运用博弈论原理指导企业有效管理，这是值得思考的事情。在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系，以及在与政府的关系和合作等多方面，博弈论都是企业经营者十分有效的决策工具，或者至少是比较科学的决策思路。还有一个经典案例，是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成，由此经常会发生因商船主或水手虐待犯人，致使大批流放人员因此死在途中(葬身大海)的事件发生。后来大英帝国对运送犯人的办法(制度)稍加改变，流放人员仍然由往来于澳洲的商船来运送，只是运送犯人的费用要等到犯人送到澳洲后才由政府支付给商船。仅就这样一点小小的“改变”，几乎再也没有犯人于中途死掉的事情发生。关于这一问题，现任招商局掌门人秦晓先生在最近做客央视《对话》节目时，也谈了他的一些看法。他认为：企业领导人应该去制定游戏规则，而不应该单纯地去做裁判。他觉得制度应当比个人的权威

寻找三个纳什均衡

1.首先将原始数据带入博弈计算程序，可以得到如下的答案：可以看到其中一个是纯策略，两个是混合策略。 2.首先用划线法找出可以找到第一个纯策略。纯策略下张三和李四的收益组合为：（60，76），张三和李四的策略分别为（0，1，0）和（0，0，1）3.用消去法消去划线的两行这样得到一个新的组合， P 1-P

假设新的组合是符合混合纳什均衡策略那么张三选上下的策略为P ，1-P ；李四选左中的策略为S,1-S. 根据纳什均衡的条件：李四的策略概率S ，1-S ，使得张三选择上下策略收益相同：得到一个等式：12S+42(1-S)=72S+36(1-S). S=1/11 1-S=10/11; 此时张三的收益为：=12×1/11+42×10/11 = 432/11 = 39.27；同样张三的概率P,1-P,使得李四选择左中的收益相等: 得等式：83P+47(1-P)=56P+95(1-P) P=16/25；1-P=9/25; 此时李四的收益：=83×16/25+47×9/25=53.12+16.92=70.04 综上为第二个混合策略纳什均衡张三和李四的策略分别为：（16/25，0，9/25）和（1/11，10/11，0），张三和李四的收益为（39.27，70.04）第三步：一般的混合纳什均衡设张三选择上中下的策略概率分别为p,q,1-p-q ；李四选择左中右的策略概率分别为s,t,1-s-t ；李四的策略要使张三的策略收益相同： 12s + 42t + 42(1-s-t)=24s + 12t + 60(1-s-t)=72s + 36t + 42(1-s-t) s=1/27, t=10/27, 1-s-t= 16/27 此时张三的收益张三收益 = 12*1/27+42*10/27+42*16/27=(12+420+672)/27=1104/27=40.89 同上可知张三需要确定一个行动概率，以使李四的选择在其收益上没有差异，得等式： 83p + 12q +47(1-p-q) = 56p + 42q + 95(1-p-q)=45p + 76q + 59(1-p-q) p=113/200, q=5/16, 1-p-q=49/400 此时李四的收益为李四收益 =83*113/200+12*5/16+47*49/400=46.895+3.755.7575=56.40 综上，此混合策略纳什均衡相对于张三和李四的策略选择用概率分别表述为（113/200，5/16， 49/400）和（1/27，10/27，16/27），收益分别为（40.89，56.40）第四步：最后策略三个策略的收益为：（60，76）（39.27，70.04）和40.89，56.40）通过帕累托上策为（60，76）对双方来说收益最大，所以张三（0，1，0），李四（0，0，1）的纳什均衡点应是实际行为最可能的结果。 1-S S