博弈论中的纳什均衡
纳什均衡

纳什均衡简介纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。
实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。
然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。
阿尔伯特·塔克(Alberttucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。
它发展了本身很有意义的n人有限非合作博弈的概念和性质。
并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。
在概念和方法两方面,该论文都是作者的独立创造。
”纳什均衡例子博弈论中一个著名的例子就是囚徒困境。
囚徒困境是一个非零和博弈,说的是两个嫌疑犯甲和乙私人民宅联手作案,被警方逮住但未获证据。
警方于是将两个嫌疑犯分开审讯。
警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。
纳什均衡大白话解释

纳什均衡大白话解释纳什均衡是一个在经济学和博弈论中非常重要的概念,由著名数学家和经济学家约翰·纳什提出。
虽然这个概念在理论上可能显得有些复杂,但其实我们可以通过一些日常生活中的例子,以及通俗易懂的语言来解释它。
什么是博弈?首先,我们要明白什么是“博弈”。
博弈,简单来说,就是多个参与者之间为了各自利益而进行的一种策略性互动。
这种互动可以是合作,也可以是竞争,关键在于每个参与者的行动都会影响到其他人的利益。
纳什均衡的概念那么,什么是纳什均衡呢?纳什均衡指的是这样一个状态:在一个博弈中,所有参与者都选择了一个策略,并且没有哪个参与者可以通过单独改变策略来获得更好的结果。
换句话说,就是大家都觉得“这样挺好,我不想再变了”。
日常生活中的纳什均衡交通拥堵想象一下你每天上班都要经过的一个拥堵的路口。
如果大家都遵守交通规则,有序通过,虽然可能还是会有点慢,但至少能保持一定的流动性。
这个时候,就形成了一个纳什均衡:没有人愿意冒险去闯红灯或者插队,因为那样做虽然可能暂时让自己快一点点,但很可能会引发更大的混乱,到头来反而得不偿失。
价格战再来看一个商业竞争的例子。
假设市场上有两家卖相似产品的公司A和B。
如果A降价,可能会吸引更多顾客,从而增加销量;但B看到A降价后,为了不失去市场份额,也可能跟着降价。
这样一来二去,最后两家公司可能都会因为价格过低而赚不到钱,甚至亏损。
这种情况下,如果两家公司都能意识到这一点,并且决定保持一个合理的价格水平,那么它们就达到了一个纳什均衡:谁也不想先降价,因为那样做对自己没好处。
合作与竞争中的纳什均衡在合作中,纳什均衡表现为一种稳定的合作关系。
比如两个人一起抬一张桌子,如果大家都出力,桌子就能稳稳当当地被抬起来;但如果其中一个人偷懒不出力,那么另一个人就会感到吃力甚至可能受伤。
在这种情况下,出力均衡就是一种纳什均衡:没有人愿意单方面减少出力,因为那样做对自己和对方都没好处。
在竞争中,纳什均衡则可能表现为一种僵持状态。
博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡在纳什均衡中,你不一定满意其他的策略,但你的策略是回馈对手招数的最佳策略。
从囚徒困境中我们会发现,作为博弈各方的行动就是针对对方行动而确定的最佳对策,而一旦知道对方在做什么,就没人愿意改变自己的做法。
博弈论学把这么一个结果称为均衡。
这个概念是有普林斯顿大学数学家约翰·纳什提出的,因此被称为纳什均衡。
诺贝尔经济学奖获得者萨缪尔森有句名言,你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词,供给与需求。
博弈论专家坎多瑞引申说:“要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是纳什均衡”。
1950年,还是一名研究生的纳什写了一篇论文,题为《n人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。
纳什的贡献是,他证明了在这一类的竞争中,在很广泛的条件下是有稳定解存在的,只要是别人的行为确定下来,竞争者就可以有最佳的策略。
那么,什么纳什均衡呢?简单说,就是一策略组合中,所有的参与者面临这样的一种情况:给定你的策略,我的策略是我最好的策略。
给定我的策略,你的策略也是你最好的策略,即双方在对方给定的策略下不愿意调整自己的策略。
纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具,所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展,甚至说是一场革命。
纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战,按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果,从纳什均衡引出一个悖论:从利己的目的触发,结果损人不利己。
“囚徒困境”就是如此,从这个意义说,纳什均衡提出的悖论实际上动摇了西方经济学的基石。
纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。
这个法则如下:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。
所谓博弈均衡,它是一稳定的博弈结果。
均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。
博弈论与纳什平衡

博弈论与纳什平衡博弈论(game theory)对人的基本假定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。
纳什(John Nash)编制的博弈论经典故事"囚徒的困境",说明了非合作博弈及其均衡解的成立,故称"纳什平衡"。
所有的博弈问题都会遇到三个要素。
在囚徒的故事中,两个囚徒是当事人(players)又称参与者;当事人所做的选择策略(strategies)是承认了杀人事实,最后两个人均赢得(payoffs)了中间的宣判结果。
如果两个囚徒之中有一个承认杀人,另外一个抵赖,不承认杀人,那么承认者将会得到减刑处理,而抵赖者将会得到最严厉的死刑判决,在纳什故事中两个人都承认了犯罪事实,所以两个囚徒得到的是中间的结果。
类似的:我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。
在互联网这个原始丛林中:最优策略是如何产生的呢?一、博弈中最优策略的产生艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。
也就是说,个人可以完全按照自己利益最大化的企图进行决策。
在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。
社会实践中有很多合作的问题。
比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。
在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。
对策论以著名的囚犯困境来描述这个问题。
A和B各表示一个人,他们的选择是完全无差异的。
选择C代表合作,选择D代表不合作。
如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。
博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。
两个囚徒互相揭发,就是一种纳什均衡。
对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。
也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。
这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。
博弈策略稳定,博弈结果也稳定。
之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。
之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。
2、纳什均衡意义重大。
纳什均衡提出,震动整个经济学界。
诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。
”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。
”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。
”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。
纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。
读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。
但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。
这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。
从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。
更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。
Q2:怎样运用纳什均衡?1、分析囚徒困境。
纳什均衡的概念

纳什均衡的概念纳什均衡是博弈论中的重要概念,指的是在一个博弈中,所有参与者都选择了自己的最佳策略,不存在更好的选择,即达到了一种均衡状态。
纳什均衡是在参与者之间相互博弈的情况下,每个参与者都选择了自己的最佳策略,并且其他参与者也同时选择了最佳策略,从而实现了一种平衡状态。
纳什均衡最早由约翰·纳什提出,他于1950年发表了研究博弈论的著名论文《非合作博弈》。
在该论文中,纳什定义了纳什均衡,并利用数学方法证明了简单博弈的纳什均衡存在性。
由于纳什均衡的提出和研究,他获得了1994年的诺贝尔经济学奖。
纳什均衡的理论适用范围非常广泛,涵盖了众多社会科学领域,如经济学、政治学、社会学等。
在经济学领域,纳什均衡被广泛运用于市场竞争、价格确定、产出决策等方面的分析。
在政治学领域,纳什均衡被应用于国际关系、选举竞争等问题的研究。
在社会学领域,纳什均衡被用于解析社会合作、集体行动的机制等等。
为了更好地理解纳什均衡的概念,我们可以通过一个具体的博弈案例来说明。
假设有两个企业A和B在某个市场上销售相同的产品,它们可以选择两种不同的定价策略:高价策略和低价策略。
企业A和B都知道,如果它们选择相同的策略,市场将会处于均衡状态;如果它们选择不同的策略,市场将会出现不稳定的情况。
在这个博弈中,我们可以使用一个博弈表来表示两个企业的策略和回报。
假设高价策略带来的利润分别为5和2,低价策略带来的利润分别为3和4。
根据这个博弈表,我们可以得到以下结论:如果企业A选择高价策略,那么企业B选择高价策略可以带来较高的利润,所以企业B将会选择高价策略。
如果企业A选择低价策略,那么企业B选择低价策略可以带来较高的利润,所以企业B同样会选择低价策略。
综上所述,无论企业A选择高价策略还是低价策略,企业B都会选择低价策略,从而形成了一个纳什均衡。
在这种均衡状态下,企业A的最佳策略是低价策略,而企业B的最佳策略也是低价策略,两个企业都无法通过改变自己的策略来获得更高的利润。
博弈论混合策略纳什均衡名词解释

博弈论混合策略纳什均衡名词解释博弈论混合策略纳什均衡是指在博弈论中,当参与者不能确定选
择某一个策略时,采取混合策略的情况下达到的均衡状态。
具体来说,混合策略是指在一个博弈中,参与者以一定的概率选
择不同的纯策略。
而纳什均衡是指在一个博弈中,参与者无法通过单
独改变自己的选择来获得更好的结果,即不存在任何参与者可以通过
改变自己的策略来让其他参与者不再选择当前策略。
混合策略纳什均衡是指游戏中所有参与者以一定的概率选择不同
的纯策略,并且这种概率分配对于所有参与者都是最优的。
也就是说,在混合策略纳什均衡下,参与者没有更好的选择可供其采取,而其他
参与者也没有更好的概率分配可供其选择。
拓展:
在博弈论中,还有许多其他类型的均衡概念,例如纯策略纳什均衡、帕累托均衡、部分均衡等等。
纯策略纳什均衡是指游戏中参与者
以确定性的纯策略进行选择,使得没有参与者可以通过改变其策略来
获得更好的结果。
帕累托均衡是指在一个博弈中,不存在可以改善任
何一个参与者的情况。
部分均衡是指只有某些参与者达到均衡状态,而其他参与者未达到均衡状态。
博弈论是研究决策制定者在相互影响下进行决策的数学工具。
通过分析不同的博弈策略和可能的结果,博弈论可以帮助我们理解冲突和合作的情况,并提供一些决策建议。
纳什均衡概念名词解释

纳什均衡概念名词解释纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定条件下做出的最优策略选择,这个选择不会被单方面的改变,否则对于另一方来说,选择其他策略反而更劣。
1. 概念解释纳什均衡的概念可以从两个方面进行解释。
从个人角度看,纳什均衡是指当每一个人都实施最优策略时,其它人不能从自己的策略中获得进一步的盈利收益;从社会角度看,纳什均衡则是指,当所有人都做出了最优策略时,整个社会得到了最大的总收益。
2. 纳什均衡的前提条件在博弈论中,纳什均衡并不是所有博弈都存在的。
对于一个博弈,存在纳什均衡需要满足以下条件:(1)所有博弈者都采取了最优策略,即无法通过改变策略来提高自己的收益;(2)每个博弈者的策略是对其他博弈者实施的策略的最佳反应;(3)每个博弈者都清楚地了解其他博弈者的策略。
3. 纳什均衡的类型在实际的博弈中,纳什均衡可以分为三种类型:(1)纯策略均衡:指每位参与者都只选定一个策略,并根据它的期望收益来进行决策,不存在概率因素。
(2)混合策略均衡:指每位参与者按一定的概率选定多个策略,并根据它的期望收益来进行决策,存在概率因素。
(3)多重纳什均衡:指博弈中存在多个均衡策略组合,每个均衡策略组合都符合博弈的前提条件。
4. 纳什均衡的意义和应用纳什均衡是博弈论的一个核心概念,其意义和应用非常广泛。
首先,纳什均衡可以用来预测和解释现实生活中的决策行为,如市场竞争、政府政策制定等。
其次,纳什均衡也可以用来指导协商和谈判的过程。
最后,纳什均衡还可以用来研究其他领域的决策行为,如军事战略、生态环境等。
综上所述,纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定条件下做出的最优策略选择,是一种使得所有参与者都满意的稳定状态。
纳什均衡的应用领域非常广泛,其理论和方法也在不断地发展和完善。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论中的纳什均衡
纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。
其研究成果见于题为《非合作博弈》(1950)的博士论文。
该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。
纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。
他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。
该解概念后来被称为纳什均衡。
定义:纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的支付将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。
这一结果对局中人B亦是如此。
纳什均衡的经典范例就是囚徒博弈,但是研究博弈论常常会使人陷入一种只追求个人利益的误区,事实上我们应该明白所谓的博
弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设,并不总能说明事实。
只是假定他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。
也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。
没有人会主动改变自己的策略以便使自己获得更大利益。
“囚徒的两难选择”有着广泛而深刻的意义。
个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。
只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。
“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。
按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。
不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。
”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。
两个囚徒的命运就是如此。
从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。
因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。
但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。
也就是
中国人说的“己所不欲勿施于人”。
但前提是人所不欲勿施于我。
其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。
从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。
我们将例举出许多类似于“囚徒的两难处境”这样的例子。
如价格战、军奋竞赛、污染等等。
一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。
其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。
所有的博弈问题都会遇到这三个要素。
因此说,学习博弈论不仅是我们接触到最前沿的经济学思想,也在一定程度上有利于我们分析客观世界,并一定程度上减少损人不利己的行为。
在博弈中,人们掌握的信息经常是不完全的,这就需要在博弈进
行过程(即动态博弈)中不断地收集信息、积累知识、修正判断。
成语故事“黔驴技穷”实际上就包含了一个不完全信息动态博弈。
毛驴刚到贵州时,老虎摸不准这个大动物究竟有多大本领,因而躲在树林里偷偷观察,这在老虎当时拥有的信息条件下是一种最优策略选择。
过了一阵子,老虎走出树林,逐渐接近毛驴,就是想获得有关毛驴的进一步信息。
一天,毛驴大叫一声,老虎吓了一跳,急忙逃走,这也是最优策略选择。
又过了一些天,老虎又来观察,并对毛驴挨得很近,往毛驴身上挤碰,故意挑衅它。
毛驴在忍无可忍的情况下,就用蹄子踢老虎,除此之外,别无它法。
老虎最终了解到毛驴的真实本领后,就扑过去将它吃了。
在这个故事里,老虎通过观察毛驴的行为逐渐修正对毛驴的看法,直到看清它的真面目。
事实上,毛驴的策略也是正确的,它知道自己的技能有限,总想掩藏自己的真实技能。
老虎吃掉毛驴的策略,在“博弈论”中就是所谓的“精炼贝叶斯均衡”。
人们常提到的“上有政策、下有对策”,其实是对管理者与被管理者之间的动态博弈的一
种描述,面对上边的政策,下边寻求对策是正常的、必然的。
从“博弈论”的角度讲,上边的政策制定必须在考虑到下边可能会有的对策的基础上进行,否则,政策就不会是科学、合理的。