纳什均衡

纳什均衡简介

纳什均衡，又称为非合作博弈均衡，是博弈论的一个重要术语，以

约翰·纳什命名。在一

个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。如果两个博弈的当事人的策略组

合分别构成各自的支配性策略，那么这个组合就被定义为纳什均衡。

一个策略组合被称为纳什均衡，当每个博弈者的均衡策略都是为了达到自己期望收益的最大值，与此同时，其他所有博弈者也遵循这样的策略。

纳什均衡的得来

关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是约翰·纳什在

普林斯顿大学攻读博士学位时完成

的。实际上，博弈论的研究起始于1944年冯·诺依曼（

Von Neumann）和

奥斯卡·摩根斯坦

（Oscar Morgenstern）合著的《博弈论和经济行

为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，

证明了纳什均衡在n人有限博弈中的普遍存在性，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而

对“合作博弈

（Cooperative Game）”和“

非合作博弈”做了明确

的区分和定义。阿尔伯特·塔克（Albert

tucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。在概念和方法两方面，该论文都是作者的独立创造。”

纳什均衡例子

博弈论中一个著名的例子就是囚徒困境。

囚徒困境是一个

非零和博弈，说的是两个嫌疑犯

甲和乙私人民宅联手作案，被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉

两个囚犯，如果你招供，而对方不招供，则你将被判刑3个月，对方将被判刑10年；若两人都不招供则因未获证据但私人民宅将各拘留1年；如果两人均招供，每人将被判刑5年。于是，两个人同时陷入招供还是不招供的两难处境。结果是，尽管甲不知乙是否招供，但他认为自己选择“招供”最好，因而甲会选择“招供”，同样乙也会选择“招供”，两人各判5年。而两人都选择不招供，虽证据不足但因私人民宅将各拘留1年的结果是不会出现的。

博弈矩阵囚犯甲

招供不招供

囚犯乙招供判刑五年

甲判刑十年；乙判刑三个月

不招供

甲判刑三个月；乙判刑十年判刑一年

在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略，那么这个组合就被定义为纳什均衡。纳什均衡又称为非合作博弈均衡，是博弈论的一个重要术语，它是以美国数学家、日后成为电影《美丽心灵》主人公的纳什的名字命名的。在上述囚徒困境例子中，两个囚犯符合自己利益的选择是坦白招供。这种两人都选择坦白的策略以及因此被判刑五年的结局就是“纳什均衡”。

纳什均衡的重要影响[1]

纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础，正如

克瑞普斯（Kreps，

1990）在《博弈论和经济建模》一书的引言中所说，“在过去的一二十年内，经济学在方法论以及

语言、概念等方面，经历了一场温和的革命，非合作博弈理论已经成为范式的中心……在经济学或

者与经济学原理相关的金融、

会计、

营销和政治

科学等学科中，现在人们已经很难找到不懂纳什均衡能够…消费?近期文献的领域。”纳什均衡的重

要影响可以概括为以下六个方面（谢识予，1999）：

（1）改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等，均已渗透到微观经济学、宏观经济学、

劳动经济学、

国际经济学、

环境经济学等经济学科的绝大部分

学科领域，改变了这些学科领域的内容和结构，成为这些学科领域的基本研究范式和理论分析工具，从而改变了原有经济学理论体系中各分支学

科的内涵。（2）扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以

及经济个体之间的交互作用模式化的有效办法，因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法，包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方

法，为经济学家们提供了深入的分析工具。

（3）加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用，不满足于对经济个体之间复杂经济关系的简单化处理，

分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律，强调从微观个体行为规律的角度发现问题的根源，因而可以

更深刻准确地理解和解释经济问题。

（4）形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系，按照经典博弈的

类型或特征进行分类，并根据相应的经典博弈的分析方法和模型进行研究，将一个领域所取得的经验方便地移植到另一个领域。

（5）扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大，就因为它普通，而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律，也适合于人类以外的其他生物的生存、运动和发展的规律。纳什

均衡和博弈论的桥梁作用，使经济学与其他社会科学、自然科学的联系更加紧密，形成了经济学与其他学科相互促进的良性循环。

（6）改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利（Kandori，

1997）对保罗·萨缪尔森（

Paul Samuelson）的名

言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家，因为它必须学习的只有两个词，那就

是…供给?和…

需求?”，曾做过一个幽默的引申，他

说，“现在这只鹦鹉需要再学两个词，那就是…纳什均衡?”。

纳什均衡案例分析

案例一：纳什均衡在货币政策效应中的应用[2]

一、博弈论下的货币政策博弈分析

货币政策博弈分析

利用博弈论方法分析宏观金融博弈问题。因而，博弈论是宏观金融博弈分析的方法论基础。纳什(Nash)

在195O年和1951年发表了两篇关于非合作博弈的重要文章，从一般意义上定义了非合作博弈及其均衡解．并证明了均衡的存在．基本奠定了现代非合作博弈论的基础。因而，该均衡以后被博弈理论称为“纳什均衡”。即是指由所有的参与者的最优策略组成的策略组合。在这种策略组合中

给定其他参与者的策略，没有任何单个参与者有积极性选择其他策略

也就没有人主动去打破这种均衡。相反如果一种均衡或制度安排，如果不是一种纳什均衡．即不是所有参与者的最优策略组合

那么，这种组合就不能成立或者至少不能持续。合作博弈强调团体理性、效率和公平。而非合作博弈强调个人理性、个人最优决策。其结果可能是有效的也可能

是无效的。现实中

大量的经济博弈问题是非合作博弈。非合作博弈理论的发展为其在经济研究中的广泛应用创造了条件并推动了合作博弈的进一步发展。

纳什均衡假定博弈参与者在选择自己的策略时，把其他参与者的策略当做给定的。而不考虑自己的选择如何影响博弈对手的选择。这个假定在静态博弈下是成立的，但在

动态博弈下却不成

立。

在静态博弈中，所有参与者同时行动，不可能在自己采取行动前观察到其他人的行动

因而就无暇反应。但在动态博弈中一方行动在先另一方

行动在后．后者自然会根据前者的选择而调整自己的选择，前者自然会理性地预期到这一点，所以不能不考虑自己的选择对其他参与者的影响，由于决策者不考虑自己的选择对他人选择的影响，纳什均衡允许了不可置信威胁的存在。1 965年泽尔腾(Selten) 将纳什均衡的概念引入了

动态分析定义了

子博弈精练纳什均衡” 的概念。将

不可置信的威胁策略从纳什均衡中剔除出去，从而解决了完全信息动态博弈均衡求解问题

将不可置信的策略变成可置信策略的行动即经济学中的

承诺行动”。如果当事人不履行其承诺时将为之付出相应的代价

这种承诺就是可置信的，否则就是不可置信的。该概念的提出，对利用博弈论方法研究货币政策问题奠定了基础。

二纳什均衡在货币政策效应中的应用

在理性预期条件下，我们考察一期的货币政策博弈均衡。假定

中央银行的目标成本函数为：

。

其中：π为通货膨胀率；y为实际经济增长

率；y* 为中央银行期望的经济增长率。

根据卢卡斯供给曲线：y= yn+ α(π ? πe),α >

0.其中：为潜在经济增长率;为公众的

预期通货膨胀率：a表示非预期通膨胀对经济的影

响程度，即总供给曲线的斜率。假定α=1,即：y= yn+ (π ? πα)

同时假定中央银行对货币增长有完全的控制能力．公众的预期完全理性不存在真实供给冲击

和货币流通速度变化的影响．

通货膨胀率π等于

货币供给增长率m,

通货膨胀预期 πα。等于

货币供给增长率 me，中央银行期望的

经济增长率

与潜在的经济增长率相等。有。

令公众的目标函数为避免由于预期误差导致的通货膨胀之害，因此可把公众的

效用函数定义

为：U= ? (m? me)2

可得该货币政策博弈的支付矩阵如下：中央银行策略(m) 公众策略(me)

0 1

0 (0,0) (0,0,5)

1 (1,-1) (0,5,0)

矩阵中m=0表示中央银行选择零的货币增长率

m=1表示中央银行选择正的货币增长率：公众策略的含义同上。由支付矩阵可知

对中央银行来说，m=1的效用严格优于m=0的效用．m=1为其最优策略。在理性预期下，公众迅速认识到中央

银行会选择正的货币增长率，其必然选择m=1以使其效用最大化,该博弈模型的纳什均衡是中央银

行选择正的货币增长率,公众选择正的通货膨胀率预期，效用函数为(0,5,0)。均衡结果显示

货币政策只会影响通货膨胀率而真实产出不变。

货币政策博弈具体表现为货币政策的决策和执行过程中存在动态不一致性问题。博弈主体在当前做出的关于未来的最优决策，在决策执行时

对决策制定者已不再是最优决策．因而他必然要调整其决策。例如在公众预期形成之前

对于货币政策制定者来说，零通货膨胀(或较低通货膨胀)可能是最优的选择。因而为了影响公众预期，他可能在此选择和许诺他将实行零通货膨胀(或较低通货膨胀)。但是，当公众预期形成以后零通货膨胀(或较低通货膨胀)对政策制定者来说已不是最优决策。为了获得非预期通货膨胀对经济增长和就业

增加的刺激作用，政策制定者必须实行正的(或更高的)通货膨胀．在完全信息条件下公众知道政策制定者会这样做．因而他的许诺是不可置信的。具有理性和完全信息的公众不会被其愚弄．最后

结果必然是被预期到的正的(或更高的)通货膨胀。相机选择货币政策的这种通货膨胀(通货紧缩)倾向

是由该博弈结构内生性决定的，即该均衡(纳什均衡)允许了不可置信的威胁策略的存在，中央银行关于零通胀(或低通胀)的许诺是不可置信的。

要消除货币政策的通货膨胀(通货紧缩)倾向

必须消除这种不可置信因素——中央银行在公众预期形成之前承诺其将毫不改变地执行单一规则

的货币政策

通过承诺行动中央银行获得了影响公众预期的能力。因而，在选择其货币供给增长率时．就必须考虑它对公众预期的立即和充分的影响就不能期望制造非预期通货膨胀(通货紧缩)来

刺激经济、增加就业或为预算融资。这就是说，提高政策的稳定性和可信程度是消除通货膨胀(通货紧缩)的关键。参考文献

↑高红阳.纳什均衡的重要影响及其问题局限

↑毛莹.纳什均衡在货币政策效应中的应用[J].商场现代化,2009,(5):363.

纳什均衡

纳什均衡简介纳什均衡，又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略，那么这个组合就被定义为纳什均衡。一个策略组合被称为纳什均衡，当每个博弈者的均衡策略都是为了达到自己期望收益的最大值，与此同时，其他所有博弈者也遵循这样的策略。纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是约翰·纳什在普林斯顿大学攻读博士学位时完成的。实际上，博弈论的研究起始于1944年冯·诺依曼（ Von Neumann）和奥斯卡·摩根斯坦（Oscar Morgenstern）合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，证明了纳什均衡在n人有限博弈中的普遍存在性，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而对“合作博弈（Cooperative Game）”和“ 非合作博弈”做了明确的区分和定义。阿尔伯特·塔克（Albert tucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。在概念和方法两方面，该论文都是作者的独立创造。” 纳什均衡例子博弈论中一个著名的例子就是囚徒困境。囚徒困境是一个非零和博弈，说的是两个嫌疑犯甲和乙私人民宅联手作案，被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被判刑3个月，对方将被判刑10年；若两人都不招供则因未获证据但私人民宅将各拘留1年；如果两人均招供，每人将被判刑5年。于是，两个人同时陷入招供还是不招供的两难处境。结果是，尽管甲不知乙是否招供，但他认为自己选择“招供”最好，因而甲会选择“招供”，同样乙也会选择“招供”，两人各判5年。而两人都选择不招供，虽证据不足但因私人民宅将各拘留1年的结果是不会出现的。博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年；乙判刑三个月不招供

平新乔《微观经济学十八讲》课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第 10 讲策略性博弈与纳什均衡跨考网独家整理最全经济学考研真题，经济学考研课后习题解析资料库，您可以在这里查阅历年经济学考研真题，经济学考研课后习题，经济学考研参考书等内容，更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验，从前辈中获得的经验对初学者来说是宝贵的财富，这或许能帮你少走弯路，躲开一些陷阱。以下内容为跨考网独家整理，如您还需更多考研资料，可选择经济学一对一在线咨询进行咨询。 1．假设厂商 A与厂商 B的平均成本与边际成本都是常数， MC A 10， MC B 8，对厂商产出的需求函数是 Q D 500 20p （ 1）如果厂商进行 Bertrand 竞争，在纳什均衡下的市场价格是多少？（ 2）每个厂商的利润分别为多少？（ 3）这个均衡是帕累托有效吗？解：（1）如果厂商进行 Bertrand 竞争，纳什均衡下的市场价格是 p B 10 ， p A 10 ，其中是一个极小的正数。理由如下：假设均衡时厂商 A 和 B 对产品的定价分别为 p A 和 p B ，那么必有 p A 10 ， p B 8 ，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，p A和 p B 都不会严格大于 10。否则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足p A 10， p B 10。但是由于 p A 的下限也是10，所以均衡时 p A 10。给定 p A 10，厂商 B的最优选择是令 p B 10 ，这里是一个介于 0到2 之间的正数，这时厂商 B可以获得整个市场的消费者。综上可知，均衡时的价格为p A 10 ， p B 10 。（ 2）由于厂商 A 的价格严格高于厂商 B 的价格，所以厂商 A 的销售量为零，从而利润也是零。下面来确定厂商 B 的销售量，此时厂商 B是市场上的垄断者，它的利润最大化问题为： max pq cq ① 其中 p 10 ，q 500 20 10 ，把这两个式子代入①式中，得到： max 10 0 8 500 20 10 解得0 ，由于必须严格大于零，这就意味着可以取一个任意小的正数，所以厂商 B的利润为： 500 20 10 10 。（3）这个结果不是帕累托有效的。因为厂商 B 的产品的价格高于它的边际成本，所以如果厂商 B和消费者可以为额外 1 单位的产品协商一个介于 8 到10 之间的价格，那么厂商 B 的利润和消费者的剩余就都可以得到提高，同时又不损害厂商 A的剩余（因为A 的利润还是零）。

纳什均衡

1.纳什均衡：给出对方的策略，你所选的是最优的（至少不比其它策略差），如果每个局中人都是这样，那么所构成的策略组合（对局），就称为纳什均衡。 2.效用：消费者偏好与收入之间的相互作用导致人们做出消费选择，效用则是人们从这种消费选择中所获得的愉悦或满足。 3.边际产量：当其他要素不变时，可变要素增加一个单位所带来的总产量的增加量。 4.生产成本：经营一个企业，为达到利润最大化，必须支付一些资金来维持运营，如建造厂房，采购机器及原料，雇用员工等支出都可视为厂家的生产成本。 5.帕累托标准：如果一种变化可以改善某些人的处境，同时对其他人都没有伤害。则这种变化是好事，应该给予实行。 6.恩格尔系数：是食品支出总额占个人消费支出总额的比重。一个家庭收入越少，家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大，随着家庭收入的增加，家庭收入中或者家庭支出中用来购买食物的支出将会下降。恩格尔系数是用来衡量家庭富足程度的重要指标。 7.效用：消费者偏好与收入之间的相互作用导致人们做出消费选择，效用则是人们从这种消费选择中所获得的愉悦或满足。 8.价格管制：是指政府对新药定价以及上市药品价格上涨实施严格的管制，企业不能自由定价，而是由政府和制药企业谈判决定新药的价格。 9.软着陆：当一个国家经过强劲的经济增长后，仍维持缓和的增长，并未因此转入衰退，即使“软着陆”。 10.硬着陆：一个国家的经济在高速增长的同时伴随着高度通货膨胀，使得经济迅速从增高长直接走入低增长甚至衰退。 11.通货膨胀：平均物价水平持续上扬的状态，通货膨胀率通常是以消费者物价指数（CPI）的变化率来表示。指数上升→物价上升，货币购买力下降。 12.再贴现率：一般商业银行可以直接向中央银行借贷的利率。所谓“贴现”：通过一定的方式把发生在未来（或不同时间）的费用和效益转化为现值的方式就叫贴现。 13.机会成本：在资源一定的情况下，多生产一个单位的某种产品，就要以少生产若干单位的另一种产品为代价。这种放弃若干单位另一种产品生产的代价，就是生产某种成品的机会成本。 14.需求价弹性价格：指在市场需求曲线的任何一点，价格每变动1%所导致的需求量变动的百分比。它是衡量产品需求量对产品价格变动的敏感指标。 15.生产函数（生产成本）：企业在每个时期投入的各种生产要素的数量与获得的产出品的数量之间的关系。 16.均衡及均衡价格：均衡：供给和需求达到平衡的状态。均衡价格：供需平衡时的价格。有时被称为市场出清价格。 17.资源的概念及分类：指用于生产能满足人类需要的东西的那些物品或劳务。分类：自由资源和经济资源 18.恩格尔曲线：某种商品的均衡购买量与消费者货币收入之间的关系。 1.药物需求与供给的特征：需求的特征：需求的不确定性、需求的最高优先性、需求的不可替代性、需求的外部效应性、需求缺乏弹性、需求的被动性、独特的需求三方结构供给的特征：高质量性、高技术性、高投入性、高风险性、高回报性、高度集中性 2.影响药品需求的因素有哪些：（一）一般经济学因素：1.经济发展水平；2.价格水平（1）是否实施医疗保障制度（2）医疗保障制度下保障的范围（3）医疗保障制度的报销制度和自付比例等（二）社会人口学因素（三）流行病学因素（四）临床医生和药师因素（五）医药技

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡 1 ?假设厂商A与厂商B的平均成本与边际成本都是常数，MC A=10， MC B =8，对厂商产出的需求函数是 Q D二500 -20 p (1)如果厂商进行Bertrand竞争，在纳什均衡下的市场价格是多少？ (2)每个厂商的利润分别为多少？ (3)这个均衡是帕累托有效吗？解：(1)如果厂商进行Bertrand竞争，纳什均衡下的市场价格是p B =10 一；，p A =10 , 其中；是一个极小的正数。理由如下：假设均衡时厂商A和B对产品的定价分别为p A和p B,那么必有p A刃0 , p B K8，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，p A和p B都不会严格大于10。否则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足p A空10 , p B?「0。但是由于p A的下限也是10,所以均衡时P A =10。给定P A =10 ,厂商B的最优选择是令 P B =10- ；，这里：是一个介于0到2 之间的正数，这时厂商B可以获得整个市场的消费者。综上可知，均衡时的价格为P A =10 , P B =10 -；。 (2)由于厂商A的价格严格高于厂商B的价格，所以厂商A的销售量为零，从而利润也是零。下面来确定厂商B的销售量，此时厂商B是市场上的垄断者，它的利润最大化问题为： max pq —cq ①其中p =10 _ q =500 -20 107、把这两个式子代入①式中，得到： max (10 —芯―)500 —20(10 —名卩解得；=0,由于；必须严格大于零，这就意味着；可以取一个任意小的正数，所以厂商 B 的利润为：||500-20 10 -; 10-;。 (3)这个结果不是帕累托有效的。因为厂商B的产品的价格高于它的边际成本，所以如果厂商B和消费者可以为额外1单位的产品协商一个介于8到10一；之间的价格，那么厂商B的利润和消费者的剩余就都可以得到提高，同时又不损害厂商A的剩余(因为A的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1 )中，第一个数表示A的支付水平，第二个数表示B的支付水平，a、b、c、d是正的常数。如果A选择“下”而B选择“右”，那么： (1) b .1 且 d ：：：1

纳什均衡不动点

纳什均衡的存在性与多重性对于数学家来说，一个数学概念的存在性与唯一性是特别需要加以关注的。这是因为，从形式逻辑角度看，如果某个事物并不存在，那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的，因为对于不存在的事物来说，任何关于它的陈述或判断都不可能加以证伪。所以，倘若某个概念所对应的事物并不存在。那么，关于这个概念所给出的研究结论都必然不存在被证伪的可能。因而根据波普尔的证伪主义观点，这样的研究不具备科学上的意义。所以，我们在对任何新提出来的数学概念加以系统研究之前，首先需要弄清楚所研究的对象事物是否存在。有许多被称为伪科学的东西，它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。譬如，所谓的特异功能或“超灵学”并未得到证实，而UFO研究迷们至今也未能拿出一件存在球外生命的证据，所以，特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。除了存在性之外，概念事物的唯一性也是数学家们所关心的问题。从纯理论的兴趣上看，数学家们更多地是从审美的角度上看待概念的唯一性，但从波普尔的证伪主义哲学看，模型均衡解的唯一性关系到模型的预测功能，从而是科学理论应基本具有的特征。我们在第二章中曾指出，理论的预测功能是判别理论的科学性的准绳，而在第三章中，我们提出用纳什均衡作为模型的预测结果。按照这样的逻辑，一个自然的推论就是：模型能否具有科学意义取决于纳什均衡的唯一性。因为倘若纳什均衡不是唯一的，那么就难以根据模型对即将出现的结果加以预测，这种不确定性对于科学理论来说是不存在的。再加上前面谈到的存在性问题，我们可以这样说，模型能否具有科学意义取决于纳什均衡的存在性和唯一性，因为这正是科学理论所具有的基本性质。博弈论目前发展的情况是这样的：已经证明在非常一般的情况下，纳什均衡是存在的，这是一个好的结果；但是，在许多情形，模型的纳什均衡解不是唯一的，这被称为纳什均衡的多重性问题。纳什在1950年代证明了纳什均衡的存在性定理，为非合作博弈打下了重要基础。纳什的工作不仅解决了存在性问题，而且还为其后的博弈论研究提供了一整套方法论工具，即运用不动点定理(fixed point theorem)这一强有力的数学工具进行博弈论数学分析，这对后来的博弈论甚至数理经济学的发展产生了很大的影响。纳什均衡的多重性问题至今仍是困扰博弈论学者的一个主要问题。为了攻克这一问题，博弈论专家已经做出了许多贡献，如聚点均衡、相关均衡，子博弈精炼纳什均衡，颤抖手均衡，序贯均衡等概念的提出。但不幸的是，这类努力还未使得多重均衡问题完全得到解决，许多博弈论专家正在这一领域进行着不懈的工作。本章将给出纳什均衡的存在性定理和讨论存在多重均衡情况下的均衡选择问题。

纳什均衡点

纳什均衡点纳什均衡点纳什均衡点（港译：纳殊均衡点），又称为非合作博弈均衡点，是博弈论的一个重要概念，以约翰·纳什命名。如果某情况下无一参与者可以独自行动而增加收益，则此策略组合被称为纳什均衡点[1]。 [编辑本段]例子经典的例子就是囚徒困境，囚徒困境是一个非零和博弈。大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被判刑一年，而对方将被判刑十年；如果两人均招供，将均被判刑五年。于是，两人同时陷入招供还是不招供的两难处境。如果两人均不招供，将最有利，只被判刑三年。但两人无法沟通，于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳氏均衡点。这时，个体的理性利益选择是与整体的理性利益选择不一致的。囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年；乙判刑一年不招供甲判刑一年；乙判刑十年甲判刑三年基于经济学中Rational agent的前提假设，两个囚犯符合自己利益的选择是坦白招供，原本对双方都有利的策略不招供从而均被判刑三年就不会出现。事实上，这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”（也叫非合作均衡），换言之，在此情况下，无一参与者可以“独自行动”（即单方面改变决定）而增加收获。 [编辑本段]学术争议和批评第一，纳什（Nash）的关于非合作（non-cooperative）博弈论的平衡不动点解（equilibrium/fixpoint）学术证明是非构造性的（non-constructive），就是说纳什用角谷静夫不动点定理（Kakutani fixed point theorem）证明了平衡不动点解是存在的，但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡 1．假设厂商A 与厂商B 的平均成本与边际成本都是常数，10A MC =，8B MC =，对厂商产出的需求函数是 50020D Q p =- （1）如果厂商进行Bertrand 竞争，在纳什均衡下的市场价格是多少？（2）每个厂商的利润分别为多少？（3）这个均衡是帕累托有效吗？解：（1）如果厂商进行Bertrand 竞争，纳什均衡下的市场价格是10B p ε=-，10A p =，其中ε是一个极小的正数。理由如下：假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ，那么必有10A p ≥，8B p ≥，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，A p 和B p 都不会严格大于10。否则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足10A p ≤，10B p ≤。但是由于A p 的下限也是10，所以均衡时10A p =。给定10A p =，厂商B 的最优选择是令10B p ε=-，这里ε是一个介于0到2之间的正数，这时厂商B 可以获得整个市场的消费者。综上可知，均衡时的价格为10A p =，10B p ε=-。（2）由于厂商A 的价格严格高于厂商B 的价格，所以厂商A 的销售量为零，从而利润也是零。下面来确定厂商B 的销售量，此时厂商B 是市场上的垄断者，它的利润最大化问题为： max pq cq ε>- ① 其中10p ε=-，()5002010q ε=-?-，把这两个式子代入①式中，得到： ()()0 max 1085002010εεε>----???? 解得0ε=，由于ε必须严格大于零，这就意味着ε可以取一个任意小的正数，所以厂商B 的利润为：()()500201010εε-?--????。（3）这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本，所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格，那么厂商B 的利润和消费者的剩余就都可以得到提高，同时又不损害厂商A 的剩余（因为A 的利润还是零）。 2．（单项选择）在下面的支付矩阵（表10-1）中，第一个数表示A 的支付水平，第二个数表示B 的支付水平，a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”，那么：表10-1 博弈的支付矩阵

团队管理中的纳什均衡

团队管理中的纳什均衡众所周知，团队就是由每一位个体员工和管理者个体组成的一个共同体，该共同体能够集中每个个体的知识、智慧和技能优势，促进个体之间的高度互补与工作协调，并形成团队优质，解决问题，实现共同目标，而纳什均衡则是指定博弈、对策和游戏中的一种情形，一种给定博弈、对策和游戏对手的最佳选择，自己的最佳选择，即每个人都从利己的角度出发做出最佳选择，选择对自己最有利的策略，而不考虑社会福利或其他对手的利益，这种策略组合由所有局中人的最佳策略组合构成，在缺乏有效外力推动的情况下，没有人会主动改变自己的策略以便获得更大利益。在团队管理中，如果团队成员之间的选择是在非完全信息对称的情况下做出的，则团队建设就很有可能遇到纳什均衡。下面我们试分析之。企业文化与个人追求企业文化是作为一个组织的企业内部的全体员工的共同价值观和道德准则，共同的精神追求和行为规范，从人本逻辑上来讲，企业文化则是企业家文化，而企业家文化的形成和确定，则必然打上企业家个人的价值取向烙印，即企业家自己的所谓最有利的选择。而团队成员在某种特定的企业文化氛围里边也有着每个人的追求，即所谓的

他所做的对自己最有利的选择，如果团队成员的选择与企业家的选择是一致的，这构成一种合作均衡，否则，团队成员的选择与企业的选择不同甚至完全相反，这就形成了纳什均衡。如在市场经济条件下，一家企业文化的价值追求体系是效率公平，则每一个团队在这种特定选择中，彼此的最佳选择就是追求效益最大化，更快更好地完成团队目标，其结果是企业目标的顺利实现；相反如果一家企业文化的价值追求体系是伦理公平，讲求平均主义，则每一个团队及其成员则会在这种给定选择中，彼此的最佳选择就是追求不劳而获，减少劳动量，甚至是高效能人才的大量流失和闲置，其结果是企业目标的落空。团队精神与团队冲突团队精神要求团队每个成员的行为能够积聚团队的整体优势，形成合力，解决问题，向团队目标迈进，而团队冲突则是由于团队成员在交往中产生意见与分歧，出现分歧，对抗导致彼此间关系紧张的局面，如果团队成员都能把团队精神视作其他成员的行为出发点和落脚点，那么该成员则也会做好他的最佳选择－－做团队精神的捍卫者和实践者，从而达成每一个成员的最佳选择；相反如果团队成员认为其他成员完全站在对抗和竞争的立场上与之对话，那么该成员也必然会站在同样的立场上做出选择，其结果导致团队冲突升级，如果在冲突升级过程中没有任何成员做出重新的以团队精神为导向的选择，那么团队精神就会沦为乌有，团队也会走向解体。职责分工与利益分配在团队管理中，进行岗位的职责分工并进行相对应的利益分配是

纳什均衡的重要影响及其问题局限

研究领域：微观经济学纳什均衡的重要影响及其问题局限高红阳（东北师范大学传媒科学学院，吉林长春 130117；吉林大学管理学院博士生，吉林长春 130022）摘要：纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础，其对经济学以及其他社会科学甚至自然科学产生了重要影响。尽管纳什均衡理论及其应用得到了空前的肯定，但近年来纳什均衡分析却遭到了前所未有的质疑。论文从理性前提、犯错误、多重性、静态分析、动态分析、期望效用等六个角度论述了目前理论所存在的问题局限，而且将学界尝试解决上述问题的有限理性、好像理性、颤抖手均衡、聚焦均衡、风险占优均衡、帕累托最优均衡、防联盟均衡、相关均衡等方法一并加以讨论阐述。关键词：纳什；纳什均衡；局限博弈论（game theory）研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，纳什均衡（Nash Equilibrium）是博弈解的一般名称，是当前博弈理论体系的核心概念。从1994年纳什（Nash）、泽尔腾（Selten）和海萨尼（Harsanyi）三位博弈论专家获得诺奖，博弈论一直是十余年来学界最活跃的研究领域之一，被经济学、政治学、生物学、军事学等许多学科奉为重要的方法论基础。 1纳什均衡的重要影响 1.1纳什及纳什均衡的得来纳什1928年生于美国西弗吉尼亚州。关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是纳什在普林斯顿大学攻读博士学位时完成的。实际上，博弈论的研究起始于1944年冯·诺依曼（Von Neumann）和奥斯卡·摩根斯坦（Oscar Morgenstern）合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，证明了纳什均衡在n人有限博弈中的普遍存在性，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而对“合作博弈（Cooperative Game）”和“非合作博弈”做了明确的区分和定义。图克（Tucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。在概念和方法两方面，该论文都是作者的独立创造。” 1.2纳什均衡的重要影响纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础，正如克瑞普斯（Kreps，1990）在《博弈论和经济建模》一书的引言中所说，“在过去的一二十年内，经济学在方法论以及语言、概念等方面，经历了一场温和的革命，非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面（谢识予，1999）：（1）改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等，均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域，改变了这些学科领域的内容和结构，成为这些学科领域的基本研究范式和理论分析工具，从而改变了原有经济学理论体系中各分支学科的内涵。（2）扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济

3-混合策略的纳什均衡

博弈论教学/混合策略的纳什均衡出自MyKnowledgeBase < 博弈论教学 Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡目录 ■1 复习 ■2 混合策略(Mixed strategy) ■2.1 举例/Example ■2.2 概念 ■2.3 纯策略和混合策略 ■2.4 混合策略的争议 ■3 混合策略的纳什均衡 ■3.1 基本概念 ■3.2 混合策略纳什均衡的存在性/纳什定理 ■3.3 学术争议与批评 ■4 混合策略纳什均衡举例 ■4.1 社会福利博弈Social Welfare Game ■4.1.1 博弈分析(方法1:收益无差异) ■4.1.2 博弈分析（方法2：图形分析法） ■4.1.3 博弈分析(方法3：导数(Derivative)极值法) ■4.2 普通例子 ■4.3 审计博弈(Tax Game) ■4.4 激励的悖论[5] ■4.5 求解纳什均衡的一般方法 ■5 多重纳什均衡 ■5.1 多重纳什均衡举例 ■5.1.1 夫妻之争 ■5.1.2 制式问题 ■5.1.3 市场机会博弈 ■5.2 多重纳什均衡分析 ■5.2.1 帕累托上策均衡（Pareto Dominated Equilibrium） ■5.2.1.1 帕累托最优Pareto optimality ■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.3 举例分析 ■5.2.2 风险上策均衡(Risk-dominant Equilibrium) ■5.2.3 聚点均衡(Focal Points Equilibrium) ■5.2.4 相关均衡 ■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义 ■7 作业 ■8 参考文献

博弈论与纳什均衡

《博弈论与纳什均衡理论》姓名张贺祺学号 2010010404 专业政治经济学指导老师张秉云

摘要博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法，也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。关键字：博弈论；纳什均衡；合作博弈；非合作博弈

目录摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) （一）博弈论的主要思想 (4) （二）博弈论的分类 (5) 三、经典案例 (7) （一）博弈论的经典案例 (7) （二）纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) （一）博弈论的重要影响 (8) （二）纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论一、引言近代对于博弈论的研究，开始于策墨咯（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。 1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。博弈论（Game Theory）:亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：（Nash equilibrium）又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。二、博弈论与纳什均衡的主要内容（一）博弈论的主要思想一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P：为局中人，博弈的参与者，也称为博弈方，局中人是能够独立决策，独立承担责任的个人或组织，局中人以最终实现自身利益最大化为目标。决策人：在博弈中率先做出决策的一方，这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者：在博弈二人对局中行动滞后的那个人，与决策人要做出基本反面的决定，并且他的动作是滞后的、默认的、被动的，但最终占优。他的策略可能依赖于决策人劣势的策略选择，因此对

寻找三个纳什均衡

1.首先将原始数据带入博弈计算程序，可以得到如下的答案：可以看到其中一个是纯策略，两个是混合策略。 2.首先用划线法找出可以找到第一个纯策略。纯策略下张三和李四的收益组合为：（60，76），张三和李四的策略分别为（0，1，0）和（0，0，1）3.用消去法消去划线的两行这样得到一个新的组合， P 1-P

假设新的组合是符合混合纳什均衡策略那么张三选上下的策略为P ，1-P ；李四选左中的策略为S,1-S. 根据纳什均衡的条件：李四的策略概率S ，1-S ，使得张三选择上下策略收益相同：得到一个等式：12S+42(1-S)=72S+36(1-S). S=1/11 1-S=10/11; 此时张三的收益为：=12×1/11+42×10/11 = 432/11 = 39.27；同样张三的概率P,1-P,使得李四选择左中的收益相等: 得等式：83P+47(1-P)=56P+95(1-P) P=16/25；1-P=9/25; 此时李四的收益：=83×16/25+47×9/25=53.12+16.92=70.04 综上为第二个混合策略纳什均衡张三和李四的策略分别为：（16/25，0，9/25）和（1/11，10/11，0），张三和李四的收益为（39.27，70.04）第三步：一般的混合纳什均衡设张三选择上中下的策略概率分别为p,q,1-p-q ；李四选择左中右的策略概率分别为s,t,1-s-t ；李四的策略要使张三的策略收益相同： 12s + 42t + 42(1-s-t)=24s + 12t + 60(1-s-t)=72s + 36t + 42(1-s-t) s=1/27, t=10/27, 1-s-t= 16/27 此时张三的收益张三收益 = 12*1/27+42*10/27+42*16/27=(12+420+672)/27=1104/27=40.89 同上可知张三需要确定一个行动概率，以使李四的选择在其收益上没有差异，得等式： 83p + 12q +47(1-p-q) = 56p + 42q + 95(1-p-q)=45p + 76q + 59(1-p-q) p=113/200, q=5/16, 1-p-q=49/400 此时李四的收益为李四收益 =83*113/200+12*5/16+47*49/400=46.895+3.755.7575=56.40 综上，此混合策略纳什均衡相对于张三和李四的策略选择用概率分别表述为（113/200，5/16， 49/400）和（1/27，10/27，16/27），收益分别为（40.89，56.40）第四步：最后策略三个策略的收益为：（60，76）（39.27，70.04）和40.89，56.40）通过帕累托上策为（60，76）对双方来说收益最大，所以张三（0，1，0），李四（0，0，1）的纳什均衡点应是实际行为最可能的结果。 1-S S

纳什均衡理论

纳什均衡理论 “纳什均衡”：合作是有利的“利己策略”。它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。 1994年诺贝尔经济学奖的获得者美国普林斯顿大学的约翰·纳什。纳什获得诺贝尔经济学奖的原因是他在博奕沦领域的贡献，他提出了“纳什均衡”理论、关于博奕论，流传最广的是一个叫做“囚徒困境”的故事：话说有一天，一个富翁在家中被杀，财物被盗；警方在此案的侦破过程中，抓到两个犯罪嫌疑人张三和李四，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称他们只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。警察分别对张三和李四说，“由于你们的偷盗罪已有确凿的证据，所以可以判你们1年刑期。但是，我可以和你做个交易。如果你单独坦白杀人的罪行，我只判你3个月的监禁，但你的同伙要被判10年刑。如果你拒不坦白，而被同伙检举，那么你就将被判10年刑，他只判3个月的监禁。但是，如果你们两人都坦白交代，那么，你们都要被判5年刑。” 张三和李四怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖，结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供，按照亚当·斯密的理论，每一个人都是一个“理性的经济人”，都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程：假如他招了，我不招，得坐10年监狱，招了才5年，所以招了划算；假如我招了，他也招，得坐5年，他要是不招，我就只坐3个月，而他会坐10年牢，也是招了划算。综合以上几种情况考虑，不管他招不招，对我而言都是招了划算。两个人都会动这样的脑筋，最终，两个人都选择了招?结果都被判5年刑期。原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题，这就是个人理性与集体理性的矛盾。实际上，如果两个都抵赖，各判刑1年，显然比都判5年好，但实际上做不到，因为它不满足个人理性要求。作为一个理性的人，张三和李四都会想，如果我抵赖而对方坦白的话，自己就可能判刑10年，理性的人是不会冒这种险的。但张三和李四都理性选择的结果，两人都被判了5年，最优的被判1年的结果并没有出现。也就是说，对每个人而言都是理性的选择，但对于整个集体来说却是不理性的。这与传统经济学所言的结论相悖。传统经济学认为市场经济存在“看不见的手”，它调节的结果是每个人的理性选择最终会造成对整个集体的最大利益。实际上，就像囚徒困境一样，这只看不见的手在参与选择的人数只有少数几个的时候会失去作用，因为这个时候，人们决策的过程会考虑其他参与者的想法，就像赌博和下棋的时候一样，这就和买家和卖家数量都巨大时的完全竞争不完全一样，需要新的一套思路进行研究。

纳什均衡的启示及其应用

纳什均衡的启示及其应用【摘要】本文介绍了博弈论中的纳什均衡——非合作博弈的概念、进化、原理和现象，并列举了纳什均衡理论在社会生活、经济生活以及企业管理等方面的应用和作用机理，从而论证了纳什均衡的理论研究意义和其在实践中的价值。【关键词】纳什均衡企业人才流失商业价格竞争环境污染贸易壁垒 “博弈”一词是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语。天才数学家纳什深入研究了非合作领域的博弈现象，对博弈论做出了杰出的贡献。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡是完全信息静态博弈解的一般概念，是最常见的均衡，是非合作对策中的一种自然趋向解。纳什均衡理论彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石。一、纳什均衡的进化 “纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。著名的“囚徒故事”中两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此，从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲，勿施于我。其次，“纳什均衡”是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展，甚至可以说是一场革命。从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。博弈论在现实中的应用很多。首先，它是一种数学理论，可以用于经济学等领域；再者，它作为一种理论，并非产生直接

纳什均衡的存在性定理中的相关解释

纳什均衡的存在性定理中的相关解释教材（《经济博弈与应用》）p33，图2.1表明不动点是曲线()?f 与45o 线的交点。当函数()x f 定义在[]1,0∈x 区间上且因变量()x f y =的值域也为[]1,0区间时，如果()x f 是连续的，则必然存在不动点。图2.1 [0,1]区间上的自变换函数的不动点直接用来证明纳什存在性定理的不动点定理不是Brouwer 角谷静夫(Kakutani)不动点定理。定义1 S 是凸的(Convex)当且仅当对任意的M M R y R x ∈∈,及满足1 ≤≤λ的λ，只要S x ∈和S y ∈，则有 ()S y x ∈-+λλ1 定义2 S 是闭的(Closed)当且仅当对每个收敛的序列()}{∞ =1j j x ，如果对每个 j 都有()S j x ∈，则有 ()S j x j ∈∞ →lim 定义3 R M 中的子集S 是开的(open)当且仅当它的补集R M /S 是闭的。定义4 S 是有界的(bounded)当且仅当存在某个正数K 使得对S 中的每个元素x 都有 ∑ ∈≤M m m K x 定义5 当函数()x f 满足下述性质时，我们称其为凹的： ()()()()()[]n R x x x f x f x x f ∈∈-+≥-+212121, 1,0,11λλλλλ x x 第一季第二季第三季第四季)(x f x 1

如果当()1,0∈λ时上面的不等式严格成立，则称()x f 为严格凹的。一个函数 ()x f 是凸的当且仅当函数-()x f 是凹的；()x f 为严格凸函数当且仅当-()x f 为严格凹函数。拟凹函数是凹函数概念的一种推广，它包括了凹函数在内的一大类函数，而这类函数在经济学中有着广泛应用，关于拟凹函数的定义如下：定义6 函数()x f 定义在R n 中的子集D 上，当且仅当()x f 满足如下性质时， ()x f 是拟凹的： ()()()()()2121,min 1x f x f x x f ≥-+λλ ∈λ[0,1] 显然，凹函数是拟凹的，但反过来并不成立，即拟凹函数不一定是凹函数。在下图中，函数()x f 是拟凹的，但不是凹的。图不是凹函数的拟凹函数 x 1 y x 2 x () x f

博弈论和纳什均衡

关于博弈论和纳什均衡你应该知道这些美股腾讯财经[微博]2015-05-25 10:05 我要分享 139 [摘要]纳什在与命运的博弈中找到均衡，纪念大师最好的方式就是尝试了解博弈论。腾讯财经综合报道（风生）奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸，两人均不幸遇难。事发当时，这辆出租车失控撞向栏杆，两人均被抛出车外。约翰-纳什因发表两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生，曾在麻省理工学院任教，晚年为普林斯顿大学担任数学系教授，死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名，1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。纳什在数学领域上取得多项突破，但他同时深受精神分裂症困扰，其生平故事在2001年被改编成电影《美丽心灵》，赢得包括最佳电影在内的4项奥斯卡奖项。尽管西维亚-纳萨斯（Sylvia Nasars）广为人知的小说《美丽心灵》（A Beautiful Mind）和改编自该书的、由拉塞尔-克罗（Russell Crowe）主演的

同名奥斯卡电影探究了纳什错综复杂的生平，但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界，人们普遍认为，与牛顿和爱因斯坦的数学理论相比，纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题，而纳什的数学却可以应用在生物学和社会学领域。如若不是精神疾病的困扰，纳什今天可能已与那些科学伟人齐名。尽管如此，他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就，他与约翰海萨尼（John Harsanyi）和莱茵哈德-泽尔腾（Reinhard Selten）一起获得了1994年诺贝尔经济学奖。什么是博弈论与纳什均衡博弈论 :亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰-纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。近代对于博弈论的研究，开始于策墨咯，波雷尔及冯-诺伊曼。1928年，冯-诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯-诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰-福布斯-纳什利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均