纳什均衡的启示及其应用

纳什均衡的启示及其应用
纳什均衡的启示及其应用

纳什均衡的启示及其应用

【摘要】本文介绍了博弈论中的纳什均衡——非合作博弈的概念、进化、原理和现象,并列举了纳什均衡理论在社会生活、经济生活以及企业管理等方面的应用和作用机理,从而论证了纳什均衡的理论研究意义和其在实践中的价值。

【关键词】纳什均衡企业人才流失商业价格竞争环境污染贸易壁垒

“博弈”一词是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语。天才数学家纳什深入研究了非合作领域的博弈现象,对博弈论做出了杰出的贡献。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

纳什均衡是完全信息静态博弈解的一般概念,是最常见的均衡,是非合作对策中的一种自然趋向解。纳什均衡理论彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石。

一、纳什均衡的进化

“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。著名的“囚徒故事”中两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲,勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。博弈论在现实中的应用很多。首先,它是一种数学理论,可以用于经济学等领域;再者,它作为一种理论,并非产生直接

纳什均衡的重要影响及其问题局限

研究领域:微观经济学 纳什均衡的重要影响及其问题局限 高红阳 (东北师范大学传媒科学学院,吉林长春 130117;吉林大学管理学院博士生,吉林长春 130022) 摘要:纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,其对经济学以及其他社会科学甚至自然科学产生了重要影响。尽管纳什均衡理论及其应用得到了空前的肯定,但近年来纳什均衡分析却遭到了前所未有的质疑。论文从理性前提、犯错误、多重性、静态分析、动态分析、期望效用等六个角度论述了目前理论所存在的问题局限,而且将学界尝试解决上述问题的有限理性、好像理性、颤抖手均衡、聚焦均衡、风险占优均衡、帕累托最优均衡、防联盟均衡、相关均衡等方法一并加以讨论阐述。 关键词:纳什;纳什均衡;局限 博弈论(game theory)研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,纳什均衡(Nash Equilibrium)是博弈解的一般名称,是当前博弈理论体系的核心概念。从1994年纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi)三位博弈论专家获得诺奖,博弈论一直是十余年来学界最活跃的研究领域之一,被经济学、政治学、生物学、军事学等许多学科奉为重要的方法论基础。 1纳什均衡的重要影响 1.1纳什及纳什均衡的得来 纳什1928年生于美国西弗吉尼亚州。关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是纳什在普林斯顿大学攻读博士学位时完成的。实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。图克(Tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。” 1.2纳什均衡的重要影响 纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面(谢识予,1999): (1)改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。 (2)扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济

纳什均衡

纳什均衡简介 纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以 约翰·纳什命名。在一 个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组 合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。 一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。 纳什均衡的得来 关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在 普林斯顿大学攻读博士学位时完成 的。实际上,博弈论的研究起始于1944年冯·诺依曼( Von Neumann)和 奥斯卡·摩根斯坦 (Oscar Morgenstern)合著的《博弈论和经济行 为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下, 证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而 对“合作博弈 (Cooperative Game)”和“ 非合作博弈”做了明确 的区分和定义。阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。” 纳什均衡例子 博弈论中一个著名的例子就是囚徒困境。 囚徒困境是一个 非零和博弈,说的是两个嫌疑犯 甲和乙私人民宅联手作案,被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉 两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。于是,两个人同时陷入招供还是不招供的两难处境。结果是,尽管甲不知乙是否招供,但他认为自己选择“招供”最好,因而甲会选择“招供”,同样乙也会选择“招供”,两人各判5年。而两人都选择不招供,虽证据不足但因私人民宅将各拘留1年的结果是不会出现的。 博弈矩阵囚犯甲 招供不招供 囚犯乙招供判刑五年 甲判刑十年;乙判刑三个月 不招供

浅析囚徒困境与纳什均衡

浅析囚徒困境 囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。 囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效,中小学生课业负担不减反增。 又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。可是,我错了吗?没有。当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。可是,我对了吗?没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。 再看中国的法治之路。虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。不过,任何事物都有两面性,“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法治。 但囚徒困境一定是坏事吗?就以囚徒困境的经典案例来说,作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。 然而如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺,向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。比如在楼市的囚徒困境中,政府能适当调控房价,给予购房者房价稳定合理的承诺,那么楼市的囚徒困境是有可能破解的。 在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡 在纳什均衡中,你不一定满意其他的策略,但你的策略是回馈对手招数的最佳策略。 从囚徒困境中我们会发现,作为博弈各方的行动就是针对对方行动而确定的最佳对策,而一旦知道对方在做什么,就没人愿意改变自己的做法。博弈论学把这么一个结果称为均衡。这个概念是有普林斯顿大学数学家约翰·纳什提出的,因此被称为纳什均衡。 诺贝尔经济学奖获得者萨缪尔森有句名言,你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词,供给与需求。博弈论专家坎多瑞引申说:“要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是纳什均衡”。 1950年,还是一名研究生的纳什写了一篇论文,题为《n人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。 纳什的贡献是,他证明了在这一类的竞争中,在很广泛的条件下是有稳定解存在的,只要是别人的行为确定下来,竞争者就可以有最佳的策略。 那么,什么纳什均衡呢?简单说,就是一策略组合中,所有的参与者面临这样的一种情况:给定你的策略,我的策略是我最好的策略。给定我的策略,你的策略也是你最好的策略,即双方在对方给定的策略下不愿意调整自己的策略。 纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具,所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展,甚至说是一场革命。 纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战,按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果,

从纳什均衡引出一个悖论:从利己的目的触发,结果损人不利己。“囚徒困境”就是如此,从这个意义说,纳什均衡提出的悖论实际上动摇了西方经济学的基石。 纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。这个法则如下:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。 在囚徒困境中存在唯一的纳什均衡点,即两个囚犯均选择“招认”,这是唯一稳定的结果。 有些博弈的纳什均衡点不止一个,如下述夫妻博弈中有两个纳什均衡点。 丈夫和妻子商量晚上的活动,丈夫喜欢看拳击,而妻子喜欢欣赏歌剧,但两个人都希望在一起度过夜晚。在这个夫妻博弈中有两个纳什均衡点:要么一同去看歌剧,要么一同去看拳击。在有两个或两个以上纳什均衡点的博弈中,其最后的结果难以预测。在夫妻博弈中,我们无法知道,最后结果是一同欣赏歌剧还是一同看拳击。 是不是所有的博弈均存在纳什均衡点呢?不一定存在纯策略纳什均衡点,但至少存在一个混合策略均衡点。 这里所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略,所谓混合策略是指参与者采取的不是唯一的策略,而是其策略空间上的概率分布。 我们下面将在警察与小偷的博弈中给出混合策略的说明。 在西部片里,我们常能看到这样的故事:某个小镇上只有一名警察,他要负责整个镇的治安,现在我们假定,小镇的一头有一家酒馆,另一头有一家银行,再假定该地有一个小偷,要实施偷盗。因为分身乏术,警察一次只能在一个地方

纳什均衡

1.纳什均衡:给出对方的策略,你所选的是最优的(至少不比其它策略差),如果每个局 中人都是这样,那么所构成的策略组合(对局),就称为纳什均衡。 2.效用:消费者偏好与收入之间的相互作用导致人们做出消费选择,效用则是人们从这种 消费选择中所获得的愉悦或满足。 3.边际产量:当其他要素不变时,可变要素增加一个单位所带来的总产量的增加量。 4.生产成本:经营一个企业,为达到利润最大化,必须支付一些资金来维持运营,如建造 厂房,采购机器及原料,雇用员工等支出都可视为厂家的生产成本。 5.帕累托标准:如果一种变化可以改善某些人的处境,同时对其他人都没有伤害。则这种 变化是好事,应该给予实行。 6.恩格尔系数:是食品支出总额占个人消费支出总额的比重。一个家庭收入越少,家庭收 入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购买食物的支出将会下降。恩格尔系数是用来衡量家庭富足程度的重要指标。 7.效用:消费者偏好与收入之间的相互作用导致人们做出消费选择,效用则是人们从这种 消费选择中所获得的愉悦或满足。 8.价格管制:是指政府对新药定价以及上市药品价格上涨实施严格的管制,企业不能自由 定价,而是由政府和制药企业谈判决定新药的价格。 9.软着陆:当一个国家经过强劲的经济增长后,仍维持缓和的增长,并未因此转入衰退, 即使“软着陆”。 10.硬着陆:一个国家的经济在高速增长的同时伴随着高度通货膨胀,使得经济迅速从增高 长直接走入低增长甚至衰退。 11.通货膨胀:平均物价水平持续上扬的状态,通货膨胀率通常是以消费者物价指数(CPI) 的变化率来表示。指数上升→物价上升,货币购买力下降。 12.再贴现率:一般商业银行可以直接向中央银行借贷的利率。所谓“贴现”:通过一定的 方式把发生在未来(或不同时间)的费用和效益转化为现值的方式就叫贴现。 13.机会成本:在资源一定的情况下,多生产一个单位的某种产品,就要以少生产若干单位 的另一种产品为代价。这种放弃若干单位另一种产品生产的代价,就是生产某种成品的机会成本。 14.需求价弹性价格:指在市场需求曲线的任何一点,价格每变动1%所导致的需求量变动 的百分比。它是衡量产品需求量对产品价格变动的敏感指标。 15.生产函数(生产成本):企业在每个时期投入的各种生产要素的数量与获得的产出品的 数量之间的关系。 16.均衡及均衡价格:均衡:供给和需求达到平衡的状态。均衡价格:供需平衡时的价格。 有时被称为市场出清价格。 17.资源的概念及分类:指用于生产能满足人类需要的东西的那些物品或劳务。分类:自由 资源和经济资源 18.恩格尔曲线:某种商品的均衡购买量与消费者货币收入之间的关系。 1.药物需求与供给的特征:需求的特征:需求的不确定性、需求的最高优先性、需求的不 可替代性、需求的外部效应性、需求缺乏弹性、需求的被动性、独特的需求三方结构供给的特征:高质量性、高技术性、高投入性、高风险性、高回报性、高度集中性 2.影响药品需求的因素有哪些: (一)一般经济学因素:1.经济发展水平;2.价格水平(1)是否实施医疗保障制度(2)医疗保障制度下保障的范围(3)医疗保障制度的报销制度和自付比例等(二) 社会人口学因素(三)流行病学因素(四)临床医生和药师因素(五)医药技

纳什均衡不动点

纳什均衡的存在性与多重性 对于数学家来说,一个数学概念的存在性与唯一性是特别需要加以关注的。这是因为,从形式逻辑角度看,如果某个事物并不存在,那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的,因为对于不存在的事物来说,任何关于它的陈述或判断都不可能加以证伪。所以,倘若某个概念所对应的事物并不存在。那么,关于这个概念所给出的研究结论都必然不存在被证伪的可能。因而根据波普尔的证伪主义观点,这样的研究不具备科学上的意义。所以,我们在对任何新提出来的数学概念加以系统研究之前,首先需要弄清楚所研究的对象事物是否存在。 有许多被称为伪科学的东西,它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。譬如,所谓的特异功能或“超灵学”并未得到证实,而UFO研究迷们至今也未能拿出一件存在球外生命的证据,所以,特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。除了存在性之外,概念事物的唯一性也是数学家们所关心的问题。从纯理论的兴趣上看,数学家们更多地是从审美的角度上看待概念的唯一性,但从波普尔的证伪主义哲学看,模型均衡解的唯一性关系到模型的预测功能,从而是科学理论应基本具有的特征。我们在第二章中曾指出,理论的预测功能是判别理论的科学性的准绳,而在第三章中,我们提出用纳什均衡作为模型的预测结果。按照这样的逻辑,一个自然的推论就是:模型能否具有科学意义取决于纳什均衡的唯一性。因为倘若纳什均衡不是唯一的,那么就难以根据模型对即将出现的结果加以预测,这种不确定性对于科学理论来说是不存在的。再加上前面谈到的存在性问题,我们可以这样说,模型能否具有科学意义取决于纳什均衡的存在性和唯一性,因为这正是科学理论所具有的基本性质。 博弈论目前发展的情况是这样的:已经证明在非常一般的情况下,纳什均衡是存在的,这是一个好的结果;但是,在许多情形,模型的纳什均衡解不是唯一的,这被称为纳什均衡的多重性问题。 纳什在1950年代证明了纳什均衡的存在性定理,为非合作博弈打下了重要基础。纳什的工作不仅解决了存在性问题,而且还为其后的博弈论研究提供了一整套方法论工具,即运用不动点定理(fixed point theorem)这一强有力的数学工具进行博弈论数学分析,这对后来的博弈论甚至数理经济学的发展产生了很大的影响。纳什均衡的多重性问题至今仍是困扰博弈论学者的一个主要问题。为了攻克这一问题,博弈论专家已经做出了许多贡献,如聚点均衡、相关均衡,子博弈精炼纳什均衡,颤抖手均衡,序贯均衡等概念的提出。但不幸的是,这类努力还未使得多重均衡问题完全得到解决,许多博弈论专家正在这一领域进行着不懈的工作。 本章将给出纳什均衡的存在性定理和讨论存在多重均衡情况下的均衡选择问题。

纳什均衡的应用

纳什均衡的应用 1.考虑不对称的古诺双头垄断,市场反需求函数为Q p -=115,A 企业生产的固定成本 为1000,B 企业没有固定成本,A 和B 两个企业的可变成本分别为2a q 和2b q 。 (1)请写出A 公司的古诺反应函数的表达式。 (2)请写出B 公司的古诺反应函数的表达式。 (3)请求出纳什均衡时两个企业的产量和利润。 2.在贝特兰德模型中,假定每个企业的最大生产能力是K ,单位生产成本为c =10,需求为100,如果两个企业的价格相同,市场需求在二者之间平分;如果j i P P < (i ,j =1,2,i ≠j),企业i 产量为Min{100-P i ,K},企业j 的产量为Min[Max(0,100-P i -K),K](即只有低价企业不能满足需求时,高价企业才生产,并且产量不超过生产能力)。 (1)求企业的得益函数; (2)假定300,即两国税收的替代系数。假定两国是同时决策,征税的边际成本为c 1,c 2>0,无固定成本。试求解该博弈问题的纳什均衡。 7.五户居民都可以在一个公共的池塘里放养鸭子。每只鸭子的收益v 是鸭子总数N 的函数,并取决于N 是否超过某个临界值N ;如果N N <,收益N N v v -==50)(;如果N N ≥时,0)(=N v 。再假设每只鸭子的成本为c =2元。若所有居民同时决定养鸭的数量,问该博弈的纳什均衡是什么? 8.一群渔夫在一个特定有限的区域内集体作业。该区域捕鱼的回报依赖于整体的总作业时

浅析囚徒困境与纳什均衡

浅析囚徒困境 令狐采学 囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。 囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效,中小学生课业负担不减反增。 又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。可是,我错了吗?没有。当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。可是,我对了吗?没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的

经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。 再看中国的法治之路。虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。不过,任何事物都有两面性,“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法治。 但囚徒困境一定是坏事吗?就以囚徒困境的经典案例来说,作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。 然而如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺,向另一方表示合

团队管理中的纳什均衡

团队管理中的纳什均衡 众所周知,团队就是由每一位个体员工和管理者个体组成的一个共同体,该共同体能够集中每个个体的知识、智慧和技能优势,促进个体之间的高度互补与工作协调,并形成团队优质,解决问题,实现共同目标,而纳什均衡则是指定博弈、对策和游戏中的一种情形,一种给定博弈、对策和游戏对手的最佳选择,自己的最佳选择,即每个人都从利己的角度出发做出最佳选择,选择对自己最有利的策略,而不考虑社会福利或其他对手的利益,这种策略组合由所有局中人的最佳策略组合构成,在缺乏有效外力推动的情况下,没有人会主动改变自己的策略以便获得更大利益。在团队管理中,如果团队成员之间的选择是在非完全信息对称的情况下做出的,则团队建设就很有可能遇到纳什均衡。下面我们试分析之。 企业文化与个人追求 企业文化是作为一个组织的企业内部的全体员工的共同价值观和道德准则,共同的精神追求和行为规范,从人本逻辑上来讲,企业文化则是企业家文化,而企业家文化的形成和确定,则必然打上企业家个人的价值取向烙印,即企业家自己的所谓最有利的选择。而团队成员在某种特定的企业文化氛围里边也有着每个人的追求,即所谓的

他所做的对自己最有利的选择,如果团队成员的选择与企业家的选择是一致的,这构成一种合作均衡,否则,团队成员的选择与企业的选择不同甚至完全相反,这就形成了纳什均衡。如在市场经济条件下,一家企业文化的价值追求体系是效率公平,则每一个团队在这种特定选择中,彼此的最佳选择就是追求效益最大化,更快更好地完成团队目标,其结果是企业目标的顺利实现;相反如果一家企业文化的价值追求体系是伦理公平,讲求平均主义,则每一个团队及其成员则会在这种给定选择中,彼此的最佳选择就是追求不劳而获,减少劳动量,甚至是高效能人才的大量流失和闲置,其结果是企业目标的落空。 团队精神与团队冲突团队 精神要求团队每个成员的行为能够积聚团队的整体优势,形成合力,解决问题,向团队目标迈进,而团队冲突则是由于团队成员在交往中产生意见与分歧,出现分歧,对抗导致彼此间关系紧张的局面,如果团队成员都能把团队精神视作其他成员的行为出发点和落脚点,那么该成员则也会做好他的最佳选择--做团队精神的捍卫者和实践者,从而达成每一个成员的最佳选择;相反如果团队成员认为其他成员完全站在对抗和竞争的立场上与之对话,那么该成员也必然会站在同样的立场上做出选择,其结果导致团队冲突升级,如果在冲突升级过程中没有任何成员做出重新的以团队精神为导向的选择,那么团队精神就会沦为乌有,团队也会走向解体。 职责分工与利益分配 在团队管理中,进行岗位的职责分工并进行相对应的利益分配是

浅析囚徒困境与纳什均衡

浅析囚徒困境 欧阳学文 囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。 囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效,中小学生课业负担不减反增。 又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。可是,

我错了吗?没有。当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。可是,我对了吗?没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。 再看中国的法治之路。虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。不过,任何事物都有两面性,“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法

纳什均衡的启示及其应用

纳什均衡的启示及其应用 【摘要】本文介绍了博弈论中的纳什均衡——非合作博弈的概念、进化、原理和现象,并列举了纳什均衡理论在社会生活、经济生活以及企业管理等方面的应用和作用机理,从而论证了纳什均衡的理论研究意义和其在实践中的价值。 【关键词】纳什均衡企业人才流失商业价格竞争环境污染贸易壁垒 “博弈”一词是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语。天才数学家纳什深入研究了非合作领域的博弈现象,对博弈论做出了杰出的贡献。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。 纳什均衡是完全信息静态博弈解的一般概念,是最常见的均衡,是非合作对策中的一种自然趋向解。纳什均衡理论彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石。 一、纳什均衡的进化 “纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。著名的“囚徒故事”中两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲,勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。 从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。博弈论在现实中的应用很多。首先,它是一种数学理论,可以用于经济学等领域;再者,它作为一种理论,并非产生直接

浅谈纳什均衡

浅谈纳什均衡 第一次接触到纳什均衡是在电影《美丽心灵》里边,主人公约翰·纳什经过不断探索和创新提出了他梦想的原创理论——纳什均衡定律。 关于纳什均衡的来源,有一段有趣的小故事。约翰·纳什假设有四男五女,其中有位女士长得非常漂亮以至于所有的男士都去追求这个女士。由于漂亮女士的天生孤傲,她拒绝了所有人的追求。于是这四个男士退而求其次,去追求另外四个女士。而这四个女士都不想作为第二个选择,所以都拒绝了这四个男士,公共利益为零。这时,约翰·纳什就想道:如果这四个男士一开始都不去追求那位漂亮女士而是直接去追求那四个不那么漂亮的女士,那么毫无疑问都会成功,这时公共效益达到最大。不管信还是不信,这个故事便是纳什均衡的最初来源了。 亚当·斯密,现代经济学之父,曾经提出:在竞争中,个人的野心往往会促进公共效益。但是约翰·纳什在普林斯顿大学发表的博士论文彻底推翻了统治了经济学界100多年的亚当·斯密的重要理论。经过一段时间后,纳什的理论像是一个炸弹爆炸在了各相关学界,引起了相当大的轰动。约翰·纳什也由于他的原创理论获得了1994年的诺贝尔经济学奖。 随着时间的推移,纳什的理论逐渐进入到博弈学领域,并且成为博弈学界不可或缺的支撑理论。 纳什均衡的定义:假设有n个局中人参与博弈,给定其他人策略

的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态。 标准定义,在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1, si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1, sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。 关于纳什均衡最经典的案例莫过于囚徒困境了,关于这个经典案例已经分析得太多太多,这里就不详细介绍了。 那么就通过生活中的例子来简单加入纳什均衡定理吧。话说马上就要期末考试了,有小A同学和小B同学两位刻苦学习的好孩子。他们相约一起复习,假设两人对各个学科的掌握情况不一致,小A对《经济学原理》比较熟络,而小B则更加擅长于《博弈与实践》课程。于是他们两个就打起了小算盘:如果小A和小B都自己复习自己所掌握

对策论中的纳什均衡应用

对策论中的纳什均衡应用 相对于对策论中的其他模型方法,博弈论是一种独特的处于各学科之间的 研究人类决策行为的方法,或者是研究人们在互动情况下所采取的策略,在现 实生活的选择中,我们会经常运用使用博弈去选择策略,无论是自觉的还是无 意识的。本文主要探讨博弈博弈论中的纳什均衡在对策论中的应用,即在不确 定条件下,人们所冒的风险很大,这种情况选择合适的战略就显得尤为关键和 重要。 1.博弈论中的纳什均衡 以博弈论中,以经济主体人的自利行为以及相应的市场反应作为研究的出 发点,无论是消费者还是生产者,也无论是竞争形势还是垄断形势,基本上是 经济主体人面对市场做出自己的最优决策。但是我们知道,作为主体人作出决 策时,不但要面对市场,还要面对作为竞争对手的其他经济主体,因此主体人 作出决策的后果,则是主体人自己的决策及竞争对手决策的共同的结果,这就 是博弈,它有一个前提,即理性人的假定。 纳什均衡是一种不确定条件下的博弈,即非合作、不完全信息下的博弈, 又叫做非合作博弈均衡,是博弈论的一个重要术语,因约翰·纳什而得名。它的定义可以这样理解:假设有n个局中人参与博弈,在给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于、也可能不依赖于 他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合。 纳什均衡指的是这样一种策略组合:这种策略组合由所有参与人最优策略组成,即在给定另人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从 实质上是说是一种非合作博弈状态。 2.纳什均衡及其在对策论中的应用 2.1囚徒困境及其应用 博弈论中一个很著名的例子——囚徒困境,就是一具典型的纳什均衡。两个小偷在行窃现场附近被抓获并被警方隔离拷问。每个小偷都必须选择是否坦 白和揭发对方。如果两个小偷都不坦白,他们都将判刑1年,如果每个小偷都 坦白并揭发对方,他们都将判刑10年,但是,如果一个坦白并揭发对方,而另

纳什均衡点

纳什均衡点 纳什均衡点纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。 如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。 [编辑本段]例子 经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。于是,两人同时陷入招供还是不招供的两难处境。如果两人均不招供,将最有利,只被判刑三年。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。这时,个体的理性利益选择是与整体的理性利益选择不一致的。 囚犯甲的博弈矩阵 囚犯甲 招供不招供 囚犯乙招供判刑五年甲判刑十年;乙判刑一年 不招供甲判刑一年;乙判刑十年甲判刑三年 基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。事实上,这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。 [编辑本段]学术争议和批评 第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发

寻找三个纳什均衡

1.首先将原始数据带入博弈计算程序,可以得到如下的答案:可以看到其中一个是纯策略,两个是混合策略。 2.首先用划线法找出可以找到第一个纯策略。 纯策略下张三和李四的收益组合为:(60,76),张三和李四的策略分别为(0,1,0)和(0,0,1)3.用消去法消去划线的两行 这样得到一个新的组合, P 1-P

假设新的组合是符合混合纳什均衡策略 那么 张三选上下的策略为P ,1-P ; 李四选左中的策略为S,1-S. 根据纳什均衡的条件:李四的策略概率S ,1-S ,使得张三选择上下策略收益相同: 得到一个等式:12S+42(1-S)=72S+36(1-S). S=1/11 1-S=10/11; 此时张三的收益为:=12×1/11+42×10/11 = 432/11 = 39.27; 同样张三的概率P,1-P,使得李四选择左中的收益相等: 得等式:83P+47(1-P)=56P+95(1-P) P=16/25;1-P=9/25; 此时李四的收益:=83×16/25+47×9/25=53.12+16.92=70.04 综上为第二个混合策略纳什均衡张三和李四的策略分别为:(16/25,0,9/25)和(1/11,10/11,0),张三和李四的收益为(39.27,70.04) 第三步:一般的混合纳什均衡 设张三选择上中下的策略概率分别为p,q,1-p-q ;李四选择左中右的策略概率分别为s,t,1-s-t ; 李四的策略要使张三的策略收益相同: 12s + 42t + 42(1-s-t)=24s + 12t + 60(1-s-t)=72s + 36t + 42(1-s-t) s=1/27, t=10/27, 1-s-t= 16/27 此时张三的收益 张三收益 = 12*1/27+42*10/27+42*16/27=(12+420+672)/27=1104/27=40.89 同上可知张三需要确定一个行动概率,以使李四的选择在其收益上没有差异,得等式: 83p + 12q +47(1-p-q) = 56p + 42q + 95(1-p-q)=45p + 76q + 59(1-p-q) p=113/200, q=5/16, 1-p-q=49/400 此时李四的收益为 李四收益 =83*113/200+12*5/16+47*49/400=46.895+3.755.7575=56.40 综上,此混合策略纳什均衡相对于张三和李四的策略选择用概率分别表述为(113/200,5/16, 49/400)和(1/27,10/27,16/27),收益分别为(40.89,56.40) 第四步:最后策略 三个策略的收益为:(60,76)(39.27,70.04)和40.89,56.40) 通过帕累托上策为(60,76)对双方来说收益最大,所以张三(0,1,0),李 四(0,0,1)的纳什均衡点应是实际行为最可能的结果。 1-S S

浅谈纳什均衡理论

浅谈纳什均衡理论 姓名:郭善禄班级:11保险精算学号:1008014 摘要:在本学期的校选修数学欣赏课上看了电影《美丽心灵(A Beautiful Mind)》使我感触非常深刻,尤其是对其中的主人公——约翰·纳什十分的敬佩和仰慕,由于我的经济学专业对其主要理论思想进行过一段时间的学习,因此纳什理论引起了我的很大兴趣,我查阅了很多关于这方面的资料,因此这次的期末论文也以此为题材。下面就让我们一同去了解和探寻这位有着传奇色彩的数学天才,诺贝 尔学奖获得者的人生和博弈理论。 关键词:博弈论;纳什均衡;非合作博弈;合作共赢。 正文:1.纳什简介及博弈论的发展 1.1纳什简介 纳什均衡:Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名… 约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。 纳什均衡定义:假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。 1.2博弈论的产生及发展 冯·诺依曼、摩根斯坦把对策论、运筹学引入经济学,形成了最早的博弈论。博弈论字面的意思是游戏策略,及用类似游戏中解决问题的方法,揭示解决社会、经济及其他领域问题的策略、对策,因此有的还把博弈论译成对策论。准确的说博弈论是在给定的条件下寻求最优策略,这里给定的条件包含其他人的策略以及本人的决策对其他决策主体的影响。 策略性活动在社会、经济、政治生活中大量存在,也可以说,整个社会、经济、政治生活都是博弈行为。因此,博弈论作为一种方法,广泛的应用在经济、政治、军事、外交中,只是博弈论在经济学中应用的最广泛、最成功。

《管理经济学(二)》论纳什均衡及其启示

装订处 论纳什均衡及其启示 摘要:纳什对博弈论的贡献有两个方面,一是合作博弈理论中的讨价还价模型,称为纳什讨价还价解;二是非合作博弈理论方面,这是他的主要贡献所在。纳什对非合作博弈的主要贡献是他在1950年和1951年的两篇论文中在非常一般的意义上定义了非合作博弈及其均衡解,并证明了均衡解的存在。这样,他便奠定了非合作博弈论的基础。纳什所定义的均衡称为“纳什均衡”,它己成为经济学中的专用术语。 关键词:纳什均衡;启示 博弈论可以划分为合作博弈和非合作博弈。合作博弈与非合作博弈是根据博弈者之间是否能够通过某种契约的约束采取合作的策略而区分的。合作的博弈是指在这种博弈中,博弈者能够通过谈判达成一个有约束的契约以限制博弈者行为,使之相互采取以一种合作的策略。如果博弈者无法通过谈判达成一个有约束的契约以限制博弈者的行为,则该种博弈为非合作博弈。 合作博弈强调的是团体理性,强调的是效率、公正、公平。非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。目前,非合作博弈的理论相对成熟。在以下的分析中,由于分析对象大都是强调个体理性,并且,博弈的参与人之间没有一个具有约束力的契约来限制博弈者的行为,只是强调个人的理性。 在非合作博弈论中,又可以从两个角度对博弈进行分类:一是参与人行动的顺序。从这个角度,可以将博弈划分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈指的是博弈中,参与人同时选择行动,或者是参与人虽然不是同时行动,但是后行动者不能知道先行动者所采取的行动;动态博弈指的是参与人的行动有先有后,且后行动者能够通过一定的手段知道先行动者的具体行动是什么;二是对其他参与人的特征、战略空间和支付函数的知识。从这

相关文档
最新文档