6 连续博弈中的纳什均衡

合集下载

博弈论-纳什均衡(非合作博弈均衡)

完全理性：理性指一种行为方式，它适合实现指定目标，而且在给定条件和约束的限度之内。

在不同的学科领域，理性所涵盖的内容存在着差异完全理性的内涵具有完全理性的行为人是个无所不知的超人，他具有纵向和横向方面完备的知识。

在纵向方面，他可以预测未来；在横向方面，他通晓资源、交易伙伴和环境等情况。

具体而言，行为人的完全理性包括以下隐含内容。

(1)不存在不确定性，即使存在不确定性，也可以预知不确定性的概率分布。

也就是说，对于具有完全理性的行为人来说，一切信息都是确定的。

(2)行为人具有可以确定的效用函数(消费者的效用函数和厂商的利润函数可以统称为效用函数)，同时行为人具有同质性以及一致性的偏好体系。

(3)选择结果具有描述不变性、程序不变性和前后关系独立性。

描述不变性要求行为人选择的先后顺序不应依赖于所描述或显示的选项，也就是说如果行为人经过再三思考，将两种描述视为同一问题的同义表达，那么它们必定导致相同的选择——即这种思考不存在异处；程序不变性要求不同方式的等价学说揭露相同的偏好次序；前后关系独立性指一项选择与其他替代方案互为独立的原则，它要求在给定Z而不提供有关X或Y 的新的信息的情况下，X与Y的优先权顺序不应该依赖于Z是否有效。

(4)行为人具备完备的计算和推理能力，可以像计算机一样在数秒内从事无穷尽的计算步骤，同时也不存在感性因素对选择的干扰。

(5)选择意味着在各种方案或选择集中进行比较和挑选，因此完全理性的行为人可以设计出所有的被选方案，以及各项方案所产生的全部后果。

(6)一个确定的报酬函数，即行为人可以确定地赋予每项行动结果一个具体的量化价值或效用。

(7)确定性的结果，也就是行为人町以实现效用最大化或最优目标(消费者效用最大化和企业利润最大化)。

在上述条件下，建立在完全理性假设的基础上的主流经济学的方法论，即行为人的选择或决策意味着在资源约束的条件下实现效用最大化或利润最大化。

行为人在选择过程中，可以遵循确定性原则、极大极小法则、边际原理以及概率法则(也就是主观期望原则)。

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡在纳什均衡中，你不一定满意其他的策略，但你的策略是回馈对手招数的最佳策略。

从囚徒困境中我们会发现，作为博弈各方的行动就是针对对方行动而确定的最佳对策，而一旦知道对方在做什么，就没人愿意改变自己的做法。

博弈论学把这么一个结果称为均衡。

这个概念是有普林斯顿大学数学家约翰·纳什提出的，因此被称为纳什均衡。

诺贝尔经济学奖获得者萨缪尔森有句名言，你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词，供给与需求。

博弈论专家坎多瑞引申说：“要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是纳什均衡”。

1950年，还是一名研究生的纳什写了一篇论文，题为《n人博弈的均衡问题》，该文只有短短一页纸，可就这短短一页纸成了博弈论的经典文献。

纳什的贡献是，他证明了在这一类的竞争中，在很广泛的条件下是有稳定解存在的，只要是别人的行为确定下来，竞争者就可以有最佳的策略。

那么，什么纳什均衡呢？简单说，就是一策略组合中，所有的参与者面临这样的一种情况：给定你的策略，我的策略是我最好的策略。

给定我的策略，你的策略也是你最好的策略，即双方在对方给定的策略下不愿意调整自己的策略。

纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具，所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展，甚至说是一场革命。

纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战，按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果，从纳什均衡引出一个悖论：从利己的目的触发，结果损人不利己。

“囚徒困境”就是如此，从这个意义说，纳什均衡提出的悖论实际上动摇了西方经济学的基石。

纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。

这个法则如下：走完寻找优势策略和剔除劣势策略的捷径之后，下一步就是寻找这个博弈的均衡。

所谓博弈均衡，它是一稳定的博弈结果。

均衡是博弈的一结果，但不是说博弈的结果都能成为均衡。

纳什均衡的完整定义

纳什均衡的完整定义纳什均衡是博弈论中一种解的概念，它是指满足下面性质的策略组合：任何一位玩家在此策略组合下单方面改变自己的策略（其他玩家策略不变）都不会提高自身的收益。

简介纳什均衡（Nash equilibrium），又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。

在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。

如果任意一位参与者在其他所有参与者的策略确定的情况下，其选择的策略是最优的，那么这个组合就被定义为纳什均衡。

一个策略组合被称为纳什均衡，当每个博弈者的均衡策略都是为了达到自己期望收益的最大值，与此同时，其他所有博弈者也遵循这样的策略。

历史背景关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是约翰·纳什在普林斯顿大学攻读博士学位时完成的。

实际上，博弈论的研究起始于1944年约翰·冯·诺依曼（Von Neumann）和奥斯卡·摩根斯特恩（Oscar Morgenstern）合著的《博弈论和经济行为》。

然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，证明了纳什均衡在n人有限博弈中的普遍存在性[1] ，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而对“合作博弈（Cooperative Game）”和“非合作博弈”做了明确的区分和定义。

阿尔伯特·塔克（Albert tucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。

它发展了本身很有意义的n人有限非合作博弈的概念和性质。

并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。

在概念和方法两方面，该论文都是作者的独立创造。

博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡？1、纳什均衡（Nash equilibrium )，又称非合作博弈均衡，是博弈论概念，指的是：一种博弈稳定结果，谁单方改变策略，谁就会损失。

两个囚徒互相揭发，就是一种纳什均衡。

对于每个囚徒来说，如果打破纳什均衡，在对方实施揭发策略时，改变揭发策略，保持沉默，自己就会由判刑2年，变成判刑5年。

也就是说，两个囚徒互相揭发是稳定博弈结果，谁单方改变策略，就会受到损失。

这也就是均衡涵义所在，两个囚徒从利己角度，都不会单方改变策略。

博弈策略稳定，博弈结果也稳定。

之所以命名为纳什均衡，是因为提出者是经济学家、博弈论创始人约翰．纳什。

之所以称为非合作博弈均衡，原因就是：两个囚徒如果合作，互相保持沉默，各自只要坐牢1年；但最终博弈结果，也就是纳什均衡显著特征，是不合作。

2、纳什均衡意义重大。

纳什均衡提出，震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说：“你只要教会鹦鹉说‘需求和供给’，它也是经济学家。

”博弈论专家坎多瑞则说：“这只鹦鹉现在必须多学一个词了，那就是‘纳什均衡’。

”诺贝尔经济学奖得主迈尔森也说：“发现纳什均衡意义，可以和生命科学中发现DNA 双螺旋结构相媲美。

”纳什也因为提出纳什均衡，创立博弈论，而获得1994年诺贝尔经济学家奖。

纳值均衡意义重大，简单来说，就是它对于经济学具有重大意义。

读友们如果了解经济学看不见的手原理，就知道，古典经济学认为，通过市场这只‘看不见的手’调节，个体追求私利行为，会促进集体利益最大化。

但纳什均衡却违反上述原理：两个囚徒分别追求私利行为，并没有促进集体（囚徒整体）利益最大化，反而是损人不利己。

这正是市场失灵软肋之处，通过博弈论视角可以得到合乎逻辑解释，更有条件找到合适解决方案。

从上述这点，读友们可以“一斑窥全豹”，感受到博弈论重要性。

更重要的是，纳什均衡非常普遍，小至个人沟通，中到公司竞争，大到国家往来，都可以观察到。

Q2：怎样运用纳什均衡？1、分析囚徒困境。

博弈论中的纳什均衡

博弈论中的纳什均衡纳什均衡，Nash equilibrium ,又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。

约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。

其研究成果见于题为《非合作博弈》（1950）的博士论文。

该博士论文导致了《n人博弈中的均衡点》（1950）和题为《非合作博弈》（1951）两篇论文的发表。

纳什在上述论文中，介绍了合作博弈与非合作博弈的区别。

他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念，也就是不限于两人零和博弈。

该解概念后来被称为纳什均衡。

定义：纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。

也就是说，此时如果他改变策略他的支付将会降低。

在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。

这一结果对局中人B亦是如此。

纳什均衡的经典范例就是囚徒博弈，但是研究博弈论常常会使人陷入一种只追求个人利益的误区，事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设，并不总能说明事实。

只是假定他们只是选择对自己最有利的策略，而不考虑社会福利或任何其他对手的利益。

也就是说，这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。

没有人会主动改变自己的策略以便使自己获得更大利益。

“囚徒的两难选择”有着广泛而深刻的意义。

个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。

博弈中的黑马——纳什均衡

博弈中的黑马——纳什均衡博弈中的黑马——纳什均衡在《童区寄传》的故事中，牧童区寄假装软弱，扮猪吃象，杀死一名强盗，又以做一个人奴仆的美好前景打消了第二名强盗试图杀死自己的意图，保全了自己，再利用强盗睡觉之际，杀死对方。

这其中的情节一波三折，惊心动魄。

对于这场对垒，我们称之为博弈，区寄的策略称之为博弈策略。

那么，什么是博弈，博弈的核心概念又是什么？掌握点博弈知识对我们有些什么裨益呢？博弈是个外来词，在英文中用game来表示，如果直译的话，博弈就是游戏。

但东方的游戏和西方的game还是有较大差别的。

我们所理解的游戏中是一种纯粹的娱乐，而在英文中的game 的含义，却是指这种游戏是在一定规则之下的活动，而目的是要自己赢。

所以，如果直接把“博弈”理解为东方的“游戏”，显然玩的味道太浓，很容易让人把它当作小孩子“玩家家”一类不登大雅之堂的小儿科，会让这门学科失去严肃性。

于是，我们把西方的“博弈”翻译成game theory。

这样，博弈又称为“博弈论”，就使得博弈有了理论的色彩和意味。

博弈或者博弈论的准确定义应该是：一些个人、团队或其他组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，同时或先后，一次或多次，从各自允许选择的行为或策略进行选择并加以实施，并从中各自取得相应结果或收益的过程。

一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即各博弈方做出决策选择后的所得和所失。

由于博弈的内容和方式是不一样的，我们可以从不同角度对博弈进行分类：一是分为合作博弈与非合作博弈。

如果各博弈方能达成某种有约束力的契约或默契，以选择共同的策略，此种博弈就是合作博弈。

反之，就属于非合作博弈。

纳什均衡概念名词解释

纳什均衡概念名词解释纳什均衡是博弈论中的一个重要概念，它描述了博弈双方在特定条件下做出的最优策略选择，这个选择不会被单方面的改变，否则对于另一方来说，选择其他策略反而更劣。

1. 概念解释纳什均衡的概念可以从两个方面进行解释。

从个人角度看，纳什均衡是指当每一个人都实施最优策略时，其它人不能从自己的策略中获得进一步的盈利收益；从社会角度看，纳什均衡则是指，当所有人都做出了最优策略时，整个社会得到了最大的总收益。

2. 纳什均衡的前提条件在博弈论中，纳什均衡并不是所有博弈都存在的。

对于一个博弈，存在纳什均衡需要满足以下条件：（1）所有博弈者都采取了最优策略，即无法通过改变策略来提高自己的收益；（2）每个博弈者的策略是对其他博弈者实施的策略的最佳反应；（3）每个博弈者都清楚地了解其他博弈者的策略。

3. 纳什均衡的类型在实际的博弈中，纳什均衡可以分为三种类型:（1）纯策略均衡：指每位参与者都只选定一个策略，并根据它的期望收益来进行决策，不存在概率因素。

（2）混合策略均衡：指每位参与者按一定的概率选定多个策略，并根据它的期望收益来进行决策，存在概率因素。

（3）多重纳什均衡：指博弈中存在多个均衡策略组合，每个均衡策略组合都符合博弈的前提条件。

4. 纳什均衡的意义和应用纳什均衡是博弈论的一个核心概念，其意义和应用非常广泛。

首先，纳什均衡可以用来预测和解释现实生活中的决策行为，如市场竞争、政府政策制定等。

其次，纳什均衡也可以用来指导协商和谈判的过程。

最后，纳什均衡还可以用来研究其他领域的决策行为，如军事战略、生态环境等。

综上所述，纳什均衡是博弈论中的一个重要概念，它描述了博弈双方在特定条件下做出的最优策略选择，是一种使得所有参与者都满意的稳定状态。

纳什均衡的应用领域非常广泛，其理论和方法也在不断地发展和完善。

演化博弈中的纳什均衡

演化博弈中的纳什均衡
在演化博弈中，纳什均衡是一种策略组合，在给定对手策略的情况下，每个参与人选择最优策略。

它反映了一个策略组合的稳定性，即在对手采用特定策略的情况下，没有其他策略组合可以提供更好的收益。

纳什均衡是一种重要的概念，它有助于理解博弈论中的策略互动和参与人的决策。

在演化博弈中，纳什均衡的概念被广泛应用，以解释在动态博弈中策略的稳定性和演化过程。

演化博弈论中的纳什均衡是关于动态博弈的理论，它强调了策略的演化和适应过程。

在这个框架下，参与人不断调整其策略以适应对手的行为，并试图在对手采取特定策略时获得更高的收益。

在演化博弈中，纳什均衡的概念与传统的纳什均衡有所不同。

传统的纳什均衡主要关注给定情况下参与人的最优反应，而演化博弈中的纳什均衡则更关注策略的动态演化和适应过程。

演化博弈论中的纳什均衡可以通过不同的方法进行求解，例如通过模拟演化过程或使用优化算法来找到最优策略组合。

在求解过程中，需要考虑每个参与人的策略空间和收益函数，以确定最优策略组合。

总之，演化博弈中的纳什均衡是一种关于动态博弈的理论，它强调了策略的演化和适应过程。

通过求解演化博弈中的纳什均衡，我们可以理解参与人在动态环境中的行为和决策过程。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

案例研究 ——配额资助对慈善捐助的影响力
• 配额资助
– 如果从其他捐款人那里筹集的金额达到200万，则他将捐出100万。
捐款人最佳捐款是 100000
最优捐款数额为零
配额资助的作用是增大一笔捐款的边际影响力。
两点提示
• 使用求微分的方法必须满足函数连续可微（呈山
形） • 即使不用微分方法，我们也可以求出最优反应函数
求解纳什均衡
• 戴尔的最优反应函数
• 惠普的最优反应函数
练习题
PDell=PHP=46.67
案例研究——猛犸象的灭绝
均衡求解
至少有两个猎手时，整体的均衡努力就会造成过度捕杀！！
公地悲剧
• 两个或更多的人过度使用一项资源，从而导致整
体的利益受损。
– – – – 过度捕捞过度开发石油开采全球气候变暖
于是纳什均衡将出现在价格为10的情形下。
• 如果有三家商店销售同类商品，纳什均衡会怎样？
案例研究 ——价格一致承诺化解价格竞争
• 如果销售相同产品的两家商店实施价格一致承诺
策略。 • 商店1的收益函数是
– [min{p1,p2}-10](1/2)[100- min{p1,p2}]
对称纳什均衡
结论
• 承诺一致价格的策略摧毁了压低对手价格的动机，从而使商店维持较高的价格。 • 看上去是加强竞争的做法反而消解了竞争。
案例研究——竞选总统
两名候选人都选择立例研究——差别化产品的价格竞争
• 电脑市场的两家公司戴尔和惠普
– 戴尔的收益
– 惠普的收益
– 两家商店销售相同产品，成本为10元
推导过程
• 剔除低于成本的定价策略
– 当两家定价p’相同且大于10时 • 商店i的收益为(1/2)(p’-10)(100-p’) – 当商店i定价p’-ε, ε极小 • 商店i的收益为[(p’ –ε)-10][100-(p’- ε)]
• 每个商店都有低于对手价格出售商品的强大动机，
6 连续博弈中的纳什均衡
• 从有限策略上升到许多策略的情形
– 学生的努力程度分三等，也可以用他花费的时间作为衡量努力程度的标准 – 假定策略可以从低到高排序，一个策略集合是一组数字，一个数字代表一个价值。 – 无限数集合的代表：自然数集合，实数集合，……
案例研究
• 相同产品的价格竞争——贝特朗价格博弈