演化博弈论简介

合集下载

演化博弈论

演化博弈论：演化博弈论(Evolutionary Game Theory)不再将人模型化为超级理性的博弈方，而是认为人类通常是通过试错的方法达到博弈均衡的，与生物进化原理具有共性，所选择的均衡是达到均衡的均衡过程的函数，因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

在理论应符合现实意义上，该理论对于生物学、经济学、金融学和证券学等学科均大有用场。

在传统博弈理论中，常常假定参与人是完全理性的，且参与人在完全信息条件下进行的，但在现实的经济生活中的参与人来讲，参与人的完全理性与完全信息的条件是很难实现的。

在企业的合作竞争中，参与人之间是有差别的，经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。

与传统博弈理论不同。

有限理性这一概念最早是由西蒙(Simon.H.A.)在研究决策问题时提出的，因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因为他们没有掌握到所必需的词汇，或许是因为这些词汇还不存在）。

2021年演化经济学方法论与演化博弈论的比较研究

演化博弈论与演化经济学方法论简述演化博弈论是与传统博弈论相对应的一种方法论。

它摒弃了传统博弈论完全理性和完全信息的假设。

因而与传统博弈论相比，演化博弈论具有两个特点一是有限理性；二是动态性。

演化经济学则是一门研究“演化”的科学，演化经济学以达尔文主义为哲学基础，以累积因果为主要原则，其方法论基础是批判实在论，具体分为层级本体论与转换本体论，强调的是隐藏在现象背后的结构和趋势。

演化经济学方法论与演化博弈论的主要区别两者的哲学基础存在根本的对立哲学基础是研究纲领的硬核。

科学革命一般是以世界观、方法论变革开始的。

能够为科学研究（包括社会科学研究）提供的哲学体系有两种牛顿主义和达尔文主义。

前者是演化博弈论的哲学基础，后者是演化经济学方法论的哲学基础。

一位英国经济思想史学家曾指出，科学革命后，标准教科书的前身——边际革命的目的是要把经济学改造成为像数学、物理学一样精密的科学。

这正是现代主流经济学的起源，也是演化博弈论的哲学源泉。

这种思想是受到了当时实证主义科学哲学和牛顿主义的支配，理由是实证科学是精密的、可以预测的。

与演化博弈论坚持牛顿主义针锋相对，演化经济学方法论坚持达尔文传统，坚持动态的、有机的、系统的宇宙观和世界观。

演化经济学方法论建立在物理学大革命、耗散结构理论、复杂性科学基础之上。

二者的研究起点存在区别演化博弈论的研究起点是个人主义，演化经济学方法论的研究起点是个体群思维。

个人主义是用个人行为解释社会，即社会可以从个人进行推导，体现在经济学中就是简约论和还原论。

简约论是用“典型性”的消费者和生产者代替所有消费者和生产者；还原论是用微观现象解释宏观现象。

于是，在这种思维的影响下，当宏观经济学无法解释某些现象时，就要千方百计地寻找宏观经济学的微观基础。

而整体主义认为，个人的行为受制于整体的社会规则和状态，是制度决定个人。

虽然在经济思想史上还有老制度学派等“异端”经济学流派走向了整体主义，但由于它们没有受到达尔文革命科学思维的训练，也只是直觉上认为主流经济学的个人主义方法是不对的。

演化博弈名词解释

演化博弈名词解释
演化博弈是指博弈论中的一个重要研究领域，它研究在自然选择、适者生存和进化的背景下，博弈参与者的策略如何随时间变化和演化。

演化博弈理论试图理解个体在选择策略时如何在更大的演化系统中相互作用和影响。

在演化博弈中，参与者被称为“生物种群”或“策略集”，其中每个参与者都选择一种策略（通常是有限的）来与其他参与者互动。

策略集通常包括三个组件：基因（个体的特征）、环境（包括其他参与者的行为和特征）和适应度函数（度量个体在某种环境下成功的程度）。

演化博弈的一个核心观点是自然选择和适者生存。

在这种竞争激烈的环境中，成功的个体将有更高的适应度，他们的后代将更有可能存活并继承这些特征。

随着时间的推移，选择过程会导致策略的多样化和优化，最终使得参与者能够更好地适应环境。

演化博弈研究方法通常包括以下几个步骤：
1.设定博弈场景，确定参与者、策略、适应度函数以及其他参数。

2.计算每个参与者的适应度函数值，评估他们在竞争中的表现。

3.通过自然选择和适者生存的原理，分析策略的演变和优化过程。

4.根据演化博弈理论，预测未来策略的变化趋势。

演化博弈在生物学、经济学、社会学和其他领域都有广泛的应用。

这种理论有助于我们理解复杂系统中策略和行为的动态变化，为研究合作、竞争和演化过程提供了有价值的视角。

演化博弈论

其他的一些理论成果包括Cressman(1992)以及Samuelson(1997)的著作。
• 演化博弈的发展出现了一些新的思路，对演化稳定策略和合作演化博弈的研究不断深入，学者开始关注带有随机因素影响的演化过程。
21世纪进入2l世纪以来，国内的学者也开始关注演化博弈论，也做出了大量的研究。
如果(S,S)不是纳什均衡，那么S不是演化稳定策略
纳什均衡和演化稳定（2）
a
X b
a 1，1
Y b
0，0
0，0
0，0
策略b是否是演化稳定的？有一个规模为E的策略b入侵
策略b的平均适应度: (1 E)*0 E *0 0
策略a的平均适应度:
(1 E)*0 E *1 E
如果（S,S）是严格的纳什均衡，那么S是演化稳
•
pi [ u(ei , x) ] pi (1)
对恒等式 p(t)xi (t) pi (t) 两边求t的导数得：
•
•
•
p xi pi p xi (2)
将式（1）带入（2）中，稍加整理可得：
•
xi [u(ei , x) u(x, x)]xi (3)
式（3）说明：采用策略i的总体比例的增长率等于策略收
与传统博弈理论不同，演化博弈理论并不要求参与人是完全理性的，也不要求完全信息的条件。
演化博弈论（Evolutionary Game Theory）把博弈理论分析和动态演化过程分析结合起来的一种理论。在方法论上，它不同于博弈论将重点放在静态均衡和比较静态均衡上，强调的是一种动态的均衡。演化博弈理论源于生物进化论。
0
X*
1
x
标准的N总体复制子动态

演化博弈

ቤተ መጻሕፍቲ ባይዱ
预先规定好的要素博弈如何确定？既然大家都是有限理性，那由谁来规定要素博弈的结构和规则（是人为设计的，还是自发演化形成的）现有的一些学习模型是否与现实中群体的理性水平相符？对于超出2维空间的动态系统以及非线性系统难于进行稳定性分析（恰好体现了人的认知能力有限理性）。
我们以一个简单的“签协议博弈” 为例，说明学习速度很慢、理性层次较低的有限理性博弈方通过模仿学习博弈和调整策略的复制动态和策略稳定性。
经济活动中的各种合作都可以用签协议来代表，因为一旦签订协议，那么重要的经济合作就有了保证。下图中得益矩阵表示的就是一个关于签协议的博弈。
博弈方2
同意博弈方 1 同意不同意不同意

有限理论博弈的有限分析框架是有限理论博弈方构成的，一定规模的特定群体内成员的某种反复博弈。例如某个由缺乏足够预见性的个体组成的小群体，其成员都对当前局面做出反应，或者相互学习、模仿邻居的优势策略的情况。也可以是在大量博弈方组成的群体中成员之间随机配对的反复博弈，相当于现实经济中对象或伙伴不固定的，多个或大量个体之间的较长经济关系。这些分析框架通常假设博弈方有一定的统计分析能力和对不同策略效果的判断能力，但没有事先的预见能力和预测能力。这种分析框架和人们在享受决策活动中的实际行为模式是比较接近的。

有限理性意味着博弈方往往不会一开始就找到最优策略，会在博弈过程中学习博弈，必须通过试错寻找较好的策略；有限理性也意味着均衡是不断调整和改进而不是一次性选择的结果，而且即使达到了均衡也可能再次偏离。
三、有限理性下的博弈分析
1、有限理性博弈分析的目标

A.放宽参与者严格的理性要求，分析有限理性的参与者通过各种学习过程，如何达到稳定的均衡状态。 B.有限理性博弈分析主要解决：不同条件下具体的学习过程（构建的学习模型体现了理性的不同要求）、学习调整过程中均衡的稳定性（运用稳定性理论，分析原Nash均衡是否收敛）。

演化博弈与自组织合作

演化博弈与自组织合作一、本文概述本文旨在深入探讨演化博弈论与自组织合作之间的紧密联系及其在实际应用中的价值。

演化博弈论作为一种新兴的理论框架，为我们理解生物进化、社会动态和经济行为提供了新的视角。

自组织合作作为一种自然现象，普遍存在于社会、生态和经济系统中，对系统的稳定性和发展具有重要影响。

本文将通过综合运用文献综述、理论分析和案例研究等方法，系统阐述演化博弈论的基本原理和自组织合作的形成机制，分析二者之间的相互作用和影响，并探讨如何将演化博弈论应用于自组织合作的研究和实践中。

在内容上，本文首先将对演化博弈论的基本概念、发展历程和核心思想进行梳理和评述，为后续分析奠定理论基础。

接着，将重点分析自组织合作的形成条件、演化过程和影响因素，揭示自组织合作背后的动力学机制和演化规律。

在此基础上，本文将深入探讨演化博弈论与自组织合作之间的内在联系，分析二者在理论和实践中的互补性和相互促进关系。

本文将结合具体案例，探讨演化博弈论在自组织合作研究和实践中的应用前景，以期为相关领域的研究和实践提供有益的参考和启示。

通过本文的研究，我们期望能够加深对演化博弈论和自组织合作的理解，揭示二者之间的内在联系和相互影响，为相关领域的研究和实践提供新的思路和方法。

我们也希望通过本文的探讨，能够激发更多学者和实践者关注演化博弈论与自组织合作的研究和应用，共同推动相关领域的发展和创新。

二、演化博弈论基础演化博弈论，作为博弈论的一个分支，将博弈理论与生物进化理论相结合，主要研究在动态环境中参与者策略的选择与变化。

它突破了经典博弈论中理性参与者和完全信息的假设，强调参与者在有限理性、不完全信息和不断试错的过程中学习和适应。

演化博弈论认为，参与者的策略选择并非一次性决策，而是在多次重复博弈中逐渐演化的。

这种演化过程受到多种因素的影响，包括参与者之间的相互作用、环境变化以及参与者自身的学习和适应能力。

在演化博弈论中，一个关键的概念是“演化稳定策略”（Evolutionary Stable Strategy, ESS）。

演化博弈论研究的现状与展望

演化博弈论研究的现状与展望一、本文概述《演化博弈论研究的现状与展望》一文旨在全面梳理和深入分析演化博弈论这一交叉学科领域的研究现状，并在此基础上展望其未来的发展趋势。

演化博弈论，作为一种独特的博弈理论，融合了生物学、生态学、经济学、社会学等多个学科的理论和方法，为研究复杂系统中的动态演化过程提供了新的视角和工具。

本文首先回顾了演化博弈论的发展历程，阐述了其基本概念和核心思想，然后重点分析了当前国内外在演化博弈论研究方面的主要成果和进展，包括理论模型的构建、实证研究的应用以及与其他学科的交叉融合等方面。

在此基础上，文章进一步探讨了演化博弈论在未来可能的研究方向和挑战，旨在为相关领域的研究者提供有益的参考和启示。

二、演化博弈论的基本概念与理论框架演化博弈论，作为一种新兴的理论体系，融合了博弈论与演化理论的精髓，主要研究在动态变化的环境中，参与者如何通过试错、学习、适应和变异等过程，不断调整和优化自身的策略行为。

它突破了传统博弈论中完全理性、完全信息等理想化假设的限制，更贴近现实世界的复杂性和不确定性。

基本概念方面，演化博弈论将参与者视为有限理性的决策者，其策略选择受到历史经验、外部环境以及自身学习能力等多重因素的影响。

同时，演化博弈论强调策略的动态调整过程，而非静态均衡。

它认为，参与者通过不断的试错和学习，逐渐适应环境，并在演化过程中形成稳定的策略分布。

在理论框架上，演化博弈论借鉴了生物演化理论中的自然选择、遗传变异等机制，构建了以策略空间、适应度函数、选择机制和变异机制为核心的理论体系。

策略空间描述了参与者所有可能的策略组合；适应度函数则用于衡量不同策略在特定环境下的表现优劣；选择机制决定了哪些策略能够在演化过程中得以保留和传承；而变异机制则为策略空间引入新的可能性，使得系统能够不断适应外部环境的变化。

通过这一理论框架，演化博弈论能够更好地刻画现实世界中的复杂动态演化过程，为我们理解和预测参与者的行为决策提供有力的分析工具。

演化博弈论

演化博弈论演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想，不再将人模型化为超级理性的博弈方，认为人类通常是通过试错的方法达到博弈均衡的，与生物演化具有共性，所选择的均衡是达到均衡的均衡过程的函数，因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

在理论应符合现实意义上，该理论对于生物学以及各种社会科学尤其是经济学，均大有用场。

演化博弈理论最早源于Fisher，Hamilton，Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析，他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。

但直到Smith andPrice(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后，才标志着演化博弈理论的正式诞生。

生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic)，这是演化博弈理论的又一次突破性发展。

模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念，它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程，ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。

编辑本段主要应用领域演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科，是证券投资研究的一个具有生命力和丰富内涵的新领域。

与现代金融学的“理性人”、“有效市场”相关假设不同，演化证券学重视对“生物本能”和“竞争与适应”的研究，强调人性和市场环境在股市演化中的重要地位，是揭示股市生存法则最有潜力的前沿科学。

其开山之作《股市真面目》颠覆了股市运行机理的传统理论，可称为达尔文式的范式革命。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

演化博弈论简介说明：这篇东西是我上周六在浙大思想讨论班上做演讲的讲稿和主要内容。

讲完以后，叶航老师提出了很多宝贵的意见。

我也正好乘这机会把没有讲或者没有讲清楚的东西梳理了一下。

整理过程中还发现了了很多问题，请大家批评。

丁丁1994年有一篇重要的文章，介绍发展经济学的最新进展。

他比较了诺斯（North）的制度变迁理论，罗默（Romer），卢卡斯（Lucas）等的内生增长理论，哈耶克的“自发秩序论”，重复博弈和演化博弈论等理论，这些理论的共同特点是“动态”（dynamic）。

传统新古典经济学是静态的，重视均衡点，但很难进行历史的研究。

正因为如此，这些新理论才显示出强大的生命力，获得广泛运用。

我们这里讲演化博弈(evolutionary game theory)，它显然有2条理论来源，一是演化理论，一是博弈论。

先来看演化理论，我首先要纠正一个常见的误解，即演化均衡是帕累托最优的，或者说最大化整个社群的福利。

我们要注意到，演化均衡不等于一般均衡，等会我会给出一些严格的定义。

从福利经济学第一定理可以得知，一般均衡必然是帕累托最优的，即所谓的看不见的手的含义，但是演化均衡并没有类似的定理。

我们用常识来分析，如果演化均衡最大化社群的福利，那么什么是社群的福利呢？是个体的总数最大吗，是个体的多样性最多吗，抑或是个体预期存活概率最大？即使我们能为适应性（fitness）找出合适的测量方法，我们也无法保证演化是朝向个体适应性最大的方向演化。

我这里用演化，避免用演进，可以减少误解。

演化理论中有两条最重要的机制。

一个叫自然选择，即不是每种生物都有相同的概率在下一期存活。

在这个世界上，有些生物个体（或者人）特别幸运，他们能活下去，但还有些个体就倒霉了，他们会被淘汰。

我们今天都活着，可见我们的祖先都还是幸运的，他们有后代继承了他们的基因。

我特别要强调自然选择，对于我们来说是被选择(be selected)，我们能决定我们的行为和策略，但不能决定我们是否被选择，那是上帝的事情。

严复说物竞天择，就是这个意思。

另一种机制叫突变机制(mutant),这保证了种群的变化。

如果没有突变，那么这个世界上存活下来的物种就会越来越少，最后只剩下一种。

对于突变机制，我也要强调它是没有方向性的，可能会提高个体的适应性，但更有可能降低个体的适应性。

突变同样是上帝的选择，微观个体无能为力。

接下来，我们就可以回顾演化经济学的思想史了。

我在幻灯片里给出了一长串人的名字，他们都可以看作是具有演化思想的经济学家，都是演化经济学的先驱。

斯密，马克思，门格尔，马歇尔，凡勃仑，熊彼特，直到哈耶克。

我尤其要强调雄彼特的贡献，他研究经济发展和经济周期，提出了著名的“创新”思想。

这带有明显的动态的特征，并影响了随后的尼尔森和温特。

安德森把熊彼特以后，尼尔森-温特以前这段时间（1930-1970）比作黑暗时代（当然这仅指演化经济学而言，对于新古典经济学无疑是黄金时代呢），这段时间很少有人关心动态的演化的经济学理论。

（阿尔奇安也许是个例外）从70年代初开始，尼尔森和温特提出了一系列演化经济学模型。

同时，梅纳德.史密斯在1973年提出了著名的演化稳定策略，奠定了演化经济学的基础。

从此，演化经济学可以算真正诞生了。

尼尔森自称是熊彼特的忠实信徒，而温特是达尔文进化论的信徒，他们的演化理论非常鲜明地具有这些特征。

计算机能够很好地模拟生态学上物种数量的演化，因而也被广泛地用于经济模型的演化模拟。

尼尔森-温特的多数模型都很容易被改编成计算机模型，用现实数据进行实证检验。

大家认为他们的模型在产业组织（IO）的应用比较成功，我就以这方面的模型为例子。

尼尔森-温特给出了个体在演化过程中的几个重要特征，我把他们列在下面1个体永远不会完美信息（局部知识或吉尔兹的地方性知识，而不是全局性知识）2个体行为受制度（正式和非正式），规范，习俗，意识系统等条件约束3个体（或者企业）可以模仿对手4开发和模仿（也就是R&D）既有“积聚效应”（可以参考Becker关于“上瘾”以及孩子教育的论文）和路径依赖的效果，又与原创性科学研究相关。

5个体竞争的结果往往是非均衡的－即败者出局（被淘汰）6个体的特征是非决定性的－这里他们是在反驳“决定论”的批评。

同时，演进的结果通常是不可逆的。

7主流经济学喜欢讨论“潜在的”均衡（也就是往往达不到的，但理论上可能的均衡），而对非均衡状态的分析要远比那些均衡来的重要。

我们重点讲其中的“创新”部分。

熊彼特的创新，到了尼尔森和温特那里，运用到对firm 的研究，被偷换成了R＆Ｄ（更具体一些，是innovation/imitation）。

创新当然不完全等同于R&D，但这样做是必要的。

我们可以参考Becker的研究方法，我们脚站在工具里，把能够工具化的变量尽量工具化，也许我们只抓住了变量的很次要一部分，我们只迈出了一小步，但对这一小步我们有足够的自信心。

回到R&D，我下面主要依据他们1982年那本著名的教科书Evolutionary theory of economic change。

我们根据以下知识列出计算方程1 资本生产率是由企业的专门化知识决定的2R&D的产物是innovation和imitation。

3R&D密度（就是R&D占总资金比例，例如微软好像是5%）由一固定规则决定。

4原创能否实现是一个柏松过程。

再加上一些常识，就能写出联立方程组，用计算机来算。

5创新是不连续的，有跳跃，有“高原现象”。

接着我们就可以批评他们的工作了。

先是一个小问题，就是如何区分原创和模仿，两者之间的关系是怎样的（互补或互替或其他），他们也做了回应。

接着是一个大问题，就是他们把R&D看作在一个搜索空间（search space）里的搜索过程。

让我先打个岔，说说经典博弈论里的共同知识（common knowledge）的事情。

耶路撒冷学派的领袖奥曼（Aumann）说，博弈论的基础是一团乱麻。

要理出一根阿里阿德涅线，我们要找到一个线头，这就是共同知识。

共同知识就是，我知道你的策略，你知道我的策略，我知道你知道我的策略，你知道我知道你的策略...宾莫尔（Binmore）等人试图用一个自明之理来取代这个共同知识。

有些事情，只要发生了，人人都应该知道（例如911事件，现在的美伊战争等）。

但他们在公理化这个自明之理时，又遇到致命的阻碍。

这就是所谓的第五公理和第六公理。

第五公理说，我知我所知。

这还算了，第六公理说，我知我所不知，这立刻遇到了哲学问题。

亚里斯多德的“愈学愈无知”的故事正好拿来反驳。

一个人如何能知道自己的策略空间，更如何能知道自己策略空间以外的空间？从语言学或者认识论的角度来看，这个公理更显得荒谬了。

博弈论大师在共同知识这个问题前的狼狈是可想而知的。

我这里只是想类比一下，R&D真的能表示成在给定的搜索空间里搜索吗？从实践的角度，我们只能处理一维和二维的情况，丁丁说的“一切人在一切方向上的创新”，这就超出我们能够处理的范围了。

我们能够在一个时点讨论多个维度（一般均衡），我们也能在时间连续情形下讨论一个维度（演化稳定－这就是尼尔森和温特他们的工作），但我们无法讨论时间连续下多个维度的情况，这超出了理性的范围，但这正是创新的特点。

说了那么多，我只是想指出，他们这派的方法论是排除个人的理性选择的。

所以他们的模型可以被很好地运用到产业组织的研究中。

他们的路子跟泰勒尔（Tirole ），美国的博弈论四人帮等的路子很不同。

传统的经验型的产业组织研究（张伯伦，罗宾逊他们的研究，到后来贝恩那里所谓的SCP 范式）已经彻底被博弈论征服了。

而尼尔森，温特他们用演进理论借尸还魂，恢复产业组织的经验研究（很显然，计算机模拟的结果可以跟实证数据对比）是很成功的。

其中最微妙的与人的选择关系最密切的R&D 活动也被巧妙的模型化了。

（但我们看到，把多维的创新压缩到1，2维的搜索空间里的搜索，这里面问题很大）接着，我们可以讨论一些重要的概念了，主要是一些博弈论的概念。

当然，其中最重要的概念就是演化稳定策略（ESS ）。

我想强调，ESS 是一种策略，而不是均衡。

策略在前，均衡在后。

由策略看演化，是由前往后看，由均衡看演化，是由后往前看。

我们先给出一个严格的定义，在两人对称博弈情况下（我们下面主要讨论对称的情况，不对称通常可以转换成对称的情形），存在策略σ，σσ'≠，()(0,1)εσ'∈，使得(,(1))(,(1))u u σεσεσσεσεσ'''+->+-，那么σ就被称为演化稳定策略。

由上面的定义可以看到，博弈双方都会采用这最优的演化稳定策略。

我们有两条性质如下性质1：演化稳定策略必然是纳什均衡。

性质2：只有严格的（即唯一的）纳什均衡才能由演化稳定策略得出。

下面我介绍一个通俗的例子，表明演化稳定策略往往会不存在，所以我们有时不得不转向均衡的分析。

这个例子很简单，叫“石头－剪刀－布”博弈。

石头胜剪刀，剪刀胜布，布胜石头，当双方的策略相同时，收益都为x.很显然，这个博弈有一个混合策略纳什均衡，即用1/3的概率分别选择出石头－剪刀－布{1/3,1/3,1/3}，或者说随机选择，这个策略的期望收益是13X 。

假设这个博弈存在演化稳定策略 ,那么双方都采取这个策略，收益显然为X.由定义得，既然策略是ESS ，那么必然有X>13X ，我们知道这只有在X>0时才满足。

当X<0时，这个博弈不存在演化稳定策略，但显然它是存在纳什均衡的，所以我们需要另一种分析方法，叫演化稳定均衡（EES ）我把定义写在下面X 是个非空纳什均衡策略闭集合，存在(0,1)ε'∈，X σ∈，((1))BR σεσεσ''∈-+，0εε'<<，(1)X εσεσ'-+∈，则X 是演化稳定均衡。

我们可以证明，每个对称博弈都存在演化稳定均衡，每个演化稳定均衡是纳什均衡集的一个元素。

这样，我们就有了几个相关的工具。

一个是演化稳定策略，由这个策略可以推导最后的均衡，但这个占优策略未必存在。

一个是演化稳定均衡，它一定是存在的，但只是最后的结果。

一个是纳什均衡，但我们知道纳什均衡往往不唯一。

接下去，我们来讨论演化策略的稳定性。

我们有时候会发现ESS 虽然是占优的，但不是稳定的－这很重要，这导致我们必须引入一种“突变”（mutant ）机制。

我下面举一个例子，是Robson(1990)年提出的，被称为“秘密握手”博弈。

有支付矩阵如下 (0.1)显然，这个博弈有2个纳什均衡，分别是(d,d)和(m,m)，(m,m)帕累托占优于(d,d)。

因为(d,d)与(d,m),(m,d)无差异，而(m,m)优于(d,m)和(m,d)，因此，只有(m,m)是演化稳定策略。