进化稳定均衡与纳什均衡

合集下载

纳什均衡

纳什均衡

纳什均衡简介纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。

如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。

一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。

纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。

实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。

然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。

阿尔伯特·塔克(Alberttucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。

它发展了本身很有意义的n人有限非合作博弈的概念和性质。

并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。

在概念和方法两方面,该论文都是作者的独立创造。

”纳什均衡例子博弈论中一个著名的例子就是囚徒困境。

囚徒困境是一个非零和博弈,说的是两个嫌疑犯甲和乙私人民宅联手作案,被警方逮住但未获证据。

警方于是将两个嫌疑犯分开审讯。

警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。

纳什均衡大白话解释

纳什均衡大白话解释

纳什均衡大白话解释纳什均衡是一个在经济学和博弈论中非常重要的概念,由著名数学家和经济学家约翰·纳什提出。

虽然这个概念在理论上可能显得有些复杂,但其实我们可以通过一些日常生活中的例子,以及通俗易懂的语言来解释它。

什么是博弈?首先,我们要明白什么是“博弈”。

博弈,简单来说,就是多个参与者之间为了各自利益而进行的一种策略性互动。

这种互动可以是合作,也可以是竞争,关键在于每个参与者的行动都会影响到其他人的利益。

纳什均衡的概念那么,什么是纳什均衡呢?纳什均衡指的是这样一个状态:在一个博弈中,所有参与者都选择了一个策略,并且没有哪个参与者可以通过单独改变策略来获得更好的结果。

换句话说,就是大家都觉得“这样挺好,我不想再变了”。

日常生活中的纳什均衡交通拥堵想象一下你每天上班都要经过的一个拥堵的路口。

如果大家都遵守交通规则,有序通过,虽然可能还是会有点慢,但至少能保持一定的流动性。

这个时候,就形成了一个纳什均衡:没有人愿意冒险去闯红灯或者插队,因为那样做虽然可能暂时让自己快一点点,但很可能会引发更大的混乱,到头来反而得不偿失。

价格战再来看一个商业竞争的例子。

假设市场上有两家卖相似产品的公司A和B。

如果A降价,可能会吸引更多顾客,从而增加销量;但B看到A降价后,为了不失去市场份额,也可能跟着降价。

这样一来二去,最后两家公司可能都会因为价格过低而赚不到钱,甚至亏损。

这种情况下,如果两家公司都能意识到这一点,并且决定保持一个合理的价格水平,那么它们就达到了一个纳什均衡:谁也不想先降价,因为那样做对自己没好处。

合作与竞争中的纳什均衡在合作中,纳什均衡表现为一种稳定的合作关系。

比如两个人一起抬一张桌子,如果大家都出力,桌子就能稳稳当当地被抬起来;但如果其中一个人偷懒不出力,那么另一个人就会感到吃力甚至可能受伤。

在这种情况下,出力均衡就是一种纳什均衡:没有人愿意单方面减少出力,因为那样做对自己和对方都没好处。

在竞争中,纳什均衡则可能表现为一种僵持状态。

进化稳定策略及其应用

进化稳定策略及其应用
混合策略(1/4,3/4)是ESS
协调博弈
设某一同质种群的成员任意配对。在这博弈中, (L,L)(D,D)都是严格对称纳什均衡,所以L和D都是ESS。 (S*,S*)是对称混合策略均衡, 其中S*=(1/4,3/4)。为了使 它为ESS必须使E(S*, S)>E(S,S)成立(S*≠S)
在此博弈中参与人选择同一行动要好于选择不同行动,
Maynard Smith & Price(1973)最初的目的是希望理解动物个体之 间的争斗为什么总是一场“有限的战争”,很少造成严重的伤害。 例如,许多蛇类的雄性个体相互之间扭缠打斗时从不使用它们的毒 牙。在Maynard Smith & Price研究这个问题之前,人们通常给出的 解释是,否则许多个体将受到严重伤害,最终对物种生存不利。但 是Maynard Smith & Price不满意这种群体选择的观点,并从个体选 择的角度运用对策论提出了他们自己的生物学解释。他们的分析是 以动物争斗为例进行的。
以上两动态系统有5个平衡点(0,1),(1,0),(0,0),(1,1),
(12p)1 (4q) 4p(1p)
(1/4,1/4).
4q(1q)
(12q)1 (4p)
q q ( 1 q )1 (4 q )
以上已经证明混合策略纳什均衡(1/4,1/4)不是ESS,而 (0,0),(1,1)不是纳什均衡,只证(1,0)是否为ESS,对于两 种群两策略的双矩阵进化博弈,要证平衡点是否为ESS, 只要证明复制者动态方程的平衡点是进化均衡。
定义:如果任何策略y≠x,存在某个 y(0使,1) 得不等式
u [ x ,y ( 1 ) x ] u [ y ,y ( 1 ) x ] 对所有的(0, )

进化稳定均衡与纳什均衡

进化稳定均衡与纳什均衡

进化稳定均衡与纳什均衡经济专家论文报告:进化稳定均衡与纳什均衡1. 引言2. 进化稳定均衡的基本概念和理论分析3. 进化稳定均衡和纳什均衡的区别和联系4. 进化稳定均衡在实际问题中的应用5. 总结与展望1. 引言进化稳定均衡和纳什均衡是现代博弈论中的两个重要概念。

前者是指在演化过程中,一种策略能够保持自身的数量和适应性,成为一种稳定的演化策略;后者是指在博弈中,每个参与者采取最佳策略的状态。

本文将分析这两种均衡的概念、性质以及在经济学中的应用,并探讨它们之间的联系和区别。

2. 进化稳定均衡的基本概念和理论分析进化稳定均衡是指一个策略因为拥有适应性而繁衍下来,成为博弈中一种最具竞争力的策略。

在进化过程中,策略需要满足两个条件:稳定和可入侵。

如果一种策略对抗其他策略的成功率高于其他策略对抗该策略的成功率,那么该策略就是稳定的。

可入侵是指其他策略能够通过有限的数量优胜该策略。

进化稳定均衡是指满足进化过程、稳定和可入侵的状态。

在理论分析中,进化稳定均衡和纳什均衡经常被对比。

在一个有限的,重复的博弈中,如果每个参与者受到不完全信息或随机事件的影响,那么进化稳定均衡可能不存在。

但是在无限重复博弈中,可以通过相关策略维护一个进化稳定均衡。

进化稳定均衡的产生依赖于群体的数量和适应性,可以通过对群体动态的分析和博弈理论的结合进行研究。

3. 进化稳定均衡和纳什均衡的区别和联系尽管进化稳定均衡和纳什均衡都是均衡的概念,它们之间有一些显著的差别。

纳什均衡是指博弈中每个参与者采取最佳策略的状态;进化稳定均衡是指具有适应性的策略在演化过程中成为博弈中一种最具竞争力的策略状态。

因此,进化稳定均衡更适用于群体的经济学分析,而纳什均衡更适用于个体的分析。

此外,在某些情况下,进化稳定均衡可能不存在;而纳什均衡总是存在的。

因此,在实际应用中,我们需要谨慎选择使用哪种均衡概念。

4. 进化稳定均衡在实际问题中的应用进化稳定均衡的理论在经济学中得到了广泛应用,其中最突出的是在博弈论和演化经济学方面。

纳什均衡的概念

纳什均衡的概念

纳什均衡的概念纳什均衡是博弈论中的重要概念,指的是在一个博弈中,所有参与者都选择了自己的最佳策略,不存在更好的选择,即达到了一种均衡状态。

纳什均衡是在参与者之间相互博弈的情况下,每个参与者都选择了自己的最佳策略,并且其他参与者也同时选择了最佳策略,从而实现了一种平衡状态。

纳什均衡最早由约翰·纳什提出,他于1950年发表了研究博弈论的著名论文《非合作博弈》。

在该论文中,纳什定义了纳什均衡,并利用数学方法证明了简单博弈的纳什均衡存在性。

由于纳什均衡的提出和研究,他获得了1994年的诺贝尔经济学奖。

纳什均衡的理论适用范围非常广泛,涵盖了众多社会科学领域,如经济学、政治学、社会学等。

在经济学领域,纳什均衡被广泛运用于市场竞争、价格确定、产出决策等方面的分析。

在政治学领域,纳什均衡被应用于国际关系、选举竞争等问题的研究。

在社会学领域,纳什均衡被用于解析社会合作、集体行动的机制等等。

为了更好地理解纳什均衡的概念,我们可以通过一个具体的博弈案例来说明。

假设有两个企业A和B在某个市场上销售相同的产品,它们可以选择两种不同的定价策略:高价策略和低价策略。

企业A和B都知道,如果它们选择相同的策略,市场将会处于均衡状态;如果它们选择不同的策略,市场将会出现不稳定的情况。

在这个博弈中,我们可以使用一个博弈表来表示两个企业的策略和回报。

假设高价策略带来的利润分别为5和2,低价策略带来的利润分别为3和4。

根据这个博弈表,我们可以得到以下结论:如果企业A选择高价策略,那么企业B选择高价策略可以带来较高的利润,所以企业B将会选择高价策略。

如果企业A选择低价策略,那么企业B选择低价策略可以带来较高的利润,所以企业B同样会选择低价策略。

综上所述,无论企业A选择高价策略还是低价策略,企业B都会选择低价策略,从而形成了一个纳什均衡。

在这种均衡状态下,企业A的最佳策略是低价策略,而企业B的最佳策略也是低价策略,两个企业都无法通过改变自己的策略来获得更高的利润。

纳什均衡

纳什均衡

纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

纳什均衡名称来源及简介:约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。

其研究成果见于题为《非合作博弈》(1950)的博士论文。

该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。

纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。

他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。

该解概念后来被称为纳什均衡。

假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。

所有局中人策略构成一个策略组合(Strategy Profile)。

纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。

即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

纳什均衡,从实质上说,是一种非合作博弈状态。

纳什均衡经典案例:囚徒困境1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。

)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。

警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。

如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。

如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

表2.2给出了这个博弈的支付矩阵。

表2.2 囚徒困境博弈关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。

纳什均衡概念名词解释

纳什均衡概念名词解释

纳什均衡概念名词解释纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定条件下做出的最优策略选择,这个选择不会被单方面的改变,否则对于另一方来说,选择其他策略反而更劣。

1. 概念解释纳什均衡的概念可以从两个方面进行解释。

从个人角度看,纳什均衡是指当每一个人都实施最优策略时,其它人不能从自己的策略中获得进一步的盈利收益;从社会角度看,纳什均衡则是指,当所有人都做出了最优策略时,整个社会得到了最大的总收益。

2. 纳什均衡的前提条件在博弈论中,纳什均衡并不是所有博弈都存在的。

对于一个博弈,存在纳什均衡需要满足以下条件:(1)所有博弈者都采取了最优策略,即无法通过改变策略来提高自己的收益;(2)每个博弈者的策略是对其他博弈者实施的策略的最佳反应;(3)每个博弈者都清楚地了解其他博弈者的策略。

3. 纳什均衡的类型在实际的博弈中,纳什均衡可以分为三种类型:(1)纯策略均衡:指每位参与者都只选定一个策略,并根据它的期望收益来进行决策,不存在概率因素。

(2)混合策略均衡:指每位参与者按一定的概率选定多个策略,并根据它的期望收益来进行决策,存在概率因素。

(3)多重纳什均衡:指博弈中存在多个均衡策略组合,每个均衡策略组合都符合博弈的前提条件。

4. 纳什均衡的意义和应用纳什均衡是博弈论的一个核心概念,其意义和应用非常广泛。

首先,纳什均衡可以用来预测和解释现实生活中的决策行为,如市场竞争、政府政策制定等。

其次,纳什均衡也可以用来指导协商和谈判的过程。

最后,纳什均衡还可以用来研究其他领域的决策行为,如军事战略、生态环境等。

综上所述,纳什均衡是博弈论中的一个重要概念,它描述了博弈双方在特定条件下做出的最优策略选择,是一种使得所有参与者都满意的稳定状态。

纳什均衡的应用领域非常广泛,其理论和方法也在不断地发展和完善。

演化博弈中的纳什均衡

演化博弈中的纳什均衡

演化博弈中的纳什均衡
在演化博弈中,纳什均衡是一种策略组合,在给定对手策略的情况下,每个参与人选择最优策略。

它反映了一个策略组合的稳定性,即在对手采用特定策略的情况下,没有其他策略组合可以提供更好的收益。

纳什均衡是一种重要的概念,它有助于理解博弈论中的策略互动和参与人的决策。

在演化博弈中,纳什均衡的概念被广泛应用,以解释在动态博弈中策略的稳定性和演化过程。

演化博弈论中的纳什均衡是关于动态博弈的理论,它强调了策略的演化和适应过程。

在这个框架下,参与人不断调整其策略以适应对手的行为,并试图在对手采取特定策略时获得更高的收益。

在演化博弈中,纳什均衡的概念与传统的纳什均衡有所不同。

传统的纳什均衡主要关注给定情况下参与人的最优反应,而演化博弈中的纳什均衡则更关注策略的动态演化和适应过程。

演化博弈论中的纳什均衡可以通过不同的方法进行求解,例如通过模拟演化过程或使用优化算法来找到最优策略组合。

在求解过程中,需要考虑每个参与人的策略空间和收益函数,以确定最优策略组合。

总之,演化博弈中的纳什均衡是一种关于动态博弈的理论,它强调了策略的演化和适应过程。

通过求解演化博弈中的纳什均衡,我们可以理解参与人在动态环境中的行为和决策过程。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

摘要为了让读者对进化博弈理论的基本概念——进化稳定策略(Evolutionarily Stable Strategy)有一个基本的了解,本文主要介绍进化稳定策略概念的提出及其发展。

为了便于理解,文中利用一些具体例子简要地介绍进化稳定均衡(就是系统选择进化稳定策略时所处的均衡)求法、应用以及它与纳什均衡之间的关系。

最后指出了传统进化稳定策略定义的缺陷及经济学家们对此所作的进一步研究。

关键词:进化博弈;进化稳定策略;进化稳定状态;纳什均衡Abstract:This paper is mainly about the concept of Evolutionarily Stable Strategy (ESS) and its developments. For the convenience of the readers’ better understanding of this basic concept in Evolutionary Game Theory, we use some cases to introduce the solution of Evolutionarily Stable Equilibrium (ESE, that is, the equilibrium when the system selects ESS), its applications and the relationships between Nash Equilibrium and ESE. Finally, we point out the flaws of the traditional concept of ESS and some economists’ researches on this.Key words: Evolutionary Game; Evolutionarily Stable Strategy; Evolutionarily Stable Status; Nash Equilibrium摘要为了让读者对进化博弈理论的基本概念——进化稳定策略(Evolutionarily Stable Strategy)有一个基本的了解,本文主要介绍进化稳定策略概念的提出及其发展。

为了便于理解,文中利用一些具体例子简要地介绍进化稳定均衡(就是系统选择进化稳定策略时所处的均衡)求法、应用以及它与纳什均衡之间的关系。

最后指出了传统进化稳定策略定义的缺陷及经济学家们对此所作的进一步研究。

关键词:进化博弈;进化稳定策略;进化稳定状态;纳什均衡引言进化生态学与博弈论的结合至少已有三十几年的历史,初看起来使人觉得奇怪,因为博弈论常常假定参与人是完全理性的,而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。

然而一旦用参与人群体来代替博弈论中的参与者个人,用群体中选择不同纯策略的个体占群体个体总数的百分比来代替博弈论中的混合策略,那么这两种理论就达到了形式上的统一。

进化博弈理论由于对参与人的理性要求较少而与现实更为接近,因此在短短的时间内就获得了迅速的发展。

特别是Maynard Smith(1973,1974)等提出基本均衡概念----进化稳定策略(Evolutionarily Stable Strategy ESS)及Taylor and Jonker(1978)提出基本动态概念----模仿者动态(Replicator Dynamics)以后,进化博弈理论被广泛地应用于生物学、社会学等领域。

1992年进化博弈理论的国际学术会议在康奈尔大学的召开,正式确定了它在经济学上的学术地位。

越来越多的经济学家应用进化博弈理论来解释并预测参与人的群体行为,在多数情况下,它比利用纳什均衡预测人的行为更现实、更准确。

由于历史原因,我国经济理论界到目前为此还没有对进化博弈理论的基本均衡概念进行系统介绍的文献。

本文试图对进化稳定策略作出简要的介绍,并把该概念与传统博弈论的基本概念—纳什均衡进行比较。

[!--empirenews.page--]进化稳定策略的定义及性质进化博弈理论(Evolutionary Games Theory)来自达尔文的生物进化理论。

在生物进化过程中不同种群在同一个生存环境中竞争同一种生存资源时,竞争的结果只有那些获得较高适应度(后代成活率)的种群③生存下来,那些得到较低适应度的种群在竞争中被淘汰(即优胜劣汰);在进化过程中个体常常会发生突变、迁移、死亡,同时自然条件也会发生剧烈变化等都会对生物进化过程产生影响,因而要对种群进化进行比较完整的分析就必须建立一些能够综合考虑这些因素影响的模型。

一般的进化博弈模型主要基于两个方面而建立起来的:选择(Selection)和突变(Mutation)。

选择即是指本期中好(能够获得较高支付)的策略在下期变得更为盛行(被更多的参与者采用);突变一般很少发生,它是以随机(无目的性)的方式选择策略(可能是能够获得高支付的策略,也可能是获得较低支付的策略)。

新的突变也必须经过选择,并且只有较好的策略才能生存(Survive)下来。

选择也可能包括许多形成机制,这些机制可能是生态的(支付决定后代的数量),也可能是个人的(试验、刺激反应等),也可能是社会的(学习与模仿等)。

就较好策略变得更为盛行而言,这个过程是适应性(Adaptive)且是不断改进(Improving)的。

Maynard Smith and Price(1973)以及Maynard Smith(1974)在考察种群个体适合度由其行为共同决定条件下个体对成功策略选择的效果时,提出了一个能够综合描述上述各种因素的均衡概念----进化稳定策略,它后来成为进化博弈理论的一个基本均衡概念。

进化稳定策略的基本思想是:假设存在一个全部选择某一特定策略的大群体和一个选择不同策略的突变小群体,突变小群体进入到大群体而形成一个混合群体,如果突变小群体在混合群体中博弈所得到的支付大于原群体中个体在混合群体中博弈所得到的支付,那么小群体就能够侵入大群体,反之就不能够侵入大群体而在演化过程中消失。

如果一个群体能够消除任何小突变群体的侵入,那么就称该群体达到了一种进化稳定状态,此时该群体所选择的策略就是进化稳定策略。

下面我们利用一个简单的模型来给出进化稳定策略的定义。

进化稳定策略是在研究生态现象时提出来的,生态学中每一个种群的行为都可以程式化为一个策略,所以在一个生态环境中所有种群就可以看作一个大群体,群体中个体之间进行的是对称博弈④。

下面就以为对称博弈为例来介绍进化稳定策略的定义。

假定存在一个个体数为n (N={1,2,…,n })的大群体⑤,其中n是一个充分大的数。

群体中每一个个体都有相同的纯策略集合(行动集),于是混合策略⑥集合S可定义为:其中表示群体(Population)中个体选择纯策略i的概率,也是进化系统在该时刻群体中选择纯策略i的个体占群体个体总数的百分比。

由于群体中个体无角色区分且个体数目n充分大,因此可以认为群体中每个个体都选择相同的混合策略x,纯策略可以理解为混合策略的退化,下面所定义的进化稳定策略对纯策略而言依然有效。

[!--empirenews.page--]假定在大群体中存在一个选择突变策略的小群体,突变小群体在大群体中所占的比例为μ,μ是一个非常小的正数。

群体中个体之间进行两两重复匿名博弈,每个个体都认为对手来自状态,这里所说的对手实际上是一个虚拟的参与人。

我们用表示选择策略s的参与人在博弈时所得到的期望支付,表示选择策略突变者与虚拟参与人博弈时所得到的支付。

给定群体所处的状态h时,每一个参与者个体都寻找可能偏离被程式化策略的最优反应策略。

假定(a)、期望支付函数(在生态学里面一般称为“适应度”fitness函数)是对称的,即。

就博弈的支付矩阵而言,一个参与人的支付矩阵是其对手的支付矩阵的转置矩阵,(b)、支付函数对各分量是连续的,(c)、如果那么群体中个体应该选择策略s。

上面的假定(a)来自于前面单群体的假定,由于我们考察的是单群体的情形,即博弈中各参与者个体都有相同的行动集,并且群体中每一个个体都与选择相同混合策略h的虚拟参与人进行博弈,因此博弈的支付矩阵是对称的;假定(b)是为了技术上处理的方便;假定(c)说明本期中能够获得较高期望支付的策略在下期变得更盛行,这一点是来自于达尔文的优胜劣汰理论,也是进化博弈理论关键所在。

如果上面的严格不等式对任何都成立,我们称策略s为进化稳定策略,群体中所有个体都选择这一策略时群体所处的状态,就称为进化[1][2][3][4]下一页稳定状态,此时系统所达到的均衡称为进化稳定均衡(Evolutionarily Stable Equilibrium)。

上面的假定(c)并不是进化稳定策略的定义,下面我们给出进化稳定策略的正式定义:策略是一个进化稳定策略,当且仅当对任何策略,存在[!--empirenews.page--]使得不等式(1)对所有的成立。

由进化稳定策略的定义,可以得到一些简单的性质,下面给出并证明其中的两个重要性质。

为了说明的方便,定义符号为的最优反应策略集。

如果一个参与人选择策略s而其对手选择策略,他的支付为,策略s就称为对策略的反应策略,对策略的所有最优反应策略集记为。

性质1、如果策略s是进化稳定策略,那么对任何都有。

证明性质(1)说明策略s是相对于其自身的最优反应策略之一,也就是。

(下面用反证法证明)如果策略s不是其自身的最优反应策略,那么必定存在另一个策略满足,由期望支付函数的连续性及期望支付函数是关于混合策略概率的线性函数,条件(1)可变为:如果存在满足的策略,那么,很明显我们至少可以找到一个,对任何都有[!--empirenews.page--]即策略s不是进化稳定策略,这与条件矛盾,所以对任何都有。

性质2、如果策略s是进化稳定策略且对任何策略满足,那么必有。

证明假定,这与条件一起隐含了对任何,(另外性质2的证明也可以直接从进化稳定策略的定义得出)。

因此策略s并不满足进化稳定的条件,即策略s并不是进化稳定策略,这就得出了矛盾。

综合这两个性质就得到Maynard Smith (1974)及Taylor and Jonker (1978)给出进化稳定策略的第三个性质,此后许多有关进化博弈理论方面的文献都沿用此性质作为对进化稳定策略的正式定义。

性质3、如果策略满足(ⅰ)对任何(ⅱ)那么策略s是进化稳定策略。

第一个条件说明:如果策略s是进化稳定策略,那么选择突变策略的个体与选择策略的个体博弈时就会得到较少的支付,因而选择突变策略的群体就不能侵入到选择进化稳定策略的群体中;第二个条件说明:选择进化稳定策略的群体可以侵入到突变者群体中,从而使得选择突变策略者在进化过程中从群体中消失。

相关文档
最新文档