进化稳定策略及其应用

合集下载

进化稳定策略及其应用

进化稳定策略及其应用
混合策略(1/4,3/4)是ESS
协调博弈
设某一同质种群的成员任意配对。在这博弈中, (L,L)(D,D)都是严格对称纳什均衡,所以L和D都是ESS。 (S*,S*)是对称混合策略均衡, 其中S*=(1/4,3/4)。为了使 它为ESS必须使E(S*, S)>E(S,S)成立(S*≠S)
在此博弈中参与人选择同一行动要好于选择不同行动,
Maynard Smith & Price(1973)最初的目的是希望理解动物个体之 间的争斗为什么总是一场“有限的战争”,很少造成严重的伤害。 例如,许多蛇类的雄性个体相互之间扭缠打斗时从不使用它们的毒 牙。在Maynard Smith & Price研究这个问题之前,人们通常给出的 解释是,否则许多个体将受到严重伤害,最终对物种生存不利。但 是Maynard Smith & Price不满意这种群体选择的观点,并从个体选 择的角度运用对策论提出了他们自己的生物学解释。他们的分析是 以动物争斗为例进行的。
以上两动态系统有5个平衡点(0,1),(1,0),(0,0),(1,1),
(12p)1 (4q) 4p(1p)
(1/4,1/4).
4q(1q)
(12q)1 (4p)
q q ( 1 q )1 (4 q )
以上已经证明混合策略纳什均衡(1/4,1/4)不是ESS,而 (0,0),(1,1)不是纳什均衡,只证(1,0)是否为ESS,对于两 种群两策略的双矩阵进化博弈,要证平衡点是否为ESS, 只要证明复制者动态方程的平衡点是进化均衡。
定义:如果任何策略y≠x,存在某个 y(0使,1) 得不等式
u [ x ,y ( 1 ) x ] u [ y ,y ( 1 ) x ] 对所有的(0, )

进化稳定均衡与纳什均衡

进化稳定均衡与纳什均衡

进化稳定均衡与纳什均衡经济专家论文报告:进化稳定均衡与纳什均衡1. 引言2. 进化稳定均衡的基本概念和理论分析3. 进化稳定均衡和纳什均衡的区别和联系4. 进化稳定均衡在实际问题中的应用5. 总结与展望1. 引言进化稳定均衡和纳什均衡是现代博弈论中的两个重要概念。

前者是指在演化过程中,一种策略能够保持自身的数量和适应性,成为一种稳定的演化策略;后者是指在博弈中,每个参与者采取最佳策略的状态。

本文将分析这两种均衡的概念、性质以及在经济学中的应用,并探讨它们之间的联系和区别。

2. 进化稳定均衡的基本概念和理论分析进化稳定均衡是指一个策略因为拥有适应性而繁衍下来,成为博弈中一种最具竞争力的策略。

在进化过程中,策略需要满足两个条件:稳定和可入侵。

如果一种策略对抗其他策略的成功率高于其他策略对抗该策略的成功率,那么该策略就是稳定的。

可入侵是指其他策略能够通过有限的数量优胜该策略。

进化稳定均衡是指满足进化过程、稳定和可入侵的状态。

在理论分析中,进化稳定均衡和纳什均衡经常被对比。

在一个有限的,重复的博弈中,如果每个参与者受到不完全信息或随机事件的影响,那么进化稳定均衡可能不存在。

但是在无限重复博弈中,可以通过相关策略维护一个进化稳定均衡。

进化稳定均衡的产生依赖于群体的数量和适应性,可以通过对群体动态的分析和博弈理论的结合进行研究。

3. 进化稳定均衡和纳什均衡的区别和联系尽管进化稳定均衡和纳什均衡都是均衡的概念,它们之间有一些显著的差别。

纳什均衡是指博弈中每个参与者采取最佳策略的状态;进化稳定均衡是指具有适应性的策略在演化过程中成为博弈中一种最具竞争力的策略状态。

因此,进化稳定均衡更适用于群体的经济学分析,而纳什均衡更适用于个体的分析。

此外,在某些情况下,进化稳定均衡可能不存在;而纳什均衡总是存在的。

因此,在实际应用中,我们需要谨慎选择使用哪种均衡概念。

4. 进化稳定均衡在实际问题中的应用进化稳定均衡的理论在经济学中得到了广泛应用,其中最突出的是在博弈论和演化经济学方面。

演化博弈理论的原理和应用

演化博弈理论的原理和应用

演化博弈理论的原理和应用1. 理论简介演化博弈理论是一种理论框架,用于研究多个个体之间相互作用的行为和策略选择。

它是从进化生物学中发展而来,吸收了经济学和社会学等学科的理论和方法,在研究社会行为和经济决策中具有重要应用。

2. 原理概述演化博弈理论主要基于以下几个原理:2.1. 演化机制演化机制是指在一群个体中,通过个体之间的相互作用和遗传机制的作用,使得个体的某种特征或行为在群体中逐渐传播和积累。

这种演化机制可以通过模拟进化算法和遗传算法进行建模和研究。

2.2. 博弈模型博弈模型是演化博弈理论的核心工具,它描述了多个个体在特定环境中的策略选择和收益获取。

著名的博弈模型包括囚徒困境、合作博弈和非合作博弈等。

通过博弈模型的构建和分析,可以揭示个体之间的相互影响和策略的动态演化。

2.3. 演化稳定策略演化稳定策略是指一种策略,在给定环境下,个体之间的策略选择在长期演化过程中保持相对稳定。

演化稳定策略是博弈模型中的重要概念,它可以用来解释和预测实际生活中的社会行为和经济现象。

3. 应用领域演化博弈理论在多个学科和领域中都有广泛的应用,以下列举了一些典型的应用:3.1. 经济学演化博弈理论在经济学中被广泛应用于研究市场竞争、价格形成、企业战略等问题。

例如,通过建立博弈模型,可以分析不同企业之间的竞争策略选择和市场份额变化。

3.2. 生态学演化博弈理论在生态学中被用于研究动物群体中的策略选择和社会行为。

例如,通过建立博弈模型,可以分析动物之间的资源争夺、合作行为和繁殖策略选择。

3.3. 社会科学演化博弈理论在社会科学领域也有重要的应用。

例如,在社会网络中,个体之间的互动和合作行为可以通过演化博弈理论进行建模和分析。

此外,演化博弈理论还可以解释和预测社会行为中的合作与竞争现象。

3.4. 计算机科学演化博弈理论在计算机科学中也有广泛的应用。

例如,在人工智能领域,通过演化博弈理论的方法,可以设计和优化智能体的决策策略,提高系统的性能和适应性。

一般两人对称博弈的复制动态和进化稳定策略例题

一般两人对称博弈的复制动态和进化稳定策略例题

一般两人对称博弈的复制动态和进化稳定策略例题一般两人对称博弈是指两个玩家在相同的游戏环境中进行博弈,每个玩家都会根据自己的利益选择不同的策略,从而导致不同的结果。

复制动态和进化稳定策略是指在这样的博弈中,玩家的策略会随着时间的推移而发生变化,最终达到一个稳定的状态。

在一个两人对称博弈中,有两种不同的策略可以选择,分别记作A和B。

假设在初始状态下,玩家A和玩家B各自采取了一种策略,分别记作a和b。

根据复制动态的原理,下一轮博弈中,玩家A和玩家B将继续采用他们上一轮博弈中的策略,如果其中一个玩家的策略获胜,那么他将成为下一轮博弈中的胜者,继续采用他的策略。

如果两个玩家的策略得分相等,那么两个玩家将随机选择一个策略进行下一轮博弈。

这个过程将持续下去,直到达到一个稳定状态。

进化稳定策略是指在一定时间内,玩家的策略会发生变化,而最终达到一个稳定的状态。

在一个两人对称博弈中,如果一个策略可以在当前环境中稳定存在,即如果所有玩家都采用这个策略,那么没有一个玩家会想要改变他们自己的策略,那么这个策略就是进化稳定策略。

举个例子,假设在一个两人对称博弈中,A和B分别可以选择合作(C)或背叛(D),并且根据不同的选择得到不同的收益。

如果两个玩家都选择合作(C,C),则他们每个人都会得到3分;如果两个玩家都选择背叛(D,D),则他们每个人都会得到1分;如果一个玩家选择合作而另一个选择背叛(C,D或D,C),则合作的玩家得到0分,而另一个玩家得到5分。

在这种情况下,合作是一个进化稳定策略,因为如果所有玩家都选择合作,那么没有一个玩家会想要改变他们的策略,因为这是他们能够获得最大收益的策略。

总之,复制动态和进化稳定策略是博弈论中的两个重要概念,通过它们可以更好地理解玩家在博弈中的策略选择,并预测最终稳定的结果。

进化稳定对策名词解释

进化稳定对策名词解释

进化稳定对策名词解释
进化稳定对策是一种策略,用来改善组织进化的稳定性,从而使
组织更容易调整与变化。

它在打破老旧理念、扩张业务范围、改善服
务质量和增强竞争力等方面发挥着重要作用。

它通过改变组织中人员、流程、系统、方法和文化等组成部分,来帮助企业达到各自的业务目标,提高业务效率,使组织可以快速适应环境的变化。

实施进化稳定对策的核心是让组织更好的对自身的稳定性进行评估,然后改进组织内部的运作机制,提升运行稳定性。

一般来说,进
化稳定性对策包括以下几大方面:
首先,巩固组织内部的协调机制,提高组织的工作效率,减少低
效率的复杂流程,确保组织的运行流程更符合业务要求。

其次,发展组织的任务和工作绩效考核体系,确保组织的员工每
人都能有效发挥角色和价值,从而实现企业的可持续发展。

再次,改善组织的人员管理结构,构建流程架构,利用最佳实践
来优化流程,增加整体效率,提高服务质量及客户满意度。

最后,对于日常运营流程,采用合理的运营工具,减少异常发生
的机会,从而提高客户满意度及企业的可持续性。

总的来说,进化稳定可以帮助组织以合理的方式实现良好的发展,提升企业的可持续性,实现企业的战略目标,改善企业的工作效率。

因此,进化稳定对策在企业发展过程中发挥着重要作用,是企业实现
目标的核心策略。

考虑进化稳定的多种群遗传算法在配电网规划中的应用

考虑进化稳定的多种群遗传算法在配电网规划中的应用
中图分类号 :T 2 M7 7 文献标识码:A
文 采用 综合 考虑 网损 、 馈线 建 设费用 和 网络 年 维护
0 引 言
配 电网规 划是 指在 负荷 预测 的基础 上 , 通过 最
折 旧费的配 电网规划数学模型, 即以规划年综合费
用 最小 为评 价标 准 。 目标 函数 为
限 的惩罚 , 一般 取值 很大 , 足要 求 时则取值 为 0 满 。
1 配 电网规划 的数学模型
1 目标 函数 . 1
()容量约束 2
只 . 一
为支路潮流; , 为支路最大允许容量 。 配电网规划问题是大规模非线性规划 问题 。 本 式 中
收 稿 日期 :2 0 -40 . 0 70 -8 作者简介 :王浩 (9 1一) 18 ,男, 华北 电力大学 电气 与电子工程学院硕士研 究生
该 规划 的配 电网必须 是连通 的网络 , 且满 足对 所 基 于进 化稳 定 的改进 多种群 遗传 算法 。 算法根 据
2 考虑进化稳 定的多种群遗传算法
21 遗传 算法和 多种 群 遗传算 法 . 遗 传机 理 的并行 优 化搜 索方法 , 它能在 搜 索过程 中
区的作用 。 当检测到当前种群中最优个体所占的比 例超 过 设定 的稳定 控制 参数 时 , 多余个 体进行 突 对
维普资讯
1 0







20 07笠
()连 通性 网络 约束 3 有 负荷节 点供 电。 ()辐 射性 网络 约束 4
规划 的配 电网必 须是 辐射 性 网络 。
遗 传算 子 ,即稳定 控制 参数 下 的突变 算子 ,提 出 了 设 置 的稳定 控制参 数对精华 种群 中的多余个 体实施 不 同于一 般变 异算 子 的突变操 作 , 以减轻 选择机 可 制对 低适 应 值个 体所 造成 的 “ 生存 压 力” ,保持种 群 的 多样 性 ,避 免过 早 收 敛 ,同 时又 扩 大搜 索 空 间, 到一般 变异 达不 到 的快速 逃离 局部最 优解 误 起

进化稳定策略

进化稳定策略
概念
梅纳德· 史密斯和普莱斯(1973)的定义: x∈A是进化稳定策略,如果y∈A,y≠x,存在一个
y ∈(0,1),不等式U[x, εy + (1 − ε)x] > U[y, εx + (1 −
ε)x]对任意ε∈(0, )都成立。 A是群体中个体博弈时的支付矩阵;y表示突变策略; 是一个与突变策略y有关的常数,称之为侵入界限; εy + (1 − ε)x表示选择进化稳定策略群体与选择突变

0,2
1,1
假设群体中有比例为X的博弈方采用鹰策 略,比例1-x的博弈方采用鸽策略
采用两种策略博弈方的期望得益(选择“鹰” 策略的得益为u1,选择“鸽”策略的得益为u2) 和群体平均期望得益分别为:
u1=-5x+2(1-x)=-7x+2 u2=1-x u =xu1 +(1-x) u2=-6x2+1
动态变化速度
dx F ( x) x(u1 u ) dt
dx F ( x) x(1 x)(1 6 x) dt
解出的复制动态的三个稳定状态分别为X*=0,X*=1和 X*=1/6.
策略群体所组成的混合群体。
进化稳定策略(evolutionarily stable strategy, 简称ESS)是指如体就不可能侵入
到这个群体。或者说,在自然选择压力下,突变
者要么改变策略而选择进化稳定策略,要么退出
系统而在进化过程中消失。可用来描述生物进化
复制动态下的进化稳定策略
生物进化的“复制动态”机制模拟即是
学习速度很慢的成员组成的大群体随机配对 的反复博弈。
鹰鸽博弈的复制动态和进化稳定策略
是同一物种、种群内部竞争和冲突中的

演化稳定策略的定义

演化稳定策略的定义

演化稳定策略的定义引言在生物学和博弈论中,演化稳定策略是指一种在群体中相对于其他策略具有优势的策略,即当大多数个体采用这种策略时,该策略难以被其他策略所取代。

演化稳定策略的概念最早由生物学家约翰·梅·古德费洛提出,后来被博弈论学者进一步研究和发展。

演化稳定策略的概念演化稳定策略是由基因传递给后代的行为策略,通常与遗传算法和适者生存等演化理论相关。

在一个给定的环境中,个体根据自己的策略产生行动,并与其他个体进行互动。

演化稳定策略具有以下特征:1.稳定性:演化稳定策略是指一种策略能够在群体中趋于稳定的存在,并且难以被其他策略所取代。

这种稳定性可以通过均衡理论来描述和分析。

2.优势性:演化稳定策略相对于其他策略具有一定的优势,能够在相同条件下取得更好的结果。

这种优势可以通过适应度函数或收益函数来衡量。

3.传递性:演化稳定策略会通过基因传递给后代,并且在下一代中继续存在和发展。

这种传递性是演化过程中的关键因素之一。

演化稳定策略与博弈论演化稳定策略的概念在博弈论中得到了广泛的应用和研究。

博弈论是研究个体或群体在决策过程中相互作用的数学模型,其中演化稳定策略是其中重要的概念之一。

在博弈论中,演化稳定策略通常通过均衡概念来描述。

均衡是指一种策略组合,当大多数个体采用该策略时,无论其他个体如何选择,都无法通过改变自己的策略来获得更好的结果。

演化稳定策略通常是一个均衡策略,能够在长期演化过程中保持自身的优势地位。

在博弈论中,存在多种演化稳定策略模型,包括纳什均衡、重复博弈中的有限和无限策略等。

这些模型通过数学方法描述了不同情况下演化稳定策略的存在和发展。

演化稳定策略的实例下面我们通过几个实例来说明演化稳定策略的定义和应用。

实例一:囚徒困境囚徒困境是博弈论中常用的一个例子,其中演化稳定策略能够解释为何个体会选择“合作”而不是“背叛”。

1.如果两个囚犯都选择合作,他们都会被判处较轻的刑期;2.如果一个囚犯选择背叛而另一个囚犯选择合作,那么背叛者将免于刑罚,而合作者将被判处较重的刑期;3.如果两个囚犯都选择背叛,他们都会被判处较重的刑期。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0 0 0
0
严格对称的纳什均衡是进化稳定策略,但是 进化稳定策略不一定是严格的纳什均衡。 (鹰鸽博弈)
鹰鸽博弈
鹰 鸽
鹰 鸽
-3,-3 0,2
2,0 1,1
有三个纳什均衡:(鹰,鸽),(鸽,鹰)和一个混合策略纳什 均衡(每个参与者以概率1/4选择鹰) ESS要求是对称的纳什均 衡,两个纯策略不是。 鹰策略的种群比例为p(0<p<1),预期回报
5种对策:1 鹰式 2鸽式 3威吓4报复性威胁5试探性威胁
单态ESS
定义 对所有不同于S*的个体策略S,如果有 E(S*, S*)>=E(S, S*) 如果在上式中的等式成立,则 E(S*, S)>E(S,S) 那么,称S*为单态ESS 在单种群进化博弈中,ESS是对称纳什均衡,但对 称纳什均衡不一定是ESS。(交换经济博弈)
进化稳定策略的简介 进化稳定策略,又称演化稳定策略(ESS),是 evolutionarily stable strategy的简写,属于行为生态学的范 畴。 定义:如果任何策略y≠x,存在某个 y (0,1) 使得不等式
u [ x , y (1 ) x ] u [ y , y (1 ) x ] 对所有的 (0, ) y 都成立,那么x △是一个进化稳定策略。
显然只有当p,q都超过1/4或两个都小于1/4时,(3)式才大 于零,其他p,q组合都使(3)式小于零,就是x*·Ay>x·Ay 不成立,同理可证(x*,y*)的一些邻域使得 y*·Bx>y·Bx不 成立,因此(x*,y*) 不是一个ESS。 下验证两个纯策略纳什均衡是ESS。 引入动态方程——复制者动态 行参与者的复制者动态为 p p [ e1 A ( q ,1 q ) ( p ,1 p ) A ( q ,1 q )]
E(H)=P(-3)+2(1-P)=2-5P E(D)=P×0+(1-p)×1=1-p
混合策略纳什均和要求E(H)=E(D)
解得p=1/4。当p<1/4时,选择鹰策略的预期收入超过了 鸽策略;当p>1/4时,则相反。所以进化将导致种群1/4的 参与人使用鹰策略。混合策略(1/4,3/4)是ESS。 证:S*=(1/4,3/4) S为任意其他策略(p,1-p),p≠1/4。 3 2 1 / 4 1 / 4 ,3 / 4 E(S*,S*)= =3/4=E(S,S*) 而 0 1 3 / 4 E(S*,S)= =5/4-2p E(S,S)= =1-4p2 比较上面两式: E(S*,S)>E(S,S)恒成立 混合策略(1/4,3/4)是ESS
3 1 / 4 ,3 / 4 0 2 p 1 1 p
3 1 / 4 ,3 / 4 0 2 p 1 1 p
协调博弈
设某一同质种群的成员任意配对。在这博弈中, (L,L)(D,D)都是严格对称纳什均衡,所以L和D都是ESS。 (S*,S*)是对称混合策略均衡, 其中S*=(1/4,3/4)。为了使 它为ESS必须使E(S*, S)>E(S,S)成立(S*≠S) 在此博弈中参与人选择同一行动要好于选择不同行动, 所以这个条件不满足,最可能背离在这个条件的S是纯 策略L,这种情况下,E(S,S)=3, E(S*, S)=3/4 ,确实背 离了条件E(S*, S)>E(S,S). L D L 3,3 0,0 D 0,0 1,1
进化稳定策略及其应用
最优化理论(optimization theory)和对策论(game theory, 又称博弈论)是进化生物学中两个最常用的、非常相近的研究 途径。它们之间的主要区别体现在适用范围上:优化理论适用 的情形是当一个个体的最优行为不依赖于其它个体的行为时, 而对策论则适用于一个个体的最优行为依赖于其它个体如何行 动的情形。 最优化理论的基本出发点是,自然选择总是倾向于使生物最有 效地传递它们的基因,因而也将是最有效地从事各种活动,包 括使它们在时间和能量分配方面达到最优状态 。但是,最优化 理论也遇到了一定困难,即在许多情况下普遍意义上的最佳策 略往往并不存在。一个个体采取某一对策是好还是坏不仅取决 于这个对策本身,而且往往还取决于种群内其它个体所采取的 对策是什么。
p (1 p )( 1, 1) A ( q ,1 q )
将A带入得 p p (1 p )( 1 4 q ) (4) 同理得列参与人的复制者动态为 q q (1 q )( 1 4 q )(5) 以上两动态系统有5个平衡点(0,1),(1,0),(0,0),(1,1), (1/4,1/4). 以上已经证明混合策略纳什均衡(1/4,1/4)不是ESS,而 (0,0),(1,1)不是纳什均衡,只证(1,0)是否为ESS,对于两种 群两策略的双矩阵进化博弈,要证平衡点是否为ESS, 只要证明复制者动态方程的平衡点是进化均衡。 动态系统的雅可比矩阵为 (1 2 p )(1 4 q ) 4 p (1 p )
局部渐进稳定性判断纳什均衡是否 为ESS
动态方程——复制者动态 增长率 p / p等于参与人的适合度 e1 . A ( p ,1 均适合度 ( p ,1 p ). A ( p ,1 p ) 用此法进行协调博弈分析:
p (1 p )( 1, 1) A ( p ,1 p )
p)
减去他的平
p p e1 A ( p ,1 p ) ( p ,1 p ) A ( p ,1 p )
将A带入得 p p (1 p )( 4 p 1) 当初始状态p0<1/4时,参与人的进化稳定策略是D;当 p0>1/4时,参与人进化稳定策略是L 注: 3 0
多态ESS(对于有多个个人策略)
定义 对所有不同于S*的S m,如果有 E(S*, S*)>=E(S, S*) 如果在上式中的等式成立,则 E(S*, S)>E(S,S) 那么,称S*为一个ESS。
设A= ( a ij ) m m 为进化博弈的行为参与人的支付 矩阵,如果存在 i0 使 a i i a ji , j i0 ,1 j m 则第 i 0 个策略e i 是进化稳定策略
3.1 鹰鸽对策与进化稳定对策概念 的提出
自然界的每一动物都经常要与其它个体争夺食物、领域和配偶等 有限资源。进化稳定对策概念的起源很大程度上是和分析这些动物 争斗行为联系在一起的(Maynard Smith & Price 1973),其后又被 推广应用到其它各式各样频率依赖选择(frequency-dependent selection)的情形(Maynard Smith 1982)。进化稳定对策理论与传 统种群遗传学对频率依赖选择的研究相比,最明显的差别可能主要 是强调的重点不同。种群遗传学家主要考察基因频率的动态以及平 衡态的性质,目的是探讨不同类型的选择对一个位点上不同基因型 的效应。为了分析上的方便,对策集经常被高度简化,经常是只考 虑对应于两个等位基因的两个对策。而ESS理论家对于遗传学系统本 身的问题考虑很少,经常假定对策可以无性繁殖或者有机体是单倍 体。这种遗传学上的高度简化使得人们可以考察更为复杂、更为广 泛的对策集,以及对策之间更加微妙的适合度相互作用。用 Maynard Smith 的话说,ESS概念的精髓就是‘假定简单化的遗传学 而考察复杂的生态学’(Hines 1987)。另外一点不同是,ESS只注 重考虑种群达到平衡时的性质,而基本上忽略了动态。容易看到, 种群遗传学和ESS理论各自都在不同方面上作了一些不现实的假定, 因此二者之间更具有互补性,而不是相互对立。
例如,一个雄性粪蝇在寻觅雌蝇时的最优占位往往取决于其 它雄蝇停落在什么位置;在争夺配偶的战斗中,一个雄性动 物的最佳对策经常取决于他的对手如何行动,有时退让是有 利的,有时激烈争斗是更适合的。在这些例子中,不存在一 个任何情形下都一律适用的最佳对策。这时我们观察到的自 然界生物它们应该采取何种对策呢?为解决这一难题, Maynard Smith(1982;Maynard Smith & Price 1973)创造性 地提出了一个全新概念––进化稳定对策,或称ESS(为英文 全称evolutionarily stable strategy的简写)。当种群内所有 个体都采取了某个对策后,其它对策者都不能侵入该种群, 那么这个对策就是进化上稳定的。这个概念不强调绝对意义 上的优化,而是从相对意义上寻求所谓的最佳:当种群完全 是由ESS对策者组成的时候,ESS对策者的适合度将大于所有 突变对策者的适合度。因而,ESS是一个弱化了的最优化概 念(Ehrlich & Roughgarden 1987)。
假设p是行参与人选择鹰策略(H)的概率,q是列 参与人选择鹰策略的概率。行参与人的预期支付 为: E(H)=q(-3)+2(1-q)=2-5q E(D)=q×0+(1-q)×1=1-q 对于列参与人其支付矩阵与行参与人相同,于是 E’(H)=p(-3)+2(1-p)=2-5p E’(D)=p×0+(1-p)×1=1-p
(1 2 p )( 1 4 q ) 4 q (1 q ) (1 2 q )( 1 4 p ) 4 p (1 p )
q q (1 q )( 1 4 q )

4 q (1 q )
(1 2 q )( 1 4 p )
按照学习规则,当q<1/4时,行参与人将p上调; 当p<1/4时,列参与人将q上调。 (p,q)平面上的的点(1/4,1/4)处的纳什均衡不是稳 定的,此时x*=(1/4,3/4)和y*=(1/4,3/4) 。现在考 虑(x,y)=((p,1-p),(q,1-q))≠(x*,y*) ,检验是否为ESS x*·Ay=1/4(2-5q)+3/4(1-q)=5/4-2q (1) x·Ay=p(2-5q)+(1-p)(1-q)=1+p-q-4pq (2) 由上两式得x*·Ay-x·Ay=4(1/4-p)(1/4-q) (3)
相关文档
最新文档