进化稳定策略在双重对称博弈中存在及证明

合集下载

演化博弈均衡点和稳定性分析

演化博弈均衡点和稳定性分析

演化博弈均衡点和稳定性分析
演化博弈是一个可以持续发展和改进策略的个体对抗策略,是研究多人竞争行为的理论。

演化博弈主要分析的是在一个竞争中,玩家之间用他们的策略进行博弈的行为特点,
演化博弈的基本理论是玩家在定义好的投掷状态与其他玩家竞争的局面中做决定,其结果
可以用一个矩阵来表示。

演化博弈的理论是模型,其中包括稳定均衡点的分析以及稳定问
题的研究。

首先,演化博弈均衡点分析是指每个玩家在博弈中作出决定时,所留下的矩阵中所取
得的结果是一种状态。

若该状态使得双方都处于一个满足状态,即当双方选择某一种策略,且所有其他策略均无法改变双方利润情况,则该状态即为均衡点。

均衡点表达一种博弈双
方在特定投掷状态下,获得最大利润的策略。

比如说,双方都坚守原则,都会得到尽可能
的福利。

其次,游戏的稳定性分析是指双方在某一特定的投掷状态下,能否维持某一均衡点,
使得双方都获取最大的利润,即双方都坚守他们的策略。

在分析过程中,要思考一种博弈
模型的稳定性及其影响因素,以及博弈模型中哪些玩家削弱了双方之间的稳定性,以及改
善双方稳定关系的措施等等。

演化博弈均衡点与稳定分析博弈做此分析有助于深入理解该博弈模型,既能分析双方
的最优策略,又能研究双方的稳定性,从而明确双方的水平以及沟通渠道,为双方进行博
弈活动提供理论指导。

3进化稳定对策

3进化稳定对策
1.
作物的生长冗余:理论与实践意义

A theory is something nobody believes, except the person who made it. An experiment is something everybody believes, except the person who made it. – Albert Einstein
具有连续对策的多人博弈
个体之间的斗争往往不是成对进行的,而是多人 集体的争斗。 多人博弈问题往往表现为连续对策的形式
多人博弈时的ESS
对策 I 是一个ESS,如果对于所有的 JI 都满足下列条件:
W (J , I ) W (I , I ) 或者当W ( J , I ) W ( I , I )时, 对于很小的q W ( J , Pq , J , I ) W ( I , Pq , J , I )
进化稳定对策与种群遗传学
均研究频率依赖选择问题,但重点不同 种群遗传学考察基因频率的动态以及平衡态的性质,目
的是探讨不同类型的选择对一个位点上不同基因型的效应。 为了分析上的方便,对策集经常被高度简化,经常是只考 虑对应于两个等位基因的两个对策 而ESS常常假定对策可以无性繁殖或者有机体是单倍体。 这种遗传学上的高度简化使得人们可以考察更为复杂、更 为广泛的对策集,以及对策之间更加微妙的适合度相互作 用。用Maynard Smith 的话说,ESS概念的精髓就是‘假 定简单化的遗传学而考察复杂的生态学’
中庸对策者表现的行为是:当自己是资源(例如 一块领域)占有者时表现为鹰,当自己是入侵者 时表现为鸽;并且假定中庸对策者表现为鹰(资 源占有者)或鸽(入侵者)的概率相等
鹰、鸽和中庸三种对策博弈时的赢得矩阵

进化稳定策略及其应用

进化稳定策略及其应用
混合策略(1/4,3/4)是ESS
协调博弈
设某一同质种群的成员任意配对。在这博弈中, (L,L)(D,D)都是严格对称纳什均衡,所以L和D都是ESS。 (S*,S*)是对称混合策略均衡, 其中S*=(1/4,3/4)。为了使 它为ESS必须使E(S*, S)>E(S,S)成立(S*≠S)
在此博弈中参与人选择同一行动要好于选择不同行动,
Maynard Smith & Price(1973)最初的目的是希望理解动物个体之 间的争斗为什么总是一场“有限的战争”,很少造成严重的伤害。 例如,许多蛇类的雄性个体相互之间扭缠打斗时从不使用它们的毒 牙。在Maynard Smith & Price研究这个问题之前,人们通常给出的 解释是,否则许多个体将受到严重伤害,最终对物种生存不利。但 是Maynard Smith & Price不满意这种群体选择的观点,并从个体选 择的角度运用对策论提出了他们自己的生物学解释。他们的分析是 以动物争斗为例进行的。
以上两动态系统有5个平衡点(0,1),(1,0),(0,0),(1,1),
(12p)1 (4q) 4p(1p)
(1/4,1/4).
4q(1q)
(12q)1 (4p)
q q ( 1 q )1 (4 q )
以上已经证明混合策略纳什均衡(1/4,1/4)不是ESS,而 (0,0),(1,1)不是纳什均衡,只证(1,0)是否为ESS,对于两 种群两策略的双矩阵进化博弈,要证平衡点是否为ESS, 只要证明复制者动态方程的平衡点是进化均衡。
定义:如果任何策略y≠x,存在某个 y(0使,1) 得不等式
u [ x ,y ( 1 ) x ] u [ y ,y ( 1 ) x ] 对所有的(0, )

进化稳定均衡与纳什均衡

进化稳定均衡与纳什均衡

进化稳定均衡与纳什均衡经济专家论文报告:进化稳定均衡与纳什均衡1. 引言2. 进化稳定均衡的基本概念和理论分析3. 进化稳定均衡和纳什均衡的区别和联系4. 进化稳定均衡在实际问题中的应用5. 总结与展望1. 引言进化稳定均衡和纳什均衡是现代博弈论中的两个重要概念。

前者是指在演化过程中,一种策略能够保持自身的数量和适应性,成为一种稳定的演化策略;后者是指在博弈中,每个参与者采取最佳策略的状态。

本文将分析这两种均衡的概念、性质以及在经济学中的应用,并探讨它们之间的联系和区别。

2. 进化稳定均衡的基本概念和理论分析进化稳定均衡是指一个策略因为拥有适应性而繁衍下来,成为博弈中一种最具竞争力的策略。

在进化过程中,策略需要满足两个条件:稳定和可入侵。

如果一种策略对抗其他策略的成功率高于其他策略对抗该策略的成功率,那么该策略就是稳定的。

可入侵是指其他策略能够通过有限的数量优胜该策略。

进化稳定均衡是指满足进化过程、稳定和可入侵的状态。

在理论分析中,进化稳定均衡和纳什均衡经常被对比。

在一个有限的,重复的博弈中,如果每个参与者受到不完全信息或随机事件的影响,那么进化稳定均衡可能不存在。

但是在无限重复博弈中,可以通过相关策略维护一个进化稳定均衡。

进化稳定均衡的产生依赖于群体的数量和适应性,可以通过对群体动态的分析和博弈理论的结合进行研究。

3. 进化稳定均衡和纳什均衡的区别和联系尽管进化稳定均衡和纳什均衡都是均衡的概念,它们之间有一些显著的差别。

纳什均衡是指博弈中每个参与者采取最佳策略的状态;进化稳定均衡是指具有适应性的策略在演化过程中成为博弈中一种最具竞争力的策略状态。

因此,进化稳定均衡更适用于群体的经济学分析,而纳什均衡更适用于个体的分析。

此外,在某些情况下,进化稳定均衡可能不存在;而纳什均衡总是存在的。

因此,在实际应用中,我们需要谨慎选择使用哪种均衡概念。

4. 进化稳定均衡在实际问题中的应用进化稳定均衡的理论在经济学中得到了广泛应用,其中最突出的是在博弈论和演化经济学方面。

对称均衡 非对称均衡 博弈论

对称均衡 非对称均衡 博弈论

对称均衡非对称均衡博弈论
对称均衡和非对称均衡是博弈论中的重要概念,用于描述博弈中各方的策略选择和结果。

在博弈论中,博弈是指一种决策情形,其中参与者的利益受到彼此的影响。

对称均衡和非对称均衡都是描述博弈中可能出现的情况的概念。

首先,让我们来看看对称均衡。

在博弈论中,对称均衡是指参与者采取相同的策略,并且没有动机去改变自己的策略,因为任何一方的单方面改变都不会使其获益。

对称均衡的一个经典例子是“囚徒困境”博弈,其中两名囚犯面临合作或者背叛的选择。

在对称均衡中,如果两名囚犯都选择背叛,那么他们都会受到最严厉的惩罚,而如果两名囚犯都选择合作,那么他们都会受益。

因此,对称均衡发生在他们都选择背叛或者都选择合作的情况下。

其次,非对称均衡是指参与者采取不同的策略,并且在当前策略下没有动机去改变自己的策略,因为任何一方的单方面改变都不会使其获益。

非对称均衡的一个例子是“买方市场”博弈,其中卖方和买方在价格谈判中采取不同的策略。

在非对称均衡中,如果卖方设定了一个最低价格,而买方愿意接受这个价格,那么双方都没有动机改变自己的策略。

总的来说,对称均衡和非对称均衡是博弈论中用于描述参与者策略选择和结果的重要概念。

通过研究对称均衡和非对称均衡,我们可以更好地理解博弈中参与者的决策行为,以及他们可能达到的结果。

这些概念对于经济学、政治学以及其他社会科学领域都具有重要意义。

希望这个回答能够帮助你更好地理解对称均衡、非对称均衡和博弈论的相关概念。

一般两人对称博弈的复制动态和进化稳定策略例题

一般两人对称博弈的复制动态和进化稳定策略例题

一般两人对称博弈的复制动态和进化稳定策略例题一般两人对称博弈是指两个玩家在相同的游戏环境中进行博弈,每个玩家都会根据自己的利益选择不同的策略,从而导致不同的结果。

复制动态和进化稳定策略是指在这样的博弈中,玩家的策略会随着时间的推移而发生变化,最终达到一个稳定的状态。

在一个两人对称博弈中,有两种不同的策略可以选择,分别记作A和B。

假设在初始状态下,玩家A和玩家B各自采取了一种策略,分别记作a和b。

根据复制动态的原理,下一轮博弈中,玩家A和玩家B将继续采用他们上一轮博弈中的策略,如果其中一个玩家的策略获胜,那么他将成为下一轮博弈中的胜者,继续采用他的策略。

如果两个玩家的策略得分相等,那么两个玩家将随机选择一个策略进行下一轮博弈。

这个过程将持续下去,直到达到一个稳定状态。

进化稳定策略是指在一定时间内,玩家的策略会发生变化,而最终达到一个稳定的状态。

在一个两人对称博弈中,如果一个策略可以在当前环境中稳定存在,即如果所有玩家都采用这个策略,那么没有一个玩家会想要改变他们自己的策略,那么这个策略就是进化稳定策略。

举个例子,假设在一个两人对称博弈中,A和B分别可以选择合作(C)或背叛(D),并且根据不同的选择得到不同的收益。

如果两个玩家都选择合作(C,C),则他们每个人都会得到3分;如果两个玩家都选择背叛(D,D),则他们每个人都会得到1分;如果一个玩家选择合作而另一个选择背叛(C,D或D,C),则合作的玩家得到0分,而另一个玩家得到5分。

在这种情况下,合作是一个进化稳定策略,因为如果所有玩家都选择合作,那么没有一个玩家会想要改变他们的策略,因为这是他们能够获得最大收益的策略。

总之,复制动态和进化稳定策略是博弈论中的两个重要概念,通过它们可以更好地理解玩家在博弈中的策略选择,并预测最终稳定的结果。

演化博弈论简介

演化博弈论简介

演化博弈论简介丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。

他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。

传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。

正因为如此,这些新理论才显示出强大的生命力,获得广泛运用。

我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。

先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。

我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。

从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。

我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。

我这里用演化,避免用演进,可以减少误解。

演化理论中有两条最重要的机制。

一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。

在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。

我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。

我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。

严复说物竞天择,就是这个意思。

另一种机制叫突变机制(mutant),这保证了种群的变化。

如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。

进化稳定策略名词解释博弈论

进化稳定策略名词解释博弈论

进化稳定策略名词解释博弈论
在博弈论中,进化稳定策略(Evolutionarily Stable Strategy,简称ESS)是一个用于描述自然选择过程中达到稳定状态的策略。

它是一种在种群中长期占据主导地位的策略,即使在其他策略发生微小变化或突变的情况下,它仍能保持稳定。

一个策略被认为是进化稳定的,当且仅当满足以下两个条件:
1. 在与其他具有相同策略的个体的对抗中,该策略具有至少与对手相等的平均适应度(fitness)。

也就是说,具有这一策略的个体在与其他相同策略个体竞争中不会处于劣势。

2. 如果一个微小的突变策略出现在种群中,那么具有进化稳定策略的个体在与突变策略个体竞争时,具有更高的平均适应度。

这意味着一旦达到进化稳定状态,任何试图改变策略的个体都会受到劣势,因此进化稳定策略能在长期内保持稳定。

这与纳什稳定的理念相关,但进化稳定策略更进一步地强调了种群内部的稳定性。

这一理论主要与博弈论、行为生态学和进化心理学有关,旨在阐述外部环境的变化如何带来新的选择性力量,而非通过有目的地处理外部环境可能发生的变化来引入新的种群进化选择力。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
动态( e l a rD n mi ) q 此 , R pi t y a c 。【 co s 至 进化博 弈理 论 有 了明确 的研 究 目标 。至今 关于进 化博 弈论 及 其应 用 的研 究 已有丰富 的 结果 。刚进 化博 弈假 定给 出博 弈
> ) , ) 定 义 2 策略 ∈a是 局 部严 格 有效 的 , 果 . 2合策略 ∈a ,令 c△表示 赋 予
作 者 简 介 : 长舟 (97 , 徽 宿 州 人 , 州 大 学 理 学 院硕 士 研 究生 , 究 方 向 为 非 线性 分析 及 应 用 。 单 1 8 -)安 贵 研
第 3期
单 长舟 : 化稳 定 策略在 双 重对 称博 弈 中存在 及证 明 进
( 州大学 理 学院, 州 贵 阳502) 贵 贵 505

要: 通过 对 进化 稳 定 策略 的 刻 画来 对双 重 对称 博 弈 中进化 稳 定 策略 存 在 进行 等 价 证 明 , 出进 化 得
稳 定 策略 存在 的 两个等价 条件 。 关键 词 : 化稳 定 策略 ; 进 双重 对称博 弈 ; 进化博 弈
么 它是 稳态 的 。
定理 2 ( . 自然 选择 基本 定理 ) 4 : 对任 何 双 重对 称
示所 有混 合 策略 的集 合 。 弈方 1 博 采取 策略 ∈A ,
性 博 弈 而 言 , , >0 , - ) 当且 仅 当 戈∈a。 等 号 成 时
立 。[ 2 1
博 弈方 2采 取策 略 Y∈a ,支付 分别 为 xA ,r 。 ryx A 当 二 者交 换 位 置 但 策 略 不 变 时 ,二 者 的支 付 分 别
为 :rx x ,rx x y 即 博 弈 与位 置 没有 关 系 , y =r y =r , A A A A 用支 付矩 阵 A 础 可描 述 进化 博 弈 , A 嫱 A 时 , 就 当 ; 础 博 弈 为双 重对称 博 弈 。 就 是说 随机 个 体 不 仅位 置 也
收 稿 日期 :0 1 1 - 7 2 1 - 1 0
第1 4卷 第 3期 21 0 2年 6月
黄 山 学 院 学 报
J u n lo a g h ie st o r a f Hu n s an Unv r i y
V0 .4 NO. 11 . 3
J n2 2 u .01
进 化稳 定策 略在双重对称博弈中存 在及证 明
单 长 舟
从群 体 中随机抽 取 2个个 体进 行博 弈 。纯策 略集 合
记 为 | {2 s 1 l群体 中采 取 的第 = , 个纯 策略 的 比例
施表示 第 纯策略 的概 率 , △= 个 记 伽∈R , x 1表 : i } =
i∈
定理 22 当且仅 当 是局 部优 越 的 。 .: ∈a麟。 定 理 23 果 一个 状 态 是L a uo 稳 定 的 , . :如 yp nv 那
定 义 21 ∈a是局 部稳定 的 , .: 如果 它有 一个 邻 域 暇 得对 中所 有的 y , #x 有
基 本均 衡概 念— —进 化稳 定 策略 (s ) E s 。此后 , 生态 学 家 T yo 和 Jn e 在 考 察 生 态 演化 现 象 时 首 次 alr okr 提 出 了进 化 博 弈理 论 的 基 本 动 态 概 念 —— 模 仿 者
2 预 备知 识
进 化 博 弈理 论 , 名 思 义 , 由 生物 学 中 关 于 顾 是 进 化 思 想 与 博 弈 理 论 交 叉 而 形 成 的 一 个 新 分 支 领 域 , 先 出现在 生 物学 中 。 1 纪 7 首 9世 0年 代 , 生态 学 家 Man r m t y ad S i h和 Pie提 出 了 进 化 博 弈 理 论 的 r c
n(= , ( 。 x ∑ l ) y ) 。 g
iq) ex yi
对邻域 , 因此根 据 引理 1 是 邻 域 V Q nu 的复 , =x 上
制 子 动态 的严 格 局 ̄ L a u o 函数 。准确 地说 , : B yp nv _ 是 连续 可微 的 , 且仅 当y 尺+ 当 = 有 ∽ = 且矗 0 ∽ < , ∈V。由定理 23得 知 , 0 VY . 策略 是渐进 稳 定 的。 由定理 31知 , 在 只需 由 . 现 ∈A在 复 制子 动 态
中 图分 类号 : 2 5 0 2 文 献标 识码 : A 文章 编号 :62 4 7 2 1 )3 0 0 - 0 1 7 - 4X(0 2 0 - 0 6 0 2
对 称 , 且收 益 一 致 , 对 研 究 许 多博 弈 的社 会 效 而 这
1 引言
率是非 常重要 的 。本文 研 究双重 对称博 弈 。
它有邻 域 礁 得 对 中所 有 策略 y . #x 有 ) > . 定 理 21 ∈A为一 个进 化稳 定 策 略 (s ) .: E s等价

于存 在 的邻 域 U ) ,使得 对任 意 x ∈U )有 #y ,
xA x r r >rAy。
支付 矩 阵
)用 支付 矩阵 A 础 , 描述 进化 博 弈 ,
引理 l假 设 ∈AAy∈ , 么 ∽ >0 当 且 : 那 - , 仅 当y x ̄ = H 等号成 立 。而且
∽ = — , 一 y) -, ) 定 理 31 任 何双 重对 称 博 弈 , 略 ∈△ 当 .: 对 策
.7 .
所 有纯 策略 正 的概 率 的混合 策 略集 合 :
{ ∈A , ) A ) ) , C cc
使 得对 所有 在 △ nU #x 有 :  ̄y ,
ux — ,) o (— y >O y
相对 熵 函数 :
, 义如下 : 定
我们 已经指 出 , 函数 的定 义域 是 的一 个相
相关文档
最新文档