第三章-第五节-演化博弈模型

合集下载

演化博弈论PPT课件

演化博弈论PPT课件
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与 人最优策略组成。即在给定别人策略的情况下,没有人有足够 理由打破这种均衡。
纳什均衡可以通过划线法得出
13
纳什均衡和演化稳定(1)
a
X b
a 0,0
Y b
1,1
1,1
0,0
策略b是否是演化稳定的? 有一个规模为E的策略a入侵
策略b的平均适应度: (1 E)*0 E *1 E 策略a的平均适应度: (1 E)*1 E*0 1 E
Y/q(1p)2p0
p1/3
18
N-群体的演化稳定策略
定义1:策略组合 x{x1,x2,..x.n,}是纳什均衡, 如果x是演化稳定策略,如果对于任意的策 略组合 yx 存在某个 (0,1) 使得对于所有的
(0,
)
和y(1)x,有
ui(xi, i) ui(yi, i)
i I
i I
定义2:策略组合x是演化稳定策略,当且 仅当x是一个严格的纳什均衡。
:是一个与突变策略y有关的常数,称之为侵入界限; εy + (1 − ε)x:表示选择进化稳定策略群体与选择突变策略群
体所组成的混合群体。
16
演化稳定策略的定义(2)
Definition 2: 对任意的s'∈S×S,满足
(i) f(s,s)≥f(s',s); (ii)如果f(s,s)=f(s',s),那么对任意的s≠s'有 f(s,s)>f(s',s'); 则s是演化稳定策略
➢ 自演化博弈论诞生之日起,它就逐渐的被人们用 来分析生物、经济等领域的问题。
1. Selten Reinhard.A Note on Evolutionary Stable Strategies in Asymmetric Animal Conflicts [J]. Journal of Theoretical Biology, 1980,(84).

演化博弈方法

演化博弈方法

演化博弈方法演化博弈方法是一种理论工具,用来描述在多个个体、组织之间互动的过程中,在适应和合作之间寻求平衡的方式。

演化博弈方法可以帮助我们理解复杂的生物和社会系统,以及它们如何演化和适应。

演化博弈方法的基本概念演化博弈方法的基本概念包括两个相互关联的概念:演化和博弈。

其中演化是指一个物种或个体针对环境的适应性变化,博弈则是指互动参与者追求最大利益的过程。

演化博弈方法的步骤演化博弈方法主要包括以下步骤:1. 设定基本模型演化博弈方法的第一步是确定基本模型。

模型中需要包括参与者的数量、行为选项、收益函数和演化规则等信息。

2. 计算策略的收益演化博弈方法通过计算策略的收益,来分析策略是否能够稳定存在或者演化。

这个过程中需要考虑到参与者的互动和环境的变化。

3. 推导出一组稳定策略在经过多次迭代和优化之后,演化博弈方法可以推导出一组稳定策略,这些策略可以在长期的互动中获得最大利益。

这些策略通常被称为纳什均衡。

4. 分析演化路径演化博弈方法还可以用来分析演化路径,即为什么一种策略会取代另一种策略,以及这个过程是如何进行的。

演化博弈方法的应用演化博弈方法在生物和社会学等领域中都有广泛的应用。

在生物学中,演化博弈方法可以用来研究有机体之间的互动和自然选择。

例如,通过使用演化博弈方法可以研究动物之间的搏斗、求偶和繁殖等行为。

在社会学中,演化博弈方法可以用来研究群体行为和社会结构的演化。

例如,通过使用演化博弈方法可以研究社交网络中的合作、竞争和共存等现象。

总之,演化博弈方法是一种有用的理论工具,可以帮助我们理解复杂的自然和社会系统。

它的应用领域包括生物学、心理学、社会学、经济学等。

第三章-第五节-演化博弈模型解读

第三章-第五节-演化博弈模型解读
设:群体比例的动态变化速度为
dx x U Y U dt
dx 则: x 2 x3 dt
当x=0时,稳定;
复制动态方程
当x>0时,最终稳定于x*=1
dx/dt
dx x 2 x3 dt
乙 Y 甲 Y N 1,1 0, 0 N 0 ,0 0,0
0
1
图1 签协议博弈的复制动态相位图 x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
在方法论上,它不同于博弈论将重点放在静态均衡
和比较静态均衡上,强调的是一种动态的均衡。演 化博弈理论源于生物进化论。
为什么将演化思想引入到博弈论中?
(1)博弈论对生物学的影响。博弈论的策略对应生
物学中的基因 ,博弈论的收益对应生物学中的 适应度。在生物学中应用的博弈论与经济学中的 传统博弈论最大区别就是非完全理性的选择。 (2)演化化思想对社会科学的影响。例如,在市场 竞争中,我们不必要去理性的想那个策略才是最 优的,最后能够在市场存活下来的企业,一定是
若x<x*,为使x→x*,应满足F(x)>0;
若x>x*,为使x→x*,应满足F(x)<0.
F(x)=dx/dt,t↑,则x↓
F(x)
这意味着:
x* 0 x
当F'(x*)<0,x*为ESS
(三)协调博弈的复制动态和ESS
复制动态方程F(x):
甲 A B
乙 A 50,50 0,49 B 49,0 60,60
x
(二)一般两人对称博弈
甲 S1 S2
乙 S1 a,a c, b S2 b ,c d,d
群体中采用S1的比例为x,S2的比例为1-x,对于甲

演化博弈论

演化博弈论

混合策略的演化稳定性
胆小鬼博弈
Y
a(q)
b(1-q)
混合策略纳什均衡 ((1/3,2/3),(1/3,2/3))
a(p) 0,0
2,1
X pq*0 p(1 q)*2 (1 p)q*1 (1 p)(1 q)*0
X b(1-p) 1,2
0,0
X / p (1 q)*2 q 0 q 1/3
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与 人最优策略组成。即在给定别人策略的情况下,没有人有足够 理由打破这种均衡。
纳(1)
a
X b
a 0,0
Y b
1,1
1,1
0,0
策略b是否是演化稳定的? 有一个规模为E的策略a入侵
策略b的平均适应度: (1 E)*0 E *1 E 策略a的平均适应度: (1 E)*1 E *0 1 E
演化博弈论
演讲人: 杜 同 学 号:S201111054
演化博弈论
➢ 第一章 演化博弈论的概述 ➢ 第二章 演化稳定策略 ➢ 第三章 复制子动态 ➢ 第四章 应用案例 ➢ 第五章 前沿介绍
第一章 演化博弈论概述
什么是演化博弈论(1)
传统博弈理论的两个苛刻假设: (1)完全理性(2)完全信息
如果(S,S)不是纳什均衡,那 么S不是演化稳定策略
纳什均衡和演化稳定(2)
a
X b
a 1,1
Y b
0,0
0,0
0,0
策略b是否是演化稳定的? 有一个规模为E的策略b入侵
策略b的平均适应度: (1 E)*0 E *0 0
策略a的平均适应度:
(1 E)*0 E *1 E
如果(S,S)是严格的纳 什均衡,那么S是演化稳

演化博弈

演化博弈


ቤተ መጻሕፍቲ ባይዱ
预先规定好的要素博弈如何确定?既然大家 都是有限理性,那由谁来规定要素博弈的结 构和规则(是人为设计的,还是自发演化形 成的) 现有的一些学习模型是否与现实中群体的理 性水平相符? 对于超出2维空间的动态系统以及非线性系 统难于进行稳定性分析(恰好体现了人的认 知能力有限理性)。
我们以一个简单的“签协议博弈” 为例,说明学习速度很慢、理性层次较 低的有限理性博弈方通过模仿学习博弈 和调整策略的复制动态和策略稳定性。
经济活动中的各种合作都可以用签协 议来代表,因为一旦签订协议,那么重 要的经济合作就有了保证。下图中得益 矩阵表示的就是一个关于签协议的博弈。
博弈方2
同意 博 弈 方 1 同意 不同意 不同意



有限理论博弈的有限分析框架是有限理论博弈方构成的, 一定规模的特定群体内成员的某种反复博弈。 例如某个由缺乏足够预见性的个体组成的小群体,其成 员都对当前局面做出反应,或者相互学习、模仿邻居的 优势策略的情况。也可以是在大量博弈方组成的群体中 成员之间随机配对的反复博弈,相当于现实经济中对象 或伙伴不固定的,多个或大量个体之间的较长经济关系。 这些分析框架通常假设博弈方有一定的统计分析能力和 对不同策略效果的判断能力,但没有事先的预见能力和 预测能力。这种分析框架和人们在享受决策活动中的实 际行为模式是比较接近的。

有限理性意味着博弈方往往不会一开始就找到 最优策略,会在博弈过程中学习博弈,必须通 过试错寻找较好的策略;有限理性也意味着均 衡是不断调整和改进而不是一次性选择的结果, 而且即使达到了均衡也可能再次偏离。
三、有限理性下的博弈分析
1、有限理性博弈分析的目标


A.放宽参与者严格的理性要求,分析有限理性 的参与者通过各种学习过程,如何达到稳定的 均衡状态。 B.有限理性博弈分析主要解决:不同条件下具 体的学习过程(构建的学习模型体现了理性的 不同要求)、学习调整过程中均衡的稳定性 (运用稳定性理论,分析原Nash均衡是否收 敛)。

第三章-第五节-演化博弈模型报告

第三章-第五节-演化博弈模型报告
误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策 略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个
稳定的策略。
复制动态实际上是描述某一特定策略在一个种群中被采用 的频数或频度的动态微分方程,可以用下式表示:
d xi dt xi [(usi , x) u ( x, x)]
演化博弈关注的问题
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
在方法论上,它不同于博弈论将重点放在静态均衡
和比较静态均衡上,强调的是一种动态的均衡。演 化博弈理论源于生物进化论。
为什么将演化思想引入到博弈论中?
(1)博弈论对生物学的影响。博弈论的策略对应生
物学中的基因 ,博弈论的收益对应生物学中的 适应度。在生物学中应用的博弈论与经济学中的 传统博弈论最大区别就是非完全理性的选择。 (2)演化化思想对社会科学的影响。例如,在市场 竞争中,我们不必要去理性的想那个策略才是最 优的,最后能够在市场存活下来的企业,一定是
(v-c)/2 鹰 (v-c)/2,
鸽 v ,0 v/2 ,v/2

0 ,v
F x
dx v vc x 1 x x 1 x dt 2 2
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
dx/dt
1/6 0 1
F x
dx x a c 1 x b d x U1 U x 1 x dt
当F(x) =0时,
复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)
稳定性定理
F(x)=dx/dt,t↑,则x↑

演化博弈

演化博弈

Taylor和Jonker提出了演化博弈理论的基本动态概念——复制动态
• 经济学家把演化博弈理论引入到经济学领域,用于分析社会制度变迁、产业演化以及股票 市场等,同时对演化博弈理论的研究也开始由对称博弈向非对称博弈深入,并取得了一定
1980s
的成果
演化博弈的产生与发展
• 演化博弈理论的发展进入了一个新的阶段。Weibull(1995)比较系统、完整地总结了演 1990s 化博弈理论,其中包含了一些最新的理论研究成果。
则竞争者群体的复制动态方程F1(x):
dx/dt dx/dt 1 x y=1/2 y>1/2 1 dx/dt
x 1 x
y<1/2
复制动态中的非对称博弈
对于博弈方2: 博弈方2 打击 博 弈 方 1 容忍
进入
不进
0, 0
1, 5
2, 2
1, 5
则在位者群体的复制动态方程F2(y):dy/dt 1 x演化博弈的基本分析过程
一般的演化博弈模型的建立主要基于两个方面:选择(Selection)和突变 (Mutation)。 选择是指能够获得较高支付的策略在以后将被更多的参与者采用;突变 是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的 策略,也可能是获得较低支付的策略)。 突变其实也是一种选择,但只有好的策略才能生存下来。突变是一种不 断试错的过程,也是一种学习与模仿的过程,这个过程是适应性且是不断改进 的。
目录页
PART TWO
最优反应动态
协调博弈的有限博弈方快速学习模型
模型: 博 弈 A 方 B 1 博弈方2 A B 50,50 49,0 0,49 60,60 协调博弈
1 5 4 3 2
5个博弈方,相邻者彼此博弈,初始策略组合为32种。

演化博弈论

演化博弈论

演化博弈论演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

在理论应符合现实意义上,该理论对于生物学以及各种社会科学尤其是经济学,均大有用场。

演化博弈理论最早源于Fisher,Hamilton,Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。

但直到Smith andPrice(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后,才标志着演化博弈理论的正式诞生。

生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic),这是演化博弈理论的又一次突破性发展。

模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。

编辑本段主要应用领域演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科,是证券投资研究的一个具有生命力和丰富内涵的新领域。

与现代金融学的“理性人”、“有效市场”相关假设不同,演化证券学重视对“生物本能”和“竞争与适应”的研究,强调人性和市场环境在股市演化中的重要地位,是揭示股市生存法则最有潜力的前沿科学。

其开山之作《股市真面目》颠覆了股市运行机理的传统理论,可称为达尔文式的范式革命。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

A
20
进入 A
不进
B 打击
0 ,0
1 ,5
不打击
2 ,2 1 ,5
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
在位者群体的复制动态方程: F B y d d y t y U B s U B y 1 y 2 x
在位者的群体复制动态相位图为:
A
18
进入 A
不进
B 打击
0 ,0
1 ,5
不打击
2 ,2 1 ,5
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
竞争者群体的复制动态方程: F A x d d x t x U A e U A x 1 x 1 2 y
竞争者的群体复制动态相位图为:
m-z ,1-m
1-m,m-z
0 ,0
➢ m、P为求偶成功的概率 ➢ z为机会成本(体力消耗、危险性等)
满足:m ∈ (0.5,1],m<P≤1
令x为采用“鸣”策略的群体比例,1-x为采用“不鸣”策略的群体 比例 则复制动态方程F(x):
F xd d x tx1 x m z 1 P x
稳定状态:x*=0,x*=1,x*=(m-z)/(1-P)
则: dx x2 x3
dx dt
xUY
U
dt
当x=0时,稳定;
复制动态A方程
当x>0时,最终稳定于x*6=1
dx/dt
dx x2 x3
dt
甲Y
N

Y
N
1,1
0 ,0
0, 0
0,0
0
1x
图1 签协议博弈的复制动态相位图
x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
Fxddxt x1xxac1xbd x1xxv2c1x2v
当F(x) =0时,x*=0,x*=1,x*=v/c为稳定状态
A
11



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
F xd d x tx1x xv 2c1x2 v
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
A
7
(二)一般两人对称博弈
甲 S1 S2

S1
S2
a,a
b ,c
c, b
d,d
群体中采用S1的比例为x,S2的比例为1-x,对于甲
U1xa1xb
U2xc1xd UxU 11xU 2
则复制动态方程F(x):
Fxddxt xU1U x 1 x x a c 1 x b d
当F(x) =0时,
dx/dt
0
ESS: x*=1
1
x
0
1v时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原
因在于当一方忍让时,另一方可获得更多收益。
A
这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。
13
(四)蛙鸣博弈的复制动态和ESS
蛙鸣 A 不鸣
蛙B

不鸣
P-z ,P-z
复制动态实际上是描述某一特定策略在一个种群中被采用 的频数或频度的动态微分方程,可以用下式表示:
dxi dt
xi[(usi ,x)u(x,x)]
A
4
演化博弈关注的问题
当时间趋于无穷大时,博弈参与方策略选择行为是怎样的? 这就是演化博弈稳定性问题,一个稳定状态必须对微小扰 动具有稳健性才能称为演化稳定策略。也就是说,如果我 们假定为演化稳定策略的稳定点,则该点除了本身必须是 均衡状态以外,还必须具有这样的性质:如果某些博弈方 由于偶然的错误偏离了它们,复制动态仍然会使x回复到 x*。在数学上,这相当于要求:当干扰使x低于时x* , dx/dt必须大于0;当干扰使得x出现高于时x*, dx/dt必 须小于0,这就要求这些稳定状态处于的导数必须小于0。
B:“打击”的群体比例为y “不打击”的群体比例为1-y
对A而言: U A e y 0 1 y 2 2 2 y
U A ny11y11
U A x U A e 1 x U A n 2 x 1 y 1 x
则竞争者群体的复制动态方程FA(x):
F A x d d x t x U A e U A x 1 x 1 2 y
(一) 市场阻入博弈
有两个群体:竞争者和在位者
竞争者
不进入
进入
竞 进入 争 者 不进
在位者
打击
不打击
0 ,0
2 ,2
1 ,5
1 ,5
(1,5) 打击
在位者 不打击
(0,0) (2,2)
A
17
采用A表示竞争者,B表示在位者
B
打击
不打击
进入 A
不进
0 ,0 1 ,5
2 ,2 1 ,5
假设:
A:“进入”的群体比例为x “不进”的群体比例为1-x
dy/dt
dy/dt
0
1y
(a) x=0 y*∈[0,1]
0
1y
(b) x≠0
ESS: y*=0
A
21
进入 A
不进
B 打击
0 ,0
1 ,5
不打击
2 ,2 1 ,5
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例
dx/dt
1/6 0
1x
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
则ESS为: x*=1/6
当冲突损失严重时,例如c/v=6时,两个种群发生战争的可能性为1/36;和平共处
的可能性为25/36;一方霸道、一方忍让的可能性为10/36。
发生战争的可能性随着c/v比值的增加而A降低,即:和平共处的可能性也随着1增2 加。



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
F xd d x tx1x xv 2c1x2 v
② 假设v=8,c=8(表示种群间和平共
处所得到的收益等于两者冲突导致的损失)
dx/dt
③ 假设v=8,c=4(表示种群间和平共
处所得到的收益大于两者冲突导致的损失)
dx/dt
dx/dt
0
1
x
0
1
x
ESS: x*=0
ESS: x*=1
显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫”。 当“鸣叫”的收益大于群体鸣叫而个别A雄蛙“搭便车”的收益时,所有雄蛙都16将鸣
叫。
三、复制动态中的非对称博弈
➢ 对称博弈:相似/相同群体中的演化博弈行为 ➢ 非对称博弈:不同群体间的演化博弈行为
对B而言: U B s x0 1 x 5 5 5 x
U B n x2 1 x 5 5 3 x
U B y U B s 1 y U B n 5 2 x y 3 x
则在位者群体的复制动态方程FB(x):
F B y d d y t y U B s U B y 1 y 2 x
x*=0和x*=1为ESS
这意味着: 当初始x<11/61时,ESS为x*=0; 当初始x>11/61时,ESS 为1x0*=1.
(四)鹰鸽博弈的复制动态和ESS



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
令x为采用“鹰”策略的群体比例,1-x为采用“鸽”策略的群体比 例 则复制动态方程F(x):
dx/dt
dx/dt
dx/dt
0
1x
(a) y=1/2 x*∈[0,1]
0
1x
(b) y>1/2 ESS: x*=0
A
0
1x
(c) y<1/2 ESS: x*=1
19
进入 A
不进
B 打击
0 ,0
1 ,5
不打击
2 ,2 1 ,5
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
A
3
在演化博弈理论中,演化稳定策略 (Evolutionary Stable Strategy, ESS)和复制动态(Replication Dynamics)是两个核 心概念。演化稳定策略是指在博弈的过程中,博弈双方由于有 限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。 于是,博弈方在博弈的过程中需要不断进行学习,有过策略失 误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策 略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个 稳定的策略。
当个别雄蛙“搭便车”的收益大于群体雄蛙“鸣叫”所获得的收益时,则总会存
A
15
在搭便车“不鸣叫”的雄蛙。
蛙鸣 A 不鸣
蛙B

不鸣
P-z ,P-z
m-z ,1-m
1-m,m-z
0 ,0
② 若(m-z)/(1-P) <0,即z>m
F xd d x tx1 x m z 1 P x
③ 若(m-z)/(1-P) >1,即m-z>1-P
若简化问题分析,令v1=10,v2=2,c=12


相关文档
最新文档