第三章-第五节-演化博弈模型教学内容

合集下载

演化博弈论PPT课件

演化博弈论PPT课件
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与 人最优策略组成。即在给定别人策略的情况下,没有人有足够 理由打破这种均衡。
纳什均衡可以通过划线法得出
13
纳什均衡和演化稳定(1)
a
X b
a 0,0
Y b
1,1
1,1
0,0
策略b是否是演化稳定的? 有一个规模为E的策略a入侵
策略b的平均适应度: (1 E)*0 E *1 E 策略a的平均适应度: (1 E)*1 E*0 1 E
Y/q(1p)2p0
p1/3
18
N-群体的演化稳定策略
定义1:策略组合 x{x1,x2,..x.n,}是纳什均衡, 如果x是演化稳定策略,如果对于任意的策 略组合 yx 存在某个 (0,1) 使得对于所有的
(0,
)
和y(1)x,有
ui(xi, i) ui(yi, i)
i I
i I
定义2:策略组合x是演化稳定策略,当且 仅当x是一个严格的纳什均衡。
:是一个与突变策略y有关的常数,称之为侵入界限; εy + (1 − ε)x:表示选择进化稳定策略群体与选择突变策略群
体所组成的混合群体。
16
演化稳定策略的定义(2)
Definition 2: 对任意的s'∈S×S,满足
(i) f(s,s)≥f(s',s); (ii)如果f(s,s)=f(s',s),那么对任意的s≠s'有 f(s,s)>f(s',s'); 则s是演化稳定策略
➢ 自演化博弈论诞生之日起,它就逐渐的被人们用 来分析生物、经济等领域的问题。
1. Selten Reinhard.A Note on Evolutionary Stable Strategies in Asymmetric Animal Conflicts [J]. Journal of Theoretical Biology, 1980,(84).

演化博弈方法

演化博弈方法

演化博弈方法演化博弈方法是一种理论工具,用来描述在多个个体、组织之间互动的过程中,在适应和合作之间寻求平衡的方式。

演化博弈方法可以帮助我们理解复杂的生物和社会系统,以及它们如何演化和适应。

演化博弈方法的基本概念演化博弈方法的基本概念包括两个相互关联的概念:演化和博弈。

其中演化是指一个物种或个体针对环境的适应性变化,博弈则是指互动参与者追求最大利益的过程。

演化博弈方法的步骤演化博弈方法主要包括以下步骤:1. 设定基本模型演化博弈方法的第一步是确定基本模型。

模型中需要包括参与者的数量、行为选项、收益函数和演化规则等信息。

2. 计算策略的收益演化博弈方法通过计算策略的收益,来分析策略是否能够稳定存在或者演化。

这个过程中需要考虑到参与者的互动和环境的变化。

3. 推导出一组稳定策略在经过多次迭代和优化之后,演化博弈方法可以推导出一组稳定策略,这些策略可以在长期的互动中获得最大利益。

这些策略通常被称为纳什均衡。

4. 分析演化路径演化博弈方法还可以用来分析演化路径,即为什么一种策略会取代另一种策略,以及这个过程是如何进行的。

演化博弈方法的应用演化博弈方法在生物和社会学等领域中都有广泛的应用。

在生物学中,演化博弈方法可以用来研究有机体之间的互动和自然选择。

例如,通过使用演化博弈方法可以研究动物之间的搏斗、求偶和繁殖等行为。

在社会学中,演化博弈方法可以用来研究群体行为和社会结构的演化。

例如,通过使用演化博弈方法可以研究社交网络中的合作、竞争和共存等现象。

总之,演化博弈方法是一种有用的理论工具,可以帮助我们理解复杂的自然和社会系统。

它的应用领域包括生物学、心理学、社会学、经济学等。

演化博弈

演化博弈

Taylor和Jonker提出了演化博弈理论的基本动态概念——复制动态
• 经济学家把演化博弈理论引入到经济学领域,用于分析社会制度变迁、产业演化以及股票 市场等,同时对演化博弈理论的研究也开始由对称博弈向非对称博弈深入,并取得了一定
1980s
的成果
演化博弈的产生与发展
• 演化博弈理论的发展进入了一个新的阶段。Weibull(1995)比较系统、完整地总结了演 1990s 化博弈理论,其中包含了一些最新的理论研究成果。
令xi(t)为t时期博弈方 i 采用策略A的邻居的数量,则xi(t) = 0,1,2.
协调博弈的有限博弈方快速学习模型
初次博弈1个A
A B B B B A B B B A B A A B A A A
B A
A A A
A
A A
初次博弈为相邻两个A
B A A B A B A A A A A
A
A A
B
初次博弈相连3个A
x0x1签协议博弈的复制动态和进化稳定策略进化稳定策略的检验????比例的博弈方偏离同意策略选择了丌同意????????11?????????????1?????0????00????1?????????????????????????1?????2????????1?????0????????????1是演化稳定策略ess????比例的博弈方偏离丌同意策略选择了同意????????1????????????1?????0????00????1?????????????????????????????2????????????0????????????0丌是演化稳定策略11000000同意博弈方2不同意同意不同意博弈方1一般两人对称博弈复制动态和进化稳定策略一般模型aacbddbc策略1博弈方2策略2策略1策略2博弈方1一般2x2对称博弈?进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈

第三章-第五节-演化博弈模型解读

第三章-第五节-演化博弈模型解读
设:群体比例的动态变化速度为
dx x U Y U dt
dx 则: x 2 x3 dt
当x=0时,稳定;
复制动态方程
当x>0时,最终稳定于x*=1
dx/dt
dx x 2 x3 dt
乙 Y 甲 Y N 1,1 0, 0 N 0 ,0 0,0
0
1
图1 签协议博弈的复制动态相位图 x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
在方法论上,它不同于博弈论将重点放在静态均衡
和比较静态均衡上,强调的是一种动态的均衡。演 化博弈理论源于生物进化论。
为什么将演化思想引入到博弈论中?
(1)博弈论对生物学的影响。博弈论的策略对应生
物学中的基因 ,博弈论的收益对应生物学中的 适应度。在生物学中应用的博弈论与经济学中的 传统博弈论最大区别就是非完全理性的选择。 (2)演化化思想对社会科学的影响。例如,在市场 竞争中,我们不必要去理性的想那个策略才是最 优的,最后能够在市场存活下来的企业,一定是
若x<x*,为使x→x*,应满足F(x)>0;
若x>x*,为使x→x*,应满足F(x)<0.
F(x)=dx/dt,t↑,则x↓
F(x)
这意味着:
x* 0 x
当F'(x*)<0,x*为ESS
(三)协调博弈的复制动态和ESS
复制动态方程F(x):
甲 A B
乙 A 50,50 0,49 B 49,0 60,60
x
(二)一般两人对称博弈
甲 S1 S2
乙 S1 a,a c, b S2 b ,c d,d
群体中采用S1的比例为x,S2的比例为1-x,对于甲

博弈论与信息经济学-5.演化博弈

博弈论与信息经济学-5.演化博弈

猎鹿博弈
猎鹿博弈源自启蒙思想家卢梭的著作《论人类不平等的起源和基础》 中的一个故事。 古代的村庄有两个猎人。当地的猎物主要有两种:鹿和兔子。如果 一个猎人单兵作战,一天最多只能打到4只兔子。只有两个一起去才 能猎获一只鹿。从填饱肚子的角度来说,4只兔子能保证一个人4天 不挨饿,而一只鹿却能让两个人吃上10天。
在演化博弈中,认为参与人的选择行为可以依据 前人的经验、学习与模仿他人行为、受遗传因素 的决定等。因而演化博弈把具有主观选择行为的 参与人扩展为包括动物、植物在内的有机体,动 植物参与者的支付可被理解为为某种适应程度。 把博弈论的分析与应用从研究人类的竞争行为扩 展为研究有机体的策略互动关系。这个领域的开 创性工作是由英国生物学家约翰· 梅纳德· 史密斯 (John Maynard Smith)和G.R.普莱斯 (G.R.Price)1973年进行的。演化博弈现在正 逐渐被广泛应用于社会经济学领域。
路径依赖的例子
有人将5只猴子放在一只笼子里,并在笼子中间吊上一串香蕉,只要 有猴子伸手去拿香蕉,就用高压水教训所有的猴子,直到没有一只猴 子再敢动手。 然后用一只新猴子替换出笼子里的一只猴子,新来的猴子不知这 里的“规矩”,竟又伸出上肢去拿香蕉,结果触怒了原来笼子里的4 只猴子,于是它们代替人执行惩罚任务,把新来的猴子暴打一顿,直 到它服从这里的“规矩”为止。 试验人员如此不断地将最初经历过高压水惩戒的猴子换出来,最 后笼子里的猴子全是新的,但没有一只猴子再敢去碰香蕉。 起初,猴子怕受到“株连”,不允许其他猴子去碰香蕉,这是合 理的。 但后来人和高压水都不再介入,而新来的猴子却固守着“不许拿 香蕉”的制度不变,这就是路径依赖的自我强化效应。
路径依赖的例子
一个广为流传、引人入胜的例证是:现代铁路两条铁轨之间的标准距 离是四英尺又八点五英寸。原来,早期的铁路是由建电车的人所设计 的,而四英尺又八点五英寸正是电车所用的轮距标准。那么,电车的 标准又是从哪里来的呢?最先造电车的人以前是造马车的,所以电车 的标准是沿用马车的轮距标准。马车又为什么要用这个轮距标准呢? 英国马路辙迹的宽度是四英尺又八点五英寸,所以,如果马车用其他 轮距,它的轮子很快会在英国的老路上撞坏。这些辙迹又是从何而来 的呢?从古罗马人那里来的。因为整个欧洲,包括英国的长途老路都 是由罗马人为它的军队所铺设的,而四英尺又八点五英寸正是罗马战 车的宽度。 任何其他轮宽的战车在这些路上行驶的话,轮子的寿命都不会很 长。可以再问,罗马人为什么以四英尺又八点五英寸为战车的轮距宽 度呢?原因很简单,这是牵引一辆战车的两匹马屁股的宽度。故事到 此还没有结束。美国航天飞机燃料箱的两旁有两个火箭推进器,因为 这 路径依赖些推进器造好之后要用火车运送,路上又要通过一些隧 道,而这些隧道的宽度只比火车轨道宽一点,因此火箭助推器的宽度 是由铁轨的宽度所决定的。 所以,最后的结论是:路径依赖导致了美国航天飞机火箭助推器 的宽度,竟然是两千年前便由两匹马屁股的宽度所决定的。

演化博弈

演化博弈

基于历史记忆的雪堆博弈
1、模型规则 将N个个体放置与某种网络的节点上 每一轮相互连接的个体同时博弈 个体的总收益是根据收益矩阵与所有邻居
博弈收益之和 一轮博弈结束后个体选择最佳策略更新 个体对于最佳策略具有记忆性,选择某个
策略取决于该策略在记忆中的数量
假设个体的记忆长度有限,长度为M,即上 一时刻到M时刻以前的历史最佳策略,个体 依据自身的历史记忆进行决策:
其中,pc为选择策略c的概率,NC和ND分别为策略C和D的数量 个体不断更新记忆,不断重复博弈,整个系统就会演化下去。
2、二维网格上的演化博弈
(1)主要研究变量
合作频率 fc
记忆长度M 收益参数r
(2)二维网格模拟
网络规模为1000,初始策略C和D各占50%, 并且在网络中随机分配
每个个体的初始记忆随机分配,并且个体 记忆对系统最终稳定行为没有任何影响
2、雪堆博弈
假设铲雪的代价为c, 每个人的好处量化为b,b>c,那么双 方收益矩阵为:
合作
B 背叛
合作 A
背叛
b-c/2, b-c/2 b-c ,b
b ,b-堆博弈中,遇到背叛时选择合作的收益大于 双方都背叛的收益,遇到背叛则选择合作; 个体的最佳策略取决于对手的策略; 相比囚徒困境,合作在雪堆博弈中更容易涌现。
复杂网络上的演化博弈
主要内容
1、群体博弈简介 2、基于历史记忆的雪堆博弈 3、演化博弈动力学与网络结构的共同演化
群体博弈简介
1、囚徒困境
囚徒的选择策略有:合作(坦白)、欺骗(抵赖)
我们可以得到的博弈矩阵为:
囚徒b
T>R>P>S
合作
欺骗
2R>T+S合作

第三章-第五节-演化博弈模型报告

第三章-第五节-演化博弈模型报告
误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策 略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个
稳定的策略。
复制动态实际上是描述某一特定策略在一个种群中被采用 的频数或频度的动态微分方程,可以用下式表示:
d xi dt xi [(usi , x) u ( x, x)]
演化博弈关注的问题
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
在方法论上,它不同于博弈论将重点放在静态均衡
和比较静态均衡上,强调的是一种动态的均衡。演 化博弈理论源于生物进化论。
为什么将演化思想引入到博弈论中?
(1)博弈论对生物学的影响。博弈论的策略对应生
物学中的基因 ,博弈论的收益对应生物学中的 适应度。在生物学中应用的博弈论与经济学中的 传统博弈论最大区别就是非完全理性的选择。 (2)演化化思想对社会科学的影响。例如,在市场 竞争中,我们不必要去理性的想那个策略才是最 优的,最后能够在市场存活下来的企业,一定是
(v-c)/2 鹰 (v-c)/2,
鸽 v ,0 v/2 ,v/2

0 ,v
F x
dx v vc x 1 x x 1 x dt 2 2
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
dx/dt
1/6 0 1
F x
dx x a c 1 x b d x U1 U x 1 x dt
当F(x) =0时,
复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)
稳定性定理
F(x)=dx/dt,t↑,则x↑

sd演化博弈模型

sd演化博弈模型

sd演化博弈模型
SD演化博弈模型(Stochastic Dynamic Evolutionary Game Model)是一种用来描述群体中个体行为演化过程的数学模型。

该模型结合了演化博弈论和随机性的因素,允许个体的行为在一定程度上发生变异和随机选择,从而更真实地反映现实生活中的群体行为演化过程。

在SD演化博弈模型中,每个个体会被赋予一定的策略(也称
为行为)来参与博弈。

个体的策略选择将决定其在博弈中的收益或者支付。

随着时间的推移,个体根据自身的策略和其他个体的策略的效果,可能会调整或者改变自己的策略,以谋求更高的收益。

与传统的演化博弈模型不同,SD演化博弈模型引入了随机性
的因素。

这种随机性可以是由外部环境的不确定性或者个体之间的随机交互所引起的。

随机性使得个体在选择策略时不仅受到自身的收益和其他个体策略的影响,还有一定的随机因素的干扰。

这种随机性的引入可以使模型更能真实地反映群体行为的波动和变化。

SD演化博弈模型在研究群体行为演化的过程中有广泛的应用。

例如,研究不同类型的策略在群体中的竞争优势、稳定状态、持续演化等问题。

这种模型可以帮助我们更好地理解群体行为的形成和演化机制,为实际问题的解决提供理论指导。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
B
50,50 0,49
49,0 60,60
Fxd dxtx1xxac1xbd 当F(x) =0时,x*=0,x*=1,
x1x61x11
x*=11/61为稳定状态
dx/dt
0
11/61
1x
图2 协调博弈的复制动态相位图
可知,当F '(0) <0, F'(1)<0, 而F'(11/61)>0,则
x*=0和x*=1为ESS
为影响。博弈论的策略对应生 物学中的基因 ,博弈论的收益对应生物学中的 适应度。在生物学中应用的博弈论与经济学中的 传统博弈论最大区别就是非完全理性的选择。
(2)演化化思想对社会科学的影响。例如,在市场 竞争中,我们不必要去理性的想那个策略才是最 优的,最后能够在市场存活下来的企业,一定是 适应能力最强的公司。
演化稳定策略的影响因素分析
二、复制动态中的对称博弈

Y
N
(一)签协议博弈
甲Y N
1,1 0, 0
0 ,0 0,0
Y:同意 N:不同意
假设:群体中“Y”的比例为x,“N”的比例为1-x,对于
甲 U Yx11x0x
U Nx01x00
U xU Y 1 x U N x 2
设:群体比例的动态变化速度为
Fxddxt x1xxac1xbd x1xxv2c1x2v
当F(x) =0时,x*=0,x*=1,x*=v/c为稳定状态



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
F xd d x tx1x xv 2c1x2 v
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
F xd d x tx1x xv 2c1x2 v
② 假设v=8,c=8(表示种群间和平共
处所得到的收益等于两者冲突导致的损失)
dx/dt
③ 假设v=8,c=4(表示种群间和平共
处所得到的收益大于两者冲突导致的损失)
dx/dt
1/6 0
1x
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
则ESS为: x*=1/6
当冲突损失严重时,例如c/v=6时,两个种群发生战争的可能性为1/36;和平共处的
可能性为25/36;一方霸道、一方忍让的可能性为10/36。
发生战争的可能性随着c/v比值的增加而降低,即:和平共处的可能性也随着增加。
dx/dt
0
ESS: x*=1
1
x
0
1
x
ESS: x*=1
当c≤v时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因
在于当一方忍让时,另一方可获得更多收益。
这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。
第五节 演化博弈模型
一、演化博弈思想
传统博弈理论的两个苛刻假设: (1)完全理性(2)完全信息
与传统博弈理论不同,演化博弈理论并不要求参与 人是完全理性的,也不要求完全信息的条件。
演化博弈论(Evolutionary Game Theory)把博弈 理论分析和动态演化过程分析结合起来的一种理论。 在方法论上,它不同于博弈论将重点放在静态均衡 和比较静态均衡上,强调的是一种动态的均衡。演 化博弈理论源于生物进化论。
这意味着: 当初始x<11/61时,ESS为x*=0; 当初始x>11/61时,ESS 为x*=1.
(四)鹰鸽博弈的复制动态和ESS



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
令x为采用“鹰”策略的群体比例,1-x为采用“鸽”策略的群体比 例 则复制动态方程F(x):
则: dx x2 x3
dx dt
xUY
U
dt
当x=0时,稳定;
复制动态方程 当x>0时,最终稳定于x*=1
dx/dt
dx x2 x3
dt
甲Y
N

Y
N
1,1
0 ,0
0, 0
0,0
0
1x
图1 签协议博弈的复制动态相位图
x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
(二)一般两人对称博弈
甲 S1 S2

S1
S2
a,a
b ,c
c, b
d,d
群体中采用S1的比例为x,S2的比例为1-x,对于甲
U1xa1xb
U2xc1xd UxU 11xU 2
则复制动态方程F(x):
Fxddxt xU1U x 1 x x a c 1 x b d
当F(x) =0时, 复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)
在演化博弈理论中,演化稳定策略 (Evolutionary Stable Strategy, ESS)和复制动态(Replication Dynamics)是两个核 心概念。演化稳定策略是指在博弈的过程中,博弈双方由于有 限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。 于是,博弈方在博弈的过程中需要不断进行学习,有过策略失 误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策 略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个 稳定的策略。
复制动态实际上是描述某一特定策略在一个种群中被采用 的频数或频度的动态微分方程,可以用下式表示:
dxi dt
xi[(usi ,x)u(x,x)]
演化博弈关注的问题
当时间趋于无穷大时,博弈参与方策略选择行为是怎样的? 这就是演化博弈稳定性问题,一个稳定状态必须对微小扰 动具有稳健性才能称为演化稳定策略。也就是说,如果我 们假定为演化稳定策略的稳定点,则该点除了本身必须是 均衡状态以外,还必须具有这样的性质:如果某些博弈方 由于偶然的错误偏离了它们,复制动态仍然会使x回复到 x*。在数学上,这相当于要求:当干扰使x低于时x* , dx/dt必须大于0;当干扰使得x出现高于时x*, dx/dt必 须小于0,这就要求这些稳定状态处于的导数必须小于0。
稳定性定理
F(x)=dx/dt,t↑,则x↑
若x<x*,为使x→x*,应满足F(x)>0; 若x>x*,为使x→x*,应满足F(x)<0.
F(x)
F(x)=dx/dt,t↑,则x↓
x* 0
这意味着: 当F'(x*)<0,x*为ESS
x
(三)协调博弈的复制动态和ESS

A
B
复制动态方程F(x):
A 甲
相关文档
最新文档