演化博弈论基础资料
博弈13:演化博弈

博弈方的学习速度很慢,理性层次较低,
而且成员组数目众多,博弈是动态、多次的。
5.3 复制动态和演化稳定性:两人对称博弈
演化博弈的动态模型:
演化博弈基本的选择动态(selection dynamics)表述为:
(t ) (t ) g ( ) i i i
其中θi(t)表示在t时刻选择策略i的个体在群体中所占比例;函数 gi(θ )表示某种具体选择过程,不同学习机制对应不同函数。
1973年,他和乔治·普瑞
斯一起在著名的《自然》 杂志上发表题为《动物冲 突的逻辑》一文。 与博弈论》,被公认为演 化博弈论之父。
1982年出版了著作《演化
•2003年出版了他最后一本著作 ——《动物信号发射》 (与大卫哈珀尔合著),为其学术生涯画上了一个圆 满的句号。
•2004年4月19日,梅纳德· 史密斯在他的书桌前 溘然长逝。
选择动态的基本特征:当初始状态下没有人采取某一纯策略i时 ,则永远不会被采用;参与者只能模仿那些已经存在的策略,即没 有反映出突变机制。
i (t ) 0 i (t ) 0
博弈方策略类型比例动态变化是演化博弈分析的 核心,其关键是动态变化的速度(方向可以用速度的 正负号来反映)。动态变化的速度取决于博弈方学习 模仿的速度。一般情况下,学习速度取决于两个因素 :一是模仿对象的数量大小(可以用相应类型博弈方 的比例表示),这关系到观察和模仿的难易程度;二 是模仿对象的程度(可以用模仿对象策略得益超过平 均得益的大小来表示),这关系到判断差异难易程度 和对模仿激励的大小。
5.2最优反应动态
假定博弈方具有相当快的学习能力,虽然在复杂局面下准 确判断分析和运用预见性的能力稍差,但它们能对不同策 略的结果作出比较正确的事后评估,并相应调整策略。 因此给定前期的经验(博弈结果),各个博弈方在本期才 能找到和采用针对前斯其他博弈方策略的最佳反应策略。 最适合描述这种理性层次博弈方的策略调整的动态机制, 这就是所谓的“最优反应动态”。
第八章--演化博弈--《博弈论与经济》-PPT课件(2024版)

A
a1 0
0 a2
▪ 1. a1 0, a2 。0
▪ 由表2-1知,此时该博弈的纯纳什均衡为 (e1, e1) ,(e2,e2) 及
▪ 混合策略纳什均衡 X ( a2 , a1 ) ,Y ( a2 , a1 )
a1 a2 a1 a2
a1 a2 a1 a2
▪ 该博弈有2个ESS,e1 与 e2 。
k
▪ 必有 E(e1, X ) E(e2, X ) E(ek , X ) C ,否则, E(X , X ) xiE(ei, X ) ,与 i 1
▪ (*)相矛盾。这样 ,
▪
k
E( X , X ) C xi C E(ei , X )
i 1
, i 1,2,,k
.
▪ 性质2 设 Y 为单总体演化博弈 G 的ESS, X 为 G 的纳什均衡策
▪ 由定理8.1的1阶最优反应条件(1)知,若 X为ESS ,X 必为纳什均衡 策略。
▪ 命题8.1 若 (X, X) 为G的严格纳什均衡,则 X 为ESS。 ▪ 例8.1 在囚徒困境问题中,(坦白,坦白)是严格纳什均
衡,因而“坦白”是ESS。它表明演化稳定性并不排除低 效率均衡策略。 ▪ 命题8.2对单总体演化博弈的支付矩阵 A 进行局部变换,即 任何一列加上一个常数,ESS不变。 ▪ 命题8.2成立的原因是ESS可由支付差所决定。
参与人1的支付矩阵。由于 E(X ,Y ) 关于X 与 Y 是双线性的,即 E(X ,Y ) 满足
▪ E(aX1 bX2 , cY1 dY2 ) acE(X1,Y1) adE(X1,Y2 ) bcE(X2 ,Y1) bdE(X2 ,Y2 ) ,
▪ 因而(1)等价于 ▪ E(X ,Y) (1 )E(X , X ) E(Y,Y) (1 )E(Y, X )
演化博弈论__谢识予__ppt

一般2*2对称博弈
dx/dt
复制动态进化博弈的结果 常常取决与带有很大偶然 性的初始状态。
1 x
11/16
5.3.4 鹰鸽博弈的复制动态 和进化稳定策略
博弈方2 鹰
vc 2
鸽 v, 0
v 2
鹰 鸽
, vc
2
0, v
,
v 2
鹰鸽博弈
复制动态方程和相位图
dx x(v c) (1 x)v F ( x) x(1 x)[ ] dt 2 2
(m-z)/(1-P) 1
x
(m-z)/(1-P)<0 0<(m-z)/(1-P)<1
dx/dt
1
x
(m-z)/(1-P)>1
5.4 复制动态和进化稳定性: 两人非对称博弈
5.4.1 市场阻入博弈的复制动态 和进化稳定策略 5.4.2 非对称鹰鸽博弈的进化分析
5.4.1 市场阻入博弈的复制动态和进化稳定策略
最优反应动态模拟
博弈方1 博弈方2
1 2.5 3 2 1.5 1.75
1 2 收敛条件 | dr || dr | 1
dq2
dq1
问题:两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略
dy/dt
1 x
x=0
dy/dt
1
x
x=0
两群体复制动态的关系和稳定性
y 1
演化博弈论考试题及答案

演化博弈论考试题及答案一、单选题(每题2分,共20分)1. 演化博弈论中,哪种类型的博弈模型是研究个体策略如何随时间演化的?A. 静态博弈B. 动态博弈C. 演化博弈D. 重复博弈答案:C2. 在演化博弈论中,哪种选择压力可以导致策略的演化?A. 随机漂移B. 突变C. 自然选择D. 以上都是答案:D3. 演化博弈论中的“复制动态”是指什么?A. 策略的随机复制B. 策略的有性复制C. 策略的无性复制D. 策略的遗传复制答案:C4. 演化博弈论中,哪种类型的均衡是策略演化的稳定结果?A. 纳什均衡B. 演化稳定策略(ESS)C. 支配策略均衡D. 子博弈完美均衡答案:B5. 在演化博弈论中,哪种策略被认为是不可被其他策略入侵的?A. 优势策略B. 劣势策略C. 演化稳定策略(ESS)D. 混合策略答案:C6. 演化博弈论中,哪种模型可以用来描述个体之间的策略互动?A. 群体模型B. 个体模型C. 空间模型D. 以上都是答案:D群体中的分布?A. 无限群体模型B. 有限群体模型C. 空间群体模型D. 以上都是答案:D8. 演化博弈论中,哪种类型的模型可以模拟个体策略在空间上的分布?A. 无限群体模型B. 有限群体模型C. 空间群体模型D. 以上都是答案:C间点的分布?A. 无限群体模型B. 有限群体模型C. 动态群体模型D. 以上都是答案:C10. 在演化博弈论中,哪种类型的模型可以模拟个体策略在不同时间点和空间上的分布?A. 无限群体模型B. 有限群体模型C. 空间动态群体模型D. 以上都是答案:C二、多选题(每题3分,共15分)1. 演化博弈论中,以下哪些因素可以影响策略的演化?A. 突变B. 随机漂移C. 自然选择D. 社会学习答案:A, B, C, D2. 在演化博弈论中,以下哪些是演化稳定策略(ESS)的特点?A. 不可被其他策略入侵B. 可以被其他策略入侵C. 一旦形成,不易被替代D. 需要所有个体都采取答案:A, C3. 演化博弈论中,以下哪些模型可以用来描述个体策略的演化?A. 复制动态模型B. 适应度景观模型C. 贝叶斯网络模型D. 马尔可夫链模型答案:A, B, D4. 在演化博弈论中,以下哪些因素可以导致策略分布的变化?A. 策略的适应度差异B. 策略的传播机制C. 环境的变化D. 个体的随机行为答案:A, B, C, D5. 演化博弈论中,以下哪些是群体模型的特点?A. 个体策略的分布是连续的B. 个体策略的分布是离散的C. 群体大小可以是无限的D. 群体大小可以是有限的答案:B, C, D三、判断题(每题2分,共20分)1. 演化博弈论只研究动物行为,不涉及人类行为。
演化博弈论

• 演化博弈的发展出现了一些新的思路,对演化稳定策略和合作演化 博弈的研究不断深入,学者开始关注带有随机因素影响的演化过程。
21世纪 进入2l世纪以来,国内的学者也开始关注演化博弈论,也做出了大 量的研究。
如果(S,S)不是纳什均衡,那 么S不是演化稳定策略
纳什均衡和演化稳定(2)
a
X b
a 1,1
Y b
0,0
0,0
0,0
策略b是否是演化稳定的? 有一个规模为E的策略b入侵
策略b的平均适应度: (1 E)*0 E *0 0
策略a的平均适应度:
(1 E)*0 E *1 E
如果(S,S)是严格的纳 什均衡,那么S是演化稳
•
pi [ u(ei , x) ] pi (1)
对恒等式 p(t)xi (t) pi (t) 两边求t的导数 得:
•
•
•
p xi pi p xi (2)
将式(1)带入(2)中,稍加整理可得:
•
xi [u(ei , x) u(x, x)]xi (3)
式(3)说明: 采用策略i的总 体比例的增长 率 等于策略收
与传统博弈理论不同,演化博弈理论并不要求参 与人是完全理性的,也不要求完全信息的条件。
演化博弈论(Evolutionary Game Theory)把博弈 理论分析和动态演化过程分析结合起来的一种理 论。在方法论上,它不同于博弈论将重点放在静 态均衡和比较静态均衡上,强调的是一种动态的 均衡。演化博弈理论源于生物进化论。
0
X*
1
x
标准的N总体复制子动态
演化博弈

ቤተ መጻሕፍቲ ባይዱ
预先规定好的要素博弈如何确定?既然大家 都是有限理性,那由谁来规定要素博弈的结 构和规则(是人为设计的,还是自发演化形 成的) 现有的一些学习模型是否与现实中群体的理 性水平相符? 对于超出2维空间的动态系统以及非线性系 统难于进行稳定性分析(恰好体现了人的认 知能力有限理性)。
我们以一个简单的“签协议博弈” 为例,说明学习速度很慢、理性层次较 低的有限理性博弈方通过模仿学习博弈 和调整策略的复制动态和策略稳定性。
经济活动中的各种合作都可以用签协 议来代表,因为一旦签订协议,那么重 要的经济合作就有了保证。下图中得益 矩阵表示的就是一个关于签协议的博弈。
博弈方2
同意 博 弈 方 1 同意 不同意 不同意
有限理论博弈的有限分析框架是有限理论博弈方构成的, 一定规模的特定群体内成员的某种反复博弈。 例如某个由缺乏足够预见性的个体组成的小群体,其成 员都对当前局面做出反应,或者相互学习、模仿邻居的 优势策略的情况。也可以是在大量博弈方组成的群体中 成员之间随机配对的反复博弈,相当于现实经济中对象 或伙伴不固定的,多个或大量个体之间的较长经济关系。 这些分析框架通常假设博弈方有一定的统计分析能力和 对不同策略效果的判断能力,但没有事先的预见能力和 预测能力。这种分析框架和人们在享受决策活动中的实 际行为模式是比较接近的。
有限理性意味着博弈方往往不会一开始就找到 最优策略,会在博弈过程中学习博弈,必须通 过试错寻找较好的策略;有限理性也意味着均 衡是不断调整和改进而不是一次性选择的结果, 而且即使达到了均衡也可能再次偏离。
三、有限理性下的博弈分析
1、有限理性博弈分析的目标
A.放宽参与者严格的理性要求,分析有限理性 的参与者通过各种学习过程,如何达到稳定的 均衡状态。 B.有限理性博弈分析主要解决:不同条件下具 体的学习过程(构建的学习模型体现了理性的 不同要求)、学习调整过程中均衡的稳定性 (运用稳定性理论,分析原Nash均衡是否收 敛)。
博弈论与信息经济学-5.演化博弈

猎鹿博弈
猎鹿博弈源自启蒙思想家卢梭的著作《论人类不平等的起源和基础》 中的一个故事。 古代的村庄有两个猎人。当地的猎物主要有两种:鹿和兔子。如果 一个猎人单兵作战,一天最多只能打到4只兔子。只有两个一起去才 能猎获一只鹿。从填饱肚子的角度来说,4只兔子能保证一个人4天 不挨饿,而一只鹿却能让两个人吃上10天。
在演化博弈中,认为参与人的选择行为可以依据 前人的经验、学习与模仿他人行为、受遗传因素 的决定等。因而演化博弈把具有主观选择行为的 参与人扩展为包括动物、植物在内的有机体,动 植物参与者的支付可被理解为为某种适应程度。 把博弈论的分析与应用从研究人类的竞争行为扩 展为研究有机体的策略互动关系。这个领域的开 创性工作是由英国生物学家约翰· 梅纳德· 史密斯 (John Maynard Smith)和G.R.普莱斯 (G.R.Price)1973年进行的。演化博弈现在正 逐渐被广泛应用于社会经济学领域。
路径依赖的例子
有人将5只猴子放在一只笼子里,并在笼子中间吊上一串香蕉,只要 有猴子伸手去拿香蕉,就用高压水教训所有的猴子,直到没有一只猴 子再敢动手。 然后用一只新猴子替换出笼子里的一只猴子,新来的猴子不知这 里的“规矩”,竟又伸出上肢去拿香蕉,结果触怒了原来笼子里的4 只猴子,于是它们代替人执行惩罚任务,把新来的猴子暴打一顿,直 到它服从这里的“规矩”为止。 试验人员如此不断地将最初经历过高压水惩戒的猴子换出来,最 后笼子里的猴子全是新的,但没有一只猴子再敢去碰香蕉。 起初,猴子怕受到“株连”,不允许其他猴子去碰香蕉,这是合 理的。 但后来人和高压水都不再介入,而新来的猴子却固守着“不许拿 香蕉”的制度不变,这就是路径依赖的自我强化效应。
路径依赖的例子
一个广为流传、引人入胜的例证是:现代铁路两条铁轨之间的标准距 离是四英尺又八点五英寸。原来,早期的铁路是由建电车的人所设计 的,而四英尺又八点五英寸正是电车所用的轮距标准。那么,电车的 标准又是从哪里来的呢?最先造电车的人以前是造马车的,所以电车 的标准是沿用马车的轮距标准。马车又为什么要用这个轮距标准呢? 英国马路辙迹的宽度是四英尺又八点五英寸,所以,如果马车用其他 轮距,它的轮子很快会在英国的老路上撞坏。这些辙迹又是从何而来 的呢?从古罗马人那里来的。因为整个欧洲,包括英国的长途老路都 是由罗马人为它的军队所铺设的,而四英尺又八点五英寸正是罗马战 车的宽度。 任何其他轮宽的战车在这些路上行驶的话,轮子的寿命都不会很 长。可以再问,罗马人为什么以四英尺又八点五英寸为战车的轮距宽 度呢?原因很简单,这是牵引一辆战车的两匹马屁股的宽度。故事到 此还没有结束。美国航天飞机燃料箱的两旁有两个火箭推进器,因为 这 路径依赖些推进器造好之后要用火车运送,路上又要通过一些隧 道,而这些隧道的宽度只比火车轨道宽一点,因此火箭助推器的宽度 是由铁轨的宽度所决定的。 所以,最后的结论是:路径依赖导致了美国航天飞机火箭助推器 的宽度,竟然是两千年前便由两匹马屁股的宽度所决定的。
演化博弈

Taylor和Jonker提出了演化博弈理论的基本动态概念——复制动态
• 经济学家把演化博弈理论引入到经济学领域,用于分析社会制度变迁、产业演化以及股票 市场等,同时对演化博弈理论的研究也开始由对称博弈向非对称博弈深入,并取得了一定
1980s
的成果
演化博弈的产生与发展
• 演化博弈理论的发展进入了一个新的阶段。Weibull(1995)比较系统、完整地总结了演 1990s 化博弈理论,其中包含了一些最新的理论研究成果。
则竞争者群体的复制动态方程F1(x):
dx/dt dx/dt 1 x y=1/2 y>1/2 1 dx/dt
x 1 x
y<1/2
复制动态中的非对称博弈
对于博弈方2: 博弈方2 打击 博 弈 方 1 容忍
进入
不进
0, 0
1, 5
2, 2
1, 5
则在位者群体的复制动态方程F2(y):dy/dt 1 x演化博弈的基本分析过程
一般的演化博弈模型的建立主要基于两个方面:选择(Selection)和突变 (Mutation)。 选择是指能够获得较高支付的策略在以后将被更多的参与者采用;突变 是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的 策略,也可能是获得较低支付的策略)。 突变其实也是一种选择,但只有好的策略才能生存下来。突变是一种不 断试错的过程,也是一种学习与模仿的过程,这个过程是适应性且是不断改进 的。
目录页
PART TWO
最优反应动态
协调博弈的有限博弈方快速学习模型
模型: 博 弈 A 方 B 1 博弈方2 A B 50,50 49,0 0,49 60,60 协调博弈
1 5 4 3 2
5个博弈方,相邻者彼此博弈,初始策略组合为32种。