进化博弈基本动态理论

合集下载

动物行为学中的进化博弈理论研究

动物行为学中的进化博弈理论研究

动物行为学中的进化博弈理论研究动物行为学是研究动物行为的学科,是现代生态学、生物学、心理学和社会学等学科的重要组成部分。

动物行为学的研究对象是具有生命特征的动物,主要研究它们的行为和行为背后的生理机制、进化历程以及环境和社会因素等方面。

其中,进化博弈理论是动物行为学研究中的重要方法和理论基础之一。

进化博弈论是一种用游戏论的方法研究生物进化的理论。

它模拟了个体之间的相互作用和竞争,研究了不同策略的演化及其对个体数量和群体结构的影响。

进化博弈论主要包括两大类博弈:一个是零和博弈,另一个是非零和博弈。

零和博弈是指参与者的利益完全对立,一个人的赢利必然导致另一个人的损失;而非零和博弈则是指参与者的利益不完全对立,即一个人获得好处不一定导致另一个人的损失。

在进化博弈理论中,个体的策略越具有适应性,其在群体中的生存和繁衍就越容易获得优势。

进化博弈论的应用在动物行为学中主要是探究动物间的竞争和合作关系。

动物遵循的交互策略可以追溯至其进化历史和适应环境中的生存需求。

如著名的鹰鸽博弈,在这个博弈中鹰会攻击鸽子并得到食物,鸽子会因此死亡;如果遇到两只鹰,它们会进行搏斗直至一方被杀死。

这样的策略是基于生物的基因编程,以及遗传变异和自然选择的结果。

近年来,进化博弈理论在动物行为学的研究中得到了广泛应用。

例如在群体动物中,进化博弈论可以解释为什么个体在取得財富和获取资源时会出现不同的策略。

举个例子,蚂蚁是非常有组织性的社群生物,它们之间会分工合作,完成不同的任务。

由于生存空间有限,种群之间的竞争很激烈。

如果一只蚂蚁选择的是搜寻食物,而另一只蚂蚁做的是攻击敌人,那么搜寻食物的蚂蚁就有更多的机会获取食物,因此这个策略就会被传承下去,进而大家都遵循这个策略。

除了群体动物,进化博弈理论在其他动物行为的研究中也存在广泛应用。

例如,在进化中,动物会根据风险和收益的情况选择最优策略。

在选择策略的时候,动物会明智地平衡自己的收益和风险。

第四章 进化博弈论

第四章 进化博弈论

采用A的得益:xi (t ) 50 [2 xi (t )] 49 采用B的得益:xi (t ) 0 [2 xi (t )] 60 当xi (t ) 22 / 61 时,采用A;当xi (t ) 22 / 61 时,采用B
最优反应动态模拟:初次博弈1个A
A
B
A A B A B B A
最优反应动态:有快速学习能力的小群体成员的 反复博弈 复制动态:学习速度很慢的成员组成的大群体随 机配对的反复博弈 进化稳定策略(ESS)
4.2 最优反应动态
4.2.1 协调博弈的有限博弈方 快速学习模型 4.2.2 古诺调整过程
4.2.1 协调博弈的有限博弈方快速学习模型
考虑5个有限理性的局中人之间,相邻局中人相互 博弈,快速学习并动态调整。
4.1.3 合作的行为生态
动物的适应性是在和生存环境的相互作用中形成的。 在竞争中,动物最终选择进化稳定策略(Evolutionary Stable Strategy,简称ESS)——该策略是被种群大多数 成员所采取的,而且不会受到其它对策的侵蚀。 一种ESS一旦确立,社会稳定下来,偏离的行为将 会受到自然的惩罚。 有利它主义和合作行为在动物界普遍存在。该行为 也可能发生在没有亲缘关系的情况:如共生现象。
这时博弈分析的核心不是博弈方的最优策略的选择, 而是有限理性的博弈方组成的群体成员的策略调整过 程、趋势和稳定性,这里的稳定性是指采用特定策略 的成员的比例不变,而非某个博弈方的策略不变。
引例: 签协议博弈的复制动态和进化稳定策略
签协议博弈:
局中人2 同意(y) 不同意(n) 同意(y) 不同意(n)
最优反应动态模拟1 博弈方1 博弈方2 2. 32 1.5 1.75
dr 1 2 收敛条件 | dr || | 1 dq2 dq1

进化博弈1

进化博弈1

1 引言博弈论(Game Theory),又称对策论,研究决策主体行为存在相互作用时,行为主体如何利用所掌握的信息进行决策,以及这种决策的均衡问题,反映了博弈局中人的行动及相互作用间冲突、竞争、协调与合作关系。

博弈论的基本概念包括:参与人、行为目标、信息、行为、支付函数、均衡和博弈结果。

博弈论是研究多人决策问题的理论,但又不同于一般的决策论,博弈强调决策主体间策略选择的相互制约性,体现了合作与冲突的对立统一关系,20世纪80年代以来,尤其是1994年诺贝尔经济学奖授予三位博弈论专家以后,博弈论取得了飞速发展,广泛应用到许多研究领域,现在已发展成为经济学的重要组成部分。

传统博弈论中一个重要的假设就是博弈双方行为人的理性假设,它假设博弈人是完全理性的,这是一条非常严格的假设,是现实世界中无法通过保证的假设。

目前包括合作博弈理论和非合作博弈理论的主流博弈论,在理性基础方面采用的是一种“完全理性”的假设。

完全理性比新古典经济学以“个体理性”为基础的“理性经济人假设”要求理性程度还要高。

因为完全理性不仅要求行为主体始终以自身最大利益为目标,具有在确定和非确定性环境中追求自身利益最大化的判断和决策能力,还要求他们具有在存在交互作用的博弈环境中完美的判断和预测能力;不仅要求人们自身有完美的理性,还要求人们相互信任对方的理性,有“理性的共同知识”。

这种完全理性假设的现实性明显是有问题的,因为它不仅意味着博弈方绝对不会犯错误,决不会冲动和不理智,即使在复杂的多层次交互推理中也不会糊涂,不会相互对对方的理性、能力、信任和对信任的信任等有任何怀疑和动摇。

事实上,人们在大多数比较复杂的决策问题中表现出来的理性,都无法满足这种“完全理性”的要求,甚至连新古典经济学“理性经济人假设”的要求都很难满足。

不仅人们的个人选择经常会犯错误,集体决策同样也经常会犯错误。

人类社会频繁发生各种战争冲突,企业选择领导人的盲目性和低效率等,都是人类集体选择决策理性不完全的证据。

进化博弈概述-山东师范大学管科学院

进化博弈概述-山东师范大学管科学院


博弈方2 鹰 博弈 方1 鹰 鸽 鸽
v-c/2 ,v-c/2
V,0
0,v
v/2 ,v/2
图5.13 鹰鸽博弈
v 代表双方争夺的利益(可以是军事利益、经 济利益或政治利益,也可以是动物的领地和繁殖机 会),c是争夺中失败一方的损失。
这个博弈也是一个 2×2 对称博弈,直接运用 2×2 对称博弈复制动态的一般公式。用 x 表示采用
采用 B的得益为
xi (t ) 0 2 xi (t ) 60 。根据最优反应动态机制,当 2 xi (t ) 50 2 xi (t ) 49 xi (t ) 0 2 xi (t ) 60 2 2
时,即xi (t ) Nhomakorabea22 61
时,博弈方i在t+1时期会采用A,否则采用B。
一、协调博弈(Coordination Game)
博弈方2 A B 博弈 A 方1 B
50,50 0,49 49,0 60,60
该博弈有两个纯策略纳什均衡:(A,A)和( B,B)。 这两个纳什均衡中,后者明显帕累托优于 前者。但如果博弈方之一有采用A的可能性,或者两 博弈方相互怀疑对方可能采用A,那么前者就是相对 于后者的风险上策均衡。因此,如果是在完全理性博 弈方之间进行这个博弈,通常的预测结果应该是(B ,B),但如果我们考虑博弈方相互对对方理性的信 任问题,或者对风险的敏感性等因素,那么风险上策 均衡(A,A)可能是更好的预测。
“鹰鸽博弈”

鹰鸽博弈研究的实际上并不是鹰和鸽之间的博弈, 而是同一物种、种群内部竞争和冲突中的策略和 均衡问题,其中“鹰”和“鸽”分别指“攻击型” 和“和平型”的两种策略或策略类型。
鹰鸽博弈是研究动物世界和人类社会中普遍存在 的竞争和冲突现象的经典博弈,其进化博弈分析 可以揭示人类社会或动物世界发生战争或激烈冲 突的可能性及其频率,以及国际关系中霸道和软 弱、侵略和反抗、威胁和妥协等共存的原因。

演化博弈理论的原理和应用

演化博弈理论的原理和应用

演化博弈理论的原理和应用1. 理论简介演化博弈理论是一种理论框架,用于研究多个个体之间相互作用的行为和策略选择。

它是从进化生物学中发展而来,吸收了经济学和社会学等学科的理论和方法,在研究社会行为和经济决策中具有重要应用。

2. 原理概述演化博弈理论主要基于以下几个原理:2.1. 演化机制演化机制是指在一群个体中,通过个体之间的相互作用和遗传机制的作用,使得个体的某种特征或行为在群体中逐渐传播和积累。

这种演化机制可以通过模拟进化算法和遗传算法进行建模和研究。

2.2. 博弈模型博弈模型是演化博弈理论的核心工具,它描述了多个个体在特定环境中的策略选择和收益获取。

著名的博弈模型包括囚徒困境、合作博弈和非合作博弈等。

通过博弈模型的构建和分析,可以揭示个体之间的相互影响和策略的动态演化。

2.3. 演化稳定策略演化稳定策略是指一种策略,在给定环境下,个体之间的策略选择在长期演化过程中保持相对稳定。

演化稳定策略是博弈模型中的重要概念,它可以用来解释和预测实际生活中的社会行为和经济现象。

3. 应用领域演化博弈理论在多个学科和领域中都有广泛的应用,以下列举了一些典型的应用:3.1. 经济学演化博弈理论在经济学中被广泛应用于研究市场竞争、价格形成、企业战略等问题。

例如,通过建立博弈模型,可以分析不同企业之间的竞争策略选择和市场份额变化。

3.2. 生态学演化博弈理论在生态学中被用于研究动物群体中的策略选择和社会行为。

例如,通过建立博弈模型,可以分析动物之间的资源争夺、合作行为和繁殖策略选择。

3.3. 社会科学演化博弈理论在社会科学领域也有重要的应用。

例如,在社会网络中,个体之间的互动和合作行为可以通过演化博弈理论进行建模和分析。

此外,演化博弈理论还可以解释和预测社会行为中的合作与竞争现象。

3.4. 计算机科学演化博弈理论在计算机科学中也有广泛的应用。

例如,在人工智能领域,通过演化博弈理论的方法,可以设计和优化智能体的决策策略,提高系统的性能和适应性。

进化博弈论

进化博弈论
进化博弈论
进化博弈论
1. 2. 3. 4. 进化博弈论概念 进化博弈论产生及其发展 进化博弈论基本内容 进化博弈论的应用
一、进化博弈论的概念
传统的博弈论由于对参与者完全理性 的假定,得出的结果往往与实际相差很远。 进化博弈来源于对生态现象的研究, 为经济学研究提供了一个全新的分析方法, 较好地克服了新古典经济学及经典博弈理 论中理性假定及多重均衡的困难,能够更 加现实地解释经济现象。

26(合作)
216,360
324,324
设合作者的比例为x(0<x<1),则有: 一个典型的合作者的期望支付为 324x+216(1-x) 一个典型的背叛者的期望支付为 360x+288(1-x) 谁更具有适应性?
谢谢!
四、进化博弈论的应用
进化博弈理论还没有形成学术界一致认 可的理论体系,其基本框架仍然处于数理 研究阶段,但它提供了一种全新的分析问 题的方法。在解释社会制度形成、行业发 展趋势、社会习俗演化等现象,获得了极 大的成功。
囚徒困境

20(背叛) 20(背叛) 288,288 26(合作) 360,216
观察群体行为的历史
• 对参与人来说,观察群体行为的历史即估算群体分布是非常重 要的。 • 首先,群体分布包含了对手如何选择策略的信息。 • 其次,通过观察群体分布也有助于参与人知道什么是好的策略 什么是不好的策在进化过程中淘汰,模仿是学习过程中的一个重要组成部 分,成功的行为不仅以说教的形式传递下来,而且也容易被模 仿。 • 参与人由于受到理性的约束而其行为是幼稚的(Naive),其决 策不是通过迅速的最优化计算得到,而是需要经历一个适应性 的调整过程,在此过程中参与人会受到其所处环境中各种确定 性或随机性因素影响。因此,系统均衡是达到均衡过程的函数, 要更准确地描述参与人行为就必须考察经济系统的动态调整过 程,动态均衡概念及动态模型在进化博弈理论中占有相当重要 的地位。

进化博弈理论的均衡概念及其拓展

进化博弈理论的均衡概念及其拓展

进化博弈理论的均衡概念及其拓展论文报告:进化博弈理论的均衡概念及其拓展研究1. 介绍进化博弈理论的基本概念和历史背景进化博弈理论是一种利用数学模型来研究生物演化行为的理论框架。

它建立在博弈论的基础上,通过对生物演化中基因的选择过程进行模拟,来解释动物行为、遗传进化、社会合作等现象。

进化博弈理论的出现为我们揭示了生物演化过程的新视角,深刻影响了一系列研究领域,如经济学、社会学、生态学等。

2. 论证进化博弈理论的均衡概念进化博弈理论所研究的对象是动态演化过程中的均衡状态。

所谓均衡状态,即当个体在当前环境下选择某种策略时,该策略能够实现最大化收益或最小化风险,且不能被其他策略所替代。

如果出现新的策略,它只有在该策略可以带来更高的收益或更小的风险时才能够被接受,否则就会被淘汰。

从进化博弈理论的角度来看,这种均衡状态能够在演化过程中稳定存在,并不断改进和优化。

3. 探讨进化博弈理论的拓展研究随着研究的不断深入,进化博弈理论不断拓展和完善。

其中主要包括进化模型的变化、策略分类的拓展和类固醇博弈的研究等。

例如,如何在爆炸式增长的人工智能领域中研究进化博弈模型,策略分类的拓展从简单的合作和竞争,到涵盖合作、有限合作和纯自利;类固醇博弈主要是在传统进化博弈的基础上,引入异位互惠机制和抗感染机制等新因素。

4. 分析进化博弈理论的应用领域进化博弈理论作为一种生物学理论,其研究对象并不仅限于生物圈,其应用领域之丰富多彩。

例如,在经济学领域,进化博弈理论可应用于研究市场竞争、战略选择、决策分析等领域;在社会学领域,可应用于解释激励合作行为、规范社会道德行为等。

5. 展望进化博弈理论的未来研究方向进化博弈理论作为一种新兴的研究方法,仍有着许多未解决的问题及待探索的领域。

未来的研究应着重于探讨复杂环境中的进化演化过程、进化博弈中的自动化学习研究、人工智能应用的深入研究等。

五个案例:1. 研究员发现一种动物在群体合作中不断进化和优化的模式,通过应用进化博弈理论,成功分析到该动物顺应环境变化而形成的进化过程,从中推断出一系列新的合作策略。

演化博弈

演化博弈

Taylor和Jonker提出了演化博弈理论的基本动态概念——复制动态
• 经济学家把演化博弈理论引入到经济学领域,用于分析社会制度变迁、产业演化以及股票 市场等,同时对演化博弈理论的研究也开始由对称博弈向非对称博弈深入,并取得了一定
1980s
的成果
演化博弈的产生与发展
• 演化博弈理论的发展进入了一个新的阶段。Weibull(1995)比较系统、完整地总结了演 1990s 化博弈理论,其中包含了一些最新的理论研究成果。
则竞争者群体的复制动态方程F1(x):
dx/dt dx/dt 1 x y=1/2 y>1/2 1 dx/dt
x 1 x
y<1/2
复制动态中的非对称博弈
对于博弈方2: 博弈方2 打击 博 弈 方 1 容忍
进入
不进
0, 0
1, 5
2, 2
1, 5
则在位者群体的复制动态方程F2(y):dy/dt 1 x演化博弈的基本分析过程
一般的演化博弈模型的建立主要基于两个方面:选择(Selection)和突变 (Mutation)。 选择是指能够获得较高支付的策略在以后将被更多的参与者采用;突变 是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的 策略,也可能是获得较低支付的策略)。 突变其实也是一种选择,但只有好的策略才能生存下来。突变是一种不 断试错的过程,也是一种学习与模仿的过程,这个过程是适应性且是不断改进 的。
目录页
PART TWO
最优反应动态
协调博弈的有限博弈方快速学习模型
模型: 博 弈 A 方 B 1 博弈方2 A B 50,50 49,0 0,49 60,60 协调博弈
1 5 4 3 2
5个博弈方,相邻者彼此博弈,初始策略组合为32种。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

摘要本文主要介绍进化博弈理论的基本动态模型:对称博弈模仿者动态模型和非对称博弈模仿者动态模型及其相关结论。

为了便于理解,在文中引用了一些简单的例子说明它们之间的区别与联系。

在此基础上文中还介绍了理论家们对随机动态所进行的相关研究及其所取得的理论成果。

最后本文比较了经典博弈理论②与进化博弈理论在动态概念上的差别。

关键词:进化稳定策略⑩;模仿者动态;随机稳定均衡进化博弈理论至少自Lewontin(1960)用于解释生态现象就已经产生了,并被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。

进化博弈理论从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。

进化博弈理论强调系统达到均衡的动态调整过程,认为系统的均衡是达到均衡过程的函数,也就说均衡依赖于达到均衡的路径。

动态概念在进化博弈理论中占有相当重要的地位,许多博弈理论家对群体行为调整过程进行了广泛而深入的研究,根据他们考虑问题的角度不同而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型;B&ouml;rgers and Sarin(1995,1997)等提出的强化动态③(Reinforcement Dynamics)模型等等。

但到目前为止,在进化博弈理论中应用最多的还是由Taylor and Jonker(1978)提出的模仿者动态(Replicator Dynamics)模型。

模仿者动态是进化博弈理论的基本动态,它能较好地描绘出有限理性个体的群体行为变化趋势,由之得出的结论能够比较准确地预测个体的群体行为,因而倍受博弈论理论家们的重视。

本文集中介绍确定性模仿者动态概念、模型及其与经典博弈动态概念的区别。

一、确定性模仿者动态一般的进化过程都包括两个可能的行为演化机制:选择机制(Selection Mechanism)和突变机制(Mutation mechanism)。

选择机制是指本期中能够获得较高支付的策略,在下期被更多参与者选择;突变是指参与者以随机(无目的性)的方式选择策略,因此突变策略可能获得较高支付也可能获得较低支付,突变一般很少发生。

新的突变也必须经过选择,并且只有获得较高支付的策略才能生存(Survive)下来。

按所研究的群体数目不同,进化博弈动态模型可分为两大类:单群体(Monomorphic Population)动态模型与多群体(Polymorphic Populations)动态模型。

单群体动态模型是指所考察的对象只含有一个群体,并且群体中个体都有相同的纯策略集,个体与虚拟的参与人④进行对称博弈。

多群体动态模型⑤是指所考察的对象中含有多个群体,不同群体个体可能有不同的纯策略集,不同群体个体之间进行的是非对称博弈。

博弈中个体选择纯策略所得的支付不仅随其所在群体的状态变化而变化,而且也随其他群体状态的变化而变化。

下面重点介绍单群体与多群体动态模仿者动态模型。

1.1、单群体确定性模仿者动态模型单群体模仿者动态模型是由Taylor and Jonker (1978)在考察生态演化现象时首次提出的。

他们把一个生态环境中所有的种群看作为一个大群体,而把群体中每个种群都想象或程式化为一个特定的纯策略。

群体在不同时刻所处的状态一般用混合策略来表示。

所谓模仿者动态是指使用某一纯策略的人数所占比例的增长率等于使用该策略时所得支付⑥与群体平均支付之差,或者与平均支付成正比例。

为了说明的方便,本文首先给出一些符号,然后给出Taylor and Jonker (1978)模仿者动态公式的推导过程。

[!--empirenews.page--]假定群体中每一个个体在任何时候只选择一个纯策略,比如,第j个个体在某时刻选择纯策略(当然由于突变或策略转移,同一个体在不同时刻可以选择不同的纯策略)。

表示群体中各个体可供选择的纯策略集;N表示群体中个体总数;表示在时刻t选择纯策略i的个体数。

表示群体在时刻t所处的状态,其中表示在该时刻选择纯策略i的人数在群体中所占的比例,即。

表示群体中个体进行随机配对匿名博弈时,群体中选择纯策略的个体所得的期望支付。

表示群体平均期望支付。

下面给出连续时间模仿者动态公式,此时动态系统的演化过程可以用微分方程来表示。

在对称博弈中每一个个体都认为其对手来自于状态为x 的群体。

事实上,每个个体所面的对手是代表群体状态的虚拟个体⑦。

假定选择纯策略的个体数的增长率等于⑧,那么可以得到如下的等式:由定义可知,两边对t微分可以⑨:两边同时除以N得到: 上式就是对称博弈模型中模仿者动态公式的微分形式。

可以看出,如果一个选择纯策略的个体得到的支付少于群体平均支付,那么选择纯策略的个体在群体中所占比例将会随着时间的演化而不断减少;如果一个选择策略[!--empirenews.page--]的个体得到的支付多于群体平均支付,那么选择策略的个体在群体中所占比例将会随着时间的演化而不断地增加;如果个体选择纯策略所得的支付恰好等群体平均支付,则选择该纯策略的个体在群体中所占比例不变。

从上面的公式推导过程可以看出,Taylor and Jonker提出的模仿者动态仅仅考虑到纯策略的继承性,而没有考虑到混合策略的可继承性。

Bomze(1986)证明了如果允许混合策略也可以被继承,那么在模仿者动态下,进化稳定策略等价于渐近稳定性。

另外,下面不加证明⑾地给出Hofbauer et al. (1979); Zeeman (1980)提出并证明的一个命题,“在模仿者动态下,对称博弈中每一个ESS都是渐近稳定的”。

这个命题的逆命题并不成立,下面用Fudenberg(1995)的一个反例来给予说明,考察表Ⅰ矩阵所示的对称博弈:该博弈有唯一对称的纳什均衡⑿(),且均衡时的期望支付为。

这个均衡并不是进化稳定均衡,因为它能够被策略侵入;又因为在平衡点处雅可比行列式的特征根是和,该均衡状态是动态系统的汇⒀(Sink),因此均衡是渐近稳定的,所以对称博弈的渐近稳定均衡并不一定是进化稳定均衡。

从模拟者动态方程可以看出,支付函数的正向变换或者位移变换⒁只改变群体演化速度而不影响群体演化路径。

因而,在进行分析时,可以对支付矩阵进行必要的简化处理。

另外,由此还可以求出的两个种群相对增长率:上式说明:个体博弈时,获得相对较多支付的群体则具有更高的增长率。

1.2、多群体模仿者动态模型Selten(1980)引入角色限制行为(Role Conditioned Behavior)而把群体分为单群体与多群体,不同群体根据个体可供选择的纯策略集不同来划分。

多群体时,不同群体中的个体有不同纯策略集、不同群体平均支付及不同群体演化速度。

因而,多群体模仿者动态公式推导比较复杂,下面给出多群体模仿者动态方程(参阅文献[24]):[!--empirenews.page--]其中,上标j表示第j个群体,其中K表示有K个群体;表示第j个群体中选择第个纯策略的个体数占该群体总数的百分比;表示群体j 在某时刻所处的状态,表示第j个群体以外的其他群体在t时刻所处的状态;表示群体j中个体行为集中的第i个纯策略;x表示混合群体的混合策略组合,表示混合群体状态为x时群体j中个体选择纯策略时所能得到的期望支付;表示混合群体的平均支付。

多群体模型并不是对单群体模型的简单改进,由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。

Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⒂”的结论,这就说明在多群体博弈中,传统的进化稳定均衡概念就显示出其局限性了。

同时,在模仿者动态下,同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

下面就利用一个例子来给予说明。

1.3、单群体与多群体的区别考察表Ⅱ矩阵所示的对称博弈:其中行代表虚拟参与人,也就是群体状态;列代表个体。

由经典博弈理论知道,这个博弈有两个非对称[1][2][3][4]下一页纳什均衡(A,B)、(B,A)和一个混合策略纳什均衡(即群体中一半个体选择策略A,另一半个体选择策略B)。

由于本文仅考察单一群体情形,即群体中个体无角色(Role)区分,因此不可能分离出两类个体,所以这个系统不可能收敛到非对称纳什均衡(A,B)、(B,A)。

在模仿者动态下,尽管没有单个个体选择混合策略,但这个混合策略纳什均衡却是该动态系统唯一进化稳定均衡且是渐近稳定均衡,下面证明它的渐近稳定性。

令表示在时刻t群体中选择策略A的个体所占比例,那么此时群体中选择策略B的个体所占的比例为[!--empirenews.page--],选择策略A所得的期望支付为,而选择策略B所得的期望支付为,群体平均期望支付为。

于是就可以得到如下一维模仿者动态方程:从微分方程可以得出,当时,如果群体中选择纯策略A的个体数少于一半时,选择A的个体数就会增加;当时,群体中选择纯策略A个体数保持不变;当时,如果群体中选择纯策略A 的个体数大于一半时,选择策略A的个体数就会减少。

也就是说,只要群体中偏离一半选A,一半选B,系统就会自动回复到混合策略均衡。

因此混合策略纳什均衡是渐近稳定的,图Ⅰ是该动态系统的相图。

下面引入个体角色区分继续分析上面的博弈,单群体时由于群体中个体无角色区分,因而无法分离出不同群体的个体;多群体时就不同了,不同角色的个体可以从群体中分离出来。

尽管博弈的支付矩阵没有变化,但却有不同的模仿者动态方程⒃。

同样,该博弈有两个非对称的纳什均衡(A,B);(B,A)和一个混合策略纳什均衡。

单群体时,博弈不可能收敛到两个非对称纳什均衡;多群体时,由于个体之间有角色区分,因而群体中就可以分离出不同角色的个体,这样就不能排除两个非对称纳什均衡。

在单群体中混合策略是渐近稳定的,但在这里混合策略纳什均衡却不满足稳定性条件。

通过解模仿者动态微分方程可以得到,该动态有五个平衡点,由各平衡点处雅可比行列式的特征根可以判断出:平衡点是系统的源(Source);平衡点[!--empirenews.page--]是系统的汇(Sink);平衡点是系统的鞍点(Saddle Point)。

图Ⅱ是该系统的相图。

显然,混合策略纳什均衡不是渐近稳定的,也不是进化稳定策略。

二、随机动态的深入研究以上给出了模仿者动态理论及其相关的结论,为了进一步了解进化博弈动态理论的最新研究成果,下面简要地介绍博弈论理论家们把随机因素纳入到进化模型的几种方式。

从理论意义上说,在确定性动态下,所有纳什均衡都是动态系统的不动点(Fixed-Point),并且所有严格纳什均衡都是渐近稳定的不动点,因此不利于系统在严格纳什均衡之间的选择;从现实意义上说,经济系统常常会受到许多随机冲击的影响,环境的不断变化、个体的试验及新旧更替等都会对群体行为产生随机影响,仅用确定性模仿者动态来描述系统行为的变化显然是不够的。

相关文档
最新文档