第四章 进化博弈论

合集下载

动物行为学中的进化博弈理论研究

动物行为学中的进化博弈理论研究

动物行为学中的进化博弈理论研究动物行为学是研究动物行为的学科,是现代生态学、生物学、心理学和社会学等学科的重要组成部分。

动物行为学的研究对象是具有生命特征的动物,主要研究它们的行为和行为背后的生理机制、进化历程以及环境和社会因素等方面。

其中,进化博弈理论是动物行为学研究中的重要方法和理论基础之一。

进化博弈论是一种用游戏论的方法研究生物进化的理论。

它模拟了个体之间的相互作用和竞争,研究了不同策略的演化及其对个体数量和群体结构的影响。

进化博弈论主要包括两大类博弈:一个是零和博弈,另一个是非零和博弈。

零和博弈是指参与者的利益完全对立,一个人的赢利必然导致另一个人的损失;而非零和博弈则是指参与者的利益不完全对立,即一个人获得好处不一定导致另一个人的损失。

在进化博弈理论中,个体的策略越具有适应性,其在群体中的生存和繁衍就越容易获得优势。

进化博弈论的应用在动物行为学中主要是探究动物间的竞争和合作关系。

动物遵循的交互策略可以追溯至其进化历史和适应环境中的生存需求。

如著名的鹰鸽博弈,在这个博弈中鹰会攻击鸽子并得到食物,鸽子会因此死亡;如果遇到两只鹰,它们会进行搏斗直至一方被杀死。

这样的策略是基于生物的基因编程,以及遗传变异和自然选择的结果。

近年来,进化博弈理论在动物行为学的研究中得到了广泛应用。

例如在群体动物中,进化博弈论可以解释为什么个体在取得財富和获取资源时会出现不同的策略。

举个例子,蚂蚁是非常有组织性的社群生物,它们之间会分工合作,完成不同的任务。

由于生存空间有限,种群之间的竞争很激烈。

如果一只蚂蚁选择的是搜寻食物,而另一只蚂蚁做的是攻击敌人,那么搜寻食物的蚂蚁就有更多的机会获取食物,因此这个策略就会被传承下去,进而大家都遵循这个策略。

除了群体动物,进化博弈理论在其他动物行为的研究中也存在广泛应用。

例如,在进化中,动物会根据风险和收益的情况选择最优策略。

在选择策略的时候,动物会明智地平衡自己的收益和风险。

竞争和合作的进化博弈理论研究

竞争和合作的进化博弈理论研究

竞争和合作的进化博弈理论研究竞争与合作一直是人们关注的话题,同时也是涉及到人际关系、组织管理、市场竞争等各个领域的热点问题。

如何在竞争与合作之间创造出良好的平衡,是人们长期以来努力解决的问题。

进化博弈理论可以帮助我们更好地理解和解决这个问题。

进化博弈理论源自于生物学领域中对群体行为和生物间相互作用的研究。

其基本思想是以自然选择为出发点,探究动物或人类在不同环境下的行为模式,从而揭示生物间相互作用的规律和演化过程。

进化博弈理论认为,生物在某种程度上会依照“自私原则”行事,然而,在一定条件下,合作交互作用也可以取得理想的效果。

这一理论可适用于组织管理、市场竞争等其他领域,来解析个体之间的行为规律、彼此关系及其演化过程。

竞争与合作的深刻内涵往往会在人们的行为中展现出来。

例如,在组织中,工作机会和晋升机会总是有限的,这就需要组织成员竞争,以获得更好的机会。

然而,如果过分强调竞争则会导致交流紧张、信息不对称等问题产生,从而影响组织效率。

相反,适度的合作交互作用有助于缩短组织运转时间、提高效率和资源利用率。

因此,如何找到竞争与合作之间的平衡点,便是组织管理中的重点课题。

另一方面,在市场竞争中,企业之间往往互相竞争,争夺市场份额。

如果企业过分竞争,不愿和其他企业合作,就会难以吸引合适的顾客和市场资源。

而在一些情况下,企业的合作又可以形成反向合作,各个企业共同维护市场秩序,以实现彼此的利益。

因此,如何在竞争的同时进行合作,既保证企业竞争实力,又维持市场稳定,是市场竞争中需要解决的问题。

进化博弈理论针对这些问题提出了有效的解决方案。

其基本模型是:个体之间的交互都是博弈过程,每个博弈的个体有不同的收益,博弈后会根据参与者的收益对个体进行自然选择。

通过建立数学模型,进化博弈理论能够模拟人类在不同场景下的决策行为,并对可能产生的结果进行预测和解析。

例如,研究者对博弈中的实验对象设定了不同的策略,有的人选择的是合作策略,有的人则选择的是竞争策略,通过不断反复的交互,便可以发现合作策略相对于竞争策略的稳定性较高。

进化博弈基本动态理论

进化博弈基本动态理论

摘要本文主要介绍进化博弈理论的基本动态模型:对称博弈模仿者动态模型和非对称博弈模仿者动态模型及其相关结论。

为了便于理解,在文中引用了一些简单的例子说明它们之间的区别与联系。

在此基础上文中还介绍了理论家们对随机动态所进行的相关研究及其所取得的理论成果。

最后本文比较了经典博弈理论②与进化博弈理论在动态概念上的差别。

关键词:进化稳定策略⑩;模仿者动态;随机稳定均衡进化博弈理论至少自Lewontin(1960)用于解释生态现象就已经产生了,并被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。

进化博弈理论从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。

进化博弈理论强调系统达到均衡的动态调整过程,认为系统的均衡是达到均衡过程的函数,也就说均衡依赖于达到均衡的路径。

动态概念在进化博弈理论中占有相当重要的地位,许多博弈理论家对群体行为调整过程进行了广泛而深入的研究,根据他们考虑问题的角度不同而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型;Börgers and Sarin(1995,1997)等提出的强化动态③(Reinforcement Dynamics)模型等等。

但到目前为止,在进化博弈理论中应用最多的还是由Taylor and Jonker(1978)提出的模仿者动态(Replicator Dynamics)模型。

模仿者动态是进化博弈理论的基本动态,它能较好地描绘出有限理性个体的群体行为变化趋势,由之得出的结论能够比较准确地预测个体的群体行为,因而倍受博弈论理论家们的重视。

本文集中介绍确定性模仿者动态概念、模型及其与经典博弈动态概念的区别。

一、确定性模仿者动态一般的进化过程都包括两个可能的行为演化机制:选择机制(Selection Mechanism)和突变机制(Mutation mechanism)。

进化博弈论

进化博弈论
进化博弈论
进化博弈论
1. 2. 3. 4. 进化博弈论概念 进化博弈论产生及其发展 进化博弈论基本内容 进化博弈论的应用
一、进化博弈论的概念
传统的博弈论由于对参与者完全理性 的假定,得出的结果往往与实际相差很远。 进化博弈来源于对生态现象的研究, 为经济学研究提供了一个全新的分析方法, 较好地克服了新古典经济学及经典博弈理 论中理性假定及多重均衡的困难,能够更 加现实地解释经济现象。

26(合作)
216,360
324,324
设合作者的比例为x(0<x<1),则有: 一个典型的合作者的期望支付为 324x+216(1-x) 一个典型的背叛者的期望支付为 360x+288(1-x) 谁更具有适应性?
谢谢!
四、进化博弈论的应用
进化博弈理论还没有形成学术界一致认 可的理论体系,其基本框架仍然处于数理 研究阶段,但它提供了一种全新的分析问 题的方法。在解释社会制度形成、行业发 展趋势、社会习俗演化等现象,获得了极 大的成功。
囚徒困境

20(背叛) 20(背叛) 288,288 26(合作) 360,216
观察群体行为的历史
• 对参与人来说,观察群体行为的历史即估算群体分布是非常重 要的。 • 首先,群体分布包含了对手如何选择策略的信息。 • 其次,通过观察群体分布也有助于参与人知道什么是好的策略 什么是不好的策在进化过程中淘汰,模仿是学习过程中的一个重要组成部 分,成功的行为不仅以说教的形式传递下来,而且也容易被模 仿。 • 参与人由于受到理性的约束而其行为是幼稚的(Naive),其决 策不是通过迅速的最优化计算得到,而是需要经历一个适应性 的调整过程,在此过程中参与人会受到其所处环境中各种确定 性或随机性因素影响。因此,系统均衡是达到均衡过程的函数, 要更准确地描述参与人行为就必须考察经济系统的动态调整过 程,动态均衡概念及动态模型在进化博弈理论中占有相当重要 的地位。

进化博弈理论的均衡概念及其拓展

进化博弈理论的均衡概念及其拓展

进化博弈理论的均衡概念及其拓展论文报告:进化博弈理论的均衡概念及其拓展研究1. 介绍进化博弈理论的基本概念和历史背景进化博弈理论是一种利用数学模型来研究生物演化行为的理论框架。

它建立在博弈论的基础上,通过对生物演化中基因的选择过程进行模拟,来解释动物行为、遗传进化、社会合作等现象。

进化博弈理论的出现为我们揭示了生物演化过程的新视角,深刻影响了一系列研究领域,如经济学、社会学、生态学等。

2. 论证进化博弈理论的均衡概念进化博弈理论所研究的对象是动态演化过程中的均衡状态。

所谓均衡状态,即当个体在当前环境下选择某种策略时,该策略能够实现最大化收益或最小化风险,且不能被其他策略所替代。

如果出现新的策略,它只有在该策略可以带来更高的收益或更小的风险时才能够被接受,否则就会被淘汰。

从进化博弈理论的角度来看,这种均衡状态能够在演化过程中稳定存在,并不断改进和优化。

3. 探讨进化博弈理论的拓展研究随着研究的不断深入,进化博弈理论不断拓展和完善。

其中主要包括进化模型的变化、策略分类的拓展和类固醇博弈的研究等。

例如,如何在爆炸式增长的人工智能领域中研究进化博弈模型,策略分类的拓展从简单的合作和竞争,到涵盖合作、有限合作和纯自利;类固醇博弈主要是在传统进化博弈的基础上,引入异位互惠机制和抗感染机制等新因素。

4. 分析进化博弈理论的应用领域进化博弈理论作为一种生物学理论,其研究对象并不仅限于生物圈,其应用领域之丰富多彩。

例如,在经济学领域,进化博弈理论可应用于研究市场竞争、战略选择、决策分析等领域;在社会学领域,可应用于解释激励合作行为、规范社会道德行为等。

5. 展望进化博弈理论的未来研究方向进化博弈理论作为一种新兴的研究方法,仍有着许多未解决的问题及待探索的领域。

未来的研究应着重于探讨复杂环境中的进化演化过程、进化博弈中的自动化学习研究、人工智能应用的深入研究等。

五个案例:1. 研究员发现一种动物在群体合作中不断进化和优化的模式,通过应用进化博弈理论,成功分析到该动物顺应环境变化而形成的进化过程,从中推断出一系列新的合作策略。

进化博弈

进化博弈

• 比如,尽管不时出现一些大权在握的战 争贩子,但随着经济发展水平的提高和 富裕程度的提高,战争的可能性在下降。
• 比如,日本还会重新成为军国主义道路 吗?
• 例2例3是同一类型的进化博弈,例1是 另一类。差别之处在于,博弈方调整和 改变自已策略的能力和速度。例1中快, 例2例3中慢。
0
0.5
1
X
• 这个例子的背景是博弈方数量很大,学 习速度很慢。这类情况下博弈方的策略 调整过程称为“复制动态”。
例3:鹰鸽博弈1——好战分子 与和平主义者的人数对比
• 双方要瓜分利益为2。 如果鸽鸽相遇,则和 平均分,各得1,无 损失;如果鹰鸽相遇, 鹰 则鹰得2,鸽得0; 如果鹰鹰相遇,会有 战斗并造成损失4, 鸽 而胜率各为50%。 鹰 -1
0
鸽 -5 2
2 1
0
1
分析:
• 鹰太少的时候,鹰占 便宜的机会多,会诱dx/dt 导更多的人变为鹰; 太多的时候则占便宜 的机会下降,并不有 利。这里因为相争的 好处没变,损失加大, 做一支鹰的诱惑减少, 本例中的均衡鸽博弈是研究动物世界和人类社会中 普遍存在的竞争和冲突现象的经典博弈, 鹰鸽博弈的进化分析则可以揭示人类社 会或动物世界发生战争或激烈冲突的可 能性及其频率,国际关系中霸道和软弱, 侵略与反抗,威胁与妥协等共存的原因 等。
dx/dt=x(uy-u*) • 假设开始时,习惯于 选择同意的博弈方在 dx/dt 总人数中所占比例为X (0<X<1),由于选择 同意明显有利,所以 随着博弈的反复进行, X会增加。增加得是快 是慢取决于选择同意 的好处的大小以及选 择同意的示范户是多 是少
0
0.5
1
X
dx/dt=x(uy-u*) • dx/dt表示与人方便者 dx/dt 所占比例的变化速度 • uy表示与人方便者或 采取合作策略者的预 期得益

博弈论08 进化博弈4

博弈论08 进化博弈4

博弈论上次课小结重复博弈就是同样结构的博弈重复进行。

重复博弈属于动态博弈。

可以按重复次数分为有限次重复博弈和无限次重复博弈。

有限次复常常不会改变局中人的选择。

无限次重复博弈没有最后一次,局中人有可能通过选择合作策略获得高收益,但能否实现高收益还取决于局中人对未来的重视程度。

采用以牙还牙策略有可能获得高收益。

蜈蚣博弈逆推归纳法是动态博弈分析中的基本方法,但用该方法推导出来的均衡结果是否合理一直是动态博弈研究中的一个疑问,因为许多博弈实验结果与理论推导结果相去甚远。

例如蜈蚣博弈:蜈蚣博弈上面的蜈蚣博弈中,博弈进行得越久,双方的收益差异越大。

如果双方的收益相差无几,是否也会出现类似的结果呢?乘客困境两个人从一个盛产瓷花瓶的地方旅行归来,他们都买了同样的花瓶。

提取行李的时候,发现花瓶被摔坏了,他们一起向航空公司索赔。

于是,航空公司请两位旅客在2元至100元之间各自写下花瓶的价格。

如果两个人写的一样,航空公司将认为他们讲的是真话,于是按照写的价格如数赔偿;如果两个人写得不一样,航空公司就论定写得低的旅客讲的是真话,并且原则上按照这个价格赔偿,但是对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。

乘客困境从为了获取最大赔偿而言,甲乙两个乘客的最佳策略是都写100元。

但是,比如甲很聪明,他想如果我少写1元变成99元,而乙会写100元,这样我将得到101元,何乐而不为呢?所以他准备写99元。

可是乙更加聪明,他算计到甲会算计他而写99元,因而他就准备写98元。

想不到甲还要更聪明一层,他计算出乙要写98元来坑他,他就准备写97元。

如此下去,精明比赛的结果就是两个人都写2元,这也是这个博弈的唯一纳什均衡。

进化博弈我们是普通人,不是神仙,也不是圣人,不是天生的赢家,我们总是缺乏分析判断能力,记性也不是很好,还常常失去理性,甚至做出错误决策。

但我们又是聪明的,我们善于模仿,我们能够总结经验,我们可以从错误和失败中学习正确的、成功的做法,逐步成为赢家。

进化博弈理论及其应用的文献综述

进化博弈理论及其应用的文献综述

进化博弈理论及其应用的文献综述进化博弈理论的思想起源于生物学领域,以有限理性的参与人群体为研究对象,考察群体行为的进化趋势。

其应用主要在社会行为、经济行为和制度的演化方面,是研究在非理性人条件下的群体决策行为的重要研究方法。

标签:进化博弈文献综述一、进化博弈的基本理论进化博弈论的研究起源于生物学领域,其目的是为了解决动物和植物的冲突及合作,为达尔文的自然选择过程提供数理基础。

进化博弈理论结合经典博弈理论及生态理论研究成果,以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的进化趋势。

正是基于其在生物物种与种群的竞争进化演变规律分析中的成功,众多学者纷纷将其概念和前提加以修正,将其广泛应用于经济领域、社会领域来解释并预测人的群体决策行为。

二、进化博弈理论的应用研究1.社会行为领域Conlisk利用带滞后项及随机项的离散时间动态来分析参与人是否总是行为的最优者。

它假定有“最优化”及“模仿”两个纯策略,其中非最优化者有一个二次损失函数,在此基础上,他寻求一个满足非最优化者损失函数等于最优化者正的常数成本的均衡群体比率,从而得出结论:当群体中几乎都是最优化者时,模仿比最优化策略更合算,因此,群体中非最优化者在群体中最优化者所占比例并不渐进地收敛于1。

Peyton Young认为现实中每个参与人都是在前人给定的经验知识基础上选择策略,个人选择策略是一个适应性的学习过程。

个体在做出选择时,尽管参与人存在一定的惯性及犯错误的可能性,经过行为的长期进化,这个适应性学习过程也会收敛于一个有效率的传统或合约。

Sandholm对个体行为偏好的进化进行了动态分析。

Juang从进化的视角研究了规则的进化与均衡的选择问题。

Nyborg和Rege探讨了有关吸烟行为的社会规范的深化,并运用挪威的经验数据对结论进行了检验。

2.制度的演化青木昌彦等运用进化博弈理论分析了社会经济体制的变迁。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

采用A的得益:xi (t ) 50 [2 xi (t )] 49 采用B的得益:xi (t ) 0 [2 xi (t )] 60 当xi (t ) 22 / 61 时,采用A;当xi (t ) 22 / 61 时,采用B
最优反应动态模拟:初次博弈1个A
A
B
A A B A B B A
最优反应动态:有快速学习能力的小群体成员的 反复博弈 复制动态:学习速度很慢的成员组成的大群体随 机配对的反复博弈 进化稳定策略(ESS)
4.2 最优反应动态
4.2.1 协调博弈的有限博弈方 快速学习模型 4.2.2 古诺调整过程
4.2.1 协调博弈的有限博弈方快速学习模型
考虑5个有限理性的局中人之间,相邻局中人相互 博弈,快速学习并动态调整。
4.1.3 合作的行为生态
动物的适应性是在和生存环境的相互作用中形成的。 在竞争中,动物最终选择进化稳定策略(Evolutionary Stable Strategy,简称ESS)——该策略是被种群大多数 成员所采取的,而且不会受到其它对策的侵蚀。 一种ESS一旦确立,社会稳定下来,偏离的行为将 会受到自然的惩罚。 有利它主义和合作行为在动物界普遍存在。该行为 也可能发生在没有亲缘关系的情况:如共生现象。
这时博弈分析的核心不是博弈方的最优策略的选择, 而是有限理性的博弈方组成的群体成员的策略调整过 程、趋势和稳定性,这里的稳定性是指采用特定策略 的成员的比例不变,而非某个博弈方的策略不变。
引例: 签协议博弈的复制动态和进化稳定策略
签协议博弈:
局中人2 同意(y) 不同意(n) 同意(y) 不同意(n)
最优反应动态模拟1 博弈方1 博弈方2 2. 32 1.5 1.75
dr 1 2 收敛条件 | dr || | 1 dq2 dq1
问题:两寡头始终假设对方产量不变
4. 3 复制动态和进化稳定性: 两人对称博弈
设某一群体进行随机配对重复博弈,且该博弈为 对称博弈,即群体中个体无角色区分,所有个体 均具有相同的战略空间。
1,1 0,0 0,0 0,0
在有限理性的前提下,并非所有的局中人开始就能 找到最佳策略(y, y)。下面分析(y, y)是ESS。 假设群体中采用“同意”比例为 x ,则不同策略期 望得益和总平均得益为:
uy x 1 (1 x ) 0 x un x 0 (1 x ) 0 0
u x uy (1 x) un x
2
所以,除x=0外,有: uy x 1 (1 x ) 0 x
u y un , u y u
un x 0 (1 x ) 0 0 u x uy (1 x) un x2
在不断的重复博弈过程中,只要局中人有基本的 判断能力,早晚会发现该差异。于是,得益较差的 局中人会或早或迟模仿另一方。 这意味着两种类型局中人的比例x和1-x不是固定不 变的,而是时间的函数: x(t)和1-x (t)。 局中人策略类型比例的动态变化是进化博弈分析 的核心。
上述比例动态变化的速度取决于模仿的速度。该 速度取决于两个因素:
(1)被模仿对象的数量大小(可用x表示);
(2)被模仿对象的成功程度(可用模仿对象的期 望得益超过平均得益的幅度表示,即 u y u )。 所以,上述比例动态变化的速度可以表示为下列 微分方程:
dx x ( u y u) dt
以采用“同意”策略类型局中人的比例为例,其动 态变化速度可用下列微分方程反映:
dx x ( uy u) x ( x x 2 ) x 2 (1 x ) x 2 x 3 dt
dx x ( uy u) x ( x x 2 ) x 2 (1 x ) x 2 x 3 dt
4.1 有限理性与进化博弈论
第四章 进化博弈论
4.1.1 进化博弈的基础假设——有限理性 传统的博弈均衡,例如Nash均衡及其精炼是以 完全理性都是共同知识(common knowledge)为 前提的。 然而,完全理性在现实中很难满足,当社会经 济环境和决策问题较复杂时,人们必须存在很大的 理性局限。有限理性对人们的决策、行为选择方式 有很大影响,有限理性基础上的博弈分析与完全理 性博弈分析也有很大区别。进化博弈分析是有限理 性博弈分析的基本框架。
4.1.4 有 限 理 性 博 弈 的 分 析 框 架
在有限理性博弈中具有真正稳定性和 较强预测 能力的均衡,必须是能够通过博弈方的模仿、 学习 的调整过程达到的,具有能经受错误偏离的干扰 的 均衡,是在受到少量干扰后仍然能够“恢复”的均衡。
4.1.4 有 限 理 性 博 弈 的 分 析 框 架
局中人2 局 中 人 1
1
A
A B 50,50 0,49
B
49,0 60,60
5 4 3
2
两个NASH均衡,但考虑到对对方理性的信任 问题,风险态度等因素,可能选(A,A)。
局中人2
局 中 人 1
A
A B 50,50 0,49
B
49,0 60,60
反应、策略调整规则推导
xi ( t )表示在t 时期,局中人i 的邻居中采用A 策略的数量; 则采用B策略的数量为2-xi ( t )。 则局中人i :
4.1.2 有限理性及其对博弈的影响
有限理性局中人:不满足完全理性假设的局中人 有限理性意味着一般至少有部分局中人不会采用完 全理性博弈的均衡策略 有限理性意味着均衡是不断调整和改进而不是一次 性选择的结果,而且即使到达了均衡也可能再次偏 离 有限理性局中人会在博弈过程中学习博弈通过试错 寻找较好的策略
B
B B
B
A B B
A
A A A A A A
A A
初次博弈相邻2个A
B
A
A A A A A A
B
B A
A
B A A
初次博弈相连3个A
A
B B A A A A
A
A A
5.2.2 古诺调整过程
古诺模型反应函数
q1 3 q2 q2 2 q 3 1 2
3 2.125 2.25 4……… 1.875 1.9375
相关文档
最新文档