第_7_章_进化博弈论简介汇总

合集下载

动物行为学中的进化博弈理论研究

动物行为学中的进化博弈理论研究动物行为学是研究动物行为的学科，是现代生态学、生物学、心理学和社会学等学科的重要组成部分。

动物行为学的研究对象是具有生命特征的动物，主要研究它们的行为和行为背后的生理机制、进化历程以及环境和社会因素等方面。

其中，进化博弈理论是动物行为学研究中的重要方法和理论基础之一。

进化博弈论是一种用游戏论的方法研究生物进化的理论。

它模拟了个体之间的相互作用和竞争，研究了不同策略的演化及其对个体数量和群体结构的影响。

进化博弈论主要包括两大类博弈：一个是零和博弈，另一个是非零和博弈。

零和博弈是指参与者的利益完全对立，一个人的赢利必然导致另一个人的损失；而非零和博弈则是指参与者的利益不完全对立，即一个人获得好处不一定导致另一个人的损失。

在进化博弈理论中，个体的策略越具有适应性，其在群体中的生存和繁衍就越容易获得优势。

进化博弈论的应用在动物行为学中主要是探究动物间的竞争和合作关系。

动物遵循的交互策略可以追溯至其进化历史和适应环境中的生存需求。

如著名的鹰鸽博弈，在这个博弈中鹰会攻击鸽子并得到食物，鸽子会因此死亡；如果遇到两只鹰，它们会进行搏斗直至一方被杀死。

这样的策略是基于生物的基因编程，以及遗传变异和自然选择的结果。

近年来，进化博弈理论在动物行为学的研究中得到了广泛应用。

例如在群体动物中，进化博弈论可以解释为什么个体在取得財富和获取资源时会出现不同的策略。

举个例子，蚂蚁是非常有组织性的社群生物，它们之间会分工合作，完成不同的任务。

由于生存空间有限，种群之间的竞争很激烈。

如果一只蚂蚁选择的是搜寻食物，而另一只蚂蚁做的是攻击敌人，那么搜寻食物的蚂蚁就有更多的机会获取食物，因此这个策略就会被传承下去，进而大家都遵循这个策略。

除了群体动物，进化博弈理论在其他动物行为的研究中也存在广泛应用。

例如，在进化中，动物会根据风险和收益的情况选择最优策略。

在选择策略的时候，动物会明智地平衡自己的收益和风险。

进化博弈概述-山东师范大学管科学院

博弈方2 鹰博弈方1 鹰鸽鸽
v-c/2 ，v-c/2
V，0
0，v
v/2 ，v/2
图5.13 鹰鸽博弈
v 代表双方争夺的利益（可以是军事利益、经济利益或政治利益，也可以是动物的领地和繁殖机会），c是争夺中失败一方的损失。
这个博弈也是一个 2×2 对称博弈，直接运用 2×2 对称博弈复制动态的一般公式。用 x 表示采用
采用 B的得益为
xi (t ) 0 2 xi (t ) 60 。根据最优反应动态机制，当 2 xi (t ) 50 2 xi (t ) 49 xi (t ) 0 2 xi (t ) 60 2 2
时，即xi (t ) Nhomakorabea22 61
时，博弈方i在t＋1时期会采用A，否则采用B。
一、协调博弈（Coordination Game）
博弈方2 A B 博弈 A 方1 B
50，50 0，49 49，0 60，60
该博弈有两个纯策略纳什均衡：（A，A）和（ B，B）。这两个纳什均衡中，后者明显帕累托优于前者。但如果博弈方之一有采用A的可能性，或者两博弈方相互怀疑对方可能采用A，那么前者就是相对于后者的风险上策均衡。因此，如果是在完全理性博弈方之间进行这个博弈，通常的预测结果应该是（B ，B），但如果我们考虑博弈方相互对对方理性的信任问题，或者对风险的敏感性等因素，那么风险上策均衡（A，A）可能是更好的预测。
“鹰鸽博弈”

鹰鸽博弈研究的实际上并不是鹰和鸽之间的博弈，而是同一物种、种群内部竞争和冲突中的策略和均衡问题，其中“鹰”和“鸽”分别指“攻击型” 和“和平型”的两种策略或策略类型。
鹰鸽博弈是研究动物世界和人类社会中普遍存在的竞争和冲突现象的经典博弈，其进化博弈分析可以揭示人类社会或动物世界发生战争或激烈冲突的可能性及其频率，以及国际关系中霸道和软弱、侵略和反抗、威胁和妥协等共存的原因。

进化博弈论

进化博弈论
进化博弈论
1. 2. 3. 4. 进化博弈论概念进化博弈论产生及其发展进化博弈论基本内容进化博弈论的应用
一、进化博弈论的概念
传统的博弈论由于对参与者完全理性的假定，得出的结果往往与实际相差很远。进化博弈来源于对生态现象的研究，为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难，能够更加现实地解释经济现象。
行
26（合作）
216，360
324，324
设合作者的比例为x（0<x<1),则有：一个典型的合作者的期望支付为 324x+216(1-x) 一个典型的背叛者的期望支付为 360x+288(1-x) 谁更具有适应性？
谢谢！
四、进化博弈论的应用
进化博弈理论还没有形成学术界一致认可的理论体系，其基本框架仍然处于数理研究阶段，但它提供了一种全新的分析问题的方法。在解释社会制度形成、行业发展趋势、社会习俗演化等现象，获得了极大的成功。
囚徒困境
列
20（背叛） 20（背叛） 288，288 26（合作） 360，216
观察群体行为的历史
• 对参与人来说，观察群体行为的历史即估算群体分布是非常重要的。 • 首先，群体分布包含了对手如何选择策略的信息。 • 其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。 • 参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

进化博弈理论的均衡概念及其拓展

进化博弈理论的均衡概念及其拓展论文报告：进化博弈理论的均衡概念及其拓展研究1. 介绍进化博弈理论的基本概念和历史背景进化博弈理论是一种利用数学模型来研究生物演化行为的理论框架。

它建立在博弈论的基础上，通过对生物演化中基因的选择过程进行模拟，来解释动物行为、遗传进化、社会合作等现象。

进化博弈理论的出现为我们揭示了生物演化过程的新视角，深刻影响了一系列研究领域，如经济学、社会学、生态学等。

2. 论证进化博弈理论的均衡概念进化博弈理论所研究的对象是动态演化过程中的均衡状态。

所谓均衡状态，即当个体在当前环境下选择某种策略时，该策略能够实现最大化收益或最小化风险，且不能被其他策略所替代。

如果出现新的策略，它只有在该策略可以带来更高的收益或更小的风险时才能够被接受，否则就会被淘汰。

从进化博弈理论的角度来看，这种均衡状态能够在演化过程中稳定存在，并不断改进和优化。

3. 探讨进化博弈理论的拓展研究随着研究的不断深入，进化博弈理论不断拓展和完善。

其中主要包括进化模型的变化、策略分类的拓展和类固醇博弈的研究等。

例如，如何在爆炸式增长的人工智能领域中研究进化博弈模型，策略分类的拓展从简单的合作和竞争，到涵盖合作、有限合作和纯自利；类固醇博弈主要是在传统进化博弈的基础上，引入异位互惠机制和抗感染机制等新因素。

4. 分析进化博弈理论的应用领域进化博弈理论作为一种生物学理论，其研究对象并不仅限于生物圈，其应用领域之丰富多彩。

例如，在经济学领域，进化博弈理论可应用于研究市场竞争、战略选择、决策分析等领域；在社会学领域，可应用于解释激励合作行为、规范社会道德行为等。

5. 展望进化博弈理论的未来研究方向进化博弈理论作为一种新兴的研究方法，仍有着许多未解决的问题及待探索的领域。

未来的研究应着重于探讨复杂环境中的进化演化过程、进化博弈中的自动化学习研究、人工智能应用的深入研究等。

五个案例：1. 研究员发现一种动物在群体合作中不断进化和优化的模式，通过应用进化博弈理论，成功分析到该动物顺应环境变化而形成的进化过程，从中推断出一系列新的合作策略。

7 演化博弈详解

谁将生存？
? 假定初始人口中TFT的比例为x，ALL-D的比例为（1-x）；
? TFT的预期支付：8x-(1-x)=9x-1; ? ALL-D的预期支付：6x+0（1-x）=6x； ? 9x-1>6x ? x>1/3
均衡
? 如果x>1/3, TFT生存；稳定均衡； ? 如果x<1/3, ALL-D生存；稳定均衡； ? 如果x=1/3，二者同样生存，但不是稳定
strategy)，该占优策略是ESS；
博弈重复两次
ALL-C TFT ALL-D
ALL-C 8，8
8，8
TFT ALL-D
8，8 12，-2
8，8 6，-1
-2，12 -1，6 0，0
谁将生存？
? 首先注意到，幼稚的合作型生存能力最差：如果遇到 ALL-C 和TFT，与 TFT 得到相同的支付，但如果遇到 ALL-D ，则比 TFT更差；
在两种策略之间选择。
左撇子与右撇子
左撇子左撇子 1，1 右撇子 0，0
右撇子 0，0 1，1
谁最适合生存？
? 答案依赖于初始的人口分布。
? 假定总人口中有x的比例是左撇子，1-x 的比例是右撇子。那么，左撇子的预期支付为：x·1+(1-x)·0=x;
? 右撇子的预期支付：x·0+(1-x)·1=1-x;
? 社会秩序是所有人行为选择的结果，但不是集中设计的，而是自发演化的结果；
? 产权制度：先占原则； ? 教室、图书馆占座位；
鹰-鸽博弈
B
鹰
鸽
鹰
-1，-1
1，0
A
鸽
0，1
0.5，0.5
三个纳什均衡

进化博弈理论及其应用的文献综述

进化博弈理论及其应用的文献综述进化博弈理论的思想起源于生物学领域,以有限理性的参与人群体为研究对象,考察群体行为的进化趋势。

其应用主要在社会行为、经济行为和制度的演化方面,是研究在非理性人条件下的群体决策行为的重要研究方法。

标签：进化博弈文献综述一、进化博弈的基本理论进化博弈论的研究起源于生物学领域,其目的是为了解决动物和植物的冲突及合作,为达尔文的自然选择过程提供数理基础。

进化博弈理论结合经典博弈理论及生态理论研究成果,以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的进化趋势。

正是基于其在生物物种与种群的竞争进化演变规律分析中的成功,众多学者纷纷将其概念和前提加以修正,将其广泛应用于经济领域、社会领域来解释并预测人的群体决策行为。

二、进化博弈理论的应用研究1.社会行为领域Conlisk利用带滞后项及随机项的离散时间动态来分析参与人是否总是行为的最优者。

它假定有“最优化”及“模仿”两个纯策略,其中非最优化者有一个二次损失函数,在此基础上,他寻求一个满足非最优化者损失函数等于最优化者正的常数成本的均衡群体比率,从而得出结论:当群体中几乎都是最优化者时,模仿比最优化策略更合算,因此,群体中非最优化者在群体中最优化者所占比例并不渐进地收敛于1。

Peyton Young认为现实中每个参与人都是在前人给定的经验知识基础上选择策略,个人选择策略是一个适应性的学习过程。

个体在做出选择时,尽管参与人存在一定的惯性及犯错误的可能性,经过行为的长期进化,这个适应性学习过程也会收敛于一个有效率的传统或合约。

Sandholm对个体行为偏好的进化进行了动态分析。

Juang从进化的视角研究了规则的进化与均衡的选择问题。

Nyborg和Rege探讨了有关吸烟行为的社会规范的深化,并运用挪威的经验数据对结论进行了检验。

2.制度的演化青木昌彦等运用进化博弈理论分析了社会经济体制的变迁。

第_7_章_进化博弈论简介汇总

– 大甲虫期望收益是 8x + 3(1-‐x) = 3 + 5x
– 小甲虫期望收益是 5x + (1-‐x) = 1 + 4x
• 大甲虫的期望收益总是超过小甲虫的，所以，“大体态”是一个进化稳定策略。
进化博弈中的“军备竞赛”
• 生物学家认为在自然界中存在具有囚徒困境结构的进化博弈现象
– 例如：树木间高矮的关系；植物根系的竞争
• 然后再看根据在总体中的占比，两种生物体随机相遇所导致的收益期望（x, p, q 的函数）
• 讨论最后这两个期望的大小，判断是否进化稳定
两个采用不同混合策略者相遇的收益
第一类 S（p）生物 T（1-‐p）
第二类生物
S（q）
T（1-‐q）
a, a c, b
b, c d, d
• 第一种（p策略者）
• 可见，不存在y，使得x<y时小甲虫的期望收益超过大甲虫。因此，策略“小体态”不是进化稳定的。
体态博弈中的进化稳定策略：考察大体态
小的甲虫1 大的
甲虫2 小的 x
5, 5 8, 1
大的 (1-x) 1, 8 3, 3
• 考虑一个很小的正数x，总体中x占比为小体态，1-‐x占比甲虫为大体态。
考察小体态是否进化稳定策略
小的甲虫1 大的
甲虫2 小的 (1-x)
5, 5 8, 1
大的 x
1, 8 3, 3
• 考虑一个小正数x，总体中有x占比的个体使用策略“大体态” ，有1-‐x占比的个体使用策略“小体态”。（甲虫们随机相遇争夺食物）
– 一只小甲虫的期望收益是 5(1-‐x)+1x = 5-‐4x – 一只大甲虫的期望收益是 8(1-‐x)+3x = 8-‐5x

第七章博弈论实验讲解

Cooper等调查了允许无约束事前交流来解决协助问题的可能性。在允许交流的情况下，选择策略2的百分比变为80%，而被试者中申明未协调选择的比重只有71%。
7.2.2.4 n人博弈的实验
n人博弈实验的目的是为了观察同一批参与人反复进行同一博弈的结果。这样可以使得谈判博弈具有合作性。
G.Kalisch等做了一组n人博弈实验。在3人博弈中，被试者被蒙住了眼睛，只能通过手势向仲裁人示意他们的行动。在4人博弈中，每个被试人都坐在其他人看不到的地方，他将自己的行动写在纸上。 3人博弈规则如下：
二种情况下，3个参与人都得0.
实验结果表明，被试者选择等待策略的比重只占了33%，而由一个被试者叫价另一个接受而形成联盟的策略出现的比例较高。实验结果说明同一批人反复进行同一个博弈有利于形成合作博弈。
7.3完全信息动态博弈实验
7.3.1基础知识逆向归纳法：该方法适用于有限次博弈，并且参与人都是理性的，都清楚的知道博弈树结构，参与人首先从博弈树的末端开始，求解末端的子博弈均衡，然后继续向前求解，直至起点。
假设有两个被试者PP和ZZ,他们已掌握零和博弈论，同时知道冯.诺依曼-摩根斯坦非零和博弈论，但他们不清楚纳什均衡理论。
支付矩阵如表所示：
纳什均衡策略为（2，1）
如果允许单边支付，冯.诺依曼-摩根斯坦的非零和博弈解是策略（1，2）。
Merrill报告了100次实验的结果，pp得到0.4美元，zz得到0.65美元。如此看来，在现实的讨价还价中并没有达到纳什均衡。
混合策略纳什均衡：参与人根据一组选定的概率，在两种或两种以上可能的行动中随机选择中得到纳什均衡。
7.2.2实验研究
7.2.2.1纳什均衡与冯.诺依曼-摩根斯坦博弈解

演化博弈论简介

演化博弈论简介丁丁1994年有一篇重要的文章，介绍发展经济学的最新进展。

他比较了诺斯（North）的制度变迁理论，罗默（Romer），卢卡斯（Lucas）等的内生增长理论，哈耶克的“自发秩序论”，重复博弈和演化博弈论等理论，这些理论的共同特点是“动态”（dynamic）。

传统新古典经济学是静态的，重视均衡点，但很难进行历史的研究。

正因为如此，这些新理论才显示出强大的生命力，获得广泛运用。

我们这里讲演化博弈(evolutionary game theory)，它显然有2条理论来源，一是演化理论，一是博弈论。

先来看演化理论，我首先要纠正一个常见的误解，即演化均衡是帕累托最优的，或者说最大化整个社群的福利。

我们要注意到，演化均衡不等于一般均衡，等会我会给出一些严格的定义。

从福利经济学第一定理可以得知，一般均衡必然是帕累托最优的，即所谓的看不见的手的含义，但是演化均衡并没有类似的定理。

我们用常识来分析，如果演化均衡最大化社群的福利，那么什么是社群的福利呢？是个体的总数最大吗，是个体的多样性最多吗，抑或是个体预期存活概率最大？即使我们能为适应性（fitness）找出合适的测量方法，我们也无法保证演化是朝向个体适应性最大的方向演化。

我这里用演化，避免用演进，可以减少误解。

演化理论中有两条最重要的机制。

一个叫自然选择，即不是每种生物都有相同的概率在下一期存活。

在这个世界上，有些生物个体（或者人）特别幸运，他们能活下去，但还有些个体就倒霉了，他们会被淘汰。

我们今天都活着，可见我们的祖先都还是幸运的，他们有后代继承了他们的基因。

我特别要强调自然选择，对于我们来说是被选择(be selected)，我们能决定我们的行为和策略，但不能决定我们是否被选择，那是上帝的事情。

严复说物竞天择，就是这个意思。

另一种机制叫突变机制(mutant),这保证了种群的变化。

如果没有突变，那么这个世界上存活下来的物种就会越来越少，最后只剩下一种。

进化博弈论

进化博弈论进化博弈论是一门研究人与其他动物（包括昆虫和其他物种）之间的性的、社会的和经济的行为的学科。

它也是一种分析动物之间的比较方法。

实际上，进化博弈论有时也被称为“比较行为学”，因为它与传统动物行为学（也称为行为生态学）具有明显的差异。

进化博弈论假设，人类和其他动物之间的行为模式是由进化产生的，而进化，又是一种种群整体行为的结果，其中每个个体都希望从该行为中获得自身利益最大化。

进化博弈论的基本想法是，动物和/或人之间的某种特定行为策略最终会被自然选择，因为它们提供了相对于其他行为策略的优势，并增加了这些物种在未来世代中的可能性。

进化博弈论可以从不同角度来解释动物和人之间的行为。

例如，在自发抉择的情况下，进化博弈论研究表明，动物的行为可能会基于某种“自身福利”标准，其中某些行为可能提供动物个体最大的收益。

同样，在社会中，进化博弈论也可以解释人的行为，例如是否为别人做出牺牲。

在进化博弈论的研究中，科学家们研究了不同物种之间的行为，以及不同环境中的各种行为结果，以此来理解行为背后的机制。

例如，研究人员正在尝试探究鸟类是如何利用社会行为来建立优势的。

一项研究发现，在大部分情况下，鸟类会朝互利的方向发展，而不是自利的方向。

另一项研究发现，羊驼和羊群之间的社会行为也具有可预测的模式，这也表明，进化博弈论可以帮助我们理解动物之间社会行为背后的机制。

此外，进化博弈论不仅可以用于研究动物之间的行为，还可以用于研究人与人之间的行为。

在人类社会中，进化博弈论也可以解释不同社会群体之间的某些行为，比如偏见与冲突之间的关系。

由于这一理论对于比较动物和人类之间的行为策略的能力，它经常被用来解释不同社会群体之间的行为差异和争议。

此外，由于进化博弈论可以帮助人们更好地理解社会性质的行为，它也可以被用来解释人类行为的某些方面，比如如何在竞争环境中获得最大的利益。

总之，进化博弈论是一种用于研究人与其他动物之间行为的学科。

它不仅可以帮助我们理解动物之间的行为，而且也可以帮助我们理解人类之间的社会性行为。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

双人双策略对称博弈均衡的一般条件
• 若（S, S）是均衡，a,b,c,d之间的关系？ • 若（S, T）是均衡，…？ • 若（T, S）是均衡，…？ • 若（T, T）是均衡，…？
经常会用到“期望”的概念
• 一个随机的行为，会有多种（以两种为例）可能的结果（r1, r2），分别对应一个概率（p1, p2），p1+p2=1
• 但我们可有一个平行的概念－－“进化稳定策略”的概念
（下面我们先学习这个概念，然后看它和纳什均衡的关系）
进化稳定策略
• 一个策略称为是进化稳定的，若当整个种群都采取这个策略时，任何采用不同策略的小规模 “入侵”群体经过多代遗传后最终会消亡。
• 形式化定义
– 一种生物体的适应性是指它与一个随机遇到的生物体互动得到的收益期望
• 则这个行为的结果期望就是
p1r1 + p2r2
• 概率常常用“比率”和“占比”来近似 • 混合策略的收益：在纯策略集合上按概
率分布选择的收益期望
进化博弈论：谁有更强的适应性
博弈与进化博弈若干概念的一种对比理解
• 博弈，纯策略
– 确定性策略，直接对应的收益
• 博弈，混合策略
均衡
– 概率性策略，期望收益
• 进化博弈，纯策略
– 对于个体：确定性策略，直接收益
– 对于群体（策略）：适应性－其中个体与其他个体随机相
遇的收益期望
• 进化博弈，混合策略
稳定性
– 对于个体：概率性策略，期望收益
– 对于群体（策略）：适应性－其中个体与其他个体随机相遇的收益期望进化Βιβλιοθήκη 弈的由来• 进化论的主要观点
– 生物体的遗传基因在很大程度上决定了它的外部特征（行为方式等），因而决定了它是否能够适应给定的环境。
• 每只甲虫有两个策略：大和小，由其基因决定。
小的甲虫1
大的
甲虫2
小的
大的
5, 5
1, 8
8, 1
3, 3
小
甲的
虫1 大
的
甲虫2
小的
大的
5, 5
1, 8
8, 1
3, 3
与经典的博弈比较
• 每只甲虫的策略都是由遗传基因硬性决定的
– “策略选择”的概念在此是缺失的
• 因此以策略选择为基础的纳什均衡思想在此没有直接的对应
生物适应性与新陈代谢
• 对于大甲虫，维持新陈代谢实际上要比较困难些
– 需要吃较多的食物才能维持较大的体态要求；即同样数量的食物，小甲虫从中可获得较多的收益（适应性）。
• 直观结论是：大体态变异基因使适应性减弱，经过多次繁衍后，它极可能被淘汰。
• 然而事实真的是这样吗？
互动与生物适应性
• 当两只甲虫为食物争夺时，可能的结果有：
生物适应性与种群变异
• 例子：体态大小的博弈
– 考虑一种甲虫种群 – 假设每只甲虫对给定环境的适应能力取决于
• 它是否可以发现食物 • 能否有效地从食物中汲取营养
– 假设一个特定的突变基因出现并开始蔓延，造成携带该突变基因的甲虫体型变大。
– 因此，在该甲虫种群中，便分成两种不同的群体——小甲虫和大甲虫。
进化博弈论简介
（对应教材第7章）
回顾上一讲（博弈论基础）
• 博弈
– 参与者（player） – 策略（strategy） – 收益，回报（payoﬀ）
• 收益矩阵－形象地描述一个博弈的结构 • 在博弈论的分析中（决定采取什么策略）
– 不是要考虑如何战胜对方，而是基于对对方的行为的预测，自己如何收益最大（尽可能大）。双方都如此态度。
– 当争夺食物的两只甲虫大小相同时，它们会平分同样的食物
– 当一只大甲虫和一只小甲虫争夺食物，则大甲虫会得到大多数的食物
– 对于同样的食物量，大甲虫在适应性上得到的益处要少，因为所得到的食物中有一部分要转化用来维持它们消耗较高的新陈代谢
收益矩阵
• 每只甲虫从争夺一定量食物的互动中获得的生物适应性（不是食物量），可认为是双人博弈中的收益。
– 适应性较强的生物体往往会繁衍较多的后代，于是使得适应性强的基因的物种在总体中的数量增加。
– 一个物种的成功进化取决于它其中的个体和其他个体（同种或者不同种）的互动。
进化博弈的由来
• 1960s，从博弈论视角来解释生物进化论
– 由基因决定的生物特征及行为可类比作博弈中的策略；
– 将生物的适应性（的提高）类比为它的收益。
• 纯策略、混合策略（在可选纯策略集合上的一个概率分布）
均衡（纳什均衡）
• 均衡：互为最佳应对
• 纳什均衡定理：在考虑混合策略条件下，任何有限参与人、有限纯策略的博弈都存在均衡
• 一般来讲，找到均衡是很困难的，但在某些限定条件下可能有系统化方法
– 例如，双人双（纯）策略
1. 检查四个策略组合是否为纯策略均衡
• J. M. Smith和G. R. Price，提出“进化稳定均衡”，标志着进化博弈的诞生。
– John M. Smith. On Evolu)on. Edinburgh Unive Press, 1972
– J. M. Smith and G. R. Price, The Logic of Conﬂict, Nature, 246, 15-‐18, 1973.
– 称“策略T在x程度上（以x水平）入侵策略S”，指的是在总体中有x占比的生物体采用策略T，1-‐x占比采用策略S；其中x是一个小于1的小正数。
– 若存在一个小正数y，当任何其他策略T以任何x<y水平入侵策略S时，采用策略S的个体的适应性严格高于采取策略T的个体，则称策略S是进化稳定的（evoluVonarily stable）。
若（1）为空，则（2）一定有；
2. 利用无差异原理试求混合策略均衡若（1）不空，
（2）也可能有
囚徒困境（协调）博弈的特征模式
• 双人双策略 • 对称 • 均衡出现在双方采用某一种相同的策略 • “最佳收益”不是均衡，因为参与人之一有
动机改变策略
鹰鸽博弈的特征模式
• 双人双策略 • 对称 • 均衡出现在双方采用不同的策略
考察小体态是否进化稳定策略
小的甲虫1 大的
甲虫2 小的 (1-x)
5, 5 8, 1
大的 x
1, 8 3, 3
• 考虑一个小正数x，总体中有x占比的个体使用策略“大体态” ，有1-‐x占比的个体使用策略“小体态”。（甲虫们随机相遇争夺食物）
– 一只小甲虫的期望收益是 5(1-‐x)+1x = 5-‐4x – 一只大甲虫的期望收益是 8(1-‐x)+3x = 8-‐5x

第_7_章_进化博弈论简介汇总

动物行为学中的进化博弈理论研究

进化博弈概述-山东师范大学管科学院

进化博弈论

进化博弈理论的均衡概念及其拓展

7 演化博弈详解

进化博弈理论及其应用的文献综述

第_7_章_进化博弈论简介汇总

第七章 博弈论实验讲解

演化博弈论简介

进化博弈论

第七章博弈论实验讲解