第五章(有限理性与进化博弈)
有限理性条件下的进化博弈理论

有限理性条件下的进化博弈理论进化博弈理论在解释生物和人类行为的演化方面具有重要作用。
传统进化博弈理论假设行为者完全理性,然而在现实生活中,由于信息不完全、认知限制和情感等因素的影响,行为者的决策往往受到有限理性的约束。
近年来,有限理性条件下的进化博弈理论受到广泛,为理解有限理性对行为和策略选择的影响提供了有益框架。
本文将回顾有限理性条件下的进化博弈理论的相关研究,总结其研究进展,并提出未来研究方向。
有限理性条件下的进化博弈理论主要有限理性个体在博弈中的行为和策略选择。
现有研究主要集中在以下几个方面:有限理性个体的行为模拟、有限理性条件下的演化稳定策略、以及有限理性对博弈结果的影响等。
尽管这些研究取得了显著成果,但仍存在一些不足之处,如对有限理性的刻画不够准确、缺乏对动态演化过程的考虑等。
本研究采用文献综述和理论分析的方法,对有限理性条件下的进化博弈理论进行综合评价和分析。
还将结合实验经济学的方法,通过设计有限理性条件下的人类博弈实验,深入探讨有限理性对行为和策略选择的影响。
通过对有限理性条件下的进化博弈理论的文献进行综述,发现有限理性个体的行为和策略选择受到多种因素的影响,如个体的学习能力和记忆力、群体规模和结构、以及博弈环境和规则等。
其中,个体的学习能力和记忆力会影响其策略调整的速度和方向,群体规模和结构会对演化稳定策略产生影响,而博弈环境和规则则会决定策略的相对优势和演化稳定性。
本研究发现,有限理性条件下的进化博弈理论为理解有限理性对行为和策略选择的影响提供了有益框架。
未来研究可以进一步探讨以下几个方面:如何更准确地刻画有限理性个体的行为和策略选择,例如考虑个体的不完全理性、偏好和情绪等因素;如何将动态演化过程纳入理论模型,以更好地模拟真实世界的演化过程;如何将有限理性条件下的进化博弈理论应用于更广泛的研究领域,例如社会心理学、经济学和生态学等。
本文对有限理性条件下的进化博弈理论进行了系统性的回顾和分析,发现该理论在解释有限理性对行为和策略选择的影响方面具有重要价值。
第五章 经济博弈论

本章介绍有限理性基础上的进化博弈分析。 完全理性在现实中很难满足,当社会经济环境和 决策问题较复杂时,人们必须存在很大的理性局 限。有限理性对人们的决策、行为选择方式有很 大影响,有限理性基础上的博弈分析与完全理性 博弈分析也有很大区别。进化博弈分析是有限理 性博弈分析的基本框架。本章介绍以最优反应动 态和复制动态为核心,以进化稳定策略为基本均 衡概念的进化博弈分析,包括基本方法、概念和 各种经典模型等。
A B B B A A A A A B A B B B A A A A B A B A A A B
5个博弈方经过4个时期的调整,最终收敛到了所有博弈方 都采用A的稳定状态。
初次博弈相邻2个A
B B B A A B A
A A A A A
A A A
初次博弈相连3个A
A B B A A A A
A A A
5.1.2 有限理性博弈分析框架
在有限理性博弈中具有真正稳定性和较强预测 能力的均衡,必须是能够通过博弈方的模仿、 学习 的调整过程达到的,具有能经受错误偏离的干扰 的 均衡,是在受到少量干扰后仍然能够“恢复”的均 衡。这时博弈分析的核心不是博弈方的最优策略的 选择,而是有限理性的博弈方组成的群体成员的策 略调整过程、趋势和稳定性,这里的稳定性是指采 用特定策略的成员的比例不变,而非某个博弈方的 策略不变
由于 xi (t ) 取0、1、2三个整数。因此上述反应规则实际就 是。如果在t时期博弈方i的两个邻居中只要有1个采用A,那 么博弈方在在t+1时期采用A.如果两个邻居都没有采用A。 那么博弈方i在t+1时期采用B 。 特点:博弈方i在t+1时期的策略与自己在第t期采取策略 反而没有直接关系;
最优反应动态模拟:初次博弈1个A
博弈论判断题

博弈论判断题第一章导论(1)单人博弈就是个人最优化决策,与典型的博弈问题有本质区别。
(2)博弈方的策略空问必须是数量空间,博弈的结果必须是数量或者能够数量化。
(3)囚徒的困境博弈中两个因徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
(4)因为零和博弈中博奔方之间的关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。
(5)凡是博弈方的选择、行为有先后次序的一定是动态博弈。
(6)多人博弈中的“破坏者”会对所有博弈方的利益产生不利影响。
(7)合作博弈就是博弈方采取相互合作态度的博弈。
参考答案:(1)正确。
因为单人博弈只有一个博弈方,因此不可能存在博弈方之间行为和利益的交互作用和制约.因此实际上就是个人最优化决策,与存在博弈方之间行为和利益交互作用和制约的典型博弈问题有本质的区别。
(2)前半句错误,后半句正确。
博弈方的策略空间不一定是数量空间,因为博弈方的策略除了可以是数量水平(如产量、价格等)以外,也可以是各种定性的行为取舍和方向选择,甚至也可能是各种函数或者其他更复杂的内容。
但一个博弈的结果必须是数量或者可以数量化,因为博弈分析只能以数量关系的比较为基础。
(3)错误。
结论恰恰相反,也就是囚徒的困境博弈中两囚徒之所以处于困境,根源正是因为两囚徒很在乎坐牢的绝对时间长短。
此外,我们一开始就假设两囚徒都是理性经济人,而理性经济人都是以自身的(绝对)利益,而不是相对利益为决策目标的。
(4)错误。
虽然零和博弈中博弈方的利益确实是对立的.但非合作博弈的含义并不是博弈力之间的关系是竞争性的、对立的,而是指博弈方是以个体理性、个体利益最大化为行为的逻辑和依据,是指博弈中不能包含有约束力的协议。
(5)错误。
其实并不是所有选择、行为有先后次序的博弈问题都是动态博弈。
例如两个厂商先后确定自己的产量,但只要后确定产量的厂商在定产之前不知道另一厂商定的产量是多少,就是静态博弈问题而非动态博弈问题。
《经济博弈论》期末考试复习资料

《经济博弈论》期末考试复习资料第一章导论1.博弈的概念:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。
它包括四个要素:参与者,策略,次序和得益。
2.一个博弈的构成要素:博弈模型有下列要素:(1)博弈方。
即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。
即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。
各博弈方的策略选择范围称策略空间。
每个博弈方各选一个策略构成一个策略组合。
(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。
(4)得益。
各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。
3.合作博弈和非合作博弈的区别:合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。
主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。
假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。
如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。
合作博弈:团体理性(效率高,公正,公平)非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率)4.完全理性和有限理性:完全理性:有完美的分析判断能力和不会犯选择行为的错误。
有限理性:博弈方的判断选择能力有缺陷。
区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。
所以不能简单地假设各博弈方都完全理性。
5.个体理性和集体理性:个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。
第一章课后题:2、4、52.设定一个博弈模型必须确定哪几个方面?设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。
第五章有限理性和进化博弈ppt课件

在整堂课的教学中,刘教师总是让学 生带着 问题来 学习, 而问题 的设置 具有一 定的梯 度,由 浅入深 ,所提 出的问 题也很 明确
演化博弈的关注内容
❖ 演化博弈强调经济变迁过程中以个体多样 性变异机制和偏好选择机制为代表的种群 研究。
❖ 它探讨种群选择的策略是否获得最佳的收 益,并消除任何小的突变群体的扰动。
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定
策略 5.3.3 协调博弈的复制动态和进化稳定博弈
在整堂课的教学中,刘教师总是让学 生带着 问题来 学习, 而问题 的设置 具有一 定的梯 度,由 浅入深 ,所提 出的问 题也很 明确
在整堂课的教学中,刘教师总是让学 生带着 问题来 学习, 而问题 的设置 具有一 定的梯 度,由 浅入深 ,所提 出的问 题也很 明确
❖ 在演化博弈中,认为参与人的选择行为可以 依据前人的经验、学习与模仿他人行为、受 遗传因素的决定等。
❖ 因而演化博弈把具有主观选择行为的参与人 扩展为包括动物、植物在内的有机体,动植 物参与者的支付可被理解为为某种适应程度。
经济学与生物学
经济学 企业 最优化 策略 利润 扩张 倒闭 创新
生物学 物种(或个体)
适应 基因 适应性(fitness) 繁殖 灭绝 变异
在整堂课的教学中,刘教师总是让学 生带着 问题来 学习, 而问题 的设置 具有一 定的梯 度,由 浅入深 ,所提 出的问 题也很 明确
自然界中的博弈
❖ 吸血蝙蝠夜间去大型哺乳动物那里吸血,有些个 体偶尔会空腹而归,此时吸饱血的个体就会吐出 胃内的血液喂给饥饿的个体,尽管它们之间并没 有直接血缘关系。
有限理性条件下的进化博弈理论

有限理性条件下的进化博弈理论一、本文概述在探讨进化博弈理论的过程中,理性假设一直占据着核心地位。
然而,现实生活中的决策过程往往受到各种限制,使得决策者难以达到完全理性。
因此,本文旨在探讨有限理性条件下的进化博弈理论,分析有限理性对博弈结果的影响,并揭示进化博弈理论在有限理性条件下的新特点和新规律。
本文首先将对有限理性进行界定,明确其内涵和特征。
在此基础上,本文将介绍进化博弈理论的基本框架和核心思想,为后续分析提供理论基础。
接着,本文将通过数学模型和案例分析,深入探究有限理性条件下进化博弈的动态演化过程,揭示有限理性对博弈策略选择、均衡状态以及博弈结果的影响。
本文还将探讨有限理性条件下进化博弈理论的实践应用。
通过分析现实生活中的经济、社会等问题,本文将展示进化博弈理论在有限理性条件下的解释力和预测力,为解决实际问题提供新的视角和方法。
本文将对有限理性条件下的进化博弈理论进行总结和展望,指出当前研究的不足和未来研究的方向,为相关领域的研究提供参考和借鉴。
二、有限理性条件下的博弈行为分析在经典博弈理论中,参与者通常被假设为完全理性的,能够完全预测和应对所有可能的情况。
然而,在现实世界中,这种完全理性状态是难以达到的。
有限理性条件下的博弈行为分析,旨在探讨在参与者决策能力受限的情况下,博弈过程和结果的变化。
有限理性意味着参与者在决策时可能无法获取全部信息,或者即使获取了全部信息,也可能由于处理信息的能力限制而无法做出最优决策。
这种局限性可能导致参与者采取简单的规则或启发式方法来指导他们的决策,而不是进行复杂的计算和推理。
在有限理性的条件下,博弈的动态性和复杂性可能会增加。
参与者可能需要在不完全了解对手策略的情况下做出反应,或者需要在不确定的环境中不断调整自己的策略。
有限理性还可能导致参与者出现认知偏差和错误,从而影响博弈的结果。
为了分析有限理性条件下的博弈行为,研究者通常采用一些数学模型和方法,如进化博弈论、适应性博弈论等。
第八讲 有限理性及其对博弈的影响

协调博弈的优先博弈方快速学习模型
12
8.2.1 协调博弈的有限博弈方快速学习模型
全部采用 A 或 B 的情况不需讨论,采用 A 策略博弈方 数量和位置有实质差异的只有 6 种情况
A B B B A B B A A A A A A A B A B A A B A A A B
B
初次博弈为 1A 的最优反应动态 (已包含有相邻 2A ,非相连 3A 和 4A 三种情况)
核心:博弈方策略类型比例是动态变化的,其变
化速度可用动态复制方程表示:
dx dt x ( u y u)
x 0时,无模拟榜样,博弈方不会有意识地改变策略。 x 0 时,若变化率为正,采用“同意”策略的博弈方
逐渐增多;若变化率为负,采用“不同意”策略的博弈 方逐渐增多。
x( x x 2 ) x 2 (1 x ) x 2 x 3
分析过程如下协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型13策略博弈方数量和位置有实质差异的只有种情况初次博弈为1a的最优反应动态已包含有相邻2a非相连3a4a三种情况协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型14初次博弈为相连3a的最优反应动态初次博弈为相邻2a的最优反应动态协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型15进化稳定策略在博弈方的动态调整策略中能达到又对少量偏离的扰动有稳健性满足这两种性质的稳定状态称进化稳定策略ess分析现实问题必须根据实际情况建立分析框架协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型16博弈方策略连续分布时的最优反应动态分析以古诺模型为例两个寡头的反应函数分别是个单位
演化博弈论__谢识予答案

dy/dt dy/dt
x=0
1
x
x=0
1
x
两群体复制动态的关系和稳定性
y 1
1/2
0
1
x
5.4.2 非对称鹰鸽博弈的进化分析
博弈方2
鹰
鸽
鹰博 鸽弈 方 1
非对称鹰鸽博弈博弈方1群体复制动态相位图
dx/dt dx/dt
dx/dt
1
x
y>5/6
y=5/6
x 1
y<5/6
1x
非对称鹰鸽博弈博弈方2群体复制动态相位图
第五章 有限理性和进化博弈
本章介绍有限理性基础上的进化博弈分析。 完全理性在现实中很难满足,当社会经济环境 和决策问题较复杂时,人们必须存在很大的理 性局限。有限理性对人们的决策、行为选择方 式有很大影响,有限理性基础上的博弈分析与 完全理性博弈分析也有很大区别。进化博弈分 析是有限理性博弈分析的基本框架。本章介绍 以最优反应动态和复制动态为核心,以进化稳 定策略为基本均衡概念的进化博弈分析,包括 基本方法、概念和各种经典模型等。
x——鸣叫雄蛙比例 复制动态方程
可能的不动点: x*=0 x*=1 x*=(m-z)/(1-p)
蛙鸣博弈复制动态相位图
dx/dt
dx/dt
1
x
dx/dt
(m-z)/(1-P)<0
(m-z)/(1-P)
1x
0<(m-z)/(1-P)<1
(m-z)/(1-P)>1
1x
5.4 复制动态和进化稳定性: 两人非对称博弈
A
B
A
B
BA
AB
B
B
B
B
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
签协议博弈的复制动态和进化稳定策略
一般两人对称博弈的复制动态和进化稳
定策略
协调博弈的复制动态和进化稳定策略
鹰鸽博弈的复制动态和进化稳定策略
一、签协议博弈的复制动态和进化稳定策略
博弈方2 同意 不同意
博弈 同 意 方1 不同意
1,1
0,0
0,0
0,0
图5.7签协议博弈
该博弈有两个纯策略纳什均衡(同意,同意)和 (不同意,不同意),其中前一个纳什均衡帕累托优 于后一个纳什均衡。现在在理性层次较低的有限理性 博弈方组成的大群体成员随机配对反复博弈的分析框 架内分析该博弈。假设整个群体中“同意”类型的博 弈 方比例是x,那么“不同意”类型博弈方的比例当然 是1x。
由于有限理性博弈方有很多理性层次,学习和策 略调整的方式和速度有很大的不同,因此,必须 用不同的机制来模拟博弈方的策略调整过程。
对于有快速学习能力的小群体成员的反复博弈, 相应的动态机制称为“最优反应动态”(Bestresponse Dynamics)。另一种情况是学习速度很 慢的成员组成的大群体随机配对的反复博弈,策 略调整用生物进化的“复制动态”(Replicate Dynamics)机制模拟。 通常也把研究有限理性博弈的理论称为“进化博 弈论”或“经济学中的进化博弈论”。
道自己的反应函数(意味着知道自己的利润函数), 不知道对方的利润(反应)函数,也没有预见能力。 不妨设一个寡头生产2.5单位,另一个寡头生产 3单位为第一个时期的结果,来演示一下两个寡头的 产量调整过程。
古诺模型的最优反应过程
设生产2.5单位的是寡头1,生产了3单位的是寡
头2。把这两个产量分别代入寡头2和寡头1的反应函 数,很容易得到两寡头第二期的产量将分别是1.5单 位和1.75单位;然后再把这两个产量分别代入寡头2 和寡头1的反应函数,不难得到第三期双方的产量为 2.125 单位和 2.25单位;依次类推可得到第四期双方
出现),上述变化率为负,即采用 “同意”策略的博 弈
方会减少;当该幅度为0时(本例只在 x=1时成立), 变化率就等于0,即采用“同意”策略的博弈方比例不
dx dt
0.5
1
x
图5.8 签协议博弈复制动态相位图
* 根据图5.8, x 0 和 x* 1 是上述复制动态的
两个稳定状态,其中 x* 1 是对应大多数初始状态
有限理性博弈的有效分析框架是由有限理性博弈方 构成的,一定规模的特定群体内成员的某种反复博 弈。博弈方有一定的统计分析能力和对不同策略效 果的事后判断能力,但没有事先的预见和预测能力。 博弈分析的核心不是博弈方的最优策略选择(这是 大多数经济分析、决策分析的核心),而是有限理 性博弈方组成的群体成员的策略调整过程、趋势和 稳定性。此外,稳定性指群体成员采用特定策略的 比例不变,而非某个博弈方的策略不变。 有限理性博弈分析的关键是确定博弈方学习和策略 调整的模式,或者说机制。
完美就属于有限理性。
二、有限理性博弈分析框架
有限理性意味着博弈方往往不会一开始就找到 最优策略,而是在博弈过程中学习博弈,必须通 过试错寻找较好的策略;有限理性也意味着一般 至少有部分博弈方不会采用完全理性博弈的均衡 策略,意味着均衡是不断调整和改进而不是一次 性选择的结果,而且即使达到了均衡也可能再次 偏离。 在有限理性博弈中具有真正稳定性和较强预测 能力的均衡,必须是能通过博弈方模仿、学习的 调整过程达到,具有能经受错误偏离的干扰,在 受到少量干扰后仍能够“恢复”的稳健的均衡。
dx x( x x 2 ) x 2 (1 x) x 2 x 3 dt
根据进化稳定策略的定义,我们要找的是 dx dt 0 的情况,解该方程有x=0 和x=1两种情况。 当 x=0 时,上述速率等于 0,即如果初始时刻没
有博弈方采用“同意” 策略,那么采用这种策略的博 弈
B B B
A A
A
A A A A A A
B
A A
图5.5初次博弈为相邻2A的最优反应动态
A
A A A A A A
B B
A
图5.6初次博弈为相连3A的最优反应动态
上述分析表明,在题设条件下,所有32种可能的 初次博弈情况中,只有一种情况是所有博弈方采用B 的状态,其余31种都会收敛到采用A的状态。这说明 A策略和 B策略都是有限理性博弈方进行上述协调博 弈的稳定状态,但前一种稳定状态显然更重要一些, 因为博弈方的策略调整收敛到这种情况的机会要大大 高于后一种情况。从而在博弈方有限理性条件下给出 了(A,A)和(B,B)这两个纳什均衡各自被采用 的机会一种趋势性判断。结论是在有限理性框架内, 博弈方采用策略 A,实现均衡(A,A)的机会远高 于采用B和实现均衡(B,B)的机会。
也就是说,由于该博弈本身是一个有多重纳什均 衡的博弈,因此在一次性博弈中,即使博弈方都是高 度理性的,博弈结果也有不确定性,很难作出完全保 险的预测。 这里举例说明最优反应动态的思想方法。 设有5个有限理性博弈方,分别处于如图5.2所示 的位署上,每个人都与各自 1 的左右邻居就图 5 .1中得益 5 2 矩阵表示的 “协调博弈” (Coordination Game)进行 反复博弈,观察他们最终会 3 4 趋于向选择哪个策略。
从上述协调博弈的最优反应动态机制给出的两 种稳定状态可以看出,只有所有博弈方都采用 A策 略同时具有在博弈方的动态策略调整中会达到,又 对少量偏离的扰动有稳健性两个性质。同时具有这 两种性质(群体趋向且抗干扰)的稳定状态,在进 化博弈论中被称为 “进化稳定策略”。在上述协调 博 弈中,A 就是一个进化稳定策略,而 B 则不是进化 稳定策略。
“同意”和“不同意”两种类型博弈方各自的期 望得 益和分别为:
u y x 1 (1 x) 0 x
un x 0 (1 x) 0 0
群体成员的平均得益为:
u x u y (1 x) un x 2
博弈方策略类型比例动态变化是有限理性博弈分 析的核心,其关键是动态变化的速度(方向可由速度 的正负号反映)。 通常情况下,博弈方学习模仿的速度取决于两个 因素:一是模仿对象的数量大小(可用相应类型博弈 方的比例来表示),因为这关系到观察和模仿的难易 程度;二是模仿对像的成功程度(可用模仿对象策略 得益超过平均得益的幅度表示),因为这关系到判断 差异的难易程度和对模仿激励的大小。
,博弈方i 采用 B的得益为
xi (t ) 0 2 xi (t ) 60 2
。根据最优反应动态机制,当
xi (t ) 50 2 xi (t ) 49 xi (t ) 0 2 xi (t ) 60 2 2
时,即 x (t ) 22 61
i
时,博弈方i在t+1时期会采用A,否则采用B。
第五章 有限理性和进化博弈
有限理性博弈及其分析框架
最优反应动态 复制动态和进化稳定性:两人对称博弈
复制动态和进化稳定性:两人非对称博弈
第一节 有限理性博弈及其分析框架
一、有限理性及其对博弈的影响
完全理性包括(追求最大利益的)理性意识、
分析推理能力、识别判断能力、记忆能力和准确行
为能力等多方面的完美性要求,其中任何一方面不
第二节 最优反应动态
博弈方具有较快学习能力(在复杂局面下准确判 断和预见能力稍差,但能够对不同策略的结果作出比 较正确的事后评估,并能相应调整其策略)的博弈。 因此给定前期的经验(博弈结果),每个博弈方本期 能找到和采取针对前期其他博弈方(全部或邻近的部 分博弈方)策略的最佳反应策略。 最适合描述这种理性层次博弈方的策略调整的动 态机制,就是所谓的 “最优反应动态”(Best Response Dynamics)。
产量为 1.875单位和 1.937 5单位,……;
上述动态调整过程趋向收敛于两寡头各生产2单
位产量(完全理性博弈的古诺产量),即唯一的纯 策略纳什均衡。由于这个稳定状态也具有对微小扰 动的稳健性,因此它是这个博弈在上述最优反应动 态下的进化稳定策略(ESS)。
第三节 复制动态和进化稳定性:两人对称博弈
方就始终不会出现。现实根据是对于有限理性博弈方 来说,一定要有模仿的对象才能进行模仿,当x=0 时 就不可能有学习模仿的榜样,因此所有博弈方都不会
有意识地改变策略。
当x>0,也就是开始时有采用 “同意” 策略的博 弈
方时,如果采用这种策略的期望得益超过平均得益的
幅度为正(本例中由 0<x<1,因此符合),那么上 述变化率为正,即采用 “同意” 策略的博弈方会逐 渐增 加;当上述幅度小于0时(本例因 0<x<1,故不可能
A、4A、5A共8种有实质差异。
假设
xi (t ) 为在t时期博弈方i
的邻居中采用A策略
的数量,该数量有0、1、2三ห้องสมุดไป่ตู้可能的值;邻居中采
用B策略的数量相应为 2 xi (t ) ,也有 0、1、2三个可 能值。
针对第t期 xi (t ) 的相关情况,博弈方i 采用 A的 得益为 为
xi (t ) 50 2 xi (t ) 49 2
以采用“同意”策略类型博弈方的比例x为例,
其 动态变化速度可以用下列动态微分方程表示: dx
dt x (u y u )
dx
dt
即“同意”类型博弈方比例随时间的变化率 。 该动态微分方程的意义是,“同意” 类型博弈方 比 例的变化率与该类型博弈方的比例成正比,与该类型 博弈方的期望得益大于所有博弈方平均得益的幅度也 成正比。称它为“复制动态”或“复制动态方程”。 把采用“同意”策略博弈方的期望得益和群体所 有
一、协调博弈(Coordination Game)
博弈方2 A B
博弈 A 50,50 方1 B 0,49