《第三章传统博弈理论(2动态博弈)》解读
博弈论(第三章)

劳资博弈
先由工会决定工资率,再由厂商决定雇用多少劳动力
max π (W , L ) = max [ R ( L ) − WL ]
L≥0 L≥0
max u[W , L* (W )]
W ≥0
R
斜率为W R(L) WL
W
W*
0
L (W )
厂商的反应函数
*
L
0
L* (W * )
L* (W )
u3 u2 u1 u0
第三节 子博弈和子博弈完美(精炼)纳什均衡 子博弈
A
借
B
不借 (1,0)
还 (2,2)
不还 起诉
A 不起诉
(1,0)
(0,4)
第三节 子博弈和子博弈完美(精炼)纳什均衡 子博弈精炼纳什均衡
如果在一个完美信息的动态博弈中,各博弈方 的策略构成的一个策略组合满足,在整个动态博弈 及它的所有子博弈中都构成纳什均衡,那么这个策 略组合称为该动态博弈的一个“子博弈精炼纳什均 衡”。
无不确定性的委托人—代理人模型
1
委托 不委托
代理人的选择
激励相容约束:
w(E)-E> w(S)-S w(E)> w(S)+E-S
2
接受
拒绝
[R(0),0]
2
努力 偷懒
[R(0),0]
[R(E)-w(E), w(E)-E]
[R(S)-w(S), w(S)-S]
参与约束:
2
接受 [R(E)-w(E), w(E)-E]
第四节 经典动态博弈模型
斯塔克博格模型( Stackelberg)
和古诺模型双方产量均为2的产量,总量为4相比 较,斯塔克博格模型中两厂商的产量较高。厂商1的得 益4.5大于古诺模型中厂商1的得益4,但厂商2的得益 2.25小于国内模型中厂商2的得益4。 *在动态博弈中,有先动优势,也有后动优势。信 息多了,可能结果好,但也可能结果更糟。
《第三章传统博弈理论(2动态博弈)》解读

“社会嵌入性”是指现代市场经济中交易或组织嵌入在参与人“社会网络” 中。 格拉诺威特1985在AJS发表开创性论文《Economic Action and Social Structure: The Problem of Embeddedness》发起了一场“新经济社会学”运动 :一方面批评了杜克海姆和帕森斯(1951)“过度社会化”的社会学传统;一 方面批评了经济学效用理论“社会化不足”的缺陷,认为规范系统既是内 生于市场或组织的参与者行为中,又是嵌入到具体的外部社会网络中。 这篇文章中提出了著名的社会学概念“嵌入性(embeddedness)”:个体或企 业的经济关系是嵌入到实际的社会网络中。
博弈论专题讲座
(Advances in Game Theory)
东北财经大学 数学与数量经济学院 刘德海
ldhai2001@
1
作业讲解
代理人
诚实 不诚实 不信任 0,0 信任
委托人 不信任 信任
0,0
诚实 5,5
代理人
不诚实 0
5, 5
张维迎《法律制度的信誉基础》一文的重复博弈模型 试计算:(1)请将该动态博弈模型转化为静态博弈模型?
第四节 纳什均衡的多重性:静态博弈的焦点均衡
思考:从博弈论角度,如何看待世界的多样性和最优性(普适性)? 传统博弈理论:参与者是完全理性的,根据所处环境能够达到最优 化目标。 ——多重均衡的精炼(最优化):如何精炼出更好的均衡结果? 演化博弈理论:参与者是有限理性的,只能达到满意解。 ——多重均衡存在的适用条件:根据不同的历史初始条件和外部随 机事件干扰,存在演化的路径依赖现象。
16
举例1:台独与大陆的台海博弈
台独分子的“理性”目标设定:中国面临着本世纪初二三十年的 战略机遇期,不希望有台海战争。台独分子觉得这是推进台独的 大好时机,通过修宪等“切香肠”渐进方式来争取独立。 台独分子的认知结构:要是中国威胁动武,陈水扁相信美国众议 院亲台反华势力能发挥影响力,台海发生冲突后美国必会拔刀相 助。中国面对美日联合干涉将知难而退,从而在美日卵翼下实现 和平独立的台独梦想。
动态博弈分析

弱纳什均衡,它们不稳定。
基于动态博弈的控制系统
• 基于动态博弈的控制系统设计,关键就是要将控 制的目标状态设计成博弈的子博弈精炼纳什均衡 。系统达到了纳什均衡,也就实现了控制目标。
策略式表示
B
策略
一
A
策略
二
策略
三 1 ,0 0 ,1
策略
四 1,0 0,0
开发 不开发
-3,-3 -3,-3 0,1 0,0
• 策略一:无论A是否选择开发,B选择开发。
• 策略二:若A选择开发,B也选择开发;若A选择 不开发,B也选择不开发。
• 策略三:若A选择开发,B就选择不开发;若A选 择不开发,B就选择开发。 • 策略四:无论A是否选择开发,B都选择不开发。
1. 完美纳什均衡:一个策略组合要成为完美纳什均 衡,就必须在所有可能的路径上达到均衡,不仅 包括均衡路径,还要包括其它不同的分支路径; 2. 对于一个参与人,他的完美均衡策略不仅可以保 证其它参与人处于均衡路径上时他可以做出最佳 反应,而且其它参与人处于非均衡(或者均衡路 径之外)时,他依然可以做出最佳反应;
51 4 4 9 -1 0 0
2. 动态博弈的策略式表述
• 若博弈的阶段很多乃至无穷,或者参与人 在一个阶段有很多可选择的行为,采用博 弈树表述将变得困难或根本不行。如下棋 ,等。 • 此时,应选用策略式表示。
2. 动态博弈的策略式表述
• 一个例子:美中军事博弈
犯 中国 不犯
美 国
犯
-2
-2
2 -4 2 2
完全按静态博弈分析,
• 静态博弈的收益矩阵 • 纳什均衡两个.
2.博弈的策略式表述
• B有两个决策节(信息集) 每个决策节上有两个可选行动,因而B有四 个纯策略,分别是:
动态博弈理论与应用

动态博弈理论与应用第一章:引言动态博弈理论是博弈论的一种重要分支,研究的是受到时间和信息约束的博弈问题。
它从时间顺序和信息公开程度等维度对博弈过程进行建模和分析,是理论经济学、管理学、计算机科学等众多学科领域中的重要研究内容之一。
本文将从动态博弈理论的基本概念、模型和方法入手,介绍动态博弈理论的主要内容和应用情况。
第二章:动态博弈理论的基本概念动态博弈理论建立在静态博弈理论之上,它的最主要的特点在于参与者的决策与结果之间存在时间上的关联关系,即决策是按照时间顺序轮流做出的。
而参与者在做出决策前,只能知道自己的信息和其他参与者之前做的决策,不能预知未来的结果。
在这个基础上,动态博弈理论提供了一系列的模型和方法来分析博弈的结果及实现方式。
第三章:动态博弈理论的模型动态博弈理论的模型可以基于信息不完备、不确定性、策略可见性等多个方面进行分类。
其中,信息不完备的模型是最基础的,最经济学家最常使用的。
信息不完备模型中,博弈参与者的行动必须基于自己已知的信息,而不知道其他参与者的信息。
而在不确定性模型中,参与者不知道结果将会如何。
策略可见性模型则是最具有实际应用的模型,这种模型中,每个参与者知道所有的实际结果及其影响,即支配条件。
第四章:动态博弈理论的方法动态博弈理论中有许多方法,常用的包括完美均衡、子博弈完美均衡、可重复博弈、概率博弈等。
典型的完美均衡策略就是一个序列,每一项都是一个单步博弈策略,游戏结果取决于序列的每一步策略。
子博弈完美均衡则是针对复杂的大型博弈进行分析的一种方法。
若子博弈具有完备信息,则必须使用完全搜索算法来处理该问题。
而可重复博弈和概率博弈则是针对直接博弈不适合的情境,如合谋的情境、局部信息的分布等,而设计的两种不同类型的博弈方法。
第五章:动态博弈理论的主要应用动态博弈理论具有广泛的应用领域,例如竞争激烈的高科技行业、公共政策设计、外交谈判和金融衍生品等领域。
例如在金融衍生品市场中,动态博弈理论可以通过构建模型分析衍生品价格,为股票、债券和外汇等市场提供更完善的竞争分析和风险管理策略。
《第三章 传统博弈理论(3不完全信息)》

8
[资料夹]朝核问题和六方会谈
朝鲜指控美国对其国家安全构成最大威胁,美国坚持朝鲜半岛无核化。
为解决问题,朝鲜一直要求与美国进行直接对话,并多次提议与美国签 订互不侵犯条约,以图获得外交承认;但美国坚持不直接与“流氓国家” 接触,要求朝鲜先行放弃核计划,并坚持采取多边对话解决。
中国外交穿梭,先2003年4月23日-25日,中、朝、美三方在北京举行了 三方会谈,中国作为中间人角色促成朝美双方进行直接沟通;然后8月份 进入六方会谈阶段。 07年3月,美国首席谈判代表希尔与朝鲜代表团团长金桂冠在日内瓦就朝 鲜核计划举行了为期两天的谈判。据美国首席谈判代表希尔称,朝鲜将 全面公开其核计划,并在年底前关闭所有核设施。
Farrell J., Rabin M. Cheap Talk. The Journal of Economic Perspectives, 1996, 10(3): 103-118.
7
第五节 纳什均衡的无效率问题:
相关均衡和信号装置
第二种实现途径: 引入外部实体进行协调 回忆:一般均衡理论中市场均衡价格的形成机制。
9
第五节 纳什均衡的无效率问题: 相关均衡和信号装置
boy
看球 看电影
看球
看电影
girl
1, 1 0, 1
1, 0 2, 2
动态博弈理论

动态博弈理论基本概念静态博弈:所有局中人同时行动;后者局中人的行动有先后顺序,但是,后行动者不能观测到先行动者的行动。
动态博弈:局中人的行动有先后顺序,后行动者可以观测到先行动者的行动。
静态博弈的表示:局中人集合;局中人的决策集;局中人的支付(收益)函数。
动态博弈的表示(博弈的扩展式表达)1、局中人集合;(其中包括虚拟局中人“自然”)2、局中人的行动顺序:谁在什么时候行动;3、局中人的行动空间(决策集):在每次行动时,局中人的可供选择的决策;4、局中人的信息集:在每次行动时,局中人所知道的以前博弈过程的信息;5、局中人的支付函数:每次行动时,局中人的所得(它是所有行动的函数);6、外生事件(“自然”的选择)的概率分布。
博弈树:多人有限策略的扩展式可以用博弈树表示例:有房产商A和B各可以开发一栋楼,开发成本为1亿。
若市场有两栋楼,当市场需求大时,每栋楼售价为1.4亿;当市场需求小时,每栋楼售价为7千万。
若市场只有一栋楼,当市场需求大时,售价为1.8亿;当市场需求小时,每栋楼售价为1.1亿。
房产商的决策选择为开发或不开发。
这样,共有下列8种可能结果:1、需求大,A开发,B不开发,则A的利润为0.8亿,B的利润为0;2、需求大,A不开发,B开发,则A的利润为0,B的利润为0.8亿;3、需求大,A开发,B开发,则A的利润为0.4亿,B的利润为0.4亿;4、需求大,A不开发,B不开发,则A的利润为0,B的利润为0;5、需求小,A开发,B不开发,则A的利润为0.1亿,B的利润为0;6、需求小,A不开发,B开发,则A的利润为0,B的利润为0.1亿;7、需求小,A开发,B开发,则A的利润为-0.3亿,B的利润为-0.3亿;8、需求小,A不开发,B不开发,则A的利润为0,B的利润为0;假设行动顺序为房产商A先行动,然后“自然”选择需求量(假设需求大或小的概率同为0.5)。
房产商B观察到房产商A行动和“自然”选择后,再选择行动。
第三章-第五节-演化博弈模型解读

dx x U Y U dt
dx 则: x 2 x3 dt
当x=0时,稳定;
复制动态方程
当x>0时,最终稳定于x*=1
dx/dt
dx x 2 x3 dt
乙 Y 甲 Y N 1,1 0, 0 N 0 ,0 0,0
0
1
图1 签协议博弈的复制动态相位图 x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
在方法论上,它不同于博弈论将重点放在静态均衡
和比较静态均衡上,强调的是一种动态的均衡。演 化博弈理论源于生物进化论。
为什么将演化思想引入到博弈论中?
(1)博弈论对生物学的影响。博弈论的策略对应生
物学中的基因 ,博弈论的收益对应生物学中的 适应度。在生物学中应用的博弈论与经济学中的 传统博弈论最大区别就是非完全理性的选择。 (2)演化化思想对社会科学的影响。例如,在市场 竞争中,我们不必要去理性的想那个策略才是最 优的,最后能够在市场存活下来的企业,一定是
若x<x*,为使x→x*,应满足F(x)>0;
若x>x*,为使x→x*,应满足F(x)<0.
F(x)=dx/dt,t↑,则x↓
F(x)
这意味着:
x* 0 x
当F'(x*)<0,x*为ESS
(三)协调博弈的复制动态和ESS
复制动态方程F(x):
甲 A B
乙 A 50,50 0,49 B 49,0 60,60
x
(二)一般两人对称博弈
甲 S1 S2
乙 S1 a,a c, b S2 b ,c d,d
群体中采用S1的比例为x,S2的比例为1-x,对于甲
第三章完全且完美信息动态博弈

第三章完全且完美信息动态博弈在动态博弈中,参与者需要根据对手的行为和策略来调整自己的行动,以便达到最佳的结果。
动态博弈可以分为完全信息动态博弈和不完全信息动态博弈。
完全信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,而不完全信息动态博弈则是指参与者不知道其他参与者的策略和收益函数。
在完全信息动态博弈中,参与者可以通过观察对手的行为来推断出对手的策略和收益函数。
这种博弈可以通过逆向归纳法来求解,即从博弈的阶段开始,逐步向前推导出每个阶段的最佳策略。
逆向归纳法是一种有效的求解完全信息动态博弈的方法,它可以帮助参与者找到最佳策略,从而实现最佳的结果。
然而,在现实世界中,完全信息动态博弈并不常见。
大多数博弈都是不完全信息动态博弈,参与者无法知道其他参与者的策略和收益函数。
在这种情况下,参与者需要通过观察对手的行为和策略来推断出对手的类型和收益函数。
这种博弈可以通过贝叶斯纳什均衡来求解,即参与者根据对手的类型和收益函数来选择自己的策略,以达到最佳的结果。
完全且完美信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,并且参与者能够观察到其他参与者的行为和策略。
这种博弈可以通过逆向归纳法和贝叶斯纳什均衡来求解,从而帮助参与者找到最佳策略,实现最佳的结果。
在完全且完美信息动态博弈中,参与者可以通过观察对手的行为和策略来推断出对手的类型和收益函数,从而调整自己的策略,以实现最佳的结果。
在完全且完美信息动态博弈中,参与者之间的互动是基于透明和预知性的。
每个参与者不仅清楚自己的策略选择和可能的收益,同时也了解其他参与者将如何根据这些信息做出反应。
这种透明度使得参与者能够做出更加精确的决策,因为他们能够预测对手的行动并据此调整自己的策略。
这种博弈的一个关键特点是,参与者之间的信息是对称的。
这意味着没有参与者拥有其他参与者所不知道的信息优势。
这种信息对称性使得博弈变得更加公平,因为它消除了信息不对称带来的不确定性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抵赖 坦白
抵赖
B
(-8,-8) (0,-10) (-10,0) (-1,-1) 博弈树(game tree)的构成:
(-8,-8) (0,-10)(-10,0) (-1,-1)
结点:包括初始结点、决策结点(作出决策)、终结点(对应参与者报酬); 若结点是有限的,则称有限次博弈。 枝:从一个决策结到直接后续结的连线,每一个枝代表参与者一个行动; 信息集:一个参与者无法作出区分的最大决策点集合(如图,囚徒B无法 判断A的行动,因此其信息集为虚线连接)。 子博弈:
15
——理解:不仅整体上是纳什均衡,而且每一个小步骤都是纳什均衡。
第四节
纳什均衡的多重性:
例:扩展式囚徒困境 坦白 坦白
动态博弈和子博弈完美均衡
B × 抵赖 坦白 × 抵赖
A ×抵赖
(-8,-8) (0,-10) (-10,0) (-1,-1)
思考:为什么动态博弈纳什均衡中,存在着一些不可信的威胁或承诺? 回忆:纳什均衡的形成——理性的参与者+既定的策略。但是,事先给定 的对方策略是否合理?
[资料夹] 非数理博弈理论
主流的数理博弈论:采用数学语言和公理性的方法来进行研究的。 谢林认为,决策主体的期望和行为无法通过纯粹的逻辑和数学推导而得。参与人在 选择博弈战略时,不仅有数学上的考虑,也有传统、声誉、个性和社会等因素。 谢林放弃传统经济学的抽象假设和理性概念,基于更接近现实的观察和众多的实际 应用,运用小模型和熟练的语言技巧,分析人们之间的相互影响及个人的自我控制 等冲突情形中的行为。 该研究方法突破了新古典经济理论分析方法,创立了“非数理博弈理论”这一新的 领域,从另一个角度完善和发展了现代博弈论。 概念和理论框架:
类比:决策问题是博弈的一种特例,其中一方是自然参与者——博弈树
Von Neumann和O. Morgenstern(1944)提出“扩展式”模型,又称博弈树 。用来描述参与者的行动顺序和采取行动时拥有的信息。
例:扩展式囚徒困境 坦白 坦白 抵赖
例:扩展式囚徒困境
A
抵赖 坦白
抵赖
B
坦白
坦白
抵赖
A
西安交通大学人文学院院长 边燕杰
格拉诺威特最著名的工作是在AJS发表的文章“The Strength of Weak Ties”( 后来形成专著 “Getting A Job ”),其基本的论断是 “弱关系假设”,即你的 家庭成员和密友(“strong ties”) 无法向一般熟人、较为疏远朋友等(“weak ties”) 提供给你多样化的知识。
理论分析结果:首先提出方案的人应该选择99元。
实验结果:美国、南斯拉夫选50:50,日本、以色列选60:40。 解释:人类决策考虑了公平等社会文化规范。最后通牒实验表明, 人们宁愿什么也得不到,也不愿意放弃机会均等和程序公平。 ——“不患寡而患不均”《论语·季氏》 世界银行《2006年发展报告:公平与发展》:总结10年来许多可控 实验结果以及近期经济学研究的成果指出,世界上不同的文化和宗 教都在关注公平与公正,公正是人们的一种偏好。
第四节 纳什均衡的多重性:静态博弈的焦点均衡
思考:从博弈论角度,如何看待世界的多样性和最优性(普适性)? 传统博弈理论:参与者是完全理性的,根据所处环境能够达到最优 化目标。 ——多重均衡的精炼(最优化):如何精炼出更好的均衡结果? 演化博弈理论:参与者是有限理性的,只能达到满意解。 ——多重均衡存在的适用条件:根据不同的历史初始条件和外部随 机事件干扰,存在演化的路径依赖现象。
(2)划线法求解静态模型的纳什均衡解? (3)如果无限次重复博弈,达成{信任,诚实}的均衡结果,需要如何设计 合适的触发策略?贴现因子的成立范围为多少?
分析:冷酷的触发策略设计为“当代理人诚实交易时保持信任,否则一旦不 诚实则取消交易”;
无限期重复博弈,代理人诚实交易的收益:U诚实= 5+5δ+5δ2+…=5/(1-δ) 代理人不诚实交易的收益:U不诚实=10+0=10 当5/(1-δ)>10时,即δ>0.5时,双方将达成{信任,诚实交易}结局。
(1)议价和冲突管理理论。代表性著作《冲突的战略》(1960) ; (2)相互依存的选择和行为理论。代表性著作《微观动机与宏观行为》(1978); (3)自我控制理论。代表作著作《选择与结果》(1984)。
[资料夹] “社会嵌入性”(social embeddedness)
Mark Granovetter
Bian, Yanjie . “Bringing Strong Ties Back In: Indirect Connection, Bridges, and Job Search in China”. American Sociological Review 62, no. 3 (1997): 366-385 .边燕杰. 找回强关系:中国的 间接关系、网络桥梁和求职,《美国社会学评论 》1997, 62:366-385.
“社会嵌入性”是指现代市场经济中交易或组织嵌入在参与人“社会网络” 中。 格拉诺威特1985在AJS发表开创性论文《Economic Action and Social Structure: The Problem of Embeddedness》发起了一场“新经济社会学”运动 :一方面批评了杜克海姆和帕森斯(1951)“过度社会化”的社会学传统;一 方面批评了经济学效用理论“社会化不足”的缺陷,认为规范系统既是内 生于市场或组织的参与者行为中,又是嵌入到具体的外部社会网络中。 这篇文章中提出了著名的社会学概念“嵌入性(embeddedness)”:个体或企 业的经济关系是嵌入到实际的社会网络中。
在预测动态博弈的可能结局时,纳什均衡存在多重性现象,其中包含一 些不可信的威胁或承诺,如何剔:决策理论中,如何处理多阶段动态规划问题?
多阶段决策又称序贯决策:决策过程可以分为若干个相互联系的阶段, 每个阶段需要作出决策,本阶段的决策影响到下一阶段的决策。 动态规划的最优化原理(Bellman,1951):作为整个过程的最优策略具 有这样的性质,无论过去的状态和决策如何,对先前决策形成的状态而 言,余下的决策必须最优。(简言之:最优策略的子策略总是最优的) 根据贝尔曼最优化原理,逆推法求解动态规划问题。
基本思想:动态博弈中,双方都具有理性的“共同知识”。在纳什均衡的基础 上(可自我实施的稳定均衡),依据反向归纳法进一步剔除那些不可信的威胁 和承诺。
子博弈完美均衡的定义:一个纳什均衡是子博弈完美纳什均衡,当该策略的每 一个子博弈都产生一个纳什均衡 ,无论实际中是否能到达 。 存在性定理(Selten, 1965):每个扩展式、完美信息博弈至少有一个纯策略子 博弈完美纳什均衡。 1965年,发表了最著名论文《一个具有需求惯性的寡头博弈模型》(德文)。 这篇文章成为子博弈精炼均衡的正式定义,为获得诺奖奠定了基础。
6
[资料夹] 2005年诺将得主—谢林(Schelling)
托马斯·克罗姆比·谢林(Thomas Crombie Schelling)(1921-) 是美国经济 学家、马里兰大学公共政策学院教授,美国科学院院士,美国艺术与科 学学院院士。研究领域是外交事务、国家安全、核策略和武器控制。
“通过博弈论分析改进了我们对冲突和合作的理解”,谢林与罗伯特· 奥曼2005年共同获奖。
举例:如果试卷命题错误(策略),即使计算过程正确(理性),答案是否正确?该 题目应该取消计分。
由于动态博弈的核心问题是“可信性”,因此子博弈完美均衡是求解动 态博弈问题的基本均衡概念。
求解方法:后退归纳法。根据共同知识假设,参与者能够预见最后一期 的行动,因此采取后退归纳法分析,从最后一个子博弈的结点出发,分 析每一个子博弈的最佳策略(纳什均衡);直至博弈开始阶段,得子博 弈完美纳什均衡SPE。
4
第四节 纳什均衡的多重性:静态博弈的焦点均衡
T 参与者B T G 2, 2 0, 0
参与者A G
1/2,1/2 1, 1
静态博弈中多重均衡的选择: 焦点原则和社会惯例
Schelling在《冲突的策略》(1960)提出,决策过程中考虑到对称、 效率、公平、风险占优等原则,以及一些社会文化惯例。 举例:如图博弈中,参与者将选择哪个策略? 结果:在三个均衡中,精炼结果是帕累托效率的纯策略(2,2) 思考:在什么情况下会选择(1,1)?
第三章 传统博弈理论的简介
主要内容: 第一节 传统博弈理论的研究范式; 第二节 纳什均衡的定义和几种实现途径; 第三节 纳什均衡的无效率:重复博弈和无名氏定理; 第四节 纳什均衡的多重性:焦点均衡和子博弈完美均衡; 第五节 纳什均衡的无效率:相关均衡和信号装置; 第六节 不完全不完美信息下纳什均衡存在性:贝叶斯均衡
——当参与者B认为,A会采取安全策略G(即Minmax策略),则均衡结 果为(1,1)
5
第四节 纳什均衡的多重性问题:焦点均衡
最后通谍博弈(Ultimatum game,简记为UG,Roth etc. 1991):100元在两个人 中分摊,其中一人首先提出方案,对方不接受则双方为0。
14
——例如优秀毕业生
Bellman R: An introduction to the theory of dynamic programming, RAND Corp. Report, 1953
第四节 纳什均衡的多重性:动态博弈和子博弈完美均衡
对于动态博弈,一种广泛认可的精练方法是子博弈完美均衡(SPE,Subgame Perfection Equilibrium)