博弈论 前向归纳法 forward induction
战略管理

战略管理题目
1、 纳什均衡作为博弈论的优缺点是什么? 纳什均衡:它是由全部参与人所选择的战略构成的这样一个组合,在这 个组合中,每个参与人的战略都是针对其他参与人人战略选择的最优反 应。 优点:纳什均衡具有战略稳定性,在均衡状态之下没有人愿意单方面改 变自己的战略选择,因此,纳什均衡具有自我实施特征。纳什均衡在战 略实施中有着非常重要的意义。 缺点:存在多个纳什均衡,这是纳什均衡的最大缺陷,降低了纳什均衡 解的预测能力,因为一旦参与人的预期不一致,就可能出现极为糟糕的 结局。
隐藏行动:是指博弈参与人采取的行动(如努力水平)一方知道而另一 方不知道。 .隐藏行动问题的解决——激励机制设计之一 (1)传统解决思路 A对隐藏行动者进行监督 B对隐藏行动者进行伦理教化。 (2)创造一种激励机制让隐藏行动者自愿努力工作或学习。 这种方法的实质就是尽量让人们自己监督自己。 A让隐藏行动者成为全部剩余收入的索取者。 B如果隐藏行动者是风险厌恶的,则为了激励他努力工作,只能将他的 报酬与产出水平挂钩,即报酬依存于产出。 C产出不可测条件下的激励机制设计:机会成本激励法,赋予团队更大 的决定权。
(6)行业进入风险。 (7)行业退出风险。 (8)内部经营整合风 险。
2、 占优策略的优缺点 在企业各自的策略集中,如果存在一个与其他竞争对手可能采取的策略 无关的最优选择,则称其为占优策略。所谓的占优策略就是指无论竞争 对手如何反应都属于本企业最佳选择的竞争策略。
博弈论第2章

• 托玛斯 谢林(Thomas C. Schelling )84岁,美国公民。他1951年 托玛斯-谢林( 谢林 岁 美国公民。 年 获得哈佛大学经济学博士学位。 获得哈佛大学经济学博士学位。后曾在美国哈佛大学的肯尼迪学 院教学长达20 20年 担任政治经济学教授, 院教学长达20年,担任政治经济学教授,并获得退休名誉教授 的称号。之后他还在美国马里兰大学公共政策学院和经济系担任 的称号。 教授,并获得退休名誉教授称号。 教授,并获得退休名誉教授称号。他教授的课程除包括经济学理 论外,还涉及外交、国家安全、核战略以及军控等多方面。 论外,还涉及外交、国家安全、核战略以及军控等多方面。
贡献:《冲突战略》、《武器与影响》等,其中前者是相关领域中最具 开创性的理论著作之一。他的理论和思想不仅运用在经济学分析中,在外 交、军事领域也深有影响。
Robert J. Aumann
Thomas C. Schelling
罗伯特·奥曼的博弈论
• • • • • 弈论:交互式条件下“最优理性决策” 完全竞争经济:参与者连续统模型 重复博弈论:理论系统性的发展 合作与非合作博弈论:非转移效用与理性的假设 其他贡献 “奥曼可衡量选择定理”、值集函数积分结 果等 评论:
博弈论的形成
博弈论的真正起点 博弈论的真正起点—— 真正起点—— 诺伊曼、 1944年 冯 诺伊曼、摩根斯坦 1944年《博弈论和经济行 Behavior) 为》 (Theory of Games and Economic Behavior) 在这本著作中引进了扩展形(Extensive Form)表 在这本著作中引进了扩展形( 扩展形 ) 示和正规形(Normal Form)或称策略形(Strategy 示和正规形( )或称策略形( 正规形 Form)、矩阵形(Matrix Form)表示,定义了极小化 )、矩阵形 )、矩阵形( )表示,定义了极小化 ),提出了稳定集( 极大解( ),提出了稳定集 极大解(Minmax Solution),提出了稳定集(Stable Sets)解概念等,正式提出了创造一种博弈论的一般理 )解概念等, 论的主意
第二章_博弈思维:向前展望,从后倒推

结果是什么呢?
声称的策略与实际的策略:言语博弈问题
A向B发出威胁:如果你进入,我将阻挠。而对B来说,如
果进入,A真的阻挠的话,它将受损失-1亿,当然此时A 也有损失。对于B来说,问题是:A的威胁可臵信吗?
B 不进入 (0,10) (-1,2) 阻挠 (0,10)
进入
(4,4)
不阻挠
A
B通过分析得出:A的威胁是不可臵信的。
老板不用多付薪金
加薪谈判博弈树
加薪谈判
让老板相信你的威胁,最好的办法就是向他证明另一家 公司愿意每年多花12000元聘用你。(当然,如果真有 其事,你就不必运用博弈论来要求加薪了。) 争取加薪的另一办法是自断后路,告诉公司里的每个人, 如果你得不到加薪,你肯定会跳槽。你的目标是,把加
薪不成而留任的局面搞得越尴尬越好。
声称的策略与实际的策略:言语博弈问题
博弈论中,经常用“可臵信”和“不可臵信”的“威胁” 或“承诺”来区分行动者说出来的策略。而分析“威胁” 或“承诺”是可臵信的还是不可臵信的方法是倒推法。 倒推法(backward induction)也叫逆向归纳法。那么什 么是倒推法?
声称的策略与实际的策略:言语博弈问题
加薪谈判
如果你只是经理,不是老板。向你要求加薪的员工对你非
常重要,很不幸的是,你的员工也知道自己很重要,而且 你不想失去他们,但你又想压制一下下属的加薪要求。
这使你的谈判处于下风,因为假如员工能让你相信,只要 你不为他加薪,他就会跳槽,那你只好答应给他加薪。 你最好的办法是交出调薪的控制权,表明你对加薪无能为
加薪谈判
在博弈论的世界里没有仁慈或怜悯,只有一己之利。
在劳资博弈中,劳方是为了争取加薪,资方是为了确保 员工能在工作上全力以赴。老板绝不会无条件为员工加 薪,只有让老板相信对他有好处,员工才能得到加薪。 假如你对公司有所贡献,公司也依赖你。你希望加薪
0 博弈论导言

0 序言0.1 博弈论的产生博弈论(game theory)又称对策论,是由美国数学家冯·诺依曼(Von. Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,是一种处理竞争与合作问题的数学决策方法。
它既是现代数学的一个新分支,也是运筹学的一个重要学科。
目前在经济学、国际关系学、计算机科学、政治学、生物学、军事战略和其他很多学科都有广泛的应用。
0.2 博弈论的发展0.2.1博弈理论的早期研究一般认为,对于博弈理论的最早研究可以追溯到18世纪初。
瓦德格拉夫(Waldegrave)在1713年提出了两人博弈的极小化极大混合策略解。
古诺(Cournot)和伯特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产量决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反映函数。
这些都是关于博弈问题的早期的零星研究。
0.2.2博弈论发展的不同阶段(1)一般认为博弈论萌芽于20世纪初。
1913年齐默罗(Zermelo)提出的“逆推归纳法”(Backward Induction Procedure)是博弈论的第一种有着一般意义的分析方法。
博弈论创立的标志是冯·诺伊曼和摩根斯坦在1944年的《博弈论与经济行为》这部著作。
在该著作中,引进了博弈论的扩展形(Extensive Form)和策略形(Strategy)表示方式,提出了创建博弈论的基本概念术语,并对合作博弈进行了研究。
(2)20世纪的40年代末到50年代初,是博弈论的发展史上一个重要阶段。
越来越多的学者进行了博弈理论的研究。
1950年,纳什(John Nash)在他的博士论文《非合作博弈》中,将博弈论扩展到了非零和博弈,最终形成了非合作博弈理论的思想源泉,纳什均衡概念的提出以及纳什均衡存在性的纳什定理的证明,发展了以纳什均衡概念为核心的非合作博弈理论。
5.2逆向归纳法的一些说明

博弈论之逆向归纳法的一些说明逆向归纳法的前提:理性共识特例一在该博弈中,如果n 比较小,这个逆向归纳解作为博弈的预测结果就可以认为是正确的;但是,如果n 比较大,则这个结果就很值得怀疑。
(1, (1)(1/2,…,1/2)(1/i ,…,1/i )(1/n ,…,1/n )(2, (2)……DDDD1A2AAA特例一参与人选择A 的概率为,则个参与人全部选择A的概率为。
比如,,,则35(1, (1)(1/2,…,1/2)(1/i ,…,1/i )(1/n ,…,1/n )(2, (2)……DDDD1A2AAA特例二:蜈蚣博弈两个参与者,分别有50个决策结。
运用逆向归纳方法,可以看出每个参与者在自己的决策结上都应该选择D ,则参与者1在初始结上选择D ,博弈结束,每个参与者各得到1个单位的收益。
(97,100)2 A(98,101)(100,100)D2A(1,1)(0,3)…D D D1A2AD1A(2,2)(99,99)1A特例二:蜈蚣博弈一些博弈实验数据表明,多数实验者在开始若干阶段会选择倾向“合作”的行动A ,但不会一直到最后一个阶段,而是在中间某个地带选择偏离行动D 。
(97,100)2 A(98,101)(100,100)D2A(1,1)(0,3)…D D D1A2AD1A(2,2)(99,99)1A特例三:前向归纳法这种从博弈的历史追踪某些“信息”的分析逻辑,叫前向归纳法(Forward Induction )。
A C BD 12(1,2)(0,0)E 1(1,1)(2,1)F2参与人1 是理性的吗?参与人1是以多大的概率是理性的? 参与人1过去的不理性是否会延续到未来的不理性?特例四:最后通牒博弈回应者B提议者A 100元(0,0)接受方案(100-x,x)提出方案(100-x,x)无论我提议怎样分,B都只能在接受提议与一无所获之间进行选择。
所以,无论我的提议是什么,他都应该接受。
博弈论——完全信息动态博弈

博弈论——完全信息动态博弈2 完全信息的动态博弈2.1完全和完美信息的动态博弈动态博弈(dynamic game):参与⼈在不同的时间选择⾏动。
完全信息动态博弈指的是各博弈⽅先后⾏动,后⾏动者知道先⾏动者的具体⾏动是什么且各博弈⽅对博弈中各种策略组合下所有参与⼈相应的得益都完全了解的博弈静态博弈习惯⽤战略式(Strategic form representation)表述,动态博弈习惯⽤扩展式(Extensive form representation)表述。
战略式表述的三要素:参与⼈集合、每个参与⼈的战略集合、由战略组合决定的每个参与⼈的⽀付。
扩展式表述的要素包括:参与⼈集合、参与⼈的⾏动顺序、参与⼈的⾏动空间、参与⼈的信息集、参与⼈的⽀付函数、外⽣事件(⾃然的选择)的概率分布。
n⼈有限战略博弈的扩展式表述⽤博弈树来表⽰1(1,2) (0,3)①结:包括决策结和终点结。
决策结是参与⼈采取⾏动的时点,终点结是博弈⾏动路径的终点。
第⼀个⾏动选择对应的决策结为“初始结”,⽤空⼼圆表⽰,其它决策结⽤实⼼圆表⽰。
X表⽰结的集合,x X表⽰某个特定的结。
z表⽰终点结,Z表⽰终点结集合。
表⽰结之间的顺序关系,x x′表⽰x在x′之前。
x之前所有结的集合称为x的前列集,x之后所有结的集合称为x的后续集。
以下两种情况不允许:前者违背了传递性和反对称性;后者违背了前列节必须是全排序的。
在以上两个假设之下,每个终点结都完全决定了博弈树的某个路径。
②枝:博弈树上,枝是从⼀个决策结到其直接后续结的连线,每⼀个枝代表参与⼈的⼀个⾏动选择。
在每⼀个枝旁标注该具体⾏动的代号。
⼀般地,每个决策结下有多个枝,给出每次⾏动时参与⼈的⾏动空间,即此时有哪些⾏动可供选择。
③信息集(information sets):博弈树中某⼀决策者在某⼀⾏动阶段具有相同信息的所有决策结集合称为⼀个信息集。
博弈树上的所有决策结分割成不同的信息集。
每⼀个信息集是决策结集合的⼀个⼦集(信息集是由决策结构成的集合),该⼦集包括所有满⾜下列条件的决策结:(1)每⼀个决策结都是同⼀个参与⼈的决策结。
博弈论1 导论(续)

2000年前我国古代的“齐威王田忌赛马” 1838年古诺寡头模型。 1883年伯特兰德寡头竞争模型。 1928年诺伊曼和摩根斯坦扩展形博弈定 义,证明有限策略两人零和博弈有确定 结果
1.4.2博弈论的形成
冯.诺伊曼和摩根斯坦《博弈论和经济行为》 Theory of Games and Economic Behavior 1944 引进扩展形(extensive form)表示和正规形 (normal form)或称策略形(strategy form)、 矩阵形(matrix form)表示 提出稳定集(stable sets)解概念 正式提出创造博弈论一般理论的主意 给出博弈论研究的一般框架、概念术语和表述 方法
1.3.7 博弈的分类和博弈理论的结构 非合作博弈和合作博弈 非合作博弈范围内:完全理性博弈和有限理 性博弈(进化博弈) 静态博弈,动态博弈,重复博弈 完全信息静态博弈,不完全信息静态博弈, 完全且完美信息动态博弈,完全但不完美信 息动态博弈,不完全信息动态博弈 零和博弈和非零和博弈,单人博弈和多人博 弈
1.3.4 博弈的过程
博弈过程: 博弈方选择、行为的次序,包括是否多次 重复选择、行为。 博弈过程对博弈结果也有重要影响。 根据博弈的过程,博弈可分为静态博弈、动态 博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型 动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
三、40年代末到70年代末是博弈论发展的重要阶段
这个时期博弈理论仍然没有成熟,理论体系还比较 乱,概念和分析方法很不统一,在经济学中的作用 和影响还比较有限,但这个时期博弈论研究的繁荣 和进展却是非常显著的。 对这一阶段博弈论研究的迅速发展,除了理论发展 自身规律的作用以外,全球政治、军事、经济特定 环境条件的影响(战争和冷战时期的军事对抗和威 慑策略研究的需要,经济竞争、国际经济竞争的加 剧),以及经济学理论发展本身的需要等,都起了 重要的作用。正是因为有了这一阶段博弈论研究的 繁荣发展,才有80、90年代博弈论的成熟和对经济 学的博弈论革命。
Chapter2 Dynamic Games of Complete and Perfect(博弈论-浙江大学)

(3)about payoffs: 每一种可能行动组合下的支付是共同知识 ——如果企图进入者不仅入,则在位者独享 10000万元利润; ——如果进入而在位者容忍,则在位者得 5000万元,进入者利润1000万元; ——如果进入并且在位者阻挠,则在位者利润 3000万元而进入者-1000万元。 信息完全
s4=―无论是否有没有人进入,都不阻挠”;
再对策略下一个定义:
A strategy for a player is a complete plan of action---it specifies a feasible action for the player in every contingency in which the player might be called on to act. (Gibbons P92) 处在一个策略中的“行动”,可称为“策略性行 动”。——如何理解?
Definition An information set for a player is a collection of decision nodes satisfying: (ⅰ)the player has the move at every node in the information set,and (ⅱ)when the play of the game reaches a node in the information set, the player with the move does not know which node in the information set has (or has not) been reached. 对完美信息动态博弈的博弈树来说,一个信 息集只包含一个决策结,对不完美信息动态 博弈,则一个信息集包含多个决策结。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Thank you! Happy new year!
Байду номын сангаас
Going back to Figure 1, the point is that, if In is interpreted as an intentional move, then Player 1 must be planning to follow it with T: there is no other way to rationalize In, because the alternative possibility (Player 1 plans to follow in with B) is irrational. Hence, Player 2 must expect T in the subgame, and hence play L. But of course this upsets our equilibrium: (OutB, R) is not stable with respect to forward-induction reasoning. Note what happens in this game: the addition of an outside option for Player 1 makes her stronger, and enables her to “force” her preferred equilibrium in the Battle of Sexes.
The second route leads to forward induction. This notion is quite distinct from backward induction-and sometimes even at odds with it! But it makes a lot of sense, at least in the opinion of this writer… The two main tenets of forward induction are: Intentionality: any more, including deviations from the equilibrium path, is intentional and purposeful. Rationalization: Players recognize this, and therefore attempt to rationalize, i.e. explain, deviations (or, more generally, unexpected moves) by guessing their objective.
Consider the profile (OutB, R) in the game in Figure 1.This is clearly a Nash equilibrium; moreover, since B is a best reply to R and conversely, (OutB, R) is actually a subgameperfect equilibrium. In fact, you can convince yourself that it is sequential and tremblinghand perfect as well. And yet, and yet…dose it really make sense for Player 2 to expect Player 1 to following In (a deviation) with B? Note that InB is strictly dominated, hence certainly irrational for Player 1:Out dose strictly better.
Wait a moment , you will say: how can Player 1 expect Player 2 to choose L when the equilibrium profile says he should play R? Well, that’s a good question. However, note that the same equilibrium profile also says that Player 1 should not deviate to In; so, in some sense, its prescriptions should be taken with a grain of salt!
The key insight of extensive-form analysis is that out-of-equilibrium beliefs determine equilibrium behavior. For instance, consider the simple two-stage entry deterrence game in which a potential entrant whether to enter a market or stay out, and the incumbent decides whether to fight or acquiesce after the entrant’s move. The Nash equilibrium in which the entrant stays out is supported by the belief that the incumbent will fight; but if we think that fighting is not a credible threat, this equilibrium collapses.
More rigorously, faced with a deviation to In, Player 2 may either think that this was merely the result of a mistake, a tremble, in which case he is entitled to continue to believe that Player 1 expects R and hence plays B; or, he can abandon his faith in this equilibrium, and attempt to come up with some alternative theory of Player 1’s behavior. The first route is the story implicit in sequential equilibrium, THPE, and backward induction in general. According to this story, (outB, R) is a fine equilibrium.
But things can be become much more subtle—and interesting. In particular, sequential equilibrium takes care of the issue of non-credible threats, but it sometimes still relies on “implausible inferences” out of equilibrium. This lecture addresses this point, focusing on the notion of forward induction.