动态博弈

合集下载

博弈演进形态

博弈演进形态

博弈演进形态
博弈的演进形态是多种多样的,它随着时间、环境、参与者之间的互动关系以及各种不确定性因素的变化而变化。

从博弈论的角度来看,博弈的演进形态大致可以分为以下几种:静态博弈:这是一种参与者同时进行决策的博弈形态,也称为零和博弈。

在静态博弈中,每个参与者的最优策略都取决于对手的策略,参与者之间没有先后行动的选择。

因此,静态博弈是一种较为简单的博弈形态。

动态博弈:动态博弈是指参与者的决策有先后顺序,后行动者可以通过观察先行动者的行为来做出自己的最优决策。

在动态博弈中,参与者需要考虑到对手可能的反应,并据此制定自己的策略。

动态博弈通常比静态博弈更加复杂。

重复博弈:重复博弈是指一系列具有关联性的决策序列。

在重复博弈中,参与者需要在考虑长远利益的同时,也要考虑到短期内的利益。

参与者可能需要与对手建立长期关系,以避免短视的决策带来的负面影响。

不完全信息博弈:在不完全信息博弈中,参与者对对手的策略和偏好等信息并不完全了解。

这种博弈形态需要考虑对手可能的策略和反应,以及对手的偏好和目标。

不完全信息博弈通常比完全信息博弈更加复杂和不确定。

总的来说,博弈的演进形态是多种多样的,每种形态都有其特点和适用场景。

在现实生活中,许多决策问题都可以通过博弈论来描述和解决。

理解不同博弈形态的特点和适用场景,有助于更好地理解和应对各种决策问题。

完全信息动态博弈和演化博弈的关系

完全信息动态博弈和演化博弈的关系

完全信息动态博弈和演化博弈的关系在博弈论的研究领域中,完全信息动态博弈和演化博弈是两个重要的分支。

它们分别从不同的角度研究博弈现象,但二者之间也存在一定的联系和关系。

本文将探讨完全信息动态博弈和演化博弈的关系,并对它们的特点和应用进行分析。

1. 完全信息动态博弈的定义和特点完全信息动态博弈是指博弈参与者在博弈过程中具备完全信息的情况下,根据先后顺序依次做出决策,随着时间的推移,博弈过程也在不断变化。

在完全信息动态博弈中,博弈参与者对于其他参与者的行动和策略都有准确的了解,能够全面考虑对手的决策,以此来优化自己的策略选择。

完全信息动态博弈的特点包括:首先,信息对称,每个博弈者都能了解其他博弈者的策略和收益函数;其次,决策按照时间顺序依次进行,每个博弈者的行动会对其他人的决策产生影响;最后,完全信息动态博弈具有策略的时序性,参与者需要根据他们观察到的其他人的决策来选择自己的策略。

2. 演化博弈的定义和特点演化博弈是指博弈参与者根据其在群体中的优势来选择策略,并通过遗传和选择机制在演化过程中逐步改变策略的过程。

演化博弈考虑的不是个体之间的完全信息,而是从整体出发,通过个体之间的相互作用和进化选择来探讨不同策略之间的稳定性和最终结果。

演化博弈的特点包括:首先,演化博弈关注的是群体中不同策略的相对频率和进化趋势,而不是个体行动的绝对收益;其次,演化博弈中存在着演化稳定策略,即一旦某种策略在群体中形成,就会对其他策略形成一种稳定的威胁;最后,演化博弈的结果依赖于演化的时间尺度和环境的改变。

3. 完全信息动态博弈与演化博弈的关系完全信息动态博弈和演化博弈虽然从不同的角度出发,但也存在一定的联系和关系。

首先,完全信息动态博弈可以看作演化博弈的一种特殊情况,即当演化博弈的时间尺度趋于无穷时,完全信息动态博弈的结果可以看作是演化博弈的极限情况。

因此,完全信息动态博弈可以为演化博弈提供一种基础理论框架。

其次,演化博弈可以用来解释完全信息动态博弈中出现的某些稳定策略。

动态博弈案例

动态博弈案例

动态博弈案例
哎呀呀,今天来给大家讲讲动态博弈案例。

就说那商业战场吧,各个企业之间的竞争那叫一个激烈啊!比如说电商平台吧,甲电商平台搞了个大促活动,哇塞,那优惠力度可大了去了!这时候乙电商平台能坐视不管吗?那肯定不能啊!乙电商平台立马跟进,推出了更厉害的优惠政策,这不是明摆着跟甲电商平台较劲嘛!这就是动态博弈啊,你出招,我接招。

再想想看,体育比赛中不也是这样嘛?篮球比赛里,自己这边球队进了一个球,那对手球队能不着急啊?他们肯定得想办法扳回来呀!两边球队就是在不断地根据对方的行动来调整自己的战术,这多刺激啊!就好像在下一盘大棋,每一步都得小心翼翼,又得果断出击。

好比甲乙两支球队,甲队发现乙队防守有漏洞,马上就专攻那个点,乙队发现后能不改变防守策略吗?肯定得呀!然后甲队又得想新的办法来突破,这不就是一场你来我往的动态博弈嘛!
还有国际关系中呢,国家之间的互动也是如此啊!一个国家采取了某种政策,其他国家也得跟着调整自己的态度和行动,就像一场复杂的博弈游戏。

在这些动态博弈中,每一方都得时刻保持清醒的头脑,得快速反应,还得有长远的眼光。

这可不是一件容易的事儿啊,但正因为这样,才让整个过程充满了挑战和乐趣。

这就是动态博弈的魅力啊,就像一场永不停歇的战斗,你永远不知道下一刻会发生什么,难道不是特别让人兴奋吗?在这些各种各样的动态博弈中,可以看到智慧的交锋、策略的较量,这就是人类社会精彩的一面啊!我们都身在其中,要么是参与者,要么是旁观者,但无论怎样,都能深刻感受到这种动态博弈带来的震撼和影响力。

所以说啊,动态博弈无处不在,它影响着我们生活的方方面面,真的是太有意思啦!。

博弈模型汇总

博弈模型汇总

博弈模型汇总如下:
1.合作博弈与非合作博弈:这是根据参与者之间是否可以达成具
有约束力的协议来划分的。

合作博弈强调团队合作和协作,目标是达成共赢;而非合作博弈则强调个人利益最大化,不考虑其他参与者的利益。

2.静态博弈与动态博弈:这是根据参与者做出决策的时间顺序来
划分的。

静态博弈是指所有参与者同时做出决策,或者决策顺序没有影响;动态博弈是指参与者的决策有先后顺序,后行动者可以观察到先行动者的决策。

3.完全信息博弈与不完全信息博弈:这是根据参与者对其他参与
者的偏好、策略和支付函数了解的程度来划分的。

完全信息博弈是指所有参与者都拥有完全的信息,能够准确判断其他参与者的策略和支付函数;不完全信息博弈则是指参与者只拥有部分信息,无法准确判断其他参与者的策略和支付函数。

4.零和博弈与非零和博弈:这是根据所有参与者的总收益是否为
零来划分的。

零和博弈是指所有参与者的总收益为零,一方的收益等于另一方的损失;非零和博弈则是指所有参与者的总收益不为零,各方的收益和损失不一定相关。

5.竞争博弈与合作博弈:这是根据参与者之间是否存在竞争或合
作关系来划分的。

竞争博弈是指参与者之间存在竞争关系,目标是追求个人利益最大化;合作博弈则是指参与者之间存在合作关系,目标是追求共同利益最大化。

6.微分博弈与离散博弈:这是根据决策变量的连续性来划分的。

微分博弈是指决策变量是连续变化的,需要考虑时间、速度等因素;离散博弈则是指决策变量只有有限个可能的取值,通常只考虑状态的变化而不考虑时间、速度等因素。

动态博弈理论与应用

动态博弈理论与应用

动态博弈理论与应用第一章:引言动态博弈理论是博弈论的一种重要分支,研究的是受到时间和信息约束的博弈问题。

它从时间顺序和信息公开程度等维度对博弈过程进行建模和分析,是理论经济学、管理学、计算机科学等众多学科领域中的重要研究内容之一。

本文将从动态博弈理论的基本概念、模型和方法入手,介绍动态博弈理论的主要内容和应用情况。

第二章:动态博弈理论的基本概念动态博弈理论建立在静态博弈理论之上,它的最主要的特点在于参与者的决策与结果之间存在时间上的关联关系,即决策是按照时间顺序轮流做出的。

而参与者在做出决策前,只能知道自己的信息和其他参与者之前做的决策,不能预知未来的结果。

在这个基础上,动态博弈理论提供了一系列的模型和方法来分析博弈的结果及实现方式。

第三章:动态博弈理论的模型动态博弈理论的模型可以基于信息不完备、不确定性、策略可见性等多个方面进行分类。

其中,信息不完备的模型是最基础的,最经济学家最常使用的。

信息不完备模型中,博弈参与者的行动必须基于自己已知的信息,而不知道其他参与者的信息。

而在不确定性模型中,参与者不知道结果将会如何。

策略可见性模型则是最具有实际应用的模型,这种模型中,每个参与者知道所有的实际结果及其影响,即支配条件。

第四章:动态博弈理论的方法动态博弈理论中有许多方法,常用的包括完美均衡、子博弈完美均衡、可重复博弈、概率博弈等。

典型的完美均衡策略就是一个序列,每一项都是一个单步博弈策略,游戏结果取决于序列的每一步策略。

子博弈完美均衡则是针对复杂的大型博弈进行分析的一种方法。

若子博弈具有完备信息,则必须使用完全搜索算法来处理该问题。

而可重复博弈和概率博弈则是针对直接博弈不适合的情境,如合谋的情境、局部信息的分布等,而设计的两种不同类型的博弈方法。

第五章:动态博弈理论的主要应用动态博弈理论具有广泛的应用领域,例如竞争激烈的高科技行业、公共政策设计、外交谈判和金融衍生品等领域。

例如在金融衍生品市场中,动态博弈理论可以通过构建模型分析衍生品价格,为股票、债券和外汇等市场提供更完善的竞争分析和风险管理策略。

第四讲 动态博弈

第四讲 动态博弈

R (0,0)
2
U
1
L (3,1) (2,2)
D
修改的市场进入博弈
试说明上述不可置信的威胁是什么? 现实生活中的例子:父亲坚决不同意女儿 的婚事,威胁说,如果女儿不与相爱的人 断绝关系,他就与女儿断绝父女关系。
逆向归纳法
逆向归纳法可以排除不可置信的威胁。之 所以可以如此,根本原因在于采用了一种 分析动态博弈的有效方法——逆向归纳法, 即从动态博弈的最后一个阶段博弈方的行 为开始分析,逐步倒推回前一个阶段相应 博弈方的行为选择,一直到第一个阶段的 分析方法。一般方法是:从最后一阶段开 始分析,每一次确定出所分析阶段博弈方 的选择和路径,然后再确定前一阶段的博 弈方选择和路径。
(L/L,L/S) (L/L,S/S) (S/L,L/S) (S/L,S/S)
(若史密斯选择大则选择大;若其选择小则选择大) (若史密斯选择大则选择大;若其选择小则选择小) (若史密斯选择大则选择小;若其选择小则选择大) (若史密斯选择大则选择小;若其选择小则选择小)
跟随领头羊Ⅰ表明只要添加一点复杂性,就 使得策略式表述变得晦涩难懂,几无用武之 地。策略式如下。
威胁是指一个参与人承诺一旦其他参与人 偏离均衡,他将采取的某种行动,威胁是 有 一定影响力的,尽管可能它从未被实施 过。
在位者
默许 斗争 进入 40,50 -10,0 进入者 不进入 0,300 0,300 市场进入博弈中,如若进入者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润,所以 斗争就是一种不可置信的威胁。但纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)就成为一个纳 什均衡。
例如,一个模型不能在一开始就说德国相信它打 赢一场与法国的战争的概率是0.8,而法国相信这 一概率只有0.4,因此它们急欲一战。恰恰相反, 它必须假定信念(先验概率)开始时是一致的, 随后因为私人信息而产生分歧。例如两个参与人 都认为德国获胜的概率是0.4,但若德国的将军是 个军事天才,则这一概率就是0.8,而且随后德国 人发现德国的将军确实是个天才。如果是法国抢 先宣战,那么法国的错误信念可能会导致一场战 争,而若德国能令人信服它对德国将军天才的私 人信息,则这场战争本可避免。

完全信息动态博弈模型

完全信息动态博弈模型

完全信息动态博弈模型完全信息动态博弈模型是博弈论中一种重要的博弈模型,它描述了一组参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。

下面将详细介绍完全信息动态博弈模型的相关内容。

一、博弈的参与者:完全信息动态博弈模型中,通常包括两个或多个参与者,每个参与者都可以做出自己的决策和行动。

参与者可以是个人、组织、公司等,他们之间存在着相互竞争和合作的关系。

二、博弈的信息:完全信息动态博弈模型中的参与者拥有完全信息,即每个参与者都能够获得关于其他参与者的决策和行动的完整信息。

通过完全信息,参与者能够准确地评估自己的决策和行动对其他参与者的影响,并作出最优化的决策。

三、博弈的行动和策略:在完全信息动态博弈中,参与者可以选择不同的行动和策略来达到自己的目标。

每个参与者根据自己对其他参与者行动和策略的评估,以及自己的目标和利益,选择最优化的行动和策略。

四、博弈的时间顺序:完全信息动态博弈是一个时间序列上的博弈模型,参与者的决策和行动是有序进行的。

参与者按照一定的时间顺序依次进行决策和行动,每个参与者都会考虑前面参与者的行动和决策对自己的影响,进而作出自己的决策。

五、博弈的结果和收益:完全信息动态博弈模型的结果是参与者的收益和利益。

通过多轮反复的博弈过程,参与者根据自己的决策和行动可以获得不同的结果和收益。

每个参与者的最终目标是通过优化自己的决策和行动,获得最大的收益和利益。

完全信息动态博弈模型是博弈论中一种重要的模型,它能够帮助我们分析和理解多方参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。

通过对博弈的参与者、信息、行动和策略、时间顺序以及结果和收益的分析,可以更好地理解和应用完全信息动态博弈模型。

动态博弈

动态博弈

“战术勾结”
寡头之间的“不回避竞争法则”,是指至 少有几个寡头厂商保证(通常以做广告的 方式)自己的索价不高于其他任何竞争者。 这样的许诺对于消费者来说似乎是件很好 的事,但事实上这样的做法会提高价格。
寡占的斯塔克博格(stackberg)模型—— 动态的寡头市场产量博弈模型
u1=q1P(Q)-c1q1 =q1[8-(q1+q2)]-2q1 =6q1- q1q2-q12
最后,实施上述策略组合的最终结果,即 路径终端处得益数组中的数字。
可信性和纳什均衡问题
相机选择和策略中的可信性问题 动态博弈中博弈方的策略并没有强制力,
而且实施起来有一个过程,只要符合博弈 方自己的利益,他们完全可以在博弈过程 中改变计划。我们称这种问题为动态博弈 中的“相机选择”(Contingent Play)。
逆推归纳法(backwards induction)
逻辑基础:动态博弈中先行动的理性的博弈方, 在前面阶段选择行为时必然会考虑后行为博弈 方在后面阶段中将会怎样选择行动,只有在博 弈的最后一个阶段不再有后续阶段牵制的博弈 方,才能做出明确的选择。而当后面阶段博弈 方的选择确定以后,前一阶段博弈方的行为也 就容易确定了。
q2应满足: 6-q1-2 q2 = 0 q2 =3-q1/2
厂商1 知道厂商2的这种决策思路,因此在选择产量水平 q直1时接就将知上道式厂代商入2自的己产的量得q2益*会函根数据,上这式样确厂定商,1的所得以益他函可数以 实际上转化成了他自己产量的一元函数:
u1(q1,q2*) = 6q1-q1q2*-q12 = 6q1-q1(3-q1/2)-q12 = 3q1-0.5q12
乙讨价还价的筹码就是可以跟甲托时间
(当然拖延对乙的收益也有影响),拖延
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

案例:开金矿博弈 版本3:法律保障不足的开金矿博弈 P1
不借
(1, 0) 起诉 (-1, 0) 不还 P1
借 P2 还
放弃 (0, 4)
(2, 2)
2· B 斯塔克尔贝里双头垄断模型 1· 博弈的时间顺序如下(1) 企业1选择产量q1 , (2) 企 业2观察到q1 以后,然后选择产量q2 ; (3) 企业i 的收 益由下面的利润函数给出:
自己避免小企业,小人物的无端指控. 办法之一就是在被指控之前就支付律师费用. 假定被告在被指控之前支付律师费用y , 那么,赔偿 区域为 s [ rx , rx d y ], 纳什均衡解为
s rx (d y) 2
因为即使 rx d 2 c p 成立, ( d y ) 2 c p rx 也可能不满足, 从而原告将不会提出指控. 这样的 承诺行动使被告节省成本 rx d 2 y . 因此,只要 y rx d 2 , 承诺行动就值得. 这 就是为什么大公司、大人物雇佣律师的原因之一.
动 态 博 弈
简单地讲,动态博弈就是参与者的行动选择必须 是有先后顺序的博弈. 参与者的每一次行动选择叫做一步或一个时期. 直观地讲,动态博弈可以看作若干个静态博弈联 合在一起看作一个博弈. 动态博弈分为 完美信息和非完美信息动态博弈. 第二章 完全信息动态博弈 1 完全信息博弈 参与者的收益函数是共同知识的博弈 2 完全且完美信息动态博弈 博弈进行的每一步当中, 要选择行动的参与者都知道这一步之前博弈进行的
显然即使 rx c p , (即上法庭的期望收益小于诉讼 成本), rx d 2 c p 的条件仍可能成立. 子博弈纳什均衡结果将是: 假定这个条件成立, 原告提出指控要求. 原告的支付为 rx d 2 c p , 被告的支付为 rx d 2 , 案件私了. 该博弈模型的实际背景举例: 因为被告打官司的成本不仅包括应诉的法律费 用而且涉及声誉损失( d ),所以,被告越大(大人物 大企业), d 越大, rx d 2 c p 的条件越可能满足. 这是为什么大人物常常受到无端指控的原因之一. 当然,大企业、大人物也可以通过他们的承诺行动使
max 2 ( q , q 2 ) max q 2 [ a q1 q 2 c ]
q2 q2
由上式可得
R 2 ( q1 )
a q1 c 2
已知 q1 a c , 这与同时行动的古诺模型中得出的
结果相同. 但两者不同之处在于这里的 R 2 ( q 1 ) 是企业 2对企业1已观测到的产量的真实反应,而在古诺模型 R 2 ( q 1 ) 是企业2对假定的企业1的产量的最优反应. 且 企业1的产量选择是和企业2同时作出的. 由于企业1也和企业2一样解出企业2的最优反应, 企业1就可以预测到他如选择q1,企业2将根据 R 2 ( q 1 ) 选择产量. 那么在博弈的第一阶段,企业1的问题就可
(a , R2 (a ).
1
1
第一,参与者1选择支付1000美元给参与者2,或者 一分不给; 第二,参与者2观察到参与者1的选择,然后决定是 否引爆一颗手雷. 两个参与者如何选择呢? 如果参与者1相信这一威胁,他的最优反应是支 付是将1000美元给参与者2,参与者2接受,博弈结束.
但参与者1却不会对这一威胁信以为真,因为它不 可置信. 手雷博弈就属于简单类型的完全且完美信息动 态博弈: 1 参与者1从可行集A1中选择一个行动a1 , 2 参与者2观察到a1后,从可行集A2中选择一个 行动a2, 3 两人的收益分别为 u 1 ( a1 , a 2 ) 和 u ( a1 , a 2 ). 逆向归纳法求解此博弈如下: 在博弈的第二阶段参与者2行动时,由于其前参 与者1已选择行动a1,他面临的决策问题可用下式表
i ( q1 , q 2 ) q i [ P ( Q ) c ]
P (Q ) a Q
(市场出清价格)
Q q 1 q 2 (市场上的总产量)
C 是生产的边际成本(固定成本为0). 为求解此博弈的逆向归纳解,首先计算企业2 对 企业1任意产量的最优反应 R 2 ( q1 ), R 2 ( q1 ) 应满足
( 0 , 9998 ) ( 9999 , 0 )
由逆向归纳法容易得出逆向归纳解为:在A第一次 选择时就结束博弈. 双方的收益为(1, 0). 但是实验的 结果如何呢? 最终B 得到10000元钱,然后,自愿地分给A 一半.
“开金矿博弈” 甲欲开发一个价值4万元的金矿,缺少1万元资金, 乙有1万元的资金可以投资.甲想说服乙借给他,并答 应分给乙2万元,乙是否应该借给他? 可将此问题看作一个两个阶段两个参与者的动态 博弈. P1 版本1:无法律保障 借 不借 P 的开金矿博弈
表示为
max 1 ( q1, R 2 ( q1 )) max q 1 [ a q1 R 2 ( q1 ) c ]
q1 0 q1 0
max q 1
a q1 c 2
1
于是
q1 0
q
1
ac 2
,
q R2 (q )
2
ac 4
.
这就是斯塔克尔贝里双头垄断博弈的逆向归纳解. 斯塔克尔贝里模型产量与古诺模型产量的比较 1)古诺产量
整个过程. 3 完全但不完美信息博弈 在博弈的某些阶段, 要选 择行动的参与者并不知道这一步之前博弈的整个 过程. 4 所有动态博弈的中心问题是可信任性. 完全且完美信息动态博弈 一、动态博弈的表述(初步描述) 1、基本要求 (1)局中人 I={ 1,2,…, n }; (2)局中人的行动次序(有先后之分),Ai 为参与者i 的行动集; (3)每次行动时局中人所进行的选择;
P 不指控 (0,0) 拒绝 P
指控 P 要求S D 放弃
( c, 0)
接受
起诉
(rx c p, rx d )
( s c, s )源自原告指控的目的本身意味着rx < p , 那么, 在博弈的 最后阶段, 原告的最优选择是放弃. 因为被告知道如果自己拒绝,原告将放弃, 被告 在倒数第二阶段的最优选择是拒绝; 原告知道将被拒 绝,原告在第一阶段的最优选择是不指控.因此子博弈 精炼纳什均衡是 原告选择(不指控,要求,放弃),被告选择(拒绝)
(4)外生事件的概率分布; (5)局中人在选择行动时所了解的信息 ; (6)支付函数. A 不仿冒 仿冒 2 博弈树 (扩展型示意) B (0,10) 制止 例:仿冒博弈
不制止 A
3 完全且完美 信息动态博弈(-2,5) 仿冒
B 制止 (2,2)
不仿冒
不制止 (5,5) (10,4)
逆向归纳法-动态规划
2
(1,0) 不还 博弈的逆向归纳解: (0, 4) (不借,X )
还 (2, 2)
易知此博弈的逆向归纳解为:乙选择不借, 博弈结束. 表示为(不借,X ) 直观解释为乙没有理由相信甲的“承诺”. 上面的博弈可以修正为以下博弈. P1 版本2:法律保障 不借 借 充足的开金矿博弈 P2 不还 (1,0) P 还 1 博弈的结果: 起诉 放弃 (2,2) (借,还) (1,0) (0,4)
蜈 蚣 博 弈
以下的蜈蚣博弈是罗森多教授(Robert Rosenthal) 1981年发表在Jour nal of Economic Theory) 上的论 文中提出的.
蜈 蚣 博 弈:
A B A B A B A
( 0 , 10000 )
(1, 0 ) ( 0 , 2 ) ( 3, 0 ) ( 0 , 4 ) ( 5 , 0 )
的状态转移方程,再根据所求问题的有关效益指标, 建立起能够联系局部与全局最优性的动态规划基本 方程. 二、逆向归纳法 1、 二人动态博弈的逆向归纳法 I ={1 ,2},局中人1先行动,2 根据1的行动选择 行动,收益函数 u i u i ( a1 , a 2 ), i 1, 2 . 局中人2 的选择 max u 2 ( a1 , a 2 ) a 2 R 2 R 2 ( a1 )
1 1
逆向归纳法背后的理性假设. 看下例三阶段两个参与者的动态博弈. 三阶段两个参与者的动态博弈的博弈树表示.
1
L R L1 (1 , 1)
2
R1 L2
(2 , 0)
1 R 2
(0 , 2)
(3 , 0)
博弈的解或博弈的结果:参与者选择L,博弈结束. 博弈的逆向归纳解表示为 (L,X).
戴威(Richard H. Thaler)发表在<<经济学视角 杂志 >>上的一个例子. 教授组织同学进行这样的实验:让A, B两同学就 一美元进行讨价还价:首先由A提出方案,若B同意, 就按照A的方案分配这一美元. 如果B 拒绝A 的提议, 则双方一文不名. 请讨论实验分配的结果. 最终A 得到1美元钱,然后自愿地分给B 一半.
示为 max u2 (a1 , a2 ),
a2 A2
假定对 A1 中的每一个 a 1,参与者2的最优化问题 只有唯一解, 用 R2 (a1 )表示. 由于参与者1 能和参与 者2一样解出2的问题, 参与者1 可以预测到参与者2 对每一个可能行动 a 1所做出的反应,这样1 在第一阶 max 段要解决的问题可归结为: A u1 (a1 , R2 (a1 )). a 假定参与者1的这一最优化问题也有唯一解,表示 为 a 1 , 我们称 (a1 , R(a1 )) 是这一博弈的逆向归纳解. 逆向归纳解不含有不可置信的威胁: 因为参与者1 能预测到参与者2对1的可能选择的最优反应, 这一预 测排除了参与者2不可置信的威胁.
q q
* 1 * 2
ac 3

ac 3

* S
2 3
(a c)
* C
3 4
( a c ),
相关文档
最新文档