动态博弈

合集下载

动态博弈案例

动态博弈案例

动态博弈案例
哎呀呀,今天来给大家讲讲动态博弈案例。

就说那商业战场吧,各个企业之间的竞争那叫一个激烈啊!比如说电商平台吧,甲电商平台搞了个大促活动,哇塞,那优惠力度可大了去了!这时候乙电商平台能坐视不管吗?那肯定不能啊!乙电商平台立马跟进,推出了更厉害的优惠政策,这不是明摆着跟甲电商平台较劲嘛!这就是动态博弈啊,你出招,我接招。

再想想看,体育比赛中不也是这样嘛?篮球比赛里,自己这边球队进了一个球,那对手球队能不着急啊?他们肯定得想办法扳回来呀!两边球队就是在不断地根据对方的行动来调整自己的战术,这多刺激啊!就好像在下一盘大棋,每一步都得小心翼翼,又得果断出击。

好比甲乙两支球队,甲队发现乙队防守有漏洞,马上就专攻那个点,乙队发现后能不改变防守策略吗?肯定得呀!然后甲队又得想新的办法来突破,这不就是一场你来我往的动态博弈嘛!
还有国际关系中呢,国家之间的互动也是如此啊!一个国家采取了某种政策,其他国家也得跟着调整自己的态度和行动,就像一场复杂的博弈游戏。

在这些动态博弈中,每一方都得时刻保持清醒的头脑,得快速反应,还得有长远的眼光。

这可不是一件容易的事儿啊,但正因为这样,才让整个过程充满了挑战和乐趣。

这就是动态博弈的魅力啊,就像一场永不停歇的战斗,你永远不知道下一刻会发生什么,难道不是特别让人兴奋吗?在这些各种各样的动态博弈中,可以看到智慧的交锋、策略的较量,这就是人类社会精彩的一面啊!我们都身在其中,要么是参与者,要么是旁观者,但无论怎样,都能深刻感受到这种动态博弈带来的震撼和影响力。

所以说啊,动态博弈无处不在,它影响着我们生活的方方面面,真的是太有意思啦!。

第四讲 动态博弈

第四讲 动态博弈

R (0,0)
2
U
1
L (3,1) (2,2)
D
修改的市场进入博弈
试说明上述不可置信的威胁是什么? 现实生活中的例子:父亲坚决不同意女儿 的婚事,威胁说,如果女儿不与相爱的人 断绝关系,他就与女儿断绝父女关系。
逆向归纳法
逆向归纳法可以排除不可置信的威胁。之 所以可以如此,根本原因在于采用了一种 分析动态博弈的有效方法——逆向归纳法, 即从动态博弈的最后一个阶段博弈方的行 为开始分析,逐步倒推回前一个阶段相应 博弈方的行为选择,一直到第一个阶段的 分析方法。一般方法是:从最后一阶段开 始分析,每一次确定出所分析阶段博弈方 的选择和路径,然后再确定前一阶段的博 弈方选择和路径。
(L/L,L/S) (L/L,S/S) (S/L,L/S) (S/L,S/S)
(若史密斯选择大则选择大;若其选择小则选择大) (若史密斯选择大则选择大;若其选择小则选择小) (若史密斯选择大则选择小;若其选择小则选择大) (若史密斯选择大则选择小;若其选择小则选择小)
跟随领头羊Ⅰ表明只要添加一点复杂性,就 使得策略式表述变得晦涩难懂,几无用武之 地。策略式如下。
威胁是指一个参与人承诺一旦其他参与人 偏离均衡,他将采取的某种行动,威胁是 有 一定影响力的,尽管可能它从未被实施 过。
在位者
默许 斗争 进入 40,50 -10,0 进入者 不进入 0,300 0,300 市场进入博弈中,如若进入者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润,所以 斗争就是一种不可置信的威胁。但纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)就成为一个纳 什均衡。
例如,一个模型不能在一开始就说德国相信它打 赢一场与法国的战争的概率是0.8,而法国相信这 一概率只有0.4,因此它们急欲一战。恰恰相反, 它必须假定信念(先验概率)开始时是一致的, 随后因为私人信息而产生分歧。例如两个参与人 都认为德国获胜的概率是0.4,但若德国的将军是 个军事天才,则这一概率就是0.8,而且随后德国 人发现德国的将军确实是个天才。如果是法国抢 先宣战,那么法国的错误信念可能会导致一场战 争,而若德国能令人信服它对德国将军天才的私 人信息,则这场战争本可避免。

完全信息动态博弈模型

完全信息动态博弈模型

完全信息动态博弈模型完全信息动态博弈模型是博弈论中一种重要的博弈模型,它描述了一组参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。

下面将详细介绍完全信息动态博弈模型的相关内容。

一、博弈的参与者:完全信息动态博弈模型中,通常包括两个或多个参与者,每个参与者都可以做出自己的决策和行动。

参与者可以是个人、组织、公司等,他们之间存在着相互竞争和合作的关系。

二、博弈的信息:完全信息动态博弈模型中的参与者拥有完全信息,即每个参与者都能够获得关于其他参与者的决策和行动的完整信息。

通过完全信息,参与者能够准确地评估自己的决策和行动对其他参与者的影响,并作出最优化的决策。

三、博弈的行动和策略:在完全信息动态博弈中,参与者可以选择不同的行动和策略来达到自己的目标。

每个参与者根据自己对其他参与者行动和策略的评估,以及自己的目标和利益,选择最优化的行动和策略。

四、博弈的时间顺序:完全信息动态博弈是一个时间序列上的博弈模型,参与者的决策和行动是有序进行的。

参与者按照一定的时间顺序依次进行决策和行动,每个参与者都会考虑前面参与者的行动和决策对自己的影响,进而作出自己的决策。

五、博弈的结果和收益:完全信息动态博弈模型的结果是参与者的收益和利益。

通过多轮反复的博弈过程,参与者根据自己的决策和行动可以获得不同的结果和收益。

每个参与者的最终目标是通过优化自己的决策和行动,获得最大的收益和利益。

完全信息动态博弈模型是博弈论中一种重要的模型,它能够帮助我们分析和理解多方参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。

通过对博弈的参与者、信息、行动和策略、时间顺序以及结果和收益的分析,可以更好地理解和应用完全信息动态博弈模型。

动态博弈理论

动态博弈理论

动态博弈理论基本概念静态博弈:所有局中人同时行动;后者局中人的行动有先后顺序,但是,后行动者不能观测到先行动者的行动。

动态博弈:局中人的行动有先后顺序,后行动者可以观测到先行动者的行动。

静态博弈的表示:局中人集合;局中人的决策集;局中人的支付(收益)函数。

动态博弈的表示(博弈的扩展式表达)1、局中人集合;(其中包括虚拟局中人“自然”)2、局中人的行动顺序:谁在什么时候行动;3、局中人的行动空间(决策集):在每次行动时,局中人的可供选择的决策;4、局中人的信息集:在每次行动时,局中人所知道的以前博弈过程的信息;5、局中人的支付函数:每次行动时,局中人的所得(它是所有行动的函数);6、外生事件(“自然”的选择)的概率分布。

博弈树:多人有限策略的扩展式可以用博弈树表示例:有房产商A和B各可以开发一栋楼,开发成本为1亿。

若市场有两栋楼,当市场需求大时,每栋楼售价为1.4亿;当市场需求小时,每栋楼售价为7千万。

若市场只有一栋楼,当市场需求大时,售价为1.8亿;当市场需求小时,每栋楼售价为1.1亿。

房产商的决策选择为开发或不开发。

这样,共有下列8种可能结果:1、需求大,A开发,B不开发,则A的利润为0.8亿,B的利润为0;2、需求大,A不开发,B开发,则A的利润为0,B的利润为0.8亿;3、需求大,A开发,B开发,则A的利润为0.4亿,B的利润为0.4亿;4、需求大,A不开发,B不开发,则A的利润为0,B的利润为0;5、需求小,A开发,B不开发,则A的利润为0.1亿,B的利润为0;6、需求小,A不开发,B开发,则A的利润为0,B的利润为0.1亿;7、需求小,A开发,B开发,则A的利润为-0.3亿,B的利润为-0.3亿;8、需求小,A不开发,B不开发,则A的利润为0,B的利润为0;假设行动顺序为房产商A先行动,然后“自然”选择需求量(假设需求大或小的概率同为0.5)。

房产商B观察到房产商A行动和“自然”选择后,再选择行动。

动态博弈学习

动态博弈学习

第8讲完美信息动态博弈第一节完美信息动态博弈的特点与解法1动态博弈的表示方法——扩展型动态博弈涉及博弈的参与人多个阶段的选择和选择的顺序问题,一般难以用策略型表示,而多用扩展型——也称博弈树——表示(有限博弈)。

以仿冒与反仿冒为例。

一些名词:参与人和行动顺序:结点:决策结——参与人决策的点;终点结支付向量:先行动的人的支付排第一,后行动的人的支付排第二......信息集:在完美信息的情况下,处于某一节点的参与人对这个结点之前的信息都是了解的。

所有的信息集都是单结的。

(根据参与人是否相互了解支付情况,有完全信息和不完全信息博弈之分,根据是否所有参与人都对自己选择前的博弈过程完全了解,由完美信息与不完美信息博弈之分。

)路径:第一阶段A仿冒,第二阶段B不制止,第三阶段A 仿冒,第四阶段B制止。

2可信性与纳什均衡的问题纳什均衡在动态博弈中不再适用。

因为:承诺和威胁的可信性问题。

例:开金矿博弈B有一价值4万元的金矿缺一万元资金。

A有一万元资金。

B承诺如果A将资金借给他,金矿开采后收益对半分成。

问题:A是否应该借给她?如果博弈进行到第二阶段,B的合理行动是“不分”,承诺是不可信的。

考虑到这一点,A在第一阶段选择“不借”。

如果在B不分时A选择打官司。

情况就是:如果打官司非常劳民伤财,则打官司的威胁就是不可信的。

情况就是:所以,承诺或威胁是否可信对于博弈的结果有很大的影响。

由于存在可信性问题,纳什均衡不再是动态博弈的适合的均衡解。

看第三种情况。

策略组合A:第一阶段选择“借”,第三阶段“打”;B:第二阶段“分”是一个纳什均衡。

证明:给定A的策略,B“分”是最佳选择;给定B“分”的策略,A第一阶段借,第三阶段打是最佳选择(第三阶段打不需要实施,但是它是保证B分的关键,因而A的策略必须包括第三阶段打的策略)但是这个纳什均衡不具有稳定性不具有一致预测性。

这是因为,如果B在第二阶段选择了“不分”,A“打”的威胁是不可信的。

《动态博弈模型》课件

《动态博弈模型》课件

子博弈精炼纳什均 衡
在完全信息动态博弈中,子博 弈精炼纳什均衡是指通过剔除 不可置信威胁和承诺的策略, 得到的均衡结果。
不完全信息动态博弈
不完全信息
在不完全信息动态博弈中,至少有一个参与者不拥有关于博弈 的所有信息,包括其他参与者的类型、策略和支付函数。
贝叶斯纳什均衡
在不完全信息动态博弈中,贝叶斯纳什均衡是一个重要的概念, 它是指所有参与者在给定自己类型和概率分布的条件下,采取的
劳动力市场
经典动态博弈模型用于研究劳动力市场的工 资和就业问题,分析雇主和雇员之间的博弈 关系。
在政治学中的应用
选举博弈
经典动态博弈模型用于分析选举中的竞选策略,如候 选人如何制定竞选纲领、如何进行宣传等。
国际关系
该模型用于研究国家间的外交政策和国际合作,分析 各国在利益冲突下的博弈行为。
立法博弈
触发战略
在重复博弈中,触发战略是指一种报复机制,如果某个参与者在某个阶段采取了不合作 的策略,其他参与者会在未来的阶段采取报复措施。
04
动态博弈模型的求解方法
逆向归纳法
逆向归纳法是一种求解动态博弈的方法,通过逆向推理,从博弈的最后阶段开始分析,逐步向前推导 ,最终得出每个参与者的最优策略。
在求解过程中,逆向归纳法假设每个参与者都了解其他参与者的策略选择,并在此基础上选择自己的最 优策略。
02
经典动态博弈模型介绍
囚徒困境
总结词
描述两个囚犯因相互背叛而导致双方都不利的结果。
详细描述
囚徒困境是一个经典的动态博弈模型,描述了两个囚 犯因被警方逮捕而面临指控的情况。如果两个囚犯都 保持沉默,他们都将得到较轻的刑罚;但如果其中一 个囚犯背叛另一个,他将得到更轻的刑罚,而另一个 囚犯将得到更重的刑罚。然而,如果两个囚犯都背叛 彼此,他们都将得到更重的刑罚。因此,尽管合作是 最佳策略,但每个囚犯都有动机背叛对方,导致双方 都不利的结果。

动态博弈

动态博弈

案例:开金矿博弈 版本3:法律保障不足的开金矿博弈 P1
不借
(1, 0) 起诉 (-1, 0) 不还 P1
借 P2 还
放弃 (0, 4)
(2, 2)
2· B 斯塔克尔贝里双头垄断模型 1· 博弈的时间顺序如下(1) 企业1选择产量q1 , (2) 企 业2观察到q1 以后,然后选择产量q2 ; (3) 企业i 的收 益由下面的利润函数给出:
自己避免小企业,小人物的无端指控. 办法之一就是在被指控之前就支付律师费用. 假定被告在被指控之前支付律师费用y , 那么,赔偿 区域为 s [ rx , rx d y ], 纳什均衡解为
s rx (d y) 2
因为即使 rx d 2 c p 成立, ( d y ) 2 c p rx 也可能不满足, 从而原告将不会提出指控. 这样的 承诺行动使被告节省成本 rx d 2 y . 因此,只要 y rx d 2 , 承诺行动就值得. 这 就是为什么大公司、大人物雇佣律师的原因之一.
动 态 博 弈
简单地讲,动态博弈就是参与者的行动选择必须 是有先后顺序的博弈. 参与者的每一次行动选择叫做一步或一个时期. 直观地讲,动态博弈可以看作若干个静态博弈联 合在一起看作一个博弈. 动态博弈分为 完美信息和非完美信息动态博弈. 第二章 完全信息动态博弈 1 完全信息博弈 参与者的收益函数是共同知识的博弈 2 完全且完美信息动态博弈 博弈进行的每一步当中, 要选择行动的参与者都知道这一步之前博弈进行的
显然即使 rx c p , (即上法庭的期望收益小于诉讼 成本), rx d 2 c p 的条件仍可能成立. 子博弈纳什均衡结果将是: 假定这个条件成立, 原告提出指控要求. 原告的支付为 rx d 2 c p , 被告的支付为 rx d 2 , 案件私了. 该博弈模型的实际背景举例: 因为被告打官司的成本不仅包括应诉的法律费 用而且涉及声誉损失( d ),所以,被告越大(大人物 大企业), d 越大, rx d 2 c p 的条件越可能满足. 这是为什么大人物常常受到无端指控的原因之一. 当然,大企业、大人物也可以通过他们的承诺行动使

博弈论——完全信息动态博弈

博弈论——完全信息动态博弈

2 完全信息的动态博弈2.1完全和完美信息的动态博弈动态博弈(dynamic game):参与人在不同的时间选择行动。

完全信息动态博弈指的是各博弈方先后行动,后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合下所有参与人相应的得益都完全了解的博弈静态博弈习惯用战略式(Strategic form representation)表述,动态博弈习惯用扩展式(Extensive form representation)表述。

战略式表述的三要素:参与人集合、每个参与人的战略集合、由战略组合决定的每个参与人的支付。

扩展式表述的要素包括:参与人集合、参与人的行动顺序、参与人的行动空间、参与人的信息集、参与人的支付函数、外生事件(自然的选择)的概率分布。

n人有限战略博弈的扩展式表述用博弈树来表示1(1,2) (0,3)①结:包括决策结和终点结。

决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。

第一个行动选择对应的决策结为“初始结”,用空心圆表示,其它决策结用实心圆表示。

X表示结的集合,x X表示某个特定的结。

z表示终点结,Z表示终点结集合。

表示结之间的顺序关系,x x´表示x在x´之前。

x之前所有结的集合称为x的前列集,x之后所有结的集合称为x的后续集。

以下两种情况不允许:前者违背了传递性和反对称性;后者违背了前列节必须是全排序的。

在以上两个假设之下,每个终点结都完全决定了博弈树的某个路径。

②枝:博弈树上,枝是从一个决策结到其直接后续结的连线,每一个枝代表参与人的一个行动选择。

在每一个枝旁标注该具体行动的代号。

一般地,每个决策结下有多个枝,给出每次行动时参与人的行动空间,即此时有哪些行动可供选择。

③信息集(information sets):博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结集合称为一个信息集。

博弈树上的所有决策结分割成不同的信息集。

每一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合),该子集包括所有满足下列条件的决策结:(1)每一个决策结都是同一个参与人的决策结。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

“战术勾结”
寡头之间的“不回避竞争法则”,是指至 少有几个寡头厂商保证(通常以做广告的 方式)自己的索价不高于其他任何竞争者。 这样的许诺对于消费者来说似乎是件很好 的事,但事实上这样的做法会提高价格。
寡占的斯塔克博格(stackberg)模型—— 动态的寡头市场产量博弈模型
u1=q1P(Q)-c1q1 =q1[8-(q1+q2)]-2q1 =6q1- q1q2-q12
最后,实施上述策略组合的最终结果,即 路径终端处得益数组中的数字。
可信性和纳什均衡问题
相机选择和策略中的可信性问题 动态博弈中博弈方的策略并没有强制力,
而且实施起来有一个过程,只要符合博弈 方自己的利益,他们完全可以在博弈过程 中改变计划。我们称这种问题为动态博弈 中的“相机选择”(Contingent Play)。
逆推归纳法(backwards induction)
逻辑基础:动态博弈中先行动的理性的博弈方, 在前面阶段选择行为时必然会考虑后行为博弈 方在后面阶段中将会怎样选择行动,只有在博 弈的最后一个阶段不再有后续阶段牵制的博弈 方,才能做出明确的选择。而当后面阶段博弈 方的选择确定以后,前一阶段博弈方的行为也 就容易确定了。
q2应满足: 6-q1-2 q2 = 0 q2 =3-q1/2
厂商1 知道厂商2的这种决策思路,因此在选择产量水平 q直1时接就将知上道式厂代商入2自的己产的量得q2益*会函根数据,上这式样确厂定商,1的所得以益他函可数以 实际上转化成了他自己产量的一元函数:
u1(q1,q2*) = 6q1-q1q2*-q12 = 6q1-q1(3-q1/2)-q12 = 3q1-0.5q12
乙讨价还价的筹码就是可以跟甲托时间
(当然拖延对乙的收益也有影响),拖延
时间对甲造成的损失越大,甲愿意分给乙
以求早日结束讨价还价的利益越大,只有 当甲完全不怕旷日持久的谈判(δ=1),或 乙的争夺是毁灭性的(δ=0)时,居于有利 地位的甲方才不需要花钱买太平,可以保 证自己的全部利益。
练习:
考虑以下双寡头策略投资模型:企业1 和企业2 当前的平均成本都是2。企业1可以装备一种新 的技术,从而使其平均成本降低到1。装备这一 技术需要花费f。企业2可以观察到企业1是否投 资于这一新技术。一旦企业1对新技术的投资行 为被观察后,两个企业如同在古诺竞争模型中 一样,同时选择自己的产量水平q1和q2。因此, 这是一个两阶段的博弈。假设市场需求函数为 P(Q)=14-Q,其中P是市场价格,Q是市场总产量, Q1会=q选1+择q2。引问进上新述技投术资?额f处于什么水平时,企业
完善的法律制度不但能保障社会的公平, 而且还能提高社会经济活动的效率,是实 现最有效率社会分工的重要保障。
当然,要充分保障社会公平和经济活动的 效率,法律制度必须对人们正当权益的保 护力度足够大,对侵害他人利益者有足够 的震慑作用。
借 乙 不借
分 甲 不分
(1,0)
(2,2)


不打
(-1,0)
例如下象棋是动态博弈,但它不仅博弈阶段很多, 而且每各阶段的可能选择也很多,因此很难用扩展 形表示。
无法用扩展形表示的动态博弈,通常可以直接 用文字描述和数学函数式表示。
动态博弈的策略和结果
动态博弈的结果首先是指各博弈方上述类 型的策略构成的策略组合;
其次,动态博弈的结果是各博弈方的策略 组合形成的一条连接各个阶段的“路径” (PATH);
三个厂商的利润函数为:
U1=(100-q1-q2-q3)q1-2q1 U2=(100-q1-q2-q3)q2-2q2 U3=(100-q1-q2-q3)q3-2q3 根据逆推归纳法,先分析第二阶段厂商3的选择 厂商3 的反应函数为:
100-q1-q2--2q3-2=0 q3=(98-q1-q2)/2
利,如果必须让对方得的数额不如早点让其得到, 这对自己是有利的。
甲 1 出 S1
接受 (S1 ,10000-S1)
乙 不接受,出 S2
接受

[δS2 ,δ(10000-S2)]
不接受,出 S
[δ2S,δ2(10000-S)]
第三回合:甲的出价S乙必须接受,因此甲的出 价会选择S=10000。为了容纳更多的可能性,仍 然保留S作为甲在该回合的出价。因此,如果博 弈进行到第三回合,双方的得益分别为δ2S和 δ2(10000-S)。
10000-S1 = 10000δ-δ2S
此时乙的得益于进行到第二回合的利益相同, 甲的得益10000-10000δ+δ2S则比进行到第二、 第三回合的得益δ2S大。因此甲在一第回合出价 S1 = 10000-10000δ+δ2S,乙方接受,甲、乙 双方得益各为10000-10000δ+δ2S和10000δ- δ2S,是这个博弈的子博弈精炼纳什均衡。
乙 不接受,出 S2 接受 甲
不接受,出 S
[δS2 ,δ(10000-S2)]
[δ2S,δ2(10000-S)]
本博弈的关键有两点:1、第三回合甲的方案有强 制力,即进行到该回合甲提出的分割比例S/10000 -S,乙必须接受,并且这一点两博弈方都是清楚 的。2、该博弈每多进行一个回合总得益就会下降 一个比例,因此让谈判拖得越长对双方可能越不
u2=q2P(Q)-c2q2 =q2[8-(q1+q2)]-2q2 =6q2- q1q2-q22
根据逆推归纳法的思路,先分析第二个厂商的决 策实厂最际大商。上值2在来已的第说经q二2,。决个相定阶当了段于,厂在并商给且2定决厂q策商1的时2 情知,况道厂下q商1,求1因选使此择u2实对的于现q1
再分析第一阶段厂商1和厂商2的选择,将厂商3的反应函 数带入1和2利润函数中,求出反应函数,解方程组
q1=q2=98/3 q3=98/6
讨价还价博弈
讨价还价(bargaining)是市场经济中最常 见、普通的事情。讨价还价在博弈论中S1
接受 (S1 ,10000-S1)
完全且完美信息动态博弈
动态博弈的扩展形表示
动态博弈一般用“扩展形” (或称“博弈树”)表示。 扩展形表述要给出每个参与人的动态描述,即参与人 在什么时点、什么情况下选择什么样的行动。
(1)参与人集合; (2)行动顺序(order of move),即谁在何时采取行动; (3)行动空间(action set),每次轮到某一参与人行动时,可
假设任一博弈方只要得益不小于下一回合自己出价 时的得益,就愿意接受对方的出价,那么乙在第二 回合能让甲接受的,也可能使自己的最大利益的S2 应满足:
S2 = δs 此时乙的收益得益为:
δ(10000-δS)=10000δ-δ2S> δ2(10000-S)
甲 1 出 S1
接受 (S1 ,10000-S1)
定义:如果一个完美信息的动态博弈中,各博弈方的 策略构成的一个策略组合满足,在整个动态博弈及 它的所有子博弈中都构成纳什均衡,那么这个策略 组合称为该动态博弈的一个“子博弈完美纳什均 衡”。
子博弈完美纳什均衡能够排除均衡策略中不可信的 威胁和承诺,因此是真正稳定的。
逆推归纳法是求完美信息动态博弈子博弈完美纳什 均衡的基本方法。
供选择的行动; (4息);信息集(information set),参与人进行选择时所知道的信 (5)收益函数,每个参与人可能选择的每一种行动所构成的行
动组合相对应的各个参与人的收益; (6)外生事件的概率分布,即虚拟参与人(自然)的可能选择,
它在博弈中的作用只是在相应的地方在若干外生事件中根据 一定的概率分布随即选取,而没有自己的利益目标和收益函 数。
S=10000
S1 10000 (1 2 )
[10000 (1 2 ), 10000( 2 )]
双方获得利益的比例取决于δ-δ2的大小。δδ2越大,甲的比例越小,乙的比例越大。当 δ=0.5时,δ-δ2有最大值0.25,当0.5<δ<1时, δ越大,δ-δ2越小,甲的得益越大,乙的得 益越小;当0<δ<0.5时,δ越大,δ-δ2越大, 甲的得益越小,乙的得益越大。
甲 1 出 S1
接受 (S1 ,10000-S1)
乙 不接受,出 S2
接受

不接受,出 S
[δS2 ,δ(10000-S2)]
[δ2S,δ2(10000-S)]
第二回合乙的选择:乙知道一旦博弈进行到第三回合,甲将 出S,自己得到δ2(10000-S),甲得到δ2S。如果乙已经拒绝 了第一回合甲的方案,此时他该如何出价才能使自己的得益 最大化呢?如果他出的S2使甲选择接受的得益小于第三回合 的得益,那么方案肯定会被拒绝,进行到第三回合,自己得 δ2(10000-S)。如果自己出的S2既能让甲接受(意味着甲的 得益不小于第三回合的得益),又能使自己的得益比第三回 合的得益大,那么这样的S2符合乙的利益。
借乙 分 甲 不分
不借 (1,0)
(2,2)
(0,4)
开金矿博弈
不可置信威胁引出信息经济学中一个很重要的 概念“承诺行动”(commitment)。
承诺行动是当事人使自己的威胁战略变得可置信的 行动。
一种威胁在什么时候才是可置信的?只有当事人在 不实施这种威胁时,就会遭受更大的损失时,威胁 才是可置信的。
(0,4)
子博弈
定义:由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和 进行博弈所需要的全部 信息,能够自成一个博 弈的原博弈的一部分, 称为原动态博弈的一个 “子博弈”。
乙 借
甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
子博弈完美纳什均衡
一般方法:从动态博弈的最后一个阶段开始分 析,每一次确定出所分析阶段博弈方的选择和 路径,然后再确定前一个阶段的博弈方的选择 和路径。
借 乙 不借
相关文档
最新文档