动态博弈剖析经典实例共53页
第五章 不完全信息动态博弈1

1、基本思路 、
在不完全信息动态博弈:①“自然 选择i类型 自然” 类型θ 参与人i自知 自知, 在不完全信息动态博弈:①“自然”选择 类型 i,θi参与人 自知, 其 他 人 -i 不 知 ; ② 在 N 选 择 后 , 参 与 人 i 开 始 行 动 ( 有 先 有 后 ( 动 态)),后行动者能观测到先行动者的行动,但不能观测到先行动者 )),后行动者能观测到先行动者的行动, 的类型(后者知前者的a,不知前者的θ) 的类型( 后者知前者的 , 不知前者的 ),但 a=a(θ),于是从 了 ( ) 于是从a了 解到θ(后行动者可以通过观察先行动者的行动a来推断其 来推断其θ或修正对 解到 ( 后行动者可以通过观察先行动者的行动 来推断其 或修正对 其类型的先验信念(概率分布) 然后③ 其类型的先验信念(概率分布),然后③后行动者选择自己的最优行 先行动者预测到自己的行动将被后行动者所利用, 动。先行动者预测到自己的行动将被后行动者所利用,就会设法选择 传递对自己最有利的信息,避免传递对自己不利的信息。 传递对自己最有利的信息,避免传递对自己不利的信息。 因此,博弈过程不仅是参与人选择行动的过程, 因此,博弈过程不仅是参与人选择行动的过程,又是参与人修正信念 的过程(主观概率) 的过程(主观概率)。 (1)两个例子 ) – 例1、“黔驴之技” 、 黔驴之技” – 例2、市场进入 、 (2)上一章的 )上一章的BNE无法全面分析上述动态博弈的均衡结果 无法全面分析上述动态博弈的均衡结果
k =1
2、贝叶斯法则 、
例1、“黔驴之技” 、 黔驴之技”
毛驴刚到贵州,是个庞然大物,老虎躲在树林偷偷地瞧(最优) ①毛驴刚到贵州,是个庞然大物,老虎躲在树林偷偷地瞧(最优)②老 虎走出树林, 想了解毛驴的真实本领的信息) 有一天毛驴大叫一声, 虎走出树林,(想了解毛驴的真实本领的信息),有一天毛驴大叫一声, 老虎被吓逃了(最优) 又过了几天,老虎习惯毛驴的叫声, 老虎被吓逃了(最优)③又过了几天,老虎习惯毛驴的叫声,老虎靠近 毛驴,毛驴用蹄子去踢老虎,这一踢向老虎传递的信息是“毛驴不过这 毛驴,毛驴用蹄子去踢老虎,这一踢向老虎传递的信息是“ 点本事而已” 老虎一下扑向毛驴,将其吃掉。这个故事里, 点本事而已”,老虎一下扑向毛驴,将其吃掉。这个故事里,老虎通过 观察毛驴的行为逐渐修正对毛驴的看法,直到看清它的真面目, 观察毛驴的行为逐渐修正对毛驴的看法,直到看清它的真面目,把它吃 掉。 这是一个PBNE,老虎的每一步行动都是给定它的信息下最优的。事实 这是一个 ,老虎的每一步行动都是给定它的信息下最优的。 上,这个故事里,毛驴的行为也是很理性的,它知道自己技能有限,所 这个故事里,毛驴的行为也是很理性的,它知道自己技能有限, 以不到万不得已是不用那仅有的一技的,否则它早就被老虎吃掉了。 以不到万不得已是不用那仅有的一技的,否则它早就被老虎吃掉了。 精练贝叶斯均衡( 精练贝叶斯均衡(PBNE):是不完全信息动态博弈均衡的基本均衡概 ) 它是泽尔腾( 念,它是泽尔腾(selten)的完全信息动态博弈子博弈精练 和海萨尼 )的完全信息动态博弈子博弈精练NE和海萨尼 的结合。 (Harsanyi)的不完全信息静态 )的不完全信息静态BNE的结合。 的结合
博弈论第四讲动态博弈

制止
(-2,5) 制止
仿冒
A 不仿冒
B
不制止 (0,10)
仿冒
A
B 不制止
不仿冒 (5,5)
(2,2)
(10,4)
节点: 边: 终节点:
引子
每一阶段节点数、每一个选择节点的可选行为 数量,都可以不同,比如
仿冒更多次数、仿冒的规模和程度、制止仿冒的力 度
也不是所有动态博弈都可以用扩展形
阶段很多,或在一个阶段有很多可以选择的行为, 如下棋
双寡头竞争:古诺(Cournot)博弈
设一市场有1,2两家厂商生产同样的产品。如果厂商1的产量为 q1,厂商2的产量为q2 ,则市场总产量为Q= q1+ q2 。设市场出 清价格P是市场总产量的函数P(Q)=a-(q1+q2)
两个企业同时选择产量,价格由市场决定; 假设每家公司的成本函数相同,并且每单位成本不随生产的数量
古诺寡头模型扩展--斯塔克博 格模型(Stackelberg)
先分析第二个厂商的决策:?
因为其决策时,厂商1的选择q1实际上已经决定了, 并且厂商2知道q1,因此对厂商2来说,相当于在给 定q1的情况下求使II2实现最大的q2 ,
II2对q2求导,得到q2必须满足:a-c- q1 -2 q2 =0, 即q2 *=(a-c- q1)/2
法律保障 --单次 企业信用体系--全寿命,一旦有失信发生,它的信用记录
有一笔摸不去的黑,将来它做生意也好,向银行贷款也好, 都会受此影响。所以国外企业对信用问题看的非常严重-- 电子商务的信用记录
关键在于必须增加一些对甲行为的制约!
在上面,甲选择不分,乙完全无可奈何;只能采取消极办法 -不借,保护自己不被骗
变化。更正规一些,每家公司具有常数边际成本函数;C(qi ) cqi
第四讲 动态博弈

R (0,0)
2
U
1
L (3,1) (2,2)
D
修改的市场进入博弈
试说明上述不可置信的威胁是什么? 现实生活中的例子:父亲坚决不同意女儿 的婚事,威胁说,如果女儿不与相爱的人 断绝关系,他就与女儿断绝父女关系。
逆向归纳法
逆向归纳法可以排除不可置信的威胁。之 所以可以如此,根本原因在于采用了一种 分析动态博弈的有效方法——逆向归纳法, 即从动态博弈的最后一个阶段博弈方的行 为开始分析,逐步倒推回前一个阶段相应 博弈方的行为选择,一直到第一个阶段的 分析方法。一般方法是:从最后一阶段开 始分析,每一次确定出所分析阶段博弈方 的选择和路径,然后再确定前一阶段的博 弈方选择和路径。
(L/L,L/S) (L/L,S/S) (S/L,L/S) (S/L,S/S)
(若史密斯选择大则选择大;若其选择小则选择大) (若史密斯选择大则选择大;若其选择小则选择小) (若史密斯选择大则选择小;若其选择小则选择大) (若史密斯选择大则选择小;若其选择小则选择小)
跟随领头羊Ⅰ表明只要添加一点复杂性,就 使得策略式表述变得晦涩难懂,几无用武之 地。策略式如下。
威胁是指一个参与人承诺一旦其他参与人 偏离均衡,他将采取的某种行动,威胁是 有 一定影响力的,尽管可能它从未被实施 过。
在位者
默许 斗争 进入 40,50 -10,0 进入者 不进入 0,300 0,300 市场进入博弈中,如若进入者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润,所以 斗争就是一种不可置信的威胁。但纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)就成为一个纳 什均衡。
例如,一个模型不能在一开始就说德国相信它打 赢一场与法国的战争的概率是0.8,而法国相信这 一概率只有0.4,因此它们急欲一战。恰恰相反, 它必须假定信念(先验概率)开始时是一致的, 随后因为私人信息而产生分歧。例如两个参与人 都认为德国获胜的概率是0.4,但若德国的将军是 个军事天才,则这一概率就是0.8,而且随后德国 人发现德国的将军确实是个天才。如果是法国抢 先宣战,那么法国的错误信念可能会导致一场战 争,而若德国能令人信服它对德国将军天才的私 人信息,则这场战争本可避免。
博弈课件第一章动态博弈4

系,是不能分割的整体. 因此在动态博弈中,研究某 个博弈方某个阶段的行为, 或者将各个阶段的行为割 裂开来研究是没有意义的. 动态博弈中某博弈方的策略 是指轮到他选择时, 针对前面阶段的各种情况,以及后续阶段可能的选择 所作相应选择的完整计划. 动态博弈的结果 包括双方(或多方)采用的策略 组合、实现的博路径和各博弈方的收益. 四、动态博弈的非对称性 因为动态博弈中各个博弈方的行为选择有先后次 序的,且后行为者能观察到此前博弈方的行为选择, 因此动态博弈中各博弈方的地位是不对称的. 另外,在 动态博弈中各博弈方的阶段选择不一定是交替进行的.
a1A1
假定参与者1的这一最优化问题也有唯一解, 表示为 a1 ,我们称 (a1 , R(a1 ))是这一博弈的逆向归纳解. 逆向归纳解不含有不可置信的威胁:因为参与者1能够 预测到参与者2 对1的可能选择的最优反应, 这一预测
排除了参与者2不可置信的威胁. 逆向归纳法背后的理性假设. 看下例三阶段两个参与者的动态博弈. 三阶段两个参与者的动态博弈的博弈树表示.
三阶段的“打”并不需要真正实施,但它是保证第 二阶段甲会分的关键,乙的策略中必须包含这个选 择. 既然双方上述策略构成一个纳什均衡,它应该 是具有稳定性的,但事实上乙根本就不会选择 “借” . 为什么会出现这种矛盾呢?主要在于乙第三阶段 的“起诉”是不可信的. 纳什均衡在动态博弈可能缺乏稳定性的根源在于 它不能排除博弈方策略中所包含的不可信的行为设定 不能解决动态博弈的相机选择引起的可信性问题. 动态博弈的有效分析概念,除了要符合纳什均衡 的基本要求以外,还必须满足另一个关键的要求,那 就是它(或者它们)必须能够排除博弈方策略中不可
博弈的结果: (借,还)
案例:开金矿博弈 版本3:法律保障不足的开金矿博弈 P1 不 还 P1
不对称信息动态博弈

不对称信息动态博弈第一节 不对称信息动态博弈的描述5.1.1 精炼贝叶斯纳什均衡在不对称信息博弈中,如果考虑博弈的动态性质,就会带来一些新的考量。
下面看看一个例子:例子5.1恋爱博弈在人生中,也许婚姻是最具代表性的不对称信息博弈,并且还是动态的博弈。
结婚的男女双方都不知道对方是否在未来的婚姻生活中是适合自己的。
为了简化分析,我们假定恋爱的一方(譬如男方)知道自己是否适合自对方的,但是对方(女方)并不知道男方是否适合她。
在图5.1中给出的一个不对称信息动态博弈中,“自然”N 首先选择参与人1(男方)的两种类型{}1112=,=θθ适合女方的男方不适合女方的男方中的某一种(当然,对于女方来说,是不是适合自己有多种含义,可以是是不是真心爱自己,也可以是不是能够挣钱,或者两者都有要求),参与人2(女方)对N 的选择具有不对称信息,她只知道男方适合或者不适合自己的可能性各占一半,我们称参与人2的先验概率为211212()()0.5P P θθ==,参与人2的类型是对称的。
(在现实中,可能男方自己也不知道自己是不是适合对方,譬如自己是否真心爱女方,或者是否能够挣钱;也就是说,男方自己对于自己的类型也是不清楚的;在这里,我们作简化的假定,即男方自己是知道自己的类型的 )男方有两个行动可以选择,一个是主动追求女孩L (L 在这里可以表示“爱”(Love ),也表示图中的左边(Left ),一个是不主动追求女孩R (表示“拒绝(refuse )”或者右边(right ));女孩也有两个行动可以选择,一个是向男孩示好l ,一个是不向男孩示好r (在这里的大小写没有男权主义的意思);N图5.1 恋爱博弈我们来分析这样的博弈是如何达到均衡的。
当女方看见男孩追求自己的时候,她不知道男孩子是否是适合自己的,连接两个L 点的虚线就表示女孩子不知道她位于哪一个点上,这两个点都是可能的,它们构成一个“信息集”h ;类似地,连接两个R 点的虚线表示女孩子看见男孩子没有主动追求自己的时候,她不知道她位于哪一个点上,这两个点都是可能的,它们构成一个“信息集”f 。
博弈论的实例分析

博弈论的实例分析一.“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。
讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。
可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。
A和B均坦白是这个博弈的纳什均衡。
这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。
即是说,不管A坦白或抵赖,B的最佳选择都是坦白。
反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。
结果,两个人都选择了坦白,各判刑8年。
在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。
二.电信价格竞争根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。
假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争,一开始的价格都是P0。
A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚刚成立不久,翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的。
正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优惠,其中就有B的价格可以比P0低10%。
这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。
在这样的市场分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影响。
这时候,A该怎么做?不妨假定:A降价而B维持,则A获利15,B损失5,整体获利10;A维持且B也维持,则A获利5,B获利10,整体获利15;A维持而B降价,则A损失10,B获利15,整体获利5;A降价且B也降价,则A损失5,B损失5,整体损失10。
生活中的博弈论案例

生活中的博弈论案例在生活中,我们经常会面临各种各样的选择和决策,而这些选择和决策往往都涉及到博弈论的原理。
博弈论是研究决策者之间策略的交互和结果的数学理论,它可以帮助我们更好地理解和分析生活中的各种情境。
下面,我将通过一些生活中的案例来说明博弈论的应用。
首先,我们来看一个经典的案例,囚徒困境。
假设有两名罪犯被捕,警察没有足够的证据来定罪,于是他们分开审讯。
如果两名罪犯都保持沉默,警察只能以轻罪定罪,每人判刑1年;如果其中一人交待,而另一人保持沉默,交待的罪犯将被免罪,而另一人将被判10年;如果两人都交待,那么每个人都将被判3年。
在这种情况下,每个人都会面临一个选择,是保持沉默还是交待对方。
这个案例中涉及到了合作与背叛、信任与背叛的问题,而最终的结果将取决于双方的选择。
另一个案例是超市定价策略。
假设有两家竞争对手的超市,它们在定价上存在博弈。
如果一家超市降低价格,另一家超市也会跟随降价,这样双方都会获得更少的利润;如果一家超市提高价格,而另一家超市保持不变,那么提高价格的超市将失去市场份额。
在这种情况下,双方都在考虑对方的策略来做出最优的决策,这就是典型的博弈论案例。
此外,还有许多其他生活中的例子可以用来解释博弈论的原理,比如政治竞选、商业竞争、劳资关系等。
在这些情境下,各方都在考虑对方的策略来做出自己的选择,而最终的结果往往是双方都在寻求最大化自己利益的平衡点。
总的来说,博弈论是一种非常有用的工具,可以帮助我们更好地理解和分析生活中的各种情境。
通过学习博弈论,我们可以更好地理解人们在决策过程中的行为,并且可以更好地制定自己的策略来应对各种情况。
希望通过这些案例的分析,可以帮助大家更好地理解博弈论的原理,从而在生活中做出更加明智的选择。
动态博弈

8 1 1 1
完全信息动态博弈
15721546 马广庆
E F
扩展式博弈
Lorem ipsum dolor sit amet, consectetur
扩展式博弈纳什均衡
Lorem ipsum dolor sit amet, consectetur
子博弈精炼纳什均衡
Lorem ipsum dolor sit amet, consectetur
逆向归纳法
Lorem ipsum dolor sit amet, consectetur
动态博弈实例分析
Lorem ipsum dolor sit amet, consectetur
重复博弈
Lorem ipsum dolor sit amet, consectetur
前言
• 智猪博弈 • 囚徒困境 • 古诺模型 • 市场进入阻扰模型 • 房地产开发博弈 • 田忌赛马
max u 2 (a1 , a 2 )
a 2 A2
2016
动态博弈模型
Stackelberg博弈模型 两个企业进行先后确定产量水平的两阶段动态博弈 第一阶段,作为领导者的企业1首先制定产量;第二阶段,作为跟随者的企业 2观察到企业1制定的产量水平后,按照利润最大化原则制定其产量。 假设两个企业的边际成本相等,c1 c 2 c - q1 q 2)其中a>0为常数, 市场需求函数为 p a ( 企业的战略选择,市场需求是共同知识。
• 动态博弈指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者
•
所选择的行动。 注:也就是说在动态博弈中的参与人不仅要考虑自己策略对自己的影响,也 要考虑自己策略对他人的影响。