[学习]动态博弈分析经典实例
博弈论第三章完全且完美信息动态博弈

➢支付:这样假设支付情况: 若美国“犯我”,中国“不犯人”,则支付向量为(2,-4); 若美国“不犯我”,中国“犯人”,则支付向量为(3,-5); 若美国“犯我”,中国“犯人”,则支付向量为(-2,-2); 若美国“不犯我”,中国“不犯人”,则支付向量为(1,1)。
我国 犯我
犯人 (-2,-2) 不犯人 (2,-4)
大
小
1/2 1/2
B
开 发
(4,4)
不开 发
(8,0)
B
开 发
(-3,-3)
B
不开
不开
发开
发
发
(1,0) (0,8) (0,0)
B 不开
开
发
发
(0,1) (0,0)
房地产开发博弈
垄断者 容忍
进入
抵抗
(1,5) (-2,2)
进入者 不进入 垄断者
容忍 抵抗
(0,10) (0,10)
静态博弈用扩展式表述
第一,一个博弈可能有不止一个纳什均衡。
第二,在纳什均衡中,参与人在选择自己的战略时,把其他 参与人的战略当作给定的,不考虑自己的选择如何影响对手 的战略。这个假设在研究静态博弈时是成立的,因为静态博 弈下,所有参与人同时行动,无暇反应。但对动态博弈而言, 这个假设就有问题了。当一个人行动在先,另一个人行动在 后时,后者自然会根据前者的选择而调整自己的选择,前者 自然会理性地预期到这一点,所以不可能不考虑自己的选择 对其对手的选择的影响。
第三,与第二个问题相联系,由于不考虑自己选择对别人选 择的影响,纳什均衡允许了不可置信威胁的存在。
根据博弈方是否相互了解得益情况,有“完全信息动态博弈”和“不 完全信息动态博弈”之分;
根据是否所有博弈方都对自己选择前的博弃过程完全了解,有“完美 信息动态博弈”和“不完美信息动态博弈”之分。
静态与动态博弈分析

目录摘要 (2)一、完全信息静态博弈 (2)1、背景 (2)2、博弈的假设与建模 (2)3、结合案例博弈分析 (3)4、结论与思考 (4)5、建议 (4)6、小结 (5)二、完全信息动态博弈 (5)1、背景 (5)2、模型的建立与假设 (6)3、分析过程 (7)4、结论 (8)5、建议 (8)6、小结 (9)完全信息问题的博弈分析摘要:通过用博弈分析方法对日常生活中具有现实意义的社会现象和人力资源管理专业问题分析事件发生的本质,从而在各种复杂因素的影响下,找到利益最大化的均衡策略,不仅可以预测参与人的策略选择,更重要是提高自身决策水平和决策质量,实际即是博弈论在现实的运用。
本文选取两个案例作为完全信息静态和动态分析的背景。
关键词:博弈论、现实运用、社会现象、招聘一、完全信息静态博弈完全信息:每个参与人对其他所有参与人的战略选择和支付收益完全了解。
静态博弈:所有参与人在共同决策环境中同时选择行动策略,每个参与人只选择一次。
纳什均衡:在给定的其他参与人选择的前提下,参与人根据自身收益选择的最优战略。
1、背景:“除非有人证物证,否则我不会再去扶跌倒的老人!”广东肇庆的阿华在扶起倒地的70多岁阿婆却遭诬陷后表示。
事发7月15日早上,阿华开摩托车上行人道准备买早餐,看到路边有位老太太跌倒在求救,阿华立刻停下来,扶起老奶奶,殊不知却遭到阿婆的诬陷,随后和阿婆的女婿发生争执。
阿婆被送到医院住院观察。
为调查真相,交警暂扣了阿华的摩托车。
事发后几天,阿华说没睡过一次好觉,还向单位请了几天假,天天在附近找证人,就是为了证实自己清白。
这起社会事件引发了我们的深思:阿婆在路边跌倒,路人是否应该扶起?在这个过程中,跌倒的阿婆是否讹钱与是否采取帮忙的路人构成博弈问题,以下通过完全信息静态博弈模型分析,解析这一社会现象。
2、博弈的假设与建模:假设:参与博弈的双方是理性人,都会选择个人利益最大化的行动。
阿婆和路人是同时做出行动选择,即参与人在决策时不知道对方的策略。
3 完全且完美信息动态博弈--博弈论

Stackelberg博弈 要挟诉讼 讨价还价 委托-代理
3.1.1 :决策结(信息集)
终点结
甲
分 (2,2) 不分 (0,4)
(1,0)
枝:行动选择
阶段 stage 路径 path
3.1.2 动态博弈的特点
动态博弈的策略和结果
静态博弈
3.1.3 完全且完美信息动态博弈
参与人
完全:complete
参与人特征、策略空间、支付函数
每个参与人选择行动的时点 完美:perfect
自己行为之前博弈进程 每个参与人每次行动时可供选择的行动集合
每个参与人每次行动时有关对手过去行动选 择的信息 支付
3.1.4 可信性
乙
借 不借
不可信诺言
分
甲
不分 (0,4)
rx<p
要挟诉讼 nuisance suits
原告
不指控 (0,0) 指控
原告
要求s
拒绝
被告
接受
原告
起诉 放弃
(s-c,-s)
(rx-p-c,-rx-d)
(-c,0)
原告
不指控 (0,0) 指控
原告
要求s
被告
拒绝 接受
原告
起诉 放弃
(s-c,-s)
(rx-p-c,-rx-d)
(-c,0)
原告:{不指控,要求,放弃} 被告:{拒绝}
(1,0)
(2,2)
可信性:各博弈方是否会真正、始终按照自己的策略所设定的方案
行为,还是可能临时改变自己的行动方案(相机选择)?
有法律保障的开金矿博弈: 可信的诺言和威胁
乙
假设打官司使乙能收 回本钱1万元,甲则失 去全部采金收入。
博弈论第四讲动态博弈

制止
(-2,5) 制止
仿冒
A 不仿冒
B
不制止 (0,10)
仿冒
A
B 不制止
不仿冒 (5,5)
(2,2)
(10,4)
节点: 边: 终节点:
引子
每一阶段节点数、每一个选择节点的可选行为 数量,都可以不同,比如
仿冒更多次数、仿冒的规模和程度、制止仿冒的力 度
也不是所有动态博弈都可以用扩展形
阶段很多,或在一个阶段有很多可以选择的行为, 如下棋
双寡头竞争:古诺(Cournot)博弈
设一市场有1,2两家厂商生产同样的产品。如果厂商1的产量为 q1,厂商2的产量为q2 ,则市场总产量为Q= q1+ q2 。设市场出 清价格P是市场总产量的函数P(Q)=a-(q1+q2)
两个企业同时选择产量,价格由市场决定; 假设每家公司的成本函数相同,并且每单位成本不随生产的数量
古诺寡头模型扩展--斯塔克博 格模型(Stackelberg)
先分析第二个厂商的决策:?
因为其决策时,厂商1的选择q1实际上已经决定了, 并且厂商2知道q1,因此对厂商2来说,相当于在给 定q1的情况下求使II2实现最大的q2 ,
II2对q2求导,得到q2必须满足:a-c- q1 -2 q2 =0, 即q2 *=(a-c- q1)/2
法律保障 --单次 企业信用体系--全寿命,一旦有失信发生,它的信用记录
有一笔摸不去的黑,将来它做生意也好,向银行贷款也好, 都会受此影响。所以国外企业对信用问题看的非常严重-- 电子商务的信用记录
关键在于必须增加一些对甲行为的制约!
在上面,甲选择不分,乙完全无可奈何;只能采取消极办法 -不借,保护自己不被骗
变化。更正规一些,每家公司具有常数边际成本函数;C(qi ) cqi
06 动态博弈

博弈树(game tree)
策略
我
你 投资
违约
你 -10 我 50
遵守合同 你 15 我 25
不投资
你0 我0
行动
你心目中的动态博弈
第一,不同的博弈可以采用相同的或极其 类似的数学形式。 第二,参与人应该能认识到,具有策略思 维的其他人会怀疑自己行动的可靠性,因 此有强烈的动机使其承诺可信。 第三,一个参与人获得越多并不意味着另 一个参与人获得更少。
例子:欧共体在空中客车与波音公司的竞争 中对空中客车公司的战略性补贴。
欧共体为了打破美国波音公司对全球 民航业的垄断,曾放弃欧洲传统的自由竞 争精神而对与波音公司进行竞争的空中客 车公司进行补贴。
当双方都未获得政府的补贴时,
两个公司都开发新型飞机会因市场
饱和而亏损,但若一家公司开发而 另一家公司不开发时,则开发的那 家公司会获巨额 利润,见表。
在这种情况下,A在自己的决策结上当然 选择“开发”,因为他预计当自己选择“开发” 后,B会选择“不开发”,自己就净赚一百万。 当B威胁A说:“不管你是否开发,我都会在这 里开发写字楼。”倘若A将B的话当了真,A就 不敢开发,让B单独开发写字楼占便宜。但是, B的威胁是“不可置信”的。 当A不理会B的威胁而果断地开发出一栋 写字楼时,B其实不会将事前的威胁付诸实施。 因为“识时务者为俊杰”,在A已开发的情况 下,B的最优决策是 “不开发”而不是“开 发”。
先动优势与后动优势
在动态博弈中,行动总有先后顺序。有些博弈具 有先动优势(first-mover advantage),但有些博弈具 有后动优势(second-mover advantage). 让产量竞争具有先动优势,而价格竞争可能是后 动优势; 开会发言? 在不完全信息下,顺序更重要。 但有些博弈既没有先动优势,也没有后动优势, 如抓阄。
博弈论3-4经典动态博弈模型

3.4 几个经典动态博弈模型453.4.1 寡占的斯塔克博格模型46动态的寡头产量竞争博弈厂商1先选择,厂商2后选择。
21q q Q +=121111112)](8[)(q q q q q c Q P q u -+-=-=221222222)](8[)(q q q q q c Q P q u -+-=-=策略空间:[0,Q max ]中所有实数。
Q max 为不至于使价格降到亏本的最大限度的产量。
Q Q P P -==8)(价格函数:边际生产成本:无固定成本得益函数:221==c c 2121116q q q q u --=2221226q q q q u --=47两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
1 、第二阶段厂商2的选择目标:得益最大化。
求使自己得益最大化下的产量值,即最大化时的一阶条件:得益函数:2221226q q q q u --=用逆推归纳法进行分析:02602122=--⇒=∂∂q q q u 112213)6(21q q q -=-=求出厂商2对厂商1产量的反应函数:48两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
2 、第一阶段厂商1的选择。
用逆推归纳法进行分析:12213q q -=厂商1可直接求出使自己得益最大化时的产量:厂商1知道2的决策思路:直接将上式代入厂商1的得益函数,得到:2112111121*211*211213)213(66),(q q q q q q q q q q q q u -=---=--=3030*1*111=⇒=-⇒=∂∂q q q u厂商1的最佳产量是生产3单位。
将之代入厂商2的反应函数,得到厂商2的最佳产量5.15.13*2=-=q 此时市场价格为3.5,双方的得益别为4.5和2.25单位。
3*1=q 12213q q -=用逆推归纳法分析得出,该动态博弈的唯一的子博弈完美纳什均衡:厂商1在第一阶段生产3单位产量,厂商2第二阶段生产1.5单位产量。
动态博弈

案例:开金矿博弈 版本3:法律保障不足的开金矿博弈 P1
不借
(1, 0) 起诉 (-1, 0) 不还 P1
借 P2 还
放弃 (0, 4)
(2, 2)
2· B 斯塔克尔贝里双头垄断模型 1· 博弈的时间顺序如下(1) 企业1选择产量q1 , (2) 企 业2观察到q1 以后,然后选择产量q2 ; (3) 企业i 的收 益由下面的利润函数给出:
自己避免小企业,小人物的无端指控. 办法之一就是在被指控之前就支付律师费用. 假定被告在被指控之前支付律师费用y , 那么,赔偿 区域为 s [ rx , rx d y ], 纳什均衡解为
s rx (d y) 2
因为即使 rx d 2 c p 成立, ( d y ) 2 c p rx 也可能不满足, 从而原告将不会提出指控. 这样的 承诺行动使被告节省成本 rx d 2 y . 因此,只要 y rx d 2 , 承诺行动就值得. 这 就是为什么大公司、大人物雇佣律师的原因之一.
动 态 博 弈
简单地讲,动态博弈就是参与者的行动选择必须 是有先后顺序的博弈. 参与者的每一次行动选择叫做一步或一个时期. 直观地讲,动态博弈可以看作若干个静态博弈联 合在一起看作一个博弈. 动态博弈分为 完美信息和非完美信息动态博弈. 第二章 完全信息动态博弈 1 完全信息博弈 参与者的收益函数是共同知识的博弈 2 完全且完美信息动态博弈 博弈进行的每一步当中, 要选择行动的参与者都知道这一步之前博弈进行的
显然即使 rx c p , (即上法庭的期望收益小于诉讼 成本), rx d 2 c p 的条件仍可能成立. 子博弈纳什均衡结果将是: 假定这个条件成立, 原告提出指控要求. 原告的支付为 rx d 2 c p , 被告的支付为 rx d 2 , 案件私了. 该博弈模型的实际背景举例: 因为被告打官司的成本不仅包括应诉的法律费 用而且涉及声誉损失( d ),所以,被告越大(大人物 大企业), d 越大, rx d 2 c p 的条件越可能满足. 这是为什么大人物常常受到无端指控的原因之一. 当然,大企业、大人物也可以通过他们的承诺行动使
经典:博弈论-完全信息动态博弈

2、博弈的扩展式表述的要素
博弈的扩展式表述包含以下要素: (1) 参与人集合:i=1,2,…,n。此外,用N代表虚拟
参与人——自然。 (2) 行动顺序:谁在什么时候行动。 (3) 参与人的行动空间: (4) 参与人的信息集: (5) 参与人的策略集: (6) 参与人的支付函数: (7)外生事件的概率分布。
博弈的收益矩阵
(1)高需求
开发 开发商A 不开发
(2)低需求
开发 开发商A 不开发
开发商B
开发
不开发
2, 2
4, 0
0, 4
0, 0
开发商B
开发
不开发
-1, -1
1, 0
0, 1
0, 0
博弈分类
按开发商博弈的先后顺序分: 静态博弈:两个开发商同时决策,或后决策者不
能观察到先行动者的行动。 动态博弈:博弈有先后顺序,且后决策者能观察
完全信息动态博弈图示:N A B
开发 (2,2)
高需求
○
A
N
低需求
开发 不开发 开发 不开发
不开发 (4,0)
开发 (0,4) B 不开发 (0,0)
开发 (-1,-1) 不开发 (1,0)
开发 (0,1) 不开发 (0,0)
(4)不完全信息动态情形:ANB
开发商A不清楚市场的需求状态,决定是否开发; 开发商B 在观察到市场需求和A的决策后决定是否开发。
到先行动者的行动后再行动。 按开发商是否知道市场需求状态分:
完全信息博弈:若两个开发商都知道市场需求状 态(高需求或低需求)。
不完全信息博弈:由自然决定市场的需求状态, 两开发商不知道。 共同知识:在市场各种可能状态和各开发商不同策 略组合下的得益矩阵是双方的共同知识。