第6章扩展式博弈

合集下载

博弈论-6

7
无限回合讨价还价甲、乙两人仍就如何分享10000美元现金进行谈判，只是谈判规则变为：从甲开始出价，对方均可以接受，也可以不接受；接受则博弈结束，不接受自己给出新分配方案，博弈进入下一回合，该过程可以无限继续。
博弈的奇数回合由甲出价，偶数回合由乙出价博弈的消耗系数δ
Shaked和Sutton（1984）一个无限回合博弈从第一回合开始和从第三回合开始的结果是一样的
8
假设存在一个博弈的解，甲在第一回合出价S，乙接受，双方支付分别为S和10000-S。根据Shaked和Sutton （1984），S也应是从第三回合开始的无限回合博弈的逆向归纳法求出的解，即第三回合也应该是甲出价S，乙接受，博弈结束。在无限回合讨价还价博弈中，甲在第三回合的出价相当于最终出价，从而无限回合博弈也相当于有强制力的三回合讨价还价博弈。所不同的是，这个三回合讨价还价博弈要求第一、三回合出价相同（S不必然为 10000）。根据前面三回合讨价还价博弈的逆向归纳法结论，该博弈的解是甲在第一回合出价（1-δ）10000+δ2S，乙接受，双方支付分别为（1-δ）10000+δ2S和10000δ-δ2S。
18
间接融资与挤兑风险
银行为了给一家企业放贷一笔 20000元的贷款，以20 ％的年利率吸引客户的存款。两个客户各有10000元资金，若他们把资金作为1年期定期存款存入该银行，银行就可以向企业贷款。如果在不满1年的时候，一个客户单独或两个客户同时要求提前取出存款，银行就不得不提前收回贷款。假设提前取款时企业只能收回80％的本钱，并全部偿还给银行。若是一个客户要求提前取款，则银行会偿还其全部本金，余款则属于另一客户；若两客户同时要求提前取款，则平分收回的资金。假设银行不收手续费和提成。

扩展式博弈与标准式博弈

– 曹操：认为小路烟火是诸葛亮“实则虚之” 的战略，故走小路
• 却不知道：诸葛亮知道自己知道“实则虚之”的用兵之道
2-2 扩展式博弈
• 扩展式博弈（extensive form game）： • 描述工具是博弈树
Game tree: ultimatum bargaining game(分配100元钱)
给B90（ 9-1分）给B10（ 1-9分）
10
90
90
10
10
0
90
0
0
90
0
10
0
0
0
0
2-4 联盟博弈
– 吴、蜀之间存在利益冲突，并多次兵戎相见，但两国为什么在赤壁之战中能结为联盟？
• 联盟：相互协调行动的一组博弈参与人 • 联盟价值：一个联盟的产出（收益）
2-4 几种著名的博弈例子
囚徒困境
1，-1
下中上 1，-1
-1，1
1，-1
强齐王中
弱
博弈描述的复杂性
——再谈田忌赛马
强
中
田中
田忌弱
Hale Waihona Puke 忌弱强中强
齐王
弱
田忌弱强
田忌
田忌
中弱
强中
齐王强弱
齐王强
弱
田忌弱
田忌强
弱
田忌
强中
田忌强
中
弱
警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：
（1）若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。（2）若二人都保持沉默（相关术语称互相“合作”），则二人同样判监 1年。（3）若二人都互相检举（相关术语称互相“背叛”），则二人同样判监 8年。

博弈论(第六章)

1
好 1
卖 2 买不买买不买不卖卖
差 1
不卖
（a）
谢富纪 2009年4月 6
1. 不完美信息动态博弈
买
卖
不买
1
不卖
好
1
买
2
差卖
1
不卖
不买
（b ）二手车交易扩展形
谢富纪 2009年4月 7
1. 不完美信息动态博弈
好 1 卖 2 买不买买 1 差不卖（0，0）
1 不卖卖
（0，0）不买
谢富纪
2009年4月
15
2. 完美贝叶斯均衡
所以，子博弈完美纳什均衡是完美贝叶斯均衡在完全且完美信息动态博弈中的特例。要求1实际上是解决完全但不完美信息动态博弈的基本前提，要有一个判断，否则决策就会失去依据。要求2序列理性相当于子博弈完美纳什均衡中的子博弈完美性。而在多节点信息集开始的不构成子博弈的部分中，序列理性通过要求各方遵循最大利益原则而排除博弈方策略中不可信的威胁或承诺。序列理性要求对保证完美贝叶斯均衡的真正稳定性是很重要的。
选R）,对博弈方1选L还是选M的可能性大小毫无
判断，则他将不知道选U和选D哪个更合理，也就是说，对两条路径的判断是决策的必要基础，从而也使均衡策略的基础。
谢富纪
2009年4月
18
2. 完美贝叶斯均衡
条件2的必要性：如果不要求序列理性，则博弈方2有一个可为自己争取到的收益3，即博弈方2威胁在轮到自己选择时唯一地选D，这样策略组合：博弈方1：第一阶段选R；博弈方2：如果轮到自己选择，唯一选D。是一个纳什均衡，也是一个子博弈完美纳什均衡（因为该博弈没有子博弈）。但博弈方2的上述策略在博弈方1不选R时选L的概率较大时，明显包含一个不可信的威胁。因此要求2对于保证不完美信息动态博弈的均衡策略中没有不可信的威胁或者承诺具有关键作用。

上海财经大学《高级微观经济学I》扩展式博弈

0
13
A 扩展式博弈
• 例：约会博弈
d1.1
– H 1={d1.1 ,d1.2} – H 2={d2 .1, d2.2} – 信息集
Reading 2
Concert
d1.2
• I 11={d1.1 }; I 12={ d1.2}
2B
S
• I 2={d2 .1, d2.2}
d2.1
d2.2
B
S
B
S
3
High See
d1.1
raise
d2.1
Pass
Meet
Low
d1.2
raise
-1 See
1
d2.2
Pass
Meet
1
2
-1
-2
1
-2
-1
2
A 扩展式博弈
• 连续行动集：货币政策
– 第一阶段：中央银行宣布政策目标 π0 – 第二阶段：居民/企业形成通货膨胀预期πe – 第三阶段：中央银行决定实际政策 π
0
– a(I1.1)∈ A(I1.1) , a(I1.2)∈ A(I1.2)
– 2的信息集I2 ={d2}
– 策略： s2 =a(I2)
d1.1
C
d2
S
C
d1.2
1
S
C
3
4
3
2
5
18
A 扩展式博弈
• 策略（一般定义）
– 是参与者信息集Ii到行动集A(Ii)的函数
– s1 =a(I1)
d1
• a(I1)∈ A(I1)
• 例：三阶段蜈蚣博弈
1.1
S
C
2
2

研究生-第六章博弈论与信息经济学

逆向选择
3.逆向选择与信贷市场信贷配给是信贷市场上存在的一种典型现象,原因在于逆向选择现象存在,高风险的项目驱赶了低风险的项目. 信贷市场中,一般高风险与高收益成正比,银行不了解贷款者的类型,厂商知道自己的信息.导致贷款利率与银行期望收益之间的变化如图所示,利率上升的(直接的) 收益效应大于(间接的)风险效应,π随r上升而上升; 当r>r*时,利率上升的(间接的)风险效应超过(直接的)收益效应,π随r的上升而下降,银行期望收益最大化的利率为r*.
隐藏行动事前隐藏信息逆向选择模型信号传递模型信息筛选模型隐藏信号的道德风险模型
事后
隐藏行动的道德风险模型
第一节逆向选择
1.逆向选择与旧货市场(Akerlof,the market for lemons) 逆向选择:在鉴定交易契约前,进行市场交易的一方可能因为占据信息优势,做出对自己有利,对另一方有害的事情,从而降低了市场效率,甚至可能导致这一市场的萎缩. 在旧货市场,卖者拥有信息,买者缺乏信息,买者以平均质量的价格购买旧商品,将质量较高的旧商品逐出市场,质量较差的旧商品留在市场,并最终成交. 即为旧货市场的逆向选择行为.
第三节完全信息静态博弈(二) ——混合策略(mixed strategies) ——混合策略(mixed strategies)
1.混合策略定义:σ*=(σ1*,…,σn*)=(σi*,σ-i *)是一纳什混合策略均衡,当且仅当对所有局中人而言, σi* 是σ-i*的最适反应,ui(σi*,σ-i *)≥ ui(σI',σ-i *), σ σ σ ≥ σ σ 对所有σi'∈∑i成立). 持混合策略的前提是在均衡时两种策略的报酬会相等,是预期支付最大化的推导结果. 2.案例分析掷硬币

第六章、合作博弈《经济博弈论基础》PPT课件

与摩根斯特恩提出来的概念，有时被记为VN-M解。记所有可能分配组成的集合为E(V)，则稳定集定义如下：
• 定义4：对于n人合作博弈(N,V)，分配集 W E(V )为稳定集，则W满足:
(1)（内部稳定性）不存在 x, y W ，满足 x y； (2)（外部稳定性）对 y W ,x W，使得 x y 。
(N,V)，有 i[U V ] i[U] i[V ]
4、夏普利值（Shapley value）
• 公理 (S1)反映了帕累托最优性的要求，表示分配收益时，不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法，主要的批评是：它忽略了联盟外局中人使联盟面临最坏处境时，自己也将付出代价（有时代价很高）。
Harsayni认为，特征函数的取值应该由联盟与其对立联盟（联盟外所有局中人形成的联盟）之间的一次谈判而决定。
第二节合作博弈解
一、合作博弈求解思路合作博弈理论求解的目的：得到博弈的“理性”最终分配，主要方法有两种：优超与赋值。
(2) 分配：合作博弈的一个分配是指对n个局中人来说，存
在一个向量 x (x1,, xn ) ，满足：
(1) xi V (N) ；(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益，V(i)表示局中人i不与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性，说明个人分配的收益和正好是各种联盟形式总的最大收益；
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0，没有人的联盟是不会有任何收益的;
V(1)=0，局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
，局中人1将不得不在0与-1之间选择。

7.3扩展式博弈

7.3扩展式博弈扩展式博弈定义7.13扩展式博弈一个扩展式博弈Γ由下列要素组成由下列要素组成：：1、有限的有限的参与人集合参与人集合N ;2、行动集A ,它包括所有可能的行动它包括所有可能的行动，，不必是有限的不必是有限的3、结或者或者历史的集合历史的集合X .（1）初始结X ∈0x ，或空的历史或空的历史。

博弈从初始结开始开始。

（2）对于一些有限多的行动A a i ∈，每个}{\0x x X ∈采取的形式为),...,,(21k a a a x =，这里a 1,a 2…表示第一步表示第一步、、第二步第二步。

的行动的行动。

（3）如果对于一些K>1,K>1, }{\),...,,(021x X a a a k ∈,那么那么，，}{\),...,,(0121x X a a a k ∈−一个结或一段历史只是对在博弈中迄今已被采取的行动的一个完全的描述的行动的一个完全的描述。

}),({)(X a x A a x A ∈∈≡表示在历史}{\0x X x ∈之后轮到参与人行动时的该参与人可选择的行动集后轮到参与人行动时的该参与人可选择的行动集。

4、一个行动集A x A ⊆)(0以及在A(x 0)上的一个概率分布π被用于描述博弈中自然的行被用于描述博弈中自然的行动动。

自然总是首先行动的首先行动的，，并且只行动一次并且只行动一次，，以概率π随机的在A(x 0)中选择一个行动。

因此，}{\),...,,(021x X a a a k ∈意味着对于i=1且只有i=1i=1，，)(0x A a i ∈。

5、终点结集合A a X a x X x E ∈∉∈≡对于一切,),({}，。

每个终点结描述了由开始至结束的博弈的一个特殊的完全演变特殊的完全演变。

6、一个函数N x E X →}){(\:0U ι,表明在属于X 的每一个决策结上那个将轮到的采取行动的每一个决策结上那个将轮到的采取行动的参与参与人。

4.扩展式博弈与反向归纳策略

扩展式博弈的形式
完全信息的情况
①
L
②
R
②
l
2 0
r
2 1
l1Biblioteka 0r 3 1
不完全信息的情况
①
L
R
l
2 0
r
2 1
②
l
1 0
r
3 1
扩展式博弈的规则

在一个偏僻的山里，有一个村庄，村里有100对夫妇。在这个村里已经形成了约定成俗的规定，如果女人发现自己的丈夫对自己不忠的话，就会毫不犹豫的将他杀死，而且当天执行。当然，她必须有确切的证据来证明他丈夫的不忠。由于这个因素，某个女人发现某个男人不忠，她不会告诉那个不忠男人的妻子。但是，她会告诉其他人的妻子，并且女人们会相互的传递这一信息，因此最后，一个男人不忠，除了其妻子不知道外，其他女人都知道。事实上是，村子里的这100对夫妇的男人都不忠，但由于女人不会将她们知道的事实告诉不忠男人的妻子，每个女人不知道自己的男人不忠，因此，该村子一直很稳定，而没有发生妻子杀丈夫的行为。村子里有1个辈分很高的老太太，她德高望重，诚实可敬，对村子里的情况了如指掌。一天，这位老人对这这100个女人说了一句很平常的话： “你们的男人当中至少有一个是不忠的。”于是，村里发生了这样一个事情，前99天，村里风平浪静，但到了第100天，村里发生了一场大屠杀，所有的女人都杀死了她们的丈夫！为什么会这样？
结论

作为博弈方你不应该仅仅是个被动的参与人，满足于接受别人制定的博弈规则，而应该设法改变博弈使其对自己尽量有利

可置信的承诺能够促进长期利润，但承诺方也确实因此而对自己的行动施加了严格的限制。这种通过限制自己行动来获取竞争优势的做法被称为策略性行为

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

扩展式博弈的定义：
扩展式博弈包括以下要素： (1) 参与人集合 Γ ={1, 2,..., n} ； (2) 参与人的行动顺序，即每个参与人在何时行动； (3) 每个参与人行动时面临的决策问题，包括参与人行动时可供他选择的行动方案以及他所了解的信息； (4) 参与人的支付函数，即博弈结束时每个参与人得到的博弈结果。
问题：
• 如何在博弈树中，将“企业2行动时是否观测到企业1的选择”这一信息表示出来？
•
在完全信息动态的“新产品开发博弈” 中，企业2决策时，企业1已经做出选择。此时，企业2面临的决策情形就有以下两种： (1) 企业2知道企业1的选择； (2) 企业2不知道企业1的选择。
• 对于第一种情形，企业2知道企业1的选择，即知道企业1选择了“开发”还是 “不开发”，因此，企业2知道博弈是从 x1到了x2还是从x1到了x3。这就意味着当轮到企业2决策时，他知道自己是在点x2 上还是在点x3上；
不开发
x4
-4 0 0 ,-4 0 0
x5
2 0 0 ,0
x6
0 ,2 0 0
0 ,0
x7
• 由于在博弈分析中，假设博弈的结构(或描述方式)为共同知识，因此，在以后的讨论中，如果给出博弈树，就意味着所有的参与人都同时一起看到了博弈树。
• 除了前面一再提到的博弈结构和参与人完全理性为共同知识外，对于多阶段的动态博弈问题，一般还假设参与人满足 “完美记忆”(perfect recall)要求，即假设参与人不会忘记以前知道或者做过的事情。
参与人1第二次行动时忘了他第一次行动时的选择。
L
2 1
x1
R
2
L′
x4
x2
1
R′
1
L′
x6
x3
1
R′
x7
L′′
R′′
L′′
x5
R′′
L′′
R′′
L′′
R′′
第六章扩展式博弈
主要内容：一、扩展式博弈二、扩展式博弈的战略及其Nash均衡三、两种博弈描述形式的比较
二、扩展式博弈的战略及其Nash均衡
Ai ( H i ) =
I i ∈H i
∪ Ai ( I i )
• 参与人i的一个纯战略si就是从信息集集合Hi到行动集合Ai(Hi)的一个映射关系，即
si : H i
→
Ai ( H i )
• 其中，对 ∀I i ∈ H i , si ( I i ) ∈ Ai ( I i )
• 根据上述定义，参与人i的一个纯战略可以解释为参与人i在各个信息集上的行动组合。 • 因此，在以后的讨论中，可以用参与人i 在每个信息集上的行动集Ai(Ii)的笛卡尔积来表示参与人i的战略集Si，即
• 为了将“企业2行动时是否知道自己是在博弈树中的点x2上还是在点x3上”这一点说清楚，需要引入“信息集”(infor mation set)的概念。
•
在博弈树中，参与人i的一个信息集(用Ii表示) 是参与人i决策结的一个集合，它满足以下两个条件： (1) Ii中的每个决策结都是参与人i的决策结； (2) 当博弈到达信息集Ii(即博弈到达Ii中某个决策结)时，参与人i知道自己是在信息集Ii中的决策结上，但不知道自己究竟在Ii中哪个决策结上。
下图表示参与人3选择时，知道参与人1的选择，但不知道参与人2的选择的博弈情形。
1
x4
x2
3
R′
x5 x6
L′
x3
3
R′
x7
L′′
R′′
L′′
R′′ L′′
R′′
L′′
R′′
下图表示参与人3选择时，知道参与人2的选择，但不知道参与人1的选择的博弈情形。
1
L
2
x1
R
2
L′
x4
x2
• 一个扩展式博弈实际上已定义了博弈的参与人及参与人的支付，因此，如果能定义一个扩展式博弈的战略，那么就意味着给出了一个扩展式博弈的战略式描述，同时也就意味着可以用Nash均衡来描述博弈的解。
• 所谓参与人的战略就是参与人在博弈中的行动规则，它规定了参与人在博弈中每一种轮到自己行动的情形下，应该采取的行动。
(4) 两个企业的支付如下：
对手不开发，获利润800万元需求大对手开发，获利润300万元开发(a )：投入2千万元资金对手不开发，获利润200万元企业需求小对手开发，赔400万元不开发(b )：不投入资金,利润为0
• 在上述例子中，我们用文字描述的方法给出了博弈问题的扩展式描述。对于一些简单的博弈问题，这种文字表述的方法也许是简单可行的。但可以想象，如果我们遇到的是更为复杂的博弈问题，文字描述所给出的模型就会显得繁冗拖沓，极不直观。
• 因此，我们需要寻找一种简便易行的扩展式博弈的描述方式。下面我们就以 “新产品开发博弈”为例，介绍一种不仅简单方便，而且十分直观的扩展式博弈的描述方式——博弈树。
1
L
2
x1
R
2
L′
3
x2
R′
3 3
L′
x6
x3
R′
3
L′′
x4
R′′
L′′
x5
R′′ L′′
R′′
L′′
x7
R′′
在以后的讨论中，我们假设博弈树中的博弈都是从上往下进行的，因此，在不引起歧义的情况下，我们都不标示出博弈树中枝的方向。
例子：
• 考察“新产品开发博弈”。试用博弈树描述“两个企业都知道市场需求，且企业1先决策，企业2观测到企业1的选择后再进行选择”的博弈情形。
Si =
I i ∈H i
∏ A (I )
i i
例如：
1 A x B 1 2 x x4 2 C D 2 ,1 1 x 3 x5 E F 1 ,1 x7 x6
1 ,2
3 ,0
• 参与人2的信息集为I2 ({x2})，参与人2在I2 ({x2}) 上的行动集为{C,D}。所以，参与人2的战略集为{C,D} ； • 参与人1的信息集为I1 ({x1})和I1 ({x3}) ，其中参与人1在I1 ({x1})上的行动集为{A,B}，在I1 ({x3}) 上的行动集为{E,F}。所以，参与人1的战略集为 {A,B}×{E,F} ，即{A,E}、{A,F}、{B,E}和{B,F}。
第六章扩展式博弈
主要内容：一、扩展式博弈二、扩展式博弈的战略及其Nash均衡三、两种博弈描述形式的比较
一、扩展式博弈
• 所谓扩展式博弈(extensive form game)是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。
• 考虑如下问题：给定一个博弈问题的扩展式，该如何来求解博弈问题的解？ • 已知对于战略式博弈，可以用Nash均衡来描述博弈问题的解，对于博弈树所描述的扩展式博弈，是否同样可以用Nash 均衡来描述博弈问题的解？
• 对于一个博弈问题，要给出其战略式描述，就必须定义清楚该博弈问题的三个要素：参与人、参与人的战略以及参与人在相应战略组合下的支付。
研究博弈问题的具体进程必须弄清楚的两个问题
(1) 每个参与人在什么时候行动(决策)； (2) 每个参与人行动时，他所面临决策问题的结构。这包括参与人行动时可供他选择的行动方案，以及参与人行动时所了解的信息。
• 上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。 • 对于一个博弈问题，如果能够说清楚博弈过程中参与人的决策问题的序列结构，那么就意味着知道了博弈问题的具体进程。
当市场需求大时，“新产品开发博弈”的博弈树
企业1 开发企业2 开发
x1
不开发
x2
不开发开发
x3 企业2
不开发
x4
3 0 0 ,3 0 0
x5
8 0 0 ,0
x6
0 ,8 0 0
x7
0 ,0
当市场需求小时，“新产品开发博弈”的博弈树
企业1 开发企业2 开发
x1
不开发
x2
不开发开发
x3 企业2
• 但在现实生活中，不满足“完美记忆” 要求的情形比比皆是。例如，人们在玩扑克时，往往会忘记自己曾经出过什么牌或者对手曾经出过什么牌；在棋类比赛中，也会出现这种情况。
• 但是，在博弈分析中，如果没有“完美记忆”假设，各种博弈结果都有可能出现，那么我们也就无法对博弈进行预测。
不满足“完美记忆”要求的博弈情形
• 设X为一决策结集合，用Ii(X)表示参与人的由决策结集X构成的一个信息集。 • 例如，I2({x2, x3})表示企业2的由决策结集 {x2, x3}构成的信息集，I2({x2})和I2({x3}) 分别表示企业2的由决策结集{x2}和{x3}构成的信息集。 • 可以在博弈树中将同一信息集中的决策结用虚线连接起来。
• 所谓博弈树就是由结和有向枝构成的 “有向树”。
企业1的选择最上端的一个点(用空心圆有“开发”和表示)，表示博弈的开始。 “不开发”，表示博弈达到分别用标有该点时企业的 “开发”和所得，其中， “不开发”的支付向量中的有向枝表示。第一个数字表示企业1的所得，第二个数字表示企业2的所得。
• 如果要用扩展式博弈对一个博弈问题进行建模，那么除了要说明博弈问题所涉及到的参与人及每位参与人的支付函数以外，还必须对博弈过程中参与人所遇到的决策问题的序列结构，进行详细的解释，说清楚每个参与人在何时行动，以及参与人行动时可供选择的行动方案和所了解到的信息。