Lecture 3 完全信息动态博弈

经济博弈论3——完全且完美信息动态博弈

第三章完全且完美信息动态博弈
本章讨论动态博弈(Dynamic Games)，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈的概念和分析方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。

逆推归纳法事实上就是把多阶段动态博弈化为一系列的单人博弈，通过对一系列单人博弈的分析，确定各博弈方在各自选择阶段的选择，最终对动态博弈结果，包括博弈的路径和各博弈方的得益作出判断，归纳各个博弈方各阶段的选择则可得到各个博弈方在整个动态博弈中的策略。由于逆推归纳法确定的各个博弈方在各阶段的选择，都是建立在后续阶段各个博弈方理性选择基础上的，因此自然排除了包含不可信的威胁或承诺的可能性，因此它得出的结论是比较可靠的，确定的各个博弈方的策略组合是有稳定性的。

最上方的圆圈表示乙的选择信息集或称选择节点（node）。如果乙选择“不借”则博弈结束，他能保住1万元本钱而甲得不到开矿的利润；如乙选择“借”则到达甲的选择信息集，轮到甲进行选择。三个终端黑点处的数组，表示由各博弈方各阶段行为依次构成的，到达这些终端的“路径”所实现的各博弈方得益。乙决策的关键是要判断甲的许诺是否可信。

结论：在一个由都有私心、都更重视自身利益的成员组成的社会中，完善公正的法律制度不但能保障社会的公平，而且还能提高社会经济活动的效率，是实现最有效率的社会分工合作的重要保障。

但是要充分保障社会公平和经济活动的效率，法律制度必须要满足两方面的要求：一是对人们正当权益的保护力度足够大；二是对侵害他人利益者有足够的威慑作用。否则，法律制度的作用就是很有限的甚至完全无效。

第三讲完全且完美信息动态博弈a讲义

第三完全且完美信息动态博弈
本章讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。
企业、政府与商业环境
博弈论与企业竞争
两个纳什均衡
纳什均衡之一是如果A进入市场，B就威胁选择商战，所以A不进入市场另一个纳什均衡是A选择进入，B随之选择容纳
容纳（900，1100）
进入
A
B
商战（-200，600）
不进入
(0, 3000)
企业、政府与商业环境
博弈论与企业竞争
一个子博弈纳什精炼均衡
可信性：动态博弈中先行为的博弈方是否应该相信后行为博弈方会采取某种策略或行为。
后行为博弈方将来采取对先行为博弈方有利的行为为 “许诺”，采取对先行方不利的行为为“威胁”。
8
2020/7/31
多阶段博弈
序列博弈
参与者选择策略有时间先后的顺序，通常采用博弈的扩展形式来进行分析
例子：进入博弈
形成额外的剩余生产能力可以阻止进入，潜在进入者知道他一旦进入，价格战就必然发生，因而构成可置信的威胁
形成剩余生产能力的行动在序列博弈中常带有先发制人的意图，因此这种行动被称为事先承诺博弈
企业、政府与商业环境
博弈论与企业竞争
3.1.1开金矿
条件：甲去开采一价值4万元的金矿，缺1万元，乙恰好有1万元可以投资。甲向乙借1万元可以可开金矿，并“许诺”成功后与对半分成。

北大课件博弈论与公共政策之完全信息动态博弈

第1讲之例1：囚徒困境
囚徒1
抵赖招认
囚徒2
抵赖
招认
-1，-1
-9，0
0，-9
-6，-6
? （2）用标准式表述例6中的博弈
三、动态博弈的均衡
? 1、利用标准式表述求纳什均衡
? 2、在博弈树上找纳什均衡
四、子博弈精炼纳什均衡
? 1、可置信的威胁与不可置信的威胁
? 一种威胁所规定的行动在事前看来是最优的，但事后看并不是参与者的最优选择，这种威胁就是不可置信的，含有这种威胁的策略就不是一个合理的策略。
? 甲、乙双方在签订一项合同后，乙方违约。乙方提出和解，愿意赔偿7万元。甲方如果上法庭，可望获得10万元赔偿，但要付出2 万元的诉讼费用。
? 甲方应当接受和解还是上法庭？
决策树
逆向归纳法
? 从右往左逐步分析。在这个过程中： ? ① 对于机会结，计算期望收益，并将相应
的值写在该结下面。 ? ② 对于决策结，还是做两件事： ? 第一，在较劣的决策枝上划叉； ? 第二，将对应于最优决策枝的收益写在该
? 结果2：仅得到2万元的修车费赔偿，概率为30%；
? 结果3：得不到任何赔偿，概率为20%。 ? 甲方应当接受和解还是上法庭？
例4：购买土地
? 某人打算购买土地，现有A、B两块地可以选择。A、B两块地的售价分别为30万元和 25万元。这两块地看起来差不多，所以买方起初打算购买价格更便宜的B。但是，买方进一步了解得知，B可能存在环境问题，因为该地过去被堆放过大量垃圾，而A不存在类似问题。如果B被危险垃圾污染，依照法律规定，买方必须进行无害化处理，成本为20万元。买方估计，B被危险垃圾污染的概率为50%。
? ① 始于博弈树中一个单结信息集的决策结，但不包括博弈的第一个决策结；

第三讲完全且完美信息动态博弈

先来后到的启示后进者信息多，但利润不如先进入者。
15
3.2.2 一个承诺可信性问题
开金矿
甲去开采一价值4万元的金矿，缺1万元，乙恰好有1万元可以投资。甲向乙借1万元开金矿，并“许诺”成功后与其对半分成
乙是否该借钱给甲呢？如果乙借钱给甲，甲是否该分钱给乙呢？
16
3.2.2 一个承诺可信性问题
分（2，2）
乙
借
不借
（1，0）
甲不分
（0，4）
甲的承诺是否可信？
17
3.2.2 一个承诺可信性问题
根据自身利益最大化原则，甲的选择是不分，
乙
借
不借
甲
（1，0）
分
不分
而乙清楚甲的行为准
（2，2）
（0，4）
则，则选择不借。对乙来讲，本博弈中甲有一个不可信的
承诺。
怎样使甲的承诺变为可信，既让乙能保住本钱，又能有更多的收益呢？关键在于增加一些对甲行为的约束。
法律保障的开金矿博弈——分钱打官司都可信
19
3.2.2 一个承诺可信性问题
乙
借
不借
甲
分（2，2）
打
（1，0）不分
乙不打
（1，0）
（0，4）
乙的策略：第一阶段借，如甲在第二阶段选择不分，则第三阶段选择打；甲的策略：若乙第一阶段借，则他在第二阶段就选择分。
在双方这样的策略组合下，本博弈的路径是（借，分），双方得益为（2， 2），实现有效率的理想结果。
● (1000,5000)
● (-1000,3000)
经发生了，容忍并保持高价是符合自己利益的。
容忍得5000万元，阻挠
得3000万元。

博弈论与信息经济学--完全信息动态博弈 ppt课件

©&® by H. Q. Feng, CUFE
5/58
一、动态博弈的表述——扩展式
（2）博弈的扩展式表述包括以下要素：参与人集合：i=1，…，n，此外，N代表虚拟参与人“自然” 参与人的行动顺序：谁在什么时候行动；参与人的行动空间：在每次行动时，参与人有些什么选择；参与人的信息集：每次行动时，参与人知道什么；参与人的支付函数：在行动结束之后，每个参与人得到些什么（支付是所有行动的函数）；外生条件（即自然的选择）的概率分布。假定房地产开发博弈的行动顺序如下：开发商A首先行动，选择开发或不开发；在A决策后，自然选择市场需求的大小；开发商B在观测到A的决策和市场需求后，决定开发或不开发。
该博弈的扩展式表述为：
©&® by H. Q. Feng, CUFE
15/58
一、动态博弈的表述——扩展式
进入者
进入
不进入
在位者
斗争默许
（0，300）
（-10，0）
（40，50）
©&® by H. Q. Feng, CUFE
16/58
二、子博弈精炼纳什均衡
纳什均衡有几个问题：
第一，一个博弈不止一个均衡，事实上，有些博弈可能有无数个纳什均衡，究竟哪一个更合理？纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的，但是如果参与人的行动有先有后，后行动者的选择空间依赖于前行动者的选择，先行动者在选择时不可能不考虑自己的行动对后行动者的影响。
©&® by H. Q. Feng, CUFE 20/58
二、子博弈精炼纳什均衡
“子博弈”的概念：从每一个行动选择开始至博弈结束又构成一个博弈，称为“子博弈”。如在进入者选择进入之后，在位者选择行动开始就是一个子博弈。子博弈需满足的条件：

第三章完全且完美信息动态博弈

c
,i
1,2
3.6 动态博弈分析的问题和扩展讨论
3.6.1 逆推归纳法的问题
逆推归纳法只能分析明确设定的博弈问题，要求博弈的结构，包括次序、规则和得益情况等都非常清楚，并且各个博弈方了解博弈结构，相互知道对方了解博弈结构。这些可能有脱实际的可能
逆推归纳法也不能分析比较复杂的动态博弈在遇到两条路径利益相同的情况时逆推归纳法也会发生选
激励相容约束：
w[R((e*)] C(e*) w[R(e)] C(e)
U
e*
e
委托人希望的代理人努力水平（满足参与约束）
3.5 有同时选择的动态博弈模型
3.5.1 标准模型
博弈中有四个博弈方，分别称为博弈方1、博弈方2、博弈方3和博弈方4
第一阶段是博弈方1和博弈方2的选择阶段，他们同时在各自的可
(0.9)
>0.1*[w(20)-S]+0.9*[w(10-S)]
[10-w(S), w(S)-S]
[20-w(E), w(E)-E] [20-w(S), w(S)-S]
激励相容约束
选择报酬和连续努力水平的委托人—代理人博弈
参与约束：
C(e) + U
w[R(e)] C(e) U
R, C
R(e)
u2 q2P(Q) c2q2 q2[8 (q1 q2)] 2q2 6q2 q1q2 q22
厂商1 厂商2
产量 3单位 1.5单位
得益 4.5 2.25
3.4.2 劳资博弈
先由工会决定工资率，厂商再决定雇用多少劳动力
max (W, L) max[R(L) WL]
L0
L0
R
斜率为W
R(L)

(精选)博弈论以及应用之3完全且完美信息动态博弈[1].pptx

局中人的博弈顺序每个局中人在各个阶段的行为选择

动态博弈dynamic game

完美信息perfect information

2019/3/31
3
3.3 动态博弈中的行为与战略I

事例1：中美战略博弈

解放初，美国总是寻找各种机会来侵犯我国。对此，毛主席提出了“人不犯我、我不犯人，人若犯我、我必犯人” 的战略方针。局中人

企业B

2019/3/31
8
3.3 动态博弈中的行为与战略VI

模型描述

收益矩阵
(开发，开发) (开发，不开发) (不开发，开发) (不开发，不开发)
开发不开发
-3，-3 0 ，1
-3，-3 0，0
1，0 0，1
1，0 0，0

纳什均衡

企业A开发B不开发

(开发，(不开发，开发)) (开发，(不开发，不开发)) (不开发，(开发，开发))

均衡结果

美不犯我，我不犯人——我方具有后动优势
13
2019/3/31
3.5 逆向归纳法II

逆向推理reasoning backward

新产品开发博弈
开发
开发 A企业不开发 B企业不开发

(-3,-3)
B企业不开发开发 (1,0) (0,1)
均衡结果

(0,0)
企业A开发，B不开发——企业A具有先动优势

收益矩阵
-2，-3 2，-5 -2，-3 0，0 1，-4 2，-5 1，-4 0，0
犯我不犯我

完全信息动态博弈模型

完全信息动态博弈模型完全信息动态博弈模型是博弈论中的一种重要模型，它描述了参与者具有完全信息（即对所有相关信息都有准确了解）的情况下进行的博弈过程。

在该模型中，参与者能够观察其他人的行为和选择，并根据这些观察作出自己的决策。

在完全信息动态博弈模型中，博弈过程分为多个阶段。

每个参与者在每个阶段都必须做出自己的决策，而后续的决策将依赖于先前的决策。

参与者可以根据观察到的其他人的行为和选择来调整自己的策略。

这种博弈模型特别适用于描述多个参与者之间具有时间序列关系的情况，如竞价拍卖、价格战等。

完全信息动态博弈模型可以用博弈树来表示。

博弈树由一系列节点和边组成，每个节点表示参与者的决策点，边表示参与者的决策选择。

根节点表示博弈的初始状态，而叶节点表示博弈的终止状态。

在每个节点上，参与者根据其他人的选择和观察到的信息来做出决策。

通过沿着博弈树的边一步一步向下移动，参与者可以在每个阶段根据观察到的信息进行反应和调整。

完全信息动态博弈模型需要考虑的核心概念是策略和均衡。

策略是参与者通过决策选择在每个节点上的行为规则，决定了参与者在每个阶段应该如何行动。

而均衡是一种状态，其中所有的参与者都无法通过单方行动来改善自己的收益。

在完全信息动态博弈模型中，通常存在多个均衡解，其中每个参与者都选择出使自己获得最大收益的策略。

通过建立完全信息动态博弈模型，我们可以分析不同参与者的决策行为和相应结果的演化过程。

通过求解均衡解，我们可以预测在不同情况下各参与者的最佳策略选择，从而为参与者提供决策依据。

此外，完全信息动态博弈模型也可以用于研究不同决策因素对博弈结果的影响，并为参与者提供制定最优策略的指导。

总之，完全信息动态博弈模型是博弈论中重要的一个模型，它描述了参与者具有完全信息的情况下进行的博弈过程。

通过建立博弈树、分析策略和求解均衡解，我们可以预测参与者的决策行为和相应结果的演化，并提供决策指导。

这种模型对于研究多个参与者之间具有时间序列关系的博弈情况非常有用，为决策者提供了重要的参考和指导。

第3章完全信息动态博弈

不开发
开发 B企业不开发
(1,0) (0,1)
(0,0)
2016/1/18
12
3.4 逆向归纳法II

逆向推理reasoning backward

新产品开发博弈
开发
开发 A企业不开发 B企业不开发

(-3,-3)
B企业不开发开发 (1,0) (0,1)
均衡结果

(0,0)
企业A开发，B不开发——企业A具有先动优势
动态博弈的矩阵描述存在的问题?战略空间复杂?后行动者的战略空间随局中人的数量和每一阶段局中人的行动选择数量而急剧增大?对多人多行动的动态博弈难以用矩阵描述需借助博弈树来表示纳什均衡有待精炼201612314?纳什均衡有待精炼?可能多个均衡描述的是同一个结果?可能存在不合理的均衡35逆向归纳法?逆向推理reasoningbackward?求以下动态博弈的均衡结果右下上前后左甲乙甲3020161231520110236序贯理性与理性操纵i?序贯理性sequentialrationality?每一个行动点上都选择最优行为?逆向归纳法遵循了序贯理性原则?理性操纵controlledrationality?利用对方的理性缺点引诱对方上钩获取更多的利益
老师，这次点名就不要记我了，以后我绝不会旷课了。。。老师，这回考试就让我过吧，以后我一定会好好学习的。。。

生活中的空头承诺

山盟海誓
你问我爱你有多深？——月亮代表我的心爱你一万年！——爱你经得起考验

包过包会：四六级包过、驾照包过、考研包过、公务员包过。。。
承诺：信誓旦旦、不过退款，但始终不签合同、画押为证实则：广泛押题、推卸责任，更有甚者人去楼空、改头换面

exfd经济博弈论3—完全且完美信息动态博弈

有什么办法能使甲的许诺变成可信的，从而使乙愿意选择“借”，然后甲遵守诺言选择 “分”，最终增加双方的利益呢？
2021/2/4
1
18
二、有法律保障的开金矿博弈II的扩展形
确实可信的威胁——通过法律武器乙
确实可信的威胁
投资
不投资
（credible threat）
甲
（1，0）
是指，博弈的参与人通过分
问题：乙是否该将钱投资给甲呢？
2021/2/4
1
17
一般假设博弈方都是以自身利益（得益）最大化为目标的，即他们不考虑道德因素。在这样的原则下，甲轮到行为时的选择必然是“不分”。乙当然清楚甲的行为准则，因此他最终合理的选择是“不借”。对乙来说，本博弈中甲有一个不可信的许诺。
有不可信的许诺，使得甲、乙的合作最终成为不可能，这样开金矿的3万元社会净利益无法实现。
2021/2/4
1
8
3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
2021/2/4
1
9
3.2.1 相机选择和策略中的可信性问题
动态博弈仍然是具有策略和利益相互依存性的决策问题。
静态博弈分析中针对具有策略和利益相互依存特性决策问题的核心分析方法——纳什均衡分析，在动态博弈分析中适用吗？
乙非常清楚在第一阶段选择不借才是保险的。
2021/2/4
1
借
乙不借
甲分（2，2）
打
（1，0）不分
乙不打
（-1，0）（0，4）
法律保障不足的开金矿博弈 ——分钱打官司都不可信
25
三、法律保障不足的开金矿博弈 III的扩展形