完全且完美信息动态博弈a

两阶段博弈

Player C
A
Player R
B -100,4
A
5，5
B
0，1
0，0
大部分同学相信你……….
• 面对一个不确定的列，在
2007年３月16日的博弈中，有 141人选择A，有44人选择B
A A
B
B -100,4
0，0
5，5
0，1
• 比例
– A: 76.22％ B: 23.78%
• 列参与人无论如何都会向您申明他将选Ａ！ • 但他是否选Ａ取决于你是否相信他，以及他是否希望、预期能再玩一次
ei 0
=(wH wL ) Pr ob{ yi (ei ) y j (e j* )} wL g (ei )
其中 yi (ei ) ei i
(2.2.4)
工作竞赛: 后向归纳法
(2.2.4)的一阶条件为：
(wH wL ) Pr ob{ yi (ei ) y j (e j* )} ei g ' (ei ) (2.2.5)
工作竞赛: 后向归纳法
wH wL 由于是g (e) 凸函数，优胜获得的奖励越高（即的值越大），就会激发更大的努力，这和我们的直觉是一致的。另一方面，在同样的奖励水平下，对产出的随机扰动因素越大，越不值得努力工作，因为这时工作竞赛的最终结果在很大程度上是由运气而非努力程度决定的。例如，当服从方差为 2 的正态分布时，则有
工作竞赛: 两阶段博弈
现在我们套用2.2.A节博弈类型的讨论思路来分析这一应用。 • 老板为参与人1，他的行动a1是选择工作竞赛中的工资水平 wH 和 wL ，这里不存在参与人2。两个工人是参与人3和4，他们观测第一阶段选定的工资水平，然后同时选择行动a3和a4，具体地说就是选定的努力程度 e1 和 e2 。（后面我们将考虑另一种可能性，就是老板选定的工资水平，工人们不愿意参与工作竞赛，却寻找另外的工作机会）最后，参与人各自的收益如前面所给出。由于产出（并由此而使工资）不只是参与人行动的函数，而且同时还受随机扰动因素 1 和 2 的影响，我们用参与人的期望收益进行分析。

第三讲非合作博弈的解：（4）

例子：斯坦伯尔伯模型。两个厂商垄断某个市场，其中厂商 1处于支配地位，它先行动，然后从属企业2后行动。假定市场需求函数为p=a-Q。厂商的单位产品的成本c。这些是企业1和2的公共知识。问：厂商1和2是如解。
假定厂商1和2所决定的产量分别为q1,q2。企业2后行动，对于企业1的任何行动，即任意给定的产量，
• 例子：假定甲在开采一个价值4万元的金矿时需要1万元资金，乙有1万元资金。甲向乙借钱来开金矿。在这个博弈的第一阶段，甲向乙承诺: 如果乙借钱给他的话，那么他就会将采到的金子与乙对半分成，即(2，3)—— 乙得到2万元的金子，同时收回自己的1万元投资。对于甲的承诺，乙如果不借钱给甲的话，那么博弈到此为止，双方收益为(0，1)。如果乙借钱给甲的话，那么博弈进入第二个阶段。在第二阶段中，若甲遵守他的承诺，分给乙一半的金子，这样两人的收益为(2，3)，其中1万元为投资成本。然而，若甲违背自己的承诺，博弈就会进入到第三个阶段: 如果乙同甲打官司，那么由于打官司费时费力，两个人的收益为(0，1)；若乙不打官司，那么两个人的收益就为(5，0)。
安娜
2 1
鲍伯
1 4
安娜
4 3 蜈蚣博弈
鲍伯 2n+1
3 6
安娜鲍伯
2n+2
2n 2n-1
2 n-1 2 n+2
• 这个博弈有两个参与人安娜和鲍伯。该博弈从安娜开始，她有两个策略“合作”和“不合作”，若她选择“不合作”，博弈即刻终止，安娜得到2，鲍伯得到1；若她选择“合作”，那么博弈继续进行，由鲍伯开始选择。鲍伯同样有“合作”和“不合作”两种策略。在这第二轮选择中，若鲍伯选择“不合作”，博弈终止，选择“合作”，博弈继续进行……在这个博弈最后一轮，即第2n 轮，若鲍伯选择“不合作”，他所得2n+1，安娜得2n-1；若他选择“合作”，鲍伯得2n+1安娜得2n+2。

博弈论判断题

博弈论判断题第一章导论(1)单人博弈就是个人最优化决策，与典型的博弈问题有本质区别。

(2)博弈方的策略空问必须是数量空间，博弈的结果必须是数量或者能够数量化。

(3)囚徒的困境博弈中两个因徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。

(4)因为零和博弈中博奔方之间的关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。

(5)凡是博弈方的选择、行为有先后次序的一定是动态博弈。

(6)多人博弈中的“破坏者”会对所有博弈方的利益产生不利影响。

(7）合作博弈就是博弈方采取相互合作态度的博弈。

参考答案：(1)正确。

因为单人博弈只有一个博弈方，因此不可能存在博弈方之间行为和利益的交互作用和制约．因此实际上就是个人最优化决策，与存在博弈方之间行为和利益交互作用和制约的典型博弈问题有本质的区别。

(2)前半句错误，后半句正确。

博弈方的策略空间不一定是数量空间，因为博弈方的策略除了可以是数量水平(如产量、价格等)以外，也可以是各种定性的行为取舍和方向选择，甚至也可能是各种函数或者其他更复杂的内容。

但一个博弈的结果必须是数量或者可以数量化，因为博弈分析只能以数量关系的比较为基础。

(3)错误。

结论恰恰相反，也就是囚徒的困境博弈中两囚徒之所以处于困境，根源正是因为两囚徒很在乎坐牢的绝对时间长短。

此外，我们一开始就假设两囚徒都是理性经济人，而理性经济人都是以自身的(绝对)利益，而不是相对利益为决策目标的。

(4)错误。

虽然零和博弈中博弈方的利益确实是对立的．但非合作博弈的含义并不是博弈力之间的关系是竞争性的、对立的，而是指博弈方是以个体理性、个体利益最大化为行为的逻辑和依据，是指博弈中不能包含有约束力的协议。

(5)错误。

其实并不是所有选择、行为有先后次序的博弈问题都是动态博弈。

例如两个厂商先后确定自己的产量，但只要后确定产量的厂商在定产之前不知道另一厂商定的产量是多少，就是静态博弈问题而非动态博弈问题。

博弈论第三章完全信息动态博弈讲解

房地产开发博弈
开发
A hA(1) 不开发
h表示信息集
N hN(1)
需求大
需求小
N hN(2)
需求大
需求小
B hB(1)
开发
不开发
B hB(2)
B hB(3)
开发
不开发开发不开发开发
B hB(4)
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1) 单位:百万元
定义一个展开式博弈的子博弈G 由一个决策结x 和所有该决策结的后继结T(x)( 包括终点结0 组成, 它满足下列条件:⑴x 是一个单点信息结即h(x)={x};⑵对于所有的 x′∈T(x),如果x″∈h(x′),则x″∈T(x)。
(3)
N
1/3
2/3
1
Y1
z1
1
x1
w1
(2,6) (5,6)
2
2
a2 (9,0)
b2 (0,3)
a2 (9,5)
b2 (0,3)
3.3 子博弈与子博弈完美
Nash 均衡在原则上适用所有的博弈,但对于预测参与人的行为来说,Nash均衡可能并不是一个合理的预测, 如房地产博弈:
A
开发
不开发
A
开发
不开发
B
B
B
B
开发不开发开发不开发开发不开发开发
不开发
有了信息集的概念, 展开式表示也可以用来表示静态博弈, 如“囚徒的困境 ”博弈可以表示为:
1
坦白
2

第二节完全信息动态博弈(1)

一博弈扩展式表述

只包含一个决策结的信息集称为单结信息集，如果博弈树的所有信息都是单结的，该博弈称为完美信息博弈。
完美信息博弈意味着博弈中没有任何两个参与人同时行动，且后行动者知道所有前序行动（任何两个决策结都无虚线相连）。

自然总是假定是单结的，因为自然在参与人决策之后行动等价于自然在参与人之前行动但参与人不能观测到自然的行动。
第二节完全信息动态搏弈 -子博弈精炼纳什均衡

一博弈扩展式表述二子博弈精练纳什均衡三应用举例
一博弈扩展式表述
战略式主要用于描述和分析静态博弈，给出的是参与人有什么战略可供选择，用博弈支付矩阵表示；扩展式主要用于描述和分析动态博弈，给出的是参与人的相机行动规则（依据条件选择行动），用博弈树表示。
如果市场上只有一栋楼需求大时可卖18亿需求小时可卖11亿博弈战略表述40004000800000800000不开发开发商a开发不开发开发30003000100000100000不开发开发商b开发商a开发不开发开发开发商b需求小的情况需求大的情况博弈的战略式表述一博弈扩展式表述由战略组合决定的每个参与人的支付进入者进入不进入0300在位者市场进入阻挠博弈树不可置信威胁合作4050斗争100开发不开发12121212开发不开发开发不开发开发不开发开发不开发4480331008000100参与人abn战略支付参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布房地产开发博弈结决策结结终点结结初始结信息集一博弈扩展式表述博弈树的基本构造包括决策结和终点结两类
N
大
小
A
开发不开发
1/2 1/2
A
开发

第三讲完全信息动态博弈

第三章完全信息动态博弈第一节完全信息动态博弈的扩展式表述动态博弈的根本特征是，参与人的行动有先后顺序，且后行动的参与人在自己行动之前能观测到先行动的参与人的行动，特别是能根据先行动的参与人的行动调整或做出自己的战略选择。

运用战略式表述动态博弈的缺陷表现在：1．看不出行动的先后顺序；2．对于描述2人以上的博弈较不方便。

因此，扩展式表述extensive form representation被用于描述动态博弈。

一、扩展式表述的要素1．参与人集合：i=1,……,n。

此外，用N代表虚拟参与人“自然”。

2．参与人的行动顺序the order of moves：谁在什么时候行动。

3．参与人的行动空间action set：在每次行动时，参与人有些什么选择。

4．参与人的信息集information set：每次行动时，参与人知道些什么。

5．参与人的支付函数：在行动结束之后，每个参与人得到些什么（支付是所有行动的函数）。

6．外生事件（即自然的选择）的概率分布。

如同两人有限博弈的战略表述可以用支付矩阵表示一样，n人有限博弈的扩展式表述可以用博弈树game tree表示。

二、博弈树的基本建筑材料building blocks（4，4）（8，）（-3，-3）1，），8），），1），）图3-1（一）结nodes1．结的分类（1）决策结decision nodes：参与人采取行动的时点。

包括：起点结——initial nodes非起点结——（2）终点结terminal nodes：博弈行动路径的终点。

2．结的顺序关系precedence relation用X表示所有结的集合，x∈X表示某个特定的结。

x≺x"表示“x在x"之前”≺3．前列集the set of predecessors和后续集the set of successors定义P(x)为在x之前的所有结的集合，简称为x的前列集；定义T(x)为x之后的所有结的集合，简称为x的后续集。

经济博弈论_谢识予_2_完全信息动态博弈0.1

单结信息集:只包含一个决策结的信息集完美（Perfect）信息：博弈树的所有信息都是单结的。 ——博弈中没有任何参与人同时行动，且后行动者能观察到先行动者的行动，且所有参与人观察到N的行动）
1 动态博弈的扩展式表述

静态博弈用扩展式表述 A
坦白抵赖坦白
Q:何为完全信息？ B
抵赖
囚徒困境博弈
-3，-3 -4，-3
-3，-3 0，0
1，-2 -4，-3 割耳
1，-2 0，0 (-3,-3) (1，-2) 默认割耳 (-4,-3) (0,0)
三个NE: (不画,{割耳,默认}) (画,{默认，割耳}) (画,{默认，默认})
画小孩不画
父亲
父亲
默认
4 NE的缺陷——不可置信的威胁
换句话说，与抽烟有关决策不是单人在中性环境中的决定，而是一种博弈。“今日卡门”和不同偏好的卡门自己，即“未来卡门”间的博弈。

5 逆向归纳法
继续抽未来的卡门不抽今天的卡门
-1，1
1，-1
0,0 两个“卡门”如何行事？未来卡门如何行事？考虑到未来卡门的未来行动，今日卡门今日如何行事？

2 动态博弈中的策略

博弈树中参与人在结点上所选择的单个行动—— 一步/招 (move)
美中军事博弈

但是，参与人可以制定一个行动计划，将每个决策结上的选择都事先规定好，即使这个决策点实际上不会出美国现。——策略
中国中国
策略：人不犯我、我不犯人；人若犯我、我必犯人
不犯人
(-2,-2) (2,-4) (3,-5) (0,0)
4 NE的缺陷——不可置信的威胁

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料第一章导论1.博弈的概念：博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，并从中各自取得相应结果的过程。

它包括四个要素：参与者，策略，次序和得益。

2.一个博弈的构成要素：博弈模型有下列要素：(1)博弈方。

即博弈中决策并承但结果的参与者．包括个人或组织等：(2)策略。

即博弈方决策、选择的内容，包括行为取舍、经济活动水平或多种行为的特定组合等。

各博弈方的策略选择范围称策略空间。

每个博弈方各选一个策略构成一个策略组合。

(3)进行博弈的次序：次序不同一般就是不同的博弈，即使博弈的其他方面都相同。

(4)得益。

各策略组合对应的各博弈方获得的数值结果，可以是经济利益，也可以是非经济利益折算的效用等。

3.合作博弈和非合作博弈的区别：合作博弈：允许存在有约束力协议的博弈；非合作博弈：不允许存在有约束力协议的博弈。

主要区别:人们的行为互相作用时，当事人能否达成一个具有约束力的协议。

假设博弈方是两个寡头企业，如果他们之间达成一个协议，联合最大化垄断利润，并且各自按这个协议生产，就是合作博弈。

如果达不成协议，或不遵守协议，每个企业都只选择自己的最优产品(价格)，则是非合作博弈。

合作博弈：团体理性(效率高，公正，公平)非合作博弈：个人理性，个人最优决策(可能有效率，可能无效率)4.完全理性和有限理性:完全理性：有完美的分析判断能力和不会犯选择行为的错误。

有限理性：博弈方的判断选择能力有缺陷。

区分两者的重要性在于如果决策者是有限理性的，那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距，以完全理性为基础的博弈分析可能会失效。

所以不能简单地假设各博弈方都完全理性。

5.个体理性和集体理性：个体理性：以个体利益最大为目标；集体理性：追求集体利益最大化。

第一章课后题：2、4、56.设定一个博弈模型必须确定哪几个方面?设定一个博弈必须确定的方面包括:(1)博弈方，即博弈中进行决策并承担结果的参与者;(2)策略(空间)，即博弈方选择的内容，可以是方向、取舍选择，也可以是连续的数量水平等;(3)得益或得益函数，即博弈方行为、策略选择的相应后果、结果，必须是数量或者能够折算成数量;(4)博弈次序，即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构，即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度，即博弈方是依据个体理性还是集体理性行为，以及理性的程度等。

第五章重复博弈完全且非完美信息动态博弈(博弈论张醒洲)PPT课件

1. 参与人1和2同时从各自的可行集A1和A2中选择a1和a2；
2. 收益情况为ui(a1,a2,a3*(a1,a2),a4*(a1,a2))，i=1,2；
假定（a1*,a2*）为以上同时行动博弈唯一的纳什均衡，我们称 (a1*,a2*,a3*(a1*,a2*),a4*(a1*,a2*))为这一两阶段博弈的子博弈完美结果。
2009-03-16
张醒洲，大连
7
两阶段囚徒Байду номын сангаас境
• 得到 a3*(a1,a2)，a4*(a1,a2)
– 根据第一阶段的行动a1和 a2 ，预测第二阶段参与人的反应； – 请注意，在囚徒困境博弈中存在唯一的纳什均衡，因此参与人
的反应独立于其在第一阶段的行动。
• 计算 ui(a1,a2,a3*(a1,a2),a4*(a1,a2))，i=1,2
• 两阶段囚徒困境博弈是“2×2 两人同时行动”博弈的一个特殊例子。在这个博弈中，我们在上一节利用后向归纳法的思路分析了“子博弈完美结果”，具体见2.2.1。
• 子博弈完美结果
如果参与人1和2预测到参与人3和4在第二阶段的行动将由 (a3*(a1,a2)，a4*(a1,a2))给出，则参与人1和2在第一阶段的问题就可以用以下的同时行动博弈表示：
参与人 1
参与人 2
L2
L1
1, 1
R1
0, 5
R2 5, 0 4, 4
图 2.3.1
• 让两个参与人进行两次囚徒困境博弈，观察第二次博弈开始之前第一次博弈的结果，并假设整个过程博弈的总收益等于两阶段博弈收益的简单相加 (即不考虑贴现因素) 。
2009-03-16
张醒洲，大连
6
“2 × 2 ×2” 博弈和子博弈完美结果

经济博弈论ppt课件

• 例二：黔馿之技
1.3.2博弈论的基本概念
• 例三：市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40，50
－10，0
0，300
0，300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30，100
－10，0
0，400
0，400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1，2厂商生产同样的产品。如果厂
商1的产量为q1 ，厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家，因为它只需要学习两
个词：供给和需求。
• 博弈论专家坎多瑞引申说：要成为现代经济学家，这
只鹦鹉必须再多学一个词，就是“纳什均衡”。
• 张维迎认为：“近几十年来，经济学一直在为其他学
科提供武器，但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例：囚徒困境
囚徒 2
坦白
不坦白
坦白
-5， -5
0， -8
不坦白
-8， 0
-1， -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人（player）：一个博弈中的决策主体，
他的目的是通过选择策略以最大化自己的支付
（效用水平）。参与人可能是自然人，也可能
是团体，如企业、国家甚至可能是若干个国家
卡尼曼（Kahneman）
• 2005：冲突和合作：罗伯特·奥曼（Robert
J.Aumann）和托马斯·谢林（Thomas C.Schelling