13第十三章 博弈论(北大第2版)
博弈论

效用(英文:Utility),是经济学中最常用的概念之一。
一般而言,效用是指对于消费者通过消费或者享受闲暇等使自己的需求、欲望等得到的满足的一个度量。
正和博弈亦称为合作博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。
负和博弈,是指双方冲突和斗争的结果,是所得小于所失,就是我们通常所说的其结果的总和为负数,也是一种两败俱伤的博弈,结果双方都有不同程度的损失那是定理在一个有n个博弈方的博弈G=﹛S1,…,Sn:u1,…,un}中,如果n是有限的,且Si 都是有限集(对i=1,…,n),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
是由纳什发现的。
美苏争霸的囚徒困境军备竞赛是囚徒困境的又一个典型例子。
下面讲的,源自30年前美国的博弈论课本,本书不敢掠美。
从军事上看,30多年前,美国和苏联是世界上的两个超级大国,它们相互对垒。
假定每一方都有两种策略选择,一个是扩军,发展战略核武器,甚至实施“星球大战”计划等;另一个是彻底裁军,直至不设军备。
如果双方都扩军,则各花费2 000亿美元用于军费。
彻底裁军,则军费为0。
在一个弱肉强食的世界上,如果美国裁军不设防,但是苏联扩军,苏联就可以任意欺侮和损害美国。
这样,美国会受到很大损失。
损失之大,直至丧失主权。
这使我们可以非正式地把这种情况下美国的赢利记做–∞,即负无穷大。
这时候,欺侮人的一方的赢利是多少呢?你可能想象应该是+∞,即正无穷大。
其实不然。
你想想,砍伐一片森林所造成的损失,难道可以用所得到的木材的价值来补偿吗?更不必说占领甚至炸毁对方一座城市,你所得到的远远低于对方的损失。
被欺侮一方的损失,并不会等量地转化为欺侮人的一方的利益,这常常是对抗的规律。
所以,在一方扩军欺侮别人而另一方裁军任人欺侮的情况下,我们假定欺侮人的一方将只掠夺到一个有限数额的财富,比方说10 000亿美元。
这10 000亿美元的掠夺成本是上面讲的2 000亿美元。
吉本斯博弈论2课件

■ 与x0相邻的节点是x0的后 续节 (successors ). x0的后续节点 是x1, x2
■ 对任何两个相邻的节点来说, 与 根相连接的路径更长的那个节点 是另一个节点的后续节.
■ 例3: x7 是x3的后续节点, 因为它
们相邻, 而且x7到 x0的路径比x3
到x0的路径更长
x4
x0 x1
x5
-1, 1
1 , -1
TT 1 , -1 -1, 1
Game theory-Chapter 2
17
Nash equilibrium
■完全信息动态博弈中的纳什均衡集(the set of Nash equilibrium)就是它的标准式的纳什均衡 集合.
Game theory-Chapter 2
18
弈可能的终点
x4
■ 例4: x4, x5, x6, x7, x8 都是终点 节
x0 x1
x5 x7
x2 x3
x6 x8
Game theory-Chapter 2
11
Game tree
■ 除终点节以外的任何节 点都代表了某个参与人.
■ 对于终点节以外的任意 后节续点节来的说边, 连缘接代它表和了它这的Player 2 个节点所代表的参与人 H 可能采取的行动
A
F
1, 2
A
F
2, 1
0, 0
2, 1
0, 0
Accommodate is the Nash equilibrium in this subgame.
Game theory-Chapter 2
26
Find subgame perfect Nash equilibria backward induction
博弈论2

定理3.3.1
如果阶段博弈G有纳什均衡,对任意有限或无限阶段 的T,重复博弈G(T)有子博弈完美纳什均衡:即在每 一阶段重复采用阶段博弈G的纳什均衡。
该定理的证明比较简单,只需验证它符合定义3.2.3规 定的子博弈完美纳什均衡的条件就可以了。
开环策略集
若局中人 i 在 t 阶段进行行动决策时,不知道该 阶段前其它局中人的行为选择,而又要在自己的原博弈 行动集 S i 中选择一个行动 sit Si ,这时他的策略称 为开环策略,全部开环策略称为开环策略集。 显然,对T次重复博弈,局中人 i 的开环策略集
5 i i j 1 j
(3.3.6) 现5位船主对其自身的游船的定价进行博弈,这是 一个静态的5人非合作博弈。
j 1
ui (s) Di ( si ) si 180si 6s si s j i 1, 2,3, 4,5
2 i
5
例3.3.2
ui 0 si
游船定价的博弈(续)
s (s1 , s2 ,, sn )为G的一个行动组合,且 是原博弈的纳什均衡点, P (s ) P (sc ) 。 局中人的策略为: i 对任意 i N 有: i
(1)第一阶段选择 s Si ,以后也一直选择行动 s ; (2)若第 t 阶段博弈前有任意其它局中人 j N \{i}
4 1 4 4 4 1
2
例3.3.1
价格战重复博弈(续)
当局中人1在第t期改变策略,局中人2具有前期信息反馈, t期时,局中人2也一定改变策略选择“降价”策略。 1 则在 t期时, 1 局中人1也能分析出局中人2的行为选择,因此在 局中人1也会选择“降价”行为。这样局中人1的总收益为:
博弈论2(方法论基础)

(2)行动 ACTIONS OR MOVES
• 参与人在博弈的某个时点的决策变量。 (坦白) • N个参与人的行动的有序集称为行动组合 (坦白,抵赖)。
11
行动的顺序
• 对于博弈的结果非常重要。有关静态和动 态博弈的区分就是基于行动的顺序做出的。 • 同样的行动集合,行动的顺序不同,每个 参与人的最有决策就不同,博弈的结果也 不同。尤其在不完全信息博弈中,后行动 者依赖观察先行动者的行动来获取信息。
• “搭便车”现象; • 公共物品,穷人和富人修路博弈(中产阶 级对社会的稳定作用); • 大股东对管理者的监督; • 天塌下来有高个子顶着。
31
性别战与先动优势
• 双均衡的性别战
女 足球 男 足球 芭蕾 芭蕾
2,1 0,0
0,0 1,2
32
一对谈恋爱的男女安排业余活动, 一对谈恋爱的男女安排业余活动 , 他们有二种选 或去看足球比赛,或去看芭蕾舞演出。 择,或去看足球比赛,或去看芭蕾舞演出。男方偏好 足球,女方偏好芭蕾,但他们宁愿在一起,不愿分开。 足球,女方偏好芭蕾,但他们宁愿在一起,不愿分开。 上表给出了这个博弈的得益矩阵。在这个博弈中, 上表给出了这个博弈的得益矩阵。在这个博弈中,如 果双方同时决定,则有两个纳什均衡, 果双方同时决定,则有两个纳什均衡,即都去看足球 比赛和都去看芭蕾演出。 比赛和都去看芭蕾演出。 但是到底最后他们去看足 球比赛还是去看芭蕾演出,并不能从中获得结论。 球比赛还是去看芭蕾演出,并不能从中获得结论。如 果假设这是个序列博弈,例如, 果假设这是个序列博弈,例如,当女方先作出选择看 芭蕾演出时,男方只能选择芭蕾; 芭蕾演出时,男方只能选择芭蕾;当女方先选择了看 足球比赛时,男方也只能选择足球。反之, 足球比赛时,男方也只能选择足球。反之,当男方先 选择了看足球比赛时,女方只能选择看足球比赛; 选择了看足球比赛时,女方只能选择看足球比赛;当 男方先选择了看芭蕾演出时,女方只能选择芭蕾。 男方先选择了看芭蕾演出时,女方只能选择芭蕾。
西方经济学第二版博弈论

六、共有财产
• 共有财产是指那些没有明确的所有者, 人人都可以免费使用的财产,包括共有 资源,比如海洋、湖泊、草场等资源。
• 如果能够对共有财产的产权进行重新构 造,使之界定明确,则可以改进资源配 置的效率。如果无法界定产权,则必须 通过法律或行政手段进行严格控制,才 能使共有财产免遭滥用。
一些经济学家认为,由于环境与生态资源属 于公共财产(common property),根本不可能做 到明确产权。
另一些经济学家则指出,即使可能做到明 确产权,除了当代人以外的受害者也无法亲自 维护自身的利益。
还有一些经济学家认为,由于在环境和生态 问题上,明确产权只意味着将某些权利给予某一 方,而不是具体的经济当事人,因而就存在着拥 有产权一方的某些经济当事人通过发出威胁来获 利的可能性,这就表明市场机制无法使环境污染 最优化。
图10-12 对完全垄断厂商征收一次总付税
习题
1. 什么是市场失灵?有哪些因素会导致市场失 灵?在市场失灵的情况下是否一定需要政府干预? 为什么?
2. 什么是逆选择?什么是败德行为?什么是委 托人-代理人问题?
3. 什么是外部性?为什么说外部性会使资源配 置效率受损?
4. 什么是公共产品?提供公共产品的效率条件
一、对完全垄断厂商的价格调节 二、对完全垄断厂商的税收调节
一、对完全垄断厂商的价格调节
• 由于与完全竞争厂商相比,完全垄断厂商 总是实行高价格、低产量政策,所以对 完全垄断厂商的价格调节是指对垄断产 品实行限价政策,也就是说政府的调节 价总是低于垄断价。
对于图10-9的 例子来讲,政府
使调节价P2等于 完全竞争价Pc时,
博弈论

12 完全信息静态博弈2 完全信息静态博弈2.1 基本分析思路和方法2.2 纳什均衡2.3 无限策略博弈分析和反应函数2.4 混合策略和混合策略纳什均衡2.5 纳什均衡的存在性2.6 纳什均衡的选择和分析方法扩展囚徒困境-3,-30,-5-5,0-1,-1坦白抵赖坦白抵赖甲乙上策:如果不管其他博弈方选择什么策略,一个博弈方的某个策略给他带来的得益始终高于其他策略,至少不低于其他策略,那么这个策略就是该博弈方的上策。
-3大于-50大于-1坦白是甲的上策坦白是乙的上策在乙选择坦白的情况下——甲选择坦白在乙选择抵赖的情况下——甲选择坦白严格上策的严格上策。
就称为博弈方那么,都有以及任一使得对任何,,博弈方存在策略合个博弈方的任何策略组如果对其他i s s s u s s u s s s s s s s s s n i i i i i i i i i i i n i i i ****111)(),(),,,,,(1−−−+−−′>≠′=−L L例1:博弈G 的得益矩阵如图所示:7,36,62,23,7上下左右甲乙。
“右”是乙的严格上策,“上”是甲的严格上策证明==*2*1:s s如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这样的策略组合就是该博弈的一个上策均衡。
(1)上策均衡如囚徒困境-3,-30,-5-5, 0-1,-1坦白抵赖坦白抵赖甲乙衡坦白,坦白):上策均策略组合(*=s 均衡——稳定的博弈结果(策略组合)严格上策均衡都成立。
对所有策略组合,不等式对于任何一个博弈方一个严格上策均衡:的为博弈满足以下条件,就称它,的一个策略组合。
如果;人博弈是设),,,(),,,,,(),,,,,,(},,2,1{),,(},,,{),,,(211111*11**2*1*1121**2*1*n n i i i i n i i i i n n n n n s s s s s s s s u s s s s s u n i G s s s s u u S S G n S S S s s s s L L L L L L L L L L L +−+−>∈==××∈=例1:7,36,62,23,7上下左右甲乙。
博弈论PPT解读

> 假定参与人1对参与人2的信念, 证明Z是最优反应策略
≥
静态环境下的行为分析 (严格劣策略的重复剔除法)重复占优法留下可理性化策略,可理性化策略集
合为最优反应策略集合,可理性化策略基于某一信念无法剔除 R={(U,L)} R={A,B} X {X,Y}
博弈论
演讲人
2021-03-21
目录
01. 博弈的表述 02. 静态环境下的行为分析 03. 动态环境下的行为分析
01
博弈的表述
博弈的表述
扩展型表示博弈
信息集与决策节点的关系
策略
策略空间(策略集合)
S={H,L}
1
2
单个策略
s=H
策略组合
(A,B)
3
4
策略组合的集合
S={A,B}X{C,D}={(A, C ),(A,D),(B,C),(B,D)}
0
3
最后对剩下的策略进行 检验
两方博弈,最优反应策略集合=非严格劣策略集合,B=UD
找出参与人1以1的概率选择某策略时,参与人2的最优反应策略
在B中,因此也在UD中
两方博弈,最优反应策略集合=非严格劣策略集合,B=UD
找出劣于其他纯策略的策略
不在UD中,也不在B中
最后对剩下的策略 进行检验
(严格劣策略的重复剔除法)重复占优法留下可理性化策略,可理性化策略集合 为最优反应策略集合,可理性化策略基于某一信念无法剔除
R={(U,L)} R={A,B} X {X,Y}
静态环境下的行为分析
定位博弈与合伙人博弈
分阶段剔除劣策略从而获得可理性化策略的集合,当剔除所有劣策略时, 上界和下界都会收敛于各参与人最优反应曲线相交的点
博弈论课件

脚的看牌人、看棋人,企业的顾问等。
对参与人的决策来说,最重要的是
必须有可供选择的行动集(策略集)和
一个很好定义 的支付函数。
自然被当作虚拟参与人。
清华诚志
10
(2)策略(strategies ):博弈中有两种策略
概念,一种为纯策略(pure strategy ), 简称策略, 指参与人在博弈中可以选择采用的行动(actions or moves)方案,是参与人在给定信息结构的情况 下的行动规则,它规定参与人在什么时候的什么情
囚徒困境反映了个人理性和集体理性的矛盾。如果 A和B都选择抵赖,各判刑1年,显然比都选择坦 白各判刑8年好得多。当然,A和B可以在被警察 抓到之前订立一个"攻守同盟",但是这可能不会有 用,因为它不构成纳什均衡,没有人有积极性遵守 这个协定,显然最好的策略是双方都抵赖.
清华诚志
5
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到自己,这样他 们必然要服长的刑期。只有当他们都首先替 对方着想时,或者相互合谋(串供)时,才可 以得到最短时间的监禁的结果。
清华诚志
26
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的思想, 每个个体都是理性的,所以必须了解竞争对手的思 想。商业关系被认为是一种相互作用。但博弈论并 不是疗法,并不是处方,它并不告诉你该付多少钱 买东西,这是计算机或者字典的任务。博弈论只是 提供一些关系的例证,一些有用的解决问题的方法。 这种思维方法也许是企业家应该学习的。对于经济 学家,也许需要学习它的理论模型,它的实验方式 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
rock
0,0
1,-1 -1,1
-1,1
0,0 1,-1
1,-1
-1,1 0,0
Person A
paper scissors
11
(3)The Battle of the Sexes(性别之战或恋爱博弈)
• 两个恋人:小丽和小勇 • 策略:看歌剧和看足球赛 • 得益:若小勇同意陪小丽看歌剧,小 丽得益(或效用)为2,小勇得益为1; 若小丽同意陪小勇去看足球赛则小勇 得益为2,小丽得益为1;否则双方得 益都为0。
(D,R)是不是可能的最优选择?
Player B L R U
Player A
(3,9) (1,8)
D
(0,0) (2,1)
如果B选择R,A的最优反应是D; 如果A选择D,而B的最优反应是R. 所以, (D,R)是一个可能的最优组合
27
(D,L)是不是一个可能的最优组合
Player B L R U
18
本章内容:
• • • • 第一节 博弈论概述 第二节 纳什均衡 第三节 子博弈精炼纳什均衡 第四节 重复博弈
19
Prisoners’ Dilemma
• Prisoners’ Dilemma 结果:
– Player A – 占优策略:招供(confess) – Player B – 占优策略:招供( confess)
38
This is called Iterated Elimination of Dominated Strategies.
• 使用重复剔除劣策略法的前提:
– 1.确信任何理性博弈参与人都不会使用严格 占劣策略。 – 2.上述理性条件是一种公共知识(This rationality requirement is common knowledge).
• 公共知识(Common Knowledge): Everybody knows everybody knows everybody knows ...
39
• 下列博弈是否可以使用占劣策略?
Left Top Middle Bottom 3,2 3,6 1,1 Center 5,4 4,2 6,3 Right 4,3 2,5 5,4
• 此时实现占优策略均衡:
– 双方都采取“招供”
20
一、占优策略及占优策略均衡
• 1.占优策略(Dominant strategy) – 在某个博弈中,如果不管其他博弈方选择 什么样策略,一博弈方的某个策略给他带 来的得益始终高于其他策略,至少不低于 其他策略,则该策略就是该博弈方的占优 策略。
21
9
Matching Pennies (猜硬币博弈) 的表达 Player B
Heads Tails
Heads Player A
-1, 1
1, -1
Tails
1, -1
-1, 1
A手握硬币让B猜测手中硬币的正反面
10
(2)Rock-scissors-paper Game
Person B
rock paper scissors
23
进一步对占优策略均衡的理解:
• 1.占优策略的实施并不依赖于其他博弈 参与人的策略选择,就是说,不管其他 人选择什么策略,他的占优策略均衡都 是唯一的。 • 2.占优策略均衡反映了所有博弈方的绝 对偏好,因此非常稳定。 • 3.根据占优策略均衡可以对博弈结果作 出最肯定的一致预测,有明确的结果。 且结果是唯一的。
如果B选择L,则A的最优反映肯定是U; 如果A选择U,则B的最优反映肯定是L。 所以, (U,L)是一个可能最优选择组合。 29
Nash Equilibrium: Matrix
Player B L R
U Player A D
(3,9) (1,8)
(0,0) (2,1)
(U,L) 和(D,R)是该博弈的两个最优策略组合,即在 每个组合中,每个人的策略都是给定其他参与人策略 情况下的最优反应。 一旦实现了有这两个组合所表示的均衡时,没有一个 人愿意偏离该均衡。这样的均衡被称为纳什均衡。 30
3r d 1s t
2n d
4 t
40
2.划线法求解NE B
Left Top 3,2 6 1,1 Center 5,4 4,2 6,3 Right 4,3 2,5 5,4
41
A
Middle Bottom
Game B
B
L
T 3, 5
R
1, 4
A
C
2, 6
4, 5
B
1, 2
0, 3
42
―猜硬币博弈‖是否有纳什均衡?如何求解?
一、博弈论定义
• 博弈论就是指研究多个个体 在平等的对局中各自利用对 方的策略变换自己的对抗策 略,以实现自己利益最大化 的学科。
6
二、如何表达一个博弈现象
在研究中任何博弈要考虑到
博弈参与者有哪些?数量如何? 博弈的规则或制约条件如何? 对手策略与自身的对应策略? 各种策略下自己的收益如何?
24
例子
Player B L R
U Player A D
(3,9) (1,8)
(0,0) (2,1)
25
(U,R)是最优选择吗?
Player B L R
U Player A
(3,9) (1,8)
(0,0) (2,1)
D
如果B选择R,A的最优选择是D; 如果A选择U,B的最优选择是L。 26 所以, (U,R) 不是一个可能的最优选择。
第十章
博弈论与厂商的 策略性行为
本章内容:
• • • • 第一节 博弈论概述 第二节 纳什均衡 第三节 子博弈精炼纳什均衡 第四节 重复博弈
2
本章内容:
• • • • 第一节 博弈论概述 第二节 纳什均衡 第三节 子博弈精炼纳什均衡 第四节 重复博弈
3
简单经济学说史 – 1950’s-- era of general equilibrium – 1960’s-- era of growth – 1970’s—era of economics of information – 1980’s – era of game theory – 1990’s—era of new institutional economics
15
三、博弈的分类
1.静态博弈和动态博弈
静态博弈:是指所有博弈方同时或可看作同 时选择策略、采取行动的博弈。 动态博弈:是指博弈方的选择、行动有先有 后,而且后选择、后行动的博弈方在自己进 行选择、行动之前可以看到在他之前选择、 行动的博弈方的选择、行动的博弈。
16
2.完全信息博弈和不完全信息博弈
• 这个唯一剩下的策略组合被称为重复剔 除劣策略的占优策略均衡
37
Repeated elimination can find the NE
B
Left Top 3,2 1,6 1,1
2n d
Center 5,4 4,2 6,3
4th
Right 4,3 2,5 5,4
3 r 1 d st
A
Middle Bottom
32
四、如何求解纳什均衡?
• 第一种方法:占劣策略剔除法 • 第二种方法:划线法
33
Game A
B Playe Black Red r A Play er
Red Black 2,2 0,5 5,0 3,3
34
Game B
L
T 3, 5
R
1, 4
C
2, 6
4, 5
B
1, 2
0, 3
35
Solution: Iterated Elimination
B
L
T 3, 5
R
1, 4
2nd
3rd
A
C
2, 6
4, 5
B
1, 2
0, 3
1st
36
2.占劣策略重复剔除法 Elimination of Dominated Strategies
• 基本思路:
– 基于完全信息和理性的假定,首先找出某个 参与人的劣策略(若存在),剔除这个劣策 略后,重新构造一个不包含剔除劣策略的新 博弈,然后再剔除某个参与人的劣策略;重 复这一过程,一直到只剩下一个唯一的策略 组合为止。
二、纳什均衡及其含义
• “纳什均衡”
– 指这样一种策略组合,在给定别人策 略选择的情况下,没有任何单个参与 人有积极性选择其他策略。 – 或者说,没有人可以通过单方面改变 自己的策略而提高自己的得益的状态。
31
纳什均衡的进一步理解
– 第一,在该策略组合中,每个参与人的策略都是 给定其他参与人的策略情况下的最佳反应。 – 第二,该策略具有自我实施(self-enforcing)的功 能。 – 第三、一旦实现了纳什均衡,任何博弈方都没有 积极性偏离该均衡状态。 – 第四、占优策略均衡一定是纳什均衡,但纳什均 衡不一定就是占优策略均衡。
– 2000’s—Now: Micro-foundation of Macroeconomics………
4
何谓博弈
• 本义:下棋 • 下棋的特点是什么? • 下棋和企业的市场竞争 有何共同点?
– 有规矩,讲策略,争输 赢
• 西方:game
– 含义比下棋更全面 – 竞争、合作
5 2016/10/15
5
12
The Battle of the Sexes(性别之战或恋爱博弈)
小丽
Football Opera
Football
2,1
0,0
小勇
Opera
0,0
1,2
13
(4)The Game of Chicken(斗鸡博弈)