第二章同时决策博弈
合集下载
博弈论第二章——博弈规则.

E(equilibrium)
▪ 均衡(equilibrium):是所有参与人的最 优战略的组合。
▪ 所谓博弈均衡,它是一种稳定的博弈结 果。
▪ 纳什均衡(Nash Equilibrium):一策 略组合中,所有的参与者面临这样的一 种情况:当其他人不改变策略时,他此 时的策略是最好的。
▪ 谢识予:给定你的 策略,我的策略是最 好的的策略,给定我的 策略,你的策略 也是最好的的策略
是指博弈分析者 感兴趣的要素的
嫌 疑 人
B
集合。是均衡行
动的组合。
坦白t
不坦 白n
嫌疑人A 坦白t 不坦白n -8,-8 0,-10 -10, 0 -1,-1
U(t,t)=0.5*(-8)+ 0.5*(-8)=-8 U(t,n)=0.5*0+ 0.5*(-10)=-5 U(n,t)=0.5*(-10)+ 0.5*0=-5 U(n,n)=0.5*(-1)+ 0.5*(-1)=-1
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
“博弈论”译自英文“Game
Theory”,直译就是“游戏理论”。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2
左
中
右
上 博弈方1
下
1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0
博弈论第3节

情侣博弈和纳什均衡
情侣博弈
丽娟 足球 足球 大 海 电影 2,1 0,0 电影 0,0 1,2
足球显然不是大海的劣势策略。 电影也不是大海的劣势策略,因为如果丽娟坚持选电 影,大海选足球只得0,选电影还可以得1。 所以,大海没有全面的劣势策略。同样,丽娟也没有 全面的劣势策略。
情侣博弈的纳什均衡
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 这类博弈很多, 这类博弈很多,引出混合策略纳什均衡概念
二、混合策略、混合策略博弈 和混合策略纳什均衡
} 混合策略:在博弈G = {S1,LSn ; u1,Lun中,博弈方 i 的策略 混合策略 空间为 S i = {si1 , L sik },则博弈方 i以概率分布 pi = ( pi1 ,L p ik ) 随机在其 k 个可选策略中选择的“策略”,称为一个“混合策 j = 1,L, k 0 ≤ p ij ≤ p i1 + L 略”,其中 1 对 都成立,且+ p ik = 1
占优策略均衡
占优策略:不管其它博弈方选择什么策略,一博 占优策略 弈方的某个策略给他带来的得益始终高于其它 的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低 价”。 占优策略均衡:一个博弈的某个策略组合中的所 占优策略均衡 有策略都是各个博弈方各自的占优策略,必然 是该博弈比较稳定的结果 占优策略均衡不是普遍存在的
囚徒困境
囚徒 2 坦 白 囚 坦 白 徒 1 不坦白 囚徒1:坦白 囚徒2:坦白 -5, -5 不坦白 0, -8
-8, 0
-1, -1
两个罪犯的得益矩阵
在一个博弈里,如果所有参与人都有占优策略 存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。所以在囚徒 困境博弈里,{坦白,坦白}是占优策略均衡。 囚徒困境反映了一个深刻的问题,即个人理性与 团体理性的冲突。这给我们一个启示,我们学习博弈论, 也许更应该研究的是怎样设计一种制度,在满足个人理性 的同时,去争取达到“集体理性”。
第二章_博弈思维:向前展望,从后倒推

结果是什么呢?
声称的策略与实际的策略:言语博弈问题
A向B发出威胁:如果你进入,我将阻挠。而对B来说,如
果进入,A真的阻挠的话,它将受损失-1亿,当然此时A 也有损失。对于B来说,问题是:A的威胁可臵信吗?
B 不进入 (0,10) (-1,2) 阻挠 (0,10)
进入
(4,4)
不阻挠
A
B通过分析得出:A的威胁是不可臵信的。
老板不用多付薪金
加薪谈判博弈树
加薪谈判
让老板相信你的威胁,最好的办法就是向他证明另一家 公司愿意每年多花12000元聘用你。(当然,如果真有 其事,你就不必运用博弈论来要求加薪了。) 争取加薪的另一办法是自断后路,告诉公司里的每个人, 如果你得不到加薪,你肯定会跳槽。你的目标是,把加
薪不成而留任的局面搞得越尴尬越好。
声称的策略与实际的策略:言语博弈问题
博弈论中,经常用“可臵信”和“不可臵信”的“威胁” 或“承诺”来区分行动者说出来的策略。而分析“威胁” 或“承诺”是可臵信的还是不可臵信的方法是倒推法。 倒推法(backward induction)也叫逆向归纳法。那么什 么是倒推法?
声称的策略与实际的策略:言语博弈问题
加薪谈判
如果你只是经理,不是老板。向你要求加薪的员工对你非
常重要,很不幸的是,你的员工也知道自己很重要,而且 你不想失去他们,但你又想压制一下下属的加薪要求。
这使你的谈判处于下风,因为假如员工能让你相信,只要 你不为他加薪,他就会跳槽,那你只好答应给他加薪。 你最好的办法是交出调薪的控制权,表明你对加薪无能为
加薪谈判
在博弈论的世界里没有仁慈或怜悯,只有一己之利。
在劳资博弈中,劳方是为了争取加薪,资方是为了确保 员工能在工作上全力以赴。老板绝不会无条件为员工加 薪,只有让老板相信对他有好处,员工才能得到加薪。 假如你对公司有所贡献,公司也依赖你。你希望加薪
第二章 完全信息静态博弈

2.3.1 古诺的寡头模型
企业Cournot模型 (无限策略博弈) 古诺( Cournot ,1838)比纳什(1950)定义早100年 假设条件: 1. 在一个寡头市场上两企业生产销售同质产品,市场 总垄产断量了Q某=一q行1+业q2的(两市寡场头) 企业就是指这两家企业 2. 市场出清价格 P = 8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 两企业同时独立地决定各自的生产产量(q1, q2) 问题:两家企业应如何决策?
一阶条件:
u1 p1
a1 2b1 P1 d1 P2
0
u2 p2
a2 2b2 P2 d2 P1
0
Cont…
❖
反应函数:
P1*
1 2b1
(a1
d1P2* )
P2*
1 2b2
(a2
d2 P1* )
❖ 纳什均衡( p1* , p2*)必需满足
P1*
1 2b1
2, 12 1, 11 2, 13
(3) (1)
上
甲
中
下
(3) 乙
(1)
左
中
右
4 ,12 0 , 12
3, 10 2, 11
2, 12 1, 11
3, 12
1, 8
2, 13
(2)
腐败与廉洁——两种路径
路径依赖:就是人们陷入一种情 况而发现从此难以脱身
❖ 1、换工作(我的工作:教师) ❖ 2、电脑操作系统 ❖ 3、婚姻 ❖ 4、腐败
第二章 完全信息静态博弈
完全信息静态博弈——各博弈方同时决策, 且所有博弈方对各方得益都了解的博弈。
囚徒的困境、齐威王田忌赛马、猜硬币、 石头剪子布、古诺产量决策
第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。
在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法
箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法
博弈论(第二章)

设某个村庄有三个农户,该村有一片大家都可以 自由放牧羊群的公共草地。由于这片草地的面积 有限,因此只能让不超过某一数量的羊吃饱,如 果在这片草地上的放牧的羊只的数量超过这个数 量,则每只羊都无法吃饱,从而每只羊的产出 (毛,皮和肉的总价值)就会减少,甚至有些羊 就会饿死。
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
第二讲纳什均衡

习题:齐威王田忌赛马矩阵
上中下 上中下
田忌
上下中 中上下 中下上 下中上 下上中
+3,-3 +1,-1 +1,-1 -1,+1 +1,-1
+1,-1 +3,-3 -1,+1 +1,-1 +1,-1
+1,-1 +1,-1 +3,-3 +1,-1 -1,+1
+1,-1 +1,-1 +1,-1 +3,-3 +1,-1
在第二行1 下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
20
第三节 纳什均衡
三、寻找纳什均衡的方法 (二)相对优势策略划线法 3.设定甲靠左行(第一行) 乙: 1>-1 乙相对优势策略:靠左行
在第一列 1下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
21
第三节 纳什均衡
四、古诺模型 max i 2.企业i的目标: π1=?,π2=? 3.企业利润最大化的一阶、二阶条件
1 0 q1 2 0 q2
2015年12月6日
2 1 2 0 2 q1 2 2 2 0 2 q 2
博弈论第二章 第二讲纳什均衡
35
第三节 纳什均衡
27
第三节
纳什均衡
要点:(1)箭 头指向的支付 大;(2)只有 一方单独改变 策略
三、寻找纳什均衡的方法 (三)箭头指向法 2.分析:(适度放牧,过度放牧) (1)给定乙不变,甲改变:0→10 (箭头向上) (2)给定甲不变,乙也不变
2015年12月6日
博弈论第二章 第二讲纳什均衡
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/11/15
13
严格劣势策略逐次消去法
理性的局中人是不会采用对自己不利的严 格劣势策略的,所以在分析博弈的可能结 局时,我们可以把局中人的严格劣势策略 都删去,只留下严格优势策略,由此得到 由双方的严格优势策略组成的博弈均衡, 叫做严格优势策略均衡。
2020/11/15
14
用严格劣势策略逐次消去法求 严格优势策略均衡
二人同时博弈
ห้องสมุดไป่ตู้
博弈中局中人的个数是博弈结构的关键 因素之一,根据局中人的个数,将博弈 分为“二人博弈”和“多人博弈”。
两人博弈就是两个各自独立决策,但策 略和利益相互依存关系的博弈方的决策 问题。例如,囚徒困境、田忌赛马、猜 硬币、打球等;经济活动中这样例子也 常见两个厂商之间的竞争、谈判、兼并 收购和劳资纠纷等。
的冲突。
2020/11/15
5
博弈的表述
博弈的三个基本要素:局中人、策略(或行动) 和得益(或支付)。
局中人:独立决策、独立承担博弈结果的个人或 组织。用i=1,2, …表示局中人,用N={1,2, …,n}表 示局中人的集合。
策略:局中人的决策内容。用Si表示局中人i可以 选择的一个特定策略,如果n个局中人每人选择 一如个 在特 囚定 徒的 困策 境略中,,则局n中维人向i的量策s=略(s集1,ss2i,=s{i…坦,白sn),。抵例 赖},而s=(坦白,坦白)是这个博弈的一个策 略组合。
左
中
右
上
1,0 1,3 0,1
下
0,4 0,2 2,0
2020/11/15
左 1,0 0,4
中 1,3 0,2
左中 1,0 1,3
15
公明博弈
注意:虚线划去的是劣势策略而不是严格劣势策略。
要求看 公 明
不要求看
2020/11/15
给看
装修行 不给看
800,600
0,0
0,1000
0,1000
公明博弈支付矩阵
2020/11/15
6
支付:每个局中人从博弈中获得的利益,它 体现每个参与博弈的局中人的追求,也是他 们行为和决策的主要依据。支付可以是利润、 收入、量化的效用、社会收益、福利等。可 以取正值,也可以取负值。
用ui表示局中人i的支付,它是策略组合s 的 函数。例如在囚徒困境博弈中,对于s=(沉 默,招供),u1(s)= -9,u2(s)=0。如果用向 量表示,支付向量为(u1(s),u2(s))=(-9,0)。 如果有n个参与人,支付向量为
2020/11/15
11
弱优势策略 (weakly dominant strategy)
并不是每一个博弈都存在严格优势策略,有 这样的情形,不存在不管其他局中人选择什 么策略,某个局中人选择他的某个策略给他 带来的支付始终高于他选择其它策略。
不管其他局中人选择什么策略,一个局中人 选择他的某个策略给他带来的支付仅仅只是 不低于他选择其它策略,我们通常把满足这 一性质的策略称为弱优势策略。
① 在二人博弈中,局中人双方的利益并不总是相 互完全冲突的,有时候也会出现双方利益方向 一致的情形。
② 在两人博弈中,掌握信息多的一方并不能保证 利益一定较多。
③ 在二人博弈中,个人追求自身利益最大化的行
为,往往并不能导致社会的最大利益,常常也
不能真正实现个人自身的最大利益。经济学常
常将这种现象称为“个人理性”与“集体理性”
设在一个n人博弈中,诸局中人的策略 集为S1,…Sn,每个局中人的支付 u1,…,un都是定义在S1×S2×…×Sn上的 函数,我们将这个博弈记作 G={S1,…Sn; u1,…,un}。这种表述方 法称为博弈的策略型表述或者正规型 表述。
2020/11/15
9
优势策略
在引论我们已经学习用支付矩阵的方 法描述一个同时决策博弈。将博弈描 述清楚并不是我们的最终目的,我们 的最终目的是把这个博弈的结果分析 清楚,即预测什么情况可能发生,什 么情况不会发生。在非合作博弈理论 中,常用的一种方法是寻找优势策略。
第二章 同时决策博弈
2020/11/15
1
主要知识点的安排
博弈的三要素和支付矩阵(第1节) *优势策略(第2节)和优势策略均衡(第3节) *相对优势策略( 第4节)和纳什均衡(第5节) 相对优势策略划线法(第6节)和箭头指向法
(第7节) 以上内容为完全信息静态博弈的分析方法 *纳什均衡的正式定义(第8节) 纳什均衡的性质——“最后归宿”(第9节) *纳什均衡的应用(第10节) 2020以/11/1上5 内容为完全信息静态博弈经典模型的应用2
2020/11/15
10
优势策略
在某个博弈中,如果不管其他局中人选择什么 策略,一个局中人的某种策略选择给他带来 的支付始终高于其他策略选择,或者至少不低 于其他策略选择,这个策略就称为优势策略。
只要这个局中人是一个理性的局中人,那么 他必定愿意选择这个策略。
优势策略可分为 ——严格优势策略(strictly dominant strategy) ——弱优势策略(weakly dominant strategy)
2020/11/15
12
严格劣势策略
不管其它博弈方的策略如何变化,给一个博
弈方带来的收益总是比另一种策略给他带来 的收益小的策略。 注意:界定一个策略是否是劣势策略,只需 要证明它比另一种策略,而不是其它所有的 策略给他带来的收益小。也就是说,对整体 而言一个博弈中只可能存在一个优势策略, 其它都是严格劣势策略。
2020/11/15
3
二人同时博弈
一般来说,局中人的个数越多,这种策 略的依存性就越复杂,分析就越困难; 但是有时候参与博弈的人数很多,博弈 的分析反而变得简单,这是因为他们的 决策会想到抵消。全体对手的决策呈现 可预见的规律。完全竞争市场的博弈就 是例证。
2020/11/15
4
二人同时博弈 研究中需要注意的问题
16
严格劣势逐次消去法的局限性
(u1(s),u2(s),…, un(s) )。
2020/11/15
7
举例
• 例如,在囚徒困境中,u1((沉默,沉默))= -1, u1((沉默,招供))= -9, u1=((招供,沉默))= 0, u1=((招供,招供))= -6。
• 同学们也可以选择支付矩阵来表示。
2020/11/15
8
博弈的策略型表述P43