第二章(完全信息静态博弈)
合集下载
博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2
左
中
右
上 博弈方1
下
1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0
第二章 完全信息静态博弈

2.3.1 古诺的寡头模型
企业Cournot模型 (无限策略博弈) 古诺( Cournot ,1838)比纳什(1950)定义早100年 假设条件: 1. 在一个寡头市场上两企业生产销售同质产品,市场 总垄产断量了Q某=一q行1+业q2的(两市寡场头) 企业就是指这两家企业 2. 市场出清价格 P = 8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 两企业同时独立地决定各自的生产产量(q1, q2) 问题:两家企业应如何决策?
一阶条件:
u1 p1
a1 2b1 P1 d1 P2
0
u2 p2
a2 2b2 P2 d2 P1
0
Cont…
❖
反应函数:
P1*
1 2b1
(a1
d1P2* )
P2*
1 2b2
(a2
d2 P1* )
❖ 纳什均衡( p1* , p2*)必需满足
P1*
1 2b1
2, 12 1, 11 2, 13
(3) (1)
上
甲
中
下
(3) 乙
(1)
左
中
右
4 ,12 0 , 12
3, 10 2, 11
2, 12 1, 11
3, 12
1, 8
2, 13
(2)
腐败与廉洁——两种路径
路径依赖:就是人们陷入一种情 况而发现从此难以脱身
❖ 1、换工作(我的工作:教师) ❖ 2、电脑操作系统 ❖ 3、婚姻 ❖ 4、腐败
第二章 完全信息静态博弈
完全信息静态博弈——各博弈方同时决策, 且所有博弈方对各方得益都了解的博弈。
囚徒的困境、齐威王田忌赛马、猜硬币、 石头剪子布、古诺产量决策
第二章完全信息静态博弈2

第二章完全信息静态博弈2
1
2021/2/22
本章重点讨论
一、博弈论的若干基本概念
占优战略均衡(Dominant strategy equilibrium,DSE) 重复剔除占优均衡(Iterated dominance equilibrium,IEDE) 纳什均衡(Pure Nash equilibrium,PNE) 混合战略纳什均衡(Mixed strategy Nash equilibrium,MNE)
2021/2/22
博弈:参与人
选择行动 战略
寻找最优目标(Max)支付
静态时:策略与行动一致,因为没有任何可能影响参与人行动选择的
信息被披露出来。
2
二、纳什均衡应用举例
1、Cournot寡头竞争模型(1838) 纳什均衡(1950)
2、豪泰林(Hotelling)价格竞争模型
3、公共地的悲剧(Tragedy of the commons)
② 旅行成本为td2,这里d是消费者到商店的距离
这里仍有 D1=x,D2=1-x,但这里 x应满足:
p 1 t( x a ) 2 p 2 t [ x ( 1 b ) ] 2 ( 3 )
解方程(3):p1t(x22axa2)p2t[x22(b1)x(b1)2]
p1p2 2t(1ab)x(1ab2a)(1ab)(1)t
若上例,若市场由(两企业构成的统一垄断企业控制)
其模型为:Max(q1q2)p(q1q2)[c1(q1)c2(q2)]
(q1q2[a(q1q2)])c(q1q2)
(q1q2[a(q1q2)])c(q1q2) Q(aQ)cQ (这里q1q2Q) 垄断企业利润最大化条件MR=MC
又 已 知 p a (q1 q2 ) AR M R a 2(q1 q2 ) a 2Q M C d (q1 q2 ) c c dQ
1
2021/2/22
本章重点讨论
一、博弈论的若干基本概念
占优战略均衡(Dominant strategy equilibrium,DSE) 重复剔除占优均衡(Iterated dominance equilibrium,IEDE) 纳什均衡(Pure Nash equilibrium,PNE) 混合战略纳什均衡(Mixed strategy Nash equilibrium,MNE)
2021/2/22
博弈:参与人
选择行动 战略
寻找最优目标(Max)支付
静态时:策略与行动一致,因为没有任何可能影响参与人行动选择的
信息被披露出来。
2
二、纳什均衡应用举例
1、Cournot寡头竞争模型(1838) 纳什均衡(1950)
2、豪泰林(Hotelling)价格竞争模型
3、公共地的悲剧(Tragedy of the commons)
② 旅行成本为td2,这里d是消费者到商店的距离
这里仍有 D1=x,D2=1-x,但这里 x应满足:
p 1 t( x a ) 2 p 2 t [ x ( 1 b ) ] 2 ( 3 )
解方程(3):p1t(x22axa2)p2t[x22(b1)x(b1)2]
p1p2 2t(1ab)x(1ab2a)(1ab)(1)t
若上例,若市场由(两企业构成的统一垄断企业控制)
其模型为:Max(q1q2)p(q1q2)[c1(q1)c2(q2)]
(q1q2[a(q1q2)])c(q1q2)
(q1q2[a(q1q2)])c(q1q2) Q(aQ)cQ (这里q1q2Q) 垄断企业利润最大化条件MR=MC
又 已 知 p a (q1 q2 ) AR M R a 2(q1 q2 ) a 2Q M C d (q1 q2 ) c c dQ
应用博弈论第二讲完全信息静态博弈

生活中其实有很多相关的例子。
•
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。
•
例2
为什么中小企业不会花钱去开发新产品 ?
•
完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。
•
生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。
•
例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
•
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。
•
例2
为什么中小企业不会花钱去开发新产品 ?
•
完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。
•
生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。
•
例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
完全信息静态博弈

一 占优战略均衡
占优战略均衡
定义:在博弈的战略表达式中,如果对于所
有的i,Si*是i的占优战略,下列战略组合称为
占优战略均衡:
s* (s1*, , sn* )
一 占优战略均衡
注意:
✓ 如果所有人都有(严格)占优战略存在,那么 占优战略均衡就是可以预测的唯一均衡。
✓ 占优战略只要求每个参与人是理性的,而不要 求每个参与人知道其他参与人是理性的(也就 是说,不要求理性是共同知识)。为什么?
二 重复剔除的占优均衡
举例: 剔除顺序:R3、C3、C2、R2,战略组合(R1,C1)
C1
R1
2,12
R2
0,12
R3
0,12
C2
1,10 0,10 0,10
C3
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
故一般使用严格劣战略剔除,可以看到,(R1,C3) (R1,C1)都是纳什均衡,但在这里是不可解的。
开发商B 开发 不开发
开发 4000,4000 8000,0
不开发 0,8000
0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
斗鸡博弈
独木桥
进 A
退
B
进
退
-3,-3 2,0
0,2 0,0
纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
6,2
R2
2,1
R3
3,0
8,4 9,6
3,6 2,8
完全信息静态博弈

三 纳什均衡
n 纳什均衡与占优战略均衡及重复剔除的占优均 衡:
n (1)每一个占优战略均衡及重复剔除的占优均衡一定 是纳什均衡,但并非每一个纳什均衡都是占优战略均 衡或重复剔除的占优均衡;
n (2)纳什均衡一定是在重复剔除严格劣战略过程中没 有被剔除掉的战略组合,但没有被剔除掉的组合不一 定是纳什均衡,除非它是唯一的(不适用于严格弱劣 战略的情况)
第二章 完全信息静态信息博弈-纳什均衡
n 一 占优战略均衡 n 二 重复剔除的占优均衡 n 三 纳什均衡 n 四 混合战略纳什均衡 n 五 纳什均衡存在性及相关讨论 n 六 纳什均衡应用举例
一 占优战略均衡
n 完全信息静态博弈 ü 完全信息:每个参与人对所有其他参与人的特
征(包括战略空间、支付函数等)完全了解 ü 静态:所有参与人同时选择行动且只选择一次。 ü 同时:只要每个参与人在选择自己的行动时不
四 混合战略纳什均衡
n 社会福利博弈
政府
流浪汉
寻找工作 流浪
2 救济 3,
1 不救济 -1,
3 -1,
0 0,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
猜谜游戏
v两个儿童各 拿一枚硬币,
v若同时正面 朝上或朝下, A给B 1分钱,
v若只有一面 朝上,B给A 1分钱。
零和博弈
博弈参与者有 输有赢,但结 果永远是0。
正面 反面
正面
反面
1 -1,
-1 1,
-1 1,
1 -1,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
n 警察与小偷
1万元
酒馆 东边
小偷
警察
警察与小偷的最优策略各是什么?
第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。
在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法
箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法
第2章_完全信息静态博弈

2. “斗鸡博弈” 斗鸡博弈”
甲、乙两人相对而行,试图通过一座独木桥。 乙两人相对而行,试图通过一座独木桥。 独木桥仅能容纳一人通行。 独木桥仅能容纳一人通行。 如果两人坚持继续前行, 如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄 的独木桥,两人都会掉到河里, 的独木桥,两人都会掉到河里,均得到收益 -10。 。 如果甲选择退让,让乙先行, 如果甲选择退让,让乙先行,那么得意的乙将得到收益 20, , 面子受损的甲 得到收益 -2。 。 如果乙选择退让,让甲先行, 如果乙选择退让,让甲先行,那么得意的甲将得到收益 20, , 面子受损的乙得到收益 -2。 。 如果甲和乙均选择退让, 如果甲和乙均选择退让,那么双方均得到收益 10。 。
2.智猪博弈 .
猪栏里养了两头猪,一头大猪、一头小猪。 猪栏里养了两头猪,一头大猪、一头小猪。 在猪圈的一端有一个盛食槽。 在猪圈的一端有一个盛食槽。 在猪圈的另一端有一个按压式开关。 在猪圈的另一端有一个按压式开关。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 大猪和小猪都在思考是否去按压开关。 大猪和小猪都在思考是否去按压开关。
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第二章
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
2.通过“划横线法”求解“智猪博弈”的均衡 .通过“划横线法”求解“智猪博弈”
小猪 按开关 按开关 大猪 等待 (10,-2) , ) (0,0) , ) (5,-1) , ) 等待 (4,2) , )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
* * 最优策略。即:ui (Si* , S ) u ( S , S 1 i i 1 ) 对于任意
Si Si
和任意的 i都成立。
二、纳什均衡的一致预测性质
一致预测性是纳什均衡的本质属性。 “一致性预测”是指:如果所有博弈方都预 测
一个特定的博弈结果会出现,那么所有的博弈方
的实际行为选择都会与他们的预测一致,即没有
q1 R1 (q2 )
(0,3)
(2,2)
q2 R2 (q1 )
(3,0) (6,0) q1 图2.9 古诺模型的反应函数几何描述
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P 1和 P 2 时,它们各 自的需求函数为 :
q1 q1 ( P 1, P 2 ) a1 b1 P 1 d1 P 2 q2 q2 ( P 1, P 2 ) a2 b2 P 2 d2 P 1
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。
哪个博弈方有偏离这个预测结果的愿望,因此这
个预测结果最终真会成为博弈的结果。
一致预测性在博弈分析中是重要的,原因在于 一个博弈方在博弈中所作预测的内容包括他自己的 选择,因此博弈方有可能会利用预测改变自己的选 择,而具有一致预测性质的博弈分析概念就能避免 这样的矛盾,从而是稳定的和自我强制的(Self enforcing),相应选择也才是真正可预测的。 纳什均衡具有一致性预测的性质,而且只有纳 什均衡才有这种性质,任何非纳什均衡的预测都不 是一致预测,因此一致预测正是纳什均衡的本质属 性。
先找出自己针对其他博弈方每种策略或 策略组合(对多人博弈)的最佳对策,即自 己的可选策略中与其他博弈方的策略或策略 组合相配合,给自己带来最大得益的策略 (这种相对最佳对策总是存在的,不过不一 定唯一),然后在此基础上,通过对其他博 弈方策略选择的判断,包括对其他博弈方对 自己策略判断的判断等,预测博弈的可能结 果和确定自己的最优策略。
严格下策反复消去法并不能解决所有 博弈的分析问题。(如猜硬币博弈、石头• 剪子•布博弈)
严格下策反复消去法失效的原因,仍 然是在典型的博弈问题中,博弈方之间普 遍存在策略依存的特征,也就是说一个博 弈方的不同策略之间,往往不存在绝对的 优劣关系,而只存在相对的、有条件的优 劣关系。
三、划线法
1
命题2.2 在n个博弈方的博弈 G {S1 , , S n ; u1 , un } 中, * * ,, s n ) 是G的一个纳什均衡,那么严格下 如果 (s1 策反复消去法一定不会将它消去。
第三节
无限策略博弈分析和反应函数
古诺的寡头模型
反应函数
伯特兰德寡头模型
q1
一、古诺寡头模型——产量博弈
设两厂商无固定成本,边际生产成本分别为 c1 和 c2 ,策略空间分别为 s1 [0, P1max ] , s2 [0, P2 max ] , 两厂商是同时决策的。
伯特兰德寡头模型——价格博弈分析(1)
两厂商的利润函数(关于价格的函数):
u1 u1 (P1 , P2 ) P1q1 c1q1 (P1 c1 )q1 (P1 c1 )(a1 b1 P1 d1 P2 )
G {S1 , , S n ; u1 , un } , n个参与人的策略式表达博弈:
* } 是一个纳什均衡,如果 策略组合 S * {S1* ,, Si* ,Sn
对于每一个 i,si* 是给定其他所有参与人选择
* * * * * S { S , , S , S S 1 1 i 1 i 1 n } 的情况下第 i个参与人的
囚徒2 坦白 抵赖
囚 坦白 -5,-5 徒 1 抵赖 -8,0
0,-8
-1,-1
图2.7 箭头法分析囚徒的困境
第二节
纳什均衡的定义
纳什均衡
(Nash Equilibrium)
纳什均衡与严格下策反复消去法
sij G {S Si1 , , S n ; u1 , u n }
一、纳什均衡的定义
划线法算例分析
博弈方2 左 中
右
0,1 2,0
博弈 上 方1 下
1,0 0,4
1,3 0,2
图2.4 划线法分析
无法用划线法确定结果的博弈
猜硬币
猜硬币方 正面 反面
盖硬 正面 币方 反面
-1,1 1,-1
1,-1 -1,1
图2.5 划线法分析猜硬币博弈
夫妻之争(Battle of Sexes) 丈夫 时装 足球 妻 时装 2,1 0,0 子 足球
盖硬 正面 币方 反面
图2.10 猜硬币博弈
2、严格竞争博弈原则
第一个原则:自己的策略选择不能预先被 另一方知道或猜中。这正是没有纳什均衡 博弈与存在唯一纳什均衡博弈之间的一个 重要的本质区别。
第二个原则:在该博弈的多次重复中,博 弈方一定要避免自己的选择带有规律性, 在该博弈中博弈方必须随机选择策略。
博弈方2 左 博弈 上 1,0 0,4 中 1,3 0,2 右 0,1 2,0
方1
下
图2.1
严格下策反复消去法算例分析
博弈方2 左 中 博弈 上 1,0 1,3 方 1 下 0,4 0,2
图 2.2 消去博弈方2 右策略后的博弈
博弈方2 左 中 博弈 上 1,0 1,3 方1
图2.3 进一步消去 博弈方1下策后的博弈
二、反应函数
前面讨论的两寡头古诺模型中,根据两厂商的 利润最大化条件可以得到两厂商的反应函数 (Reaction Function) :
1 q 1 R1 ( q2 ) (6 q2 ) 2 q R ( q ) 1 (6 q ) 2 2 1 1 2
q2 (0,6)
二、严格下策反复消去法
(Iterated Elimination of Strictly Dominated Strategies) 一博弈方的某个策略给他带来的得益总比其它策略带 来的得益小,就称这种策略为“严格下策”。通过对可选 策略的相互比较,把不可能采用的较差策略排除掉,从而 筛选出较好的策略。
。
4、混合策略和混合策略纳什均衡
第二章 完全信息静态博弈
基本分析思路和方法
纳什均衡 无限策略博弈分析和反应函数
混合策略和混合策略纳什均衡
第一节 基本分析思路和方法
上策均衡
;
严格下策反复消去法;
划线法; 剪头法。
一、上策均衡
博弈中如果不管其他博弈方选择什么策略,一博
弈方的某个策略给他带来的得益始终高于其他策
伯特兰德寡头模型——价格博弈分析(2)
解此方程组,得 :
P1*
P2*
d1 2b2 (a2 b2 c2 ) (a1 b1c1 ) 4b1b2 d1d 2 4b1b2 d1d 2
d2 2b1 (a1 b1c1 ) (a2 b2 c2 ) 4b1b2 d1d 2 4b1b2 d1d 2
很显然,上述猜硬币博弈中两博弈方 都以1/2 的相同概率随机选择正面、反面 时,双方都无法根据对方的选择获益。 这种博弈方以一定的概率分布在可选 策略中随机选择的策略,称为“混合策 略”。 与此相对,把原来意义上的策略称为 “纯策略”。
3、混合策略定义
定义: 在博弈 G {S1 , , Sn ; u1 , , un } 中,博弈方 i Si {si1 , , sik } ,则博弈方 i以概率 的策略空间为 分布 pi ( pi1 , , pik ) 随机在其 k 个可选择策略 中选择的“策略”,称为一个 “混合策 pij 1 略” 0 。其中 对于 j=1,…, k都成立, 且 pi1 pik 1
2 1
u 2 q2 P(Q) c2 q2 q2 [8 (q1 q2 )] 2q2
2 6q2 q1q2 q2
古诺寡头模型——产量博弈分析(2)
利润最大化条件:
* * 6 q2 2 q1 0 * * 6 q 2 q 1 2 0
解得:
u1 q1 P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12
古诺寡头模型——产量博弈分析(1)
两厂商的利润函数分别为:
u1 q1 P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q
* * (P 1 , P 2 )
为该博弈唯一的纳什均衡 。
第四节
混合策略和混合策略纳什均衡
严格竞争博弈和混合策略的引进
多重均衡博弈和混合策略
混合策略和严格劣策略重复剔除
混合策略反应函数
一、严格竞争博弈和混合策略的引进
1、猜硬币博弈
猜硬币方 正面 反面 -1,1 1,-1 1,-1 -1,1
设一市场有1、2两家厂商生产同样的产品。如果 厂商1的产量为 q1 ,厂商2的产量为 q2 ,则市场总产 量为 Q q1 q2 。设市场出清价格P(可以将产品全部 卖出去的价格)是市场总产量的函数:
P P(Q) 8 Q
再设两厂商的生产都无固定成本,且每增加一单 位产量的边际成本相等 c1 c2 2 。最后强调两厂商同 时决定各自的产量,即他们在决策之前都不知道另 一方的产量。
Si Si
和任意的 i都成立。
二、纳什均衡的一致预测性质
一致预测性是纳什均衡的本质属性。 “一致性预测”是指:如果所有博弈方都预 测
一个特定的博弈结果会出现,那么所有的博弈方
的实际行为选择都会与他们的预测一致,即没有
q1 R1 (q2 )
(0,3)
(2,2)
q2 R2 (q1 )
(3,0) (6,0) q1 图2.9 古诺模型的反应函数几何描述
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P 1和 P 2 时,它们各 自的需求函数为 :
q1 q1 ( P 1, P 2 ) a1 b1 P 1 d1 P 2 q2 q2 ( P 1, P 2 ) a2 b2 P 2 d2 P 1
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。
哪个博弈方有偏离这个预测结果的愿望,因此这
个预测结果最终真会成为博弈的结果。
一致预测性在博弈分析中是重要的,原因在于 一个博弈方在博弈中所作预测的内容包括他自己的 选择,因此博弈方有可能会利用预测改变自己的选 择,而具有一致预测性质的博弈分析概念就能避免 这样的矛盾,从而是稳定的和自我强制的(Self enforcing),相应选择也才是真正可预测的。 纳什均衡具有一致性预测的性质,而且只有纳 什均衡才有这种性质,任何非纳什均衡的预测都不 是一致预测,因此一致预测正是纳什均衡的本质属 性。
先找出自己针对其他博弈方每种策略或 策略组合(对多人博弈)的最佳对策,即自 己的可选策略中与其他博弈方的策略或策略 组合相配合,给自己带来最大得益的策略 (这种相对最佳对策总是存在的,不过不一 定唯一),然后在此基础上,通过对其他博 弈方策略选择的判断,包括对其他博弈方对 自己策略判断的判断等,预测博弈的可能结 果和确定自己的最优策略。
严格下策反复消去法并不能解决所有 博弈的分析问题。(如猜硬币博弈、石头• 剪子•布博弈)
严格下策反复消去法失效的原因,仍 然是在典型的博弈问题中,博弈方之间普 遍存在策略依存的特征,也就是说一个博 弈方的不同策略之间,往往不存在绝对的 优劣关系,而只存在相对的、有条件的优 劣关系。
三、划线法
1
命题2.2 在n个博弈方的博弈 G {S1 , , S n ; u1 , un } 中, * * ,, s n ) 是G的一个纳什均衡,那么严格下 如果 (s1 策反复消去法一定不会将它消去。
第三节
无限策略博弈分析和反应函数
古诺的寡头模型
反应函数
伯特兰德寡头模型
q1
一、古诺寡头模型——产量博弈
设两厂商无固定成本,边际生产成本分别为 c1 和 c2 ,策略空间分别为 s1 [0, P1max ] , s2 [0, P2 max ] , 两厂商是同时决策的。
伯特兰德寡头模型——价格博弈分析(1)
两厂商的利润函数(关于价格的函数):
u1 u1 (P1 , P2 ) P1q1 c1q1 (P1 c1 )q1 (P1 c1 )(a1 b1 P1 d1 P2 )
G {S1 , , S n ; u1 , un } , n个参与人的策略式表达博弈:
* } 是一个纳什均衡,如果 策略组合 S * {S1* ,, Si* ,Sn
对于每一个 i,si* 是给定其他所有参与人选择
* * * * * S { S , , S , S S 1 1 i 1 i 1 n } 的情况下第 i个参与人的
囚徒2 坦白 抵赖
囚 坦白 -5,-5 徒 1 抵赖 -8,0
0,-8
-1,-1
图2.7 箭头法分析囚徒的困境
第二节
纳什均衡的定义
纳什均衡
(Nash Equilibrium)
纳什均衡与严格下策反复消去法
sij G {S Si1 , , S n ; u1 , u n }
一、纳什均衡的定义
划线法算例分析
博弈方2 左 中
右
0,1 2,0
博弈 上 方1 下
1,0 0,4
1,3 0,2
图2.4 划线法分析
无法用划线法确定结果的博弈
猜硬币
猜硬币方 正面 反面
盖硬 正面 币方 反面
-1,1 1,-1
1,-1 -1,1
图2.5 划线法分析猜硬币博弈
夫妻之争(Battle of Sexes) 丈夫 时装 足球 妻 时装 2,1 0,0 子 足球
盖硬 正面 币方 反面
图2.10 猜硬币博弈
2、严格竞争博弈原则
第一个原则:自己的策略选择不能预先被 另一方知道或猜中。这正是没有纳什均衡 博弈与存在唯一纳什均衡博弈之间的一个 重要的本质区别。
第二个原则:在该博弈的多次重复中,博 弈方一定要避免自己的选择带有规律性, 在该博弈中博弈方必须随机选择策略。
博弈方2 左 博弈 上 1,0 0,4 中 1,3 0,2 右 0,1 2,0
方1
下
图2.1
严格下策反复消去法算例分析
博弈方2 左 中 博弈 上 1,0 1,3 方 1 下 0,4 0,2
图 2.2 消去博弈方2 右策略后的博弈
博弈方2 左 中 博弈 上 1,0 1,3 方1
图2.3 进一步消去 博弈方1下策后的博弈
二、反应函数
前面讨论的两寡头古诺模型中,根据两厂商的 利润最大化条件可以得到两厂商的反应函数 (Reaction Function) :
1 q 1 R1 ( q2 ) (6 q2 ) 2 q R ( q ) 1 (6 q ) 2 2 1 1 2
q2 (0,6)
二、严格下策反复消去法
(Iterated Elimination of Strictly Dominated Strategies) 一博弈方的某个策略给他带来的得益总比其它策略带 来的得益小,就称这种策略为“严格下策”。通过对可选 策略的相互比较,把不可能采用的较差策略排除掉,从而 筛选出较好的策略。
。
4、混合策略和混合策略纳什均衡
第二章 完全信息静态博弈
基本分析思路和方法
纳什均衡 无限策略博弈分析和反应函数
混合策略和混合策略纳什均衡
第一节 基本分析思路和方法
上策均衡
;
严格下策反复消去法;
划线法; 剪头法。
一、上策均衡
博弈中如果不管其他博弈方选择什么策略,一博
弈方的某个策略给他带来的得益始终高于其他策
伯特兰德寡头模型——价格博弈分析(2)
解此方程组,得 :
P1*
P2*
d1 2b2 (a2 b2 c2 ) (a1 b1c1 ) 4b1b2 d1d 2 4b1b2 d1d 2
d2 2b1 (a1 b1c1 ) (a2 b2 c2 ) 4b1b2 d1d 2 4b1b2 d1d 2
很显然,上述猜硬币博弈中两博弈方 都以1/2 的相同概率随机选择正面、反面 时,双方都无法根据对方的选择获益。 这种博弈方以一定的概率分布在可选 策略中随机选择的策略,称为“混合策 略”。 与此相对,把原来意义上的策略称为 “纯策略”。
3、混合策略定义
定义: 在博弈 G {S1 , , Sn ; u1 , , un } 中,博弈方 i Si {si1 , , sik } ,则博弈方 i以概率 的策略空间为 分布 pi ( pi1 , , pik ) 随机在其 k 个可选择策略 中选择的“策略”,称为一个 “混合策 pij 1 略” 0 。其中 对于 j=1,…, k都成立, 且 pi1 pik 1
2 1
u 2 q2 P(Q) c2 q2 q2 [8 (q1 q2 )] 2q2
2 6q2 q1q2 q2
古诺寡头模型——产量博弈分析(2)
利润最大化条件:
* * 6 q2 2 q1 0 * * 6 q 2 q 1 2 0
解得:
u1 q1 P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12
古诺寡头模型——产量博弈分析(1)
两厂商的利润函数分别为:
u1 q1 P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q
* * (P 1 , P 2 )
为该博弈唯一的纳什均衡 。
第四节
混合策略和混合策略纳什均衡
严格竞争博弈和混合策略的引进
多重均衡博弈和混合策略
混合策略和严格劣策略重复剔除
混合策略反应函数
一、严格竞争博弈和混合策略的引进
1、猜硬币博弈
猜硬币方 正面 反面 -1,1 1,-1 1,-1 -1,1
设一市场有1、2两家厂商生产同样的产品。如果 厂商1的产量为 q1 ,厂商2的产量为 q2 ,则市场总产 量为 Q q1 q2 。设市场出清价格P(可以将产品全部 卖出去的价格)是市场总产量的函数:
P P(Q) 8 Q
再设两厂商的生产都无固定成本,且每增加一单 位产量的边际成本相等 c1 c2 2 。最后强调两厂商同 时决定各自的产量,即他们在决策之前都不知道另 一方的产量。