复旦大学经济博弈论课件--经济博弈论(6)
合集下载
复旦大学经济博弈论课件--经济博弈论242页PPT

30.11.2019
课件
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
课件
17
竞争:个体利益最大化
q1R 1(q2,q3)4 81 2q21 2q3
11 q2R 2(q 1,q3)4 82q 12q3 q 3R 3(q 1,q2)4 81 2q 11 2q2
q1 *q2 *q3 *24 u1*u2 *u3 *576
Q*72
u*1728
21
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈G {S1, Sn;u1, un中},博弈方 i的策略
空间为 Si {si1, sik},则博弈方 i以概率分布 pi (pi1, pik)
随机在其 k个可选策略中选择的“策略”,称为一个“混合策
略”,0其p中ij 1 j1, 对,k
u 1 u 1 ( P 1 ,P 2 ) P 1 q 1 c 1 q 1 ( P 1 c 1 ) q 1 (P 1 c 1 )a 1 ( b 1 P 1 d 1 P 2 )
u 2 u 2 ( P 1 ,P 2 ) P 2 q 2 c 2 q 2 ( P 2 c 2 ) q 2 (P 2 c 2 )a 2 ( b 2 P 2 d 2 P 1 )
上策均衡不是普遍存在的
30.11.2019
课件
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
《经济博弈论》课件

常见博弈形式
合作博弈
指博弈者之间相互合作,以达到共同利益最大 化的博弈形式。
非合作博弈
指博弈者在无法达成合作的情况下,各自进行 决策,追求自身利益的博弈形式。
零和博弈
又称为固定和博弈,指博弈者的利益互为相反, 一方得到的利益与另一方失去的利益பைடு நூலகம்和为零。
零和博弈的例子
经典的零和博弈例子是两个囚犯的囚徒困境, 其中一方的得益必定意味着另一方的损失。
引言
博弈论是一门研究理性个体在决策过程中相互影响与相互制约的科学。它研究的是决策者如何在不确定环境中 做出选择,以及这些选择如何影响他人。
博弈论概述
- 什么是博弈论?博弈论是研究决策者之间相互作用和互动的数学模型框架。 - 博弈论的基本概念包括:博弈者、策略、支付、纳什均衡等。 - 博弈论的应用领域广泛,包括经济学、政治学、生物学、社会学等。
博弈论中的重要概念
1 纳什均衡
指博弈中的一组策略,每个博弈者都在这些策略下选择自己的最佳反应。没有进一步改 变策略的动机。
2 支配策略
指在任何情况下,选择该策略所带来的利益总是大于或等于其他策略的策略。
3 动态博弈
指博弈中的决策是基于时间顺序进行的,后续决策往往会受到前期决策的影响。
博弈论的实际应用
《经济博弈论》PPT课件
This presentation will introduce the key concepts of economic game theory, its applications, and highlight important strategies and examples. Get ready to delve into the fascinating world of strategic decision-making.
经济博弈论第六章不完全信息静态博弈共39页

11
27.04.2020
6.1.3 海萨尼转换
基本思路:将静态博弈转化为动态博弈 (1)假设有一个名为“自然”的博弈方0,该博弈
方的作用是先为其他每个博弈方抽取他们的类型, 抽取的这些类型构成类型向量
t=(t1,…,tn),其中t i T i ,i=1,…,n。
(2)“自然”让每个博弈方知道到自己的类型, 但却不让其他博弈方知道。
10
27.04.2020
6.1.2 静态贝叶斯博弈的一般表示
静态贝叶斯博弈的一般表达式为: G={A1,…,An ;T1,…,Tn;u1,…,un}
其中Ai为博弈方i的行为空间(策略空间), Ti是博弈方i的类型空间,博弈方i的得益 ui=ui(a1,…,an,ti)为策略组合(a1,…,an ) 和类型ti的函数。
q1*a2C1C3 H(1)CL)
6
27.04.2020
6.1.1 不完全信息的古诺模型
与完全信息古诺模型比较 完全信息古诺模型中的的产量
q1*
a2C1 3
C2
q2*
a2C2 3
C1
CH C2 q2*(CH)q2*
CL C2 q2*(CL)q2*
ቤተ መጻሕፍቲ ባይዱ
7
27.04.2020
6.1.2 静态贝叶斯博弈的一般表示
厂商1只知道有两种可能性,一种是C2= C2(q2) = CH q2概率为θ另一种是C2= C2(q2)= C Lq2, 概率为1-θ,而CH>CL,也即边际成本有高、低两 种可能。
3
27.04.2020
6.1.1 不完全信息的古诺模型
厂商2在边际成本是较高的CH时会选择较低的产 量,而在边际成本为较低的CL时会选择较高的产 量。
复旦大学经济博弈论课件--经济博弈论536页

以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
d d x tx ( u y u ) x (x x 2 ) x 2 ( 1 x ) x 2 x 3
22.03.2020
课件
14
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
22.03.2020
其中abcd可以是任何得益,根据问题设定。
22.03.2020
课件
17
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
d d x tx(u 1 u )x[u 1x1u (1x)u 2] x(1x)u (u) x(1x)x[(ac)(1x)b (d)]
复制动态 相位图
22.03.2020
x 课件
1
x
18
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
d x F (x ) x (1 x )x [ (a c ) (1 x )b ( d )] dt
22.03.2020
课件
3
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群0
课件
4
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
d d x tx ( u y u ) x (x x 2 ) x 2 ( 1 x ) x 2 x 3
22.03.2020
课件
14
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
22.03.2020
其中abcd可以是任何得益,根据问题设定。
22.03.2020
课件
17
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
d d x tx(u 1 u )x[u 1x1u (1x)u 2] x(1x)u (u) x(1x)x[(ac)(1x)b (d)]
复制动态 相位图
22.03.2020
x 课件
1
x
18
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
d x F (x ) x (1 x )x [ (a c ) (1 x )b ( d )] dt
22.03.2020
课件
3
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群0
课件
4
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
《复旦大学--经济博弈论》-公开课件

n 克劳鳆和索贝尔采用的一种随机选择的混合策 略可以克服这种问题。
1/26/2020
复旦大学经济博弈论课件
部分合并完美贝叶斯均衡的区间划分和数量
n两区间部分合并均衡区间长度不等长, =0.5-2b,前一 个区间的长度是 -0 = 0.5-2b,后一个区间的长度为1- = 0.5+2b,后一个区间长4b。 n结论对更多区间的部分合并均衡也成立。n区间,[ , ) 是之一,长度为c,行为方对该区间类型最优行为( + )/2 ,对后一区间[ , )类型的最佳行为( + )/2。两个区间 交界处类型声明方偏好的行为,须在( + )/2和( + )/2 间无差异:
1/26/2020
复旦大学经济博弈论课件
8.1.1 不完全信息动态博弈问题
n 古玩市场等各种议价博弈 n 不完全信息先后选择产量的寡头市场产量博弈 n 彩礼问题 n 广告对消费者的影响 n 学历、成绩在招聘人才、员工中的作用 n 投保人寿保险前的体检 n 学生考试前和毕业论文中的诚信承诺
1/26/2020
声明方 类型
2,0 1,1 1,1 2,0
不能传递信息(声明方 与行为方偏好相反)
1/26/2020
1. 不同类型的声明方必须偏好行为方不同行为 2. 对应声明方不同类型行为方必须偏好不同行为 3. 行为方的偏好必须与声明方具有一致性
复旦大学经济博弈论课件
离散型声明博弈模型
1/26/2020
复旦大学经济博弈论课件
第八章 不完全信息动态博弈
本章讨论不完全信息动态博弈,也就是动 态贝叶斯博弈。动态贝叶斯博弈与静态贝叶斯 博弈在许多方面是相似的,差别只是动态贝叶 斯博弈转化成的不是两阶段有同时选择的特殊 不完美信息动态博弈,而是更一般的不完美信 息动态博弈,因此可以直接利用不完美信息动 态博弈的均衡概念进行分析。本章主要介绍信 息传递条件、机制和效率方面的模型。
经济博弈论潘

1.1.2 定义
博弈-----个人、队组或其他组织,面对一定的环境条件,在一定的 规则下,同时或先后,一次或多次,从各自允许选择的行为或策 略中进行选择并加以买施,并从中各自取得相应结果的过程。
一个博弈需要设定下列4个方面: (1)博弈的参加者 (2)各博弈方各自可选择的全部策略或行为的集合。 (3)进行博弈的次序。 (4)博弈方的得益。
而“非合作博弈”则是指在各博弈方之间不能存在任何有约束力的协 议,也就是说各博弈方不能公然“串通”、“共谋”的博弈问题。
1.1.3 博弈论研究的历史和发展述评
产量决策的古诺(Cournot)模型
价格决策的伯特兰德(Bertrand)模型
本世纪20年代,法国数学家波雷尔(Borel)用最佳策略的概念研究了下 棋和其他许多具体的决策问题,并试图把它们作为应用数学的分支加 以系统研究 1944年诺依曼(Neumann)和摩根斯坦(Morgensten)合著的《博弈论和 经济行为》一书的出版标志着系统的博弈理论的初步形成。
1.2.2齐威王与田忌赛马
传说齐威王经常要大将田忌与他赛马,赛马的规则是这样的:每次双 方各出三匹马,一对一比赛三场,每一场的输方要赔一千斤铜给赢方。 齐威王的三匹马和田忌的三匹马按实力都可分为上、中、下三等。由 于齐威王的上、中、下三匹马都分别比田忌的上、中、下三匹马略胜
一筹,因此田忌每次都是连输三场,要输掉三千斤铜。实际上,田忌 的上马虽不如齐威王的上马,却比齐威王的中马和下马都要好,同样, 田忌的中马则比齐威王的下马要好一些,田忌每次都连输三场是有些 冤枉的。后来田忌的谋士孙膑给田忌出了个主意,即让田忌不要用自 己的上马去对抗齐威王的上马,而是用下马去对抗齐威王的上马,上 马则去对抗齐威王的中马,中马去对抗齐威王的下马。 田忌的谋士孙膑给田忌出了个主意,即让田忌不要用自己的上马去对 抗齐威王的上马,而是用下马去对抗齐威王的上马,上马则去对抗齐 威王的中马,中马去对抗齐威王的下马。这样,虽然第一场田忌必输 无疑,但后两场田忌却都能赢,二胜一负,田忌反而能赢齐威王一千 斤铜。 这个著名的故事生动地告诉我们巧用策略是多么的重要,在实力、条 件一定的情况下,对已方力量和有利条件的巧妙调度和运用常会起到 意想不到的效果。
《经济博弈论》PPT课件

13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
复旦大学谢识予经济博弈论

0.1*[20-w(S)] +0.9*[10-w(S)]<0
23
四、有不确定性且不可监督的 委托人—代理人博弈
1
委托
不委托
只能根据成果付酬,w是成果函数, 而非努力程度函数。不确定性对 代理人利益、选择有影响。
2
接受
[0,0]
拒绝
高产 (0.9)
2
努力
偷懒
0
低产 高产 (0.1) (0.1)
[10-w(10), w(10)-E]
[R(S)-w(S), w(S)-S] [R(0),0]
委托: R(S)-w(S) > R(0) 不委托: R(S)-w(S) < R(0)
21
数值例子
R(E)10EE2
E=2, S=1, W(E)=4, w(S)=2
1
委托
不委托
2
接受
[0,0] 拒绝
2
努力
[0,0] 偷懒
[12, 2]
[7,1]
第二阶段是博弈方3和博弈方4的选择阶段,他们在看到 博弈方1和博弈方2的选择 a 1 和 a 2 以后,同时在各自的
可选策略(行为)集合 A3 和 A4 中分别选择 a 3 和 a 4
各博弈方的得益都取决于所有博弈方的策略 a1,a2,a3,a4 即博弈方i的得益是各个博弈方所选择策略的多元函数 ui ui(a1,a2,a3,a4)
30
3.5.2 间接融资和挤兑风险
客 不存 户 1 存款
客户2 不存 存款 1, 1 1, 1 1, 1 第1下.2二一,阶阶1段段.2
第一阶段
客户2 提前 到期 客 提前 0.8,0.8 1,0.6 户 1 到期 0.6,1 1.2,1.2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
上策均衡不是普遍存在的
2021/3/11
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
左中
右
上 1,0 1,3 0,1
下 0,4 0,2 2,0
左 1,0 0,4
中 1,3 0,2
左 1,0
P1*
1 2b1
(a1 b1c1 d1P2* )
2021/3/11
P2*
1 2b2
(a2
b2c2
d 2 P1* )
16
2.3.4 公共资源问题
公共草地养羊问题
Q q1 qn V V (Q)
ui qiV (Q) qic
以三农户为例 n=3,c=4
2021/3/11
17
竞争:个体利益最大化
第二章 完全信息静态博弈
本章介绍完全信息静态博弈。完全信息静 态博弈即各博弈方同时决策,且所有博弈方对 各方得益都了解的博弈。囚徒的困境、齐威王 田忌赛马、猜硬币、石头剪子布、古诺产量决 策都属于这种博弈。完全信息静态博弈属于非 合作博弈最基本的类型。本章介绍完全信息静 态博弈的一般分析方法、纳什均衡概念、各种 经典模型及其应用等。
11 q1 R1(q2 , q3 ) 48 2 q2 2 q3
q2
R2 (q1, q3 )
48
1 2
q1
1 2
q3
q3
R3 (q1, q2 )
48
1 2
q1
1 2
q2
q* 1
q2*
q3*
24
u1* u2* u3* 576
Q* 72
u* 1728
合作:总体利益最大化
u Q(100 Q) 4Q 96 Q
为
Si {,si1则,博sik弈} 方 以概率分i 布
pi 随 (机pi1在,其pik 个)
可选策略中k 选择的“策略”,称为一个“混合策略”,其中
对 0 p都ij 成 1立,j且 1,, k
pi1 pik 1
混合策略扩展博弈:博弈方在混合策略的策略空间(概率
分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
加重对首位的处罚:短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略
2021/3/11
26
小偷 偷不偷
守卫 睡 不睡 V,-D -P,0 0,S 0,0
小偷 得益(偷)
0 -P
V
Pg 守卫
1 睡的概略
- P’
加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒
一、猜硬币博弈
盖 正面 硬 币 反面 方
猜硬币方
正面
反面
-1, 1
1, -1
1, -1
-1, 1
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略
这类博弈很多,引出混合策略纳什均衡概念
2021/3/11
22
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈 G {S1,Sn;u中1,,u博n}弈方 的策略i 空间
混合策略纳什均衡:包含混合策略的策略组合,构成纳什 均衡。
2021/3/11
23
三、一个例子
该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析
博弈方1的混合策略
博 弈A 方B 1
博弈方2
C
D
2, 3 5, 2
3, 1 1, 5
pA 3 pB 1 pA 2 pB 5
博弈方2的混合策略
pC 2 pD 5 pC 3 pD 1
2021/3/11
13
两寡头间的囚徒困境博弈
厂 不突破 商 1 突破
厂商2
不突破
突破
4.5,4.5
3.75,5
5,3.75
4,4
2021/3/11
以自身最大利益为目标:各生产 2单位产量,各自得益为4
以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
14
2.3.2 反应函数
古诺模型的反应函数
都是对其余博弈方策略的组合
(si* , si*1, si*1,...sn* )
的最佳对策,也即ui (si*,si*1, si*, si*1,...sn*) ui (si*,s对i*1,任sij意, si*1,...sn*)
都成立,si j则称Si
为 的一(s个i*, 纳什sn*均) 衡G
2021/3/11
0, 2
3, 3
1, 3
1, 1
2021/3/11
博弈方2采用纯策略L时,博弈方1 采用混合策略(1/2,1/2,0)的得益
u1e
1 2
3
1 2
0
0
1
3 2
博弈方2采用纯策略R时,博弈方1 采用混合策略(1/2,1/2,0)的得益
u1e
1 2
0
1 2
3 01
3 2
31
2.4.4 混合策略反应函数
2021/3/11
29
三、市场机会博弈
厂商2
进
不进
厂 进 -50,-50 100,0 商 1 不进 0,100 0,0
市场机会
进 不进 得益
厂商1: 2/3 1/3
0
厂商2: 2/3 1/3
0
2021/3/11
30
2.4.3 混合策略和严格下策反复消去法
博U
弈 方
M
1D
博弈方2
L
R
3, 1
0, 2
2021/3/11
Q 48 3 24 72 u 2304 3576 1728
18
2.3.5 反应函数的问题和局限性
在许多博弈中,博弈方的策略是有限且非连 续时,其得益函数不是连续可导函数,无法 求得反应函数,从而不能通过解方程组的方 法求得纳什均衡。
即使得益函数可以求导,也可能各博弈方的 得益函数比较复杂,因此各自的反应函数也 比较复杂,并不总能保证各博弈方的反应函 数有交点,特别不能保证有唯一的交点。
2021/3/11
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
2021/3/11
8
2.2.1 纳什均衡的定义
策 博略弈空方间i的:S第1,j个S策n 略:si j Si 博弈方 i的得益:u i
博弈:G {S1,Sn;u1,un}
纳什均衡:在博弈G {S1,Sn;u1中,,un}如果由各个博弈方的各i
一个策略组成的某个策略组合 (s中i*,,s任n* ) 一博弈方 的策略,
2021/3/11
19
2.4 混合策略和混合策略纳什均衡
2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数
2021/3/11
20
么么么么方面
Sds绝对是假的
2.4.1 严格竞争博弈和混合策略的引进
9
2.2.2 纳什均衡的一致预测性质
一致预测:如果所有博弈方都预测一个特定博弈 结果会出现,所有博弈方都不会利用该预测或者 这种预测能力选择与预测结果不一致的策略,即 没有哪个博弈方有偏离这个预测结果的愿望,因 此预测结果会成为博弈的最终结果
只有纳什均衡才具有一致预测的性质 一致预测性是纳什均衡的本质属性 一致预测并不意味着一定能准确预测,因为有 多重均衡,预测不一致的可能
2021/3/11
夫妻之争博弈的混合策略纳什均衡
策略
得益
博弈方1 (0.75,0.25) 0.67
博弈方2 (1/3,2/3) 0.75
28
二、制式问题
厂A 商 1B
厂商2
A
B
1, 3 0, 0
0, 0 2, 2
制式问题
制式问题混合策略纳什均衡
A
B
得益
厂商1: 0.4 0.6 0.664
厂商2: 0.67 0.33 1.296
2021/3/11
27
2.4.2 多重均衡博弈和混合策略
一、夫妻之争的混合策略纳什均衡
妻 时装 子
足球
丈夫 时装 足球 2, 1 0, 0
0, 0 1, 3
夫妻之争
妻子的混合策略
pw(C)1 pw(F) 0 pw(C) 0 pw(F)3
丈夫的混合策略
ph (C) 2 ph (F) 0 ph (C) 0 ph (F)1
1, 3 0, 2
0, 1 2, 0
囚 徒
-5, -5
0, -8
夫 妻
困
-8, 0
-1, -1
之
境
争
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
2021/3/11
2, 1 0, 0
0, 0 1, 3
7
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
q1 q1(P1, P2 ) a1 b1P1 d1P2 q2 q2 (P1, P2 ) a2 b2P2 d2P1
u1 u1(P1, P2 ) P1q1 c1q1 (P1 c1)q1 (P1 c1)(a1 b1P1 d1P2 )
2021/3/11
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
左中
右
上 1,0 1,3 0,1
下 0,4 0,2 2,0
左 1,0 0,4
中 1,3 0,2
左 1,0
P1*
1 2b1
(a1 b1c1 d1P2* )
2021/3/11
P2*
1 2b2
(a2
b2c2
d 2 P1* )
16
2.3.4 公共资源问题
公共草地养羊问题
Q q1 qn V V (Q)
ui qiV (Q) qic
以三农户为例 n=3,c=4
2021/3/11
17
竞争:个体利益最大化
第二章 完全信息静态博弈
本章介绍完全信息静态博弈。完全信息静 态博弈即各博弈方同时决策,且所有博弈方对 各方得益都了解的博弈。囚徒的困境、齐威王 田忌赛马、猜硬币、石头剪子布、古诺产量决 策都属于这种博弈。完全信息静态博弈属于非 合作博弈最基本的类型。本章介绍完全信息静 态博弈的一般分析方法、纳什均衡概念、各种 经典模型及其应用等。
11 q1 R1(q2 , q3 ) 48 2 q2 2 q3
q2
R2 (q1, q3 )
48
1 2
q1
1 2
q3
q3
R3 (q1, q2 )
48
1 2
q1
1 2
q2
q* 1
q2*
q3*
24
u1* u2* u3* 576
Q* 72
u* 1728
合作:总体利益最大化
u Q(100 Q) 4Q 96 Q
为
Si {,si1则,博sik弈} 方 以概率分i 布
pi 随 (机pi1在,其pik 个)
可选策略中k 选择的“策略”,称为一个“混合策略”,其中
对 0 p都ij 成 1立,j且 1,, k
pi1 pik 1
混合策略扩展博弈:博弈方在混合策略的策略空间(概率
分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
加重对首位的处罚:短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略
2021/3/11
26
小偷 偷不偷
守卫 睡 不睡 V,-D -P,0 0,S 0,0
小偷 得益(偷)
0 -P
V
Pg 守卫
1 睡的概略
- P’
加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒
一、猜硬币博弈
盖 正面 硬 币 反面 方
猜硬币方
正面
反面
-1, 1
1, -1
1, -1
-1, 1
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略
这类博弈很多,引出混合策略纳什均衡概念
2021/3/11
22
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈 G {S1,Sn;u中1,,u博n}弈方 的策略i 空间
混合策略纳什均衡:包含混合策略的策略组合,构成纳什 均衡。
2021/3/11
23
三、一个例子
该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析
博弈方1的混合策略
博 弈A 方B 1
博弈方2
C
D
2, 3 5, 2
3, 1 1, 5
pA 3 pB 1 pA 2 pB 5
博弈方2的混合策略
pC 2 pD 5 pC 3 pD 1
2021/3/11
13
两寡头间的囚徒困境博弈
厂 不突破 商 1 突破
厂商2
不突破
突破
4.5,4.5
3.75,5
5,3.75
4,4
2021/3/11
以自身最大利益为目标:各生产 2单位产量,各自得益为4
以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
14
2.3.2 反应函数
古诺模型的反应函数
都是对其余博弈方策略的组合
(si* , si*1, si*1,...sn* )
的最佳对策,也即ui (si*,si*1, si*, si*1,...sn*) ui (si*,s对i*1,任sij意, si*1,...sn*)
都成立,si j则称Si
为 的一(s个i*, 纳什sn*均) 衡G
2021/3/11
0, 2
3, 3
1, 3
1, 1
2021/3/11
博弈方2采用纯策略L时,博弈方1 采用混合策略(1/2,1/2,0)的得益
u1e
1 2
3
1 2
0
0
1
3 2
博弈方2采用纯策略R时,博弈方1 采用混合策略(1/2,1/2,0)的得益
u1e
1 2
0
1 2
3 01
3 2
31
2.4.4 混合策略反应函数
2021/3/11
29
三、市场机会博弈
厂商2
进
不进
厂 进 -50,-50 100,0 商 1 不进 0,100 0,0
市场机会
进 不进 得益
厂商1: 2/3 1/3
0
厂商2: 2/3 1/3
0
2021/3/11
30
2.4.3 混合策略和严格下策反复消去法
博U
弈 方
M
1D
博弈方2
L
R
3, 1
0, 2
2021/3/11
Q 48 3 24 72 u 2304 3576 1728
18
2.3.5 反应函数的问题和局限性
在许多博弈中,博弈方的策略是有限且非连 续时,其得益函数不是连续可导函数,无法 求得反应函数,从而不能通过解方程组的方 法求得纳什均衡。
即使得益函数可以求导,也可能各博弈方的 得益函数比较复杂,因此各自的反应函数也 比较复杂,并不总能保证各博弈方的反应函 数有交点,特别不能保证有唯一的交点。
2021/3/11
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
2021/3/11
8
2.2.1 纳什均衡的定义
策 博略弈空方间i的:S第1,j个S策n 略:si j Si 博弈方 i的得益:u i
博弈:G {S1,Sn;u1,un}
纳什均衡:在博弈G {S1,Sn;u1中,,un}如果由各个博弈方的各i
一个策略组成的某个策略组合 (s中i*,,s任n* ) 一博弈方 的策略,
2021/3/11
19
2.4 混合策略和混合策略纳什均衡
2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数
2021/3/11
20
么么么么方面
Sds绝对是假的
2.4.1 严格竞争博弈和混合策略的引进
9
2.2.2 纳什均衡的一致预测性质
一致预测:如果所有博弈方都预测一个特定博弈 结果会出现,所有博弈方都不会利用该预测或者 这种预测能力选择与预测结果不一致的策略,即 没有哪个博弈方有偏离这个预测结果的愿望,因 此预测结果会成为博弈的最终结果
只有纳什均衡才具有一致预测的性质 一致预测性是纳什均衡的本质属性 一致预测并不意味着一定能准确预测,因为有 多重均衡,预测不一致的可能
2021/3/11
夫妻之争博弈的混合策略纳什均衡
策略
得益
博弈方1 (0.75,0.25) 0.67
博弈方2 (1/3,2/3) 0.75
28
二、制式问题
厂A 商 1B
厂商2
A
B
1, 3 0, 0
0, 0 2, 2
制式问题
制式问题混合策略纳什均衡
A
B
得益
厂商1: 0.4 0.6 0.664
厂商2: 0.67 0.33 1.296
2021/3/11
27
2.4.2 多重均衡博弈和混合策略
一、夫妻之争的混合策略纳什均衡
妻 时装 子
足球
丈夫 时装 足球 2, 1 0, 0
0, 0 1, 3
夫妻之争
妻子的混合策略
pw(C)1 pw(F) 0 pw(C) 0 pw(F)3
丈夫的混合策略
ph (C) 2 ph (F) 0 ph (C) 0 ph (F)1
1, 3 0, 2
0, 1 2, 0
囚 徒
-5, -5
0, -8
夫 妻
困
-8, 0
-1, -1
之
境
争
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
2021/3/11
2, 1 0, 0
0, 0 1, 3
7
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
q1 q1(P1, P2 ) a1 b1P1 d1P2 q2 q2 (P1, P2 ) a2 b2P2 d2P1
u1 u1(P1, P2 ) P1q1 c1q1 (P1 c1)q1 (P1 c1)(a1 b1P1 d1P2 )