博弈论与信息经济学混合战略纳什均衡
博弈论与信息经济学-2-2混合均衡

混合战略
• 定义: 在n个参与人博弈的战略式表述G = {S1, ..., Sn;u1, ..., un}中,假定参与人i有K个纯 战略: Si = {si1, ..., siK},那么,概率分布σ i = (σ i1,..., σ iK)称为i的一个混合战略,这里σ ik =σ (sik)是i选择Sik的概率,对于所有的k = 1,..., K,0≤σ ik ≤ 1,∑1Kσ ik = 1。 • 纯战略可以理解为混合战略的特例,比如说, 纯战略si1等价于混合战略σ i = (1,0,...,0), 即选择纯战略si1的概率为1,选择任何其他纯 战略的概率为0。
混合战略纳什均衡
• 根据上述道理,纳什均衡也可以表述如下: • 定义: σ * = (σ 1*,...,σ i* ...,σ n*)是一个 纳什均衡,如果对于所有的参与人i,
sik∈Si • 若σik等于0,则上式严格不等式成立, sik不进入混合战略;若σik不等于0,则 上式的等式成立,sik进入混合战略。
博弈论与信息经济学
第2章 完全但不完美信息静态博弈-2 ——混合战略纳什均衡
主要内容
• • • • • • 占优战略均衡、重复剔除的占优均衡 纳什均衡 库诺特寡头竞争模型 混合战略纳什均衡 纳什均衡的存在性和多重性 聚点均衡和相关均衡
纯战略纳什均衡
• 纳什均衡定义为一个满足所有参与人的 效用最大化要求的战略组合,即 (s1*,...,si*, ...,sn*)是一个纳什 均衡,当且仅当对于所有的i,si* ∈argmax ui(si,s-i*)。 • 根据这一定义,有些博弈不存在纳什均 衡。
支付最大化法
• 对上述效用函数求微分,得到政府最优化的一 阶条件为: • dυ G/dθ = 5γ – 1 = 0 • 因此, • γ * = 0.2 • 就是说,在混合战略均衡下,流浪汉以0.2的 概率选择寻找工作,以0.8的概率选择游荡。
混合策略纳什均衡

02
混合策略纳什均衡的基本理论
纳什均衡的定义与性质
纳什均衡的定义
在博弈中,如果每个玩家都采取自己的最优策略,那么整个博弈会达到一种均 衡状态,即所有参与者的利益达到最大化。
纳什均衡的性质
纳什均衡是一种自我稳定的状态,即使受到外部干扰,也会迅速恢复到原始状 态。此外,纳什均衡也是最优的,因为它使得每个参与者的利益都达到最大化 。
其次,现有的研究往往只关注特定的博弈模型, 对于更一般化的博弈模型,尤其是对于连续型博 弈和多阶段博弈的研究还比较缺乏。
首先,混合策略纳什均衡的概念和性质仍需进一 步深化和研究。例如,对于非完全信息博弈,如 何准确地刻画混合策略纳什均衡点的数量和分布 等问题仍需探索。
最后,现有的研究主要集中在理论层面,对于如 何将混合策略纳什均衡应用到实际问题中,如何 设计和制定有效的混合策略等问题还需要进一步 探讨。
未来研究方向与挑战
未来研究可以进一步拓展混合策略纳什均衡的应用领域,例如在经济学、政治学、社会学等领域的应 用。
另外,针对现有的研究不足,未来研究可以深入探索混合策略纳什均衡的性质和计算方法,以及如何设 计和制定有效的混合策略等问题。
此外,未来的研究还可以进一步拓展混合策略纳什均衡的理论框架,例如在多阶段博弈、不完全信息博 弈、非线性博弈等领域的研究。
略纳什均衡来分析。
在生物学领域的应用
在生物学中,混合策略纳什均衡可以用来研究生物种 群的进化稳定性和生态平衡。
在生态系统中,生物种群可以通过选择不同的繁殖、 迁徙、捕食等策略来适应环境变化,这种博弈关系可 以通过混合策略纳什均衡来分析。
在其他领域的应用
在社会学中,混合策略纳什均衡可以用来研究社会群 体中的合作与竞争关系。
混合策略纳什均衡例子

混合策略纳什均衡例子混合策略纳什均衡是博弈论中的一个重要概念,指的是各参与者选择一个概率分布作为他们的策略,从而达到一个稳定的状态。
在混合策略纳什均衡中,没有任何参与者可以通过单独改变自己的策略来获得更好的结果。
一个经典的混合策略纳什均衡的例子是“岩石-剪刀-布”游戏。
在这个游戏中,两个参与者(称为玩家1和玩家2)可以选择出岩石、剪刀或布中的任意一种。
每一种选择都有一定的胜负规则:岩石胜剪刀,剪刀胜布,布胜岩石。
假设玩家1选择出岩石、剪刀和布的概率分别为p1、q1和r1,玩家2选择出岩石、剪刀和布的概率分别为p2、q2和r2。
两个玩家的利益可以用一个支付矩阵表示如下:| 岩石 | 剪刀 | 布-----------------------------岩石 | 0 | -1 | 1-----------------------------剪刀 | 1 | 0 | -1-----------------------------布 | -1 | 1 | 0在混合策略纳什均衡中,每个玩家选择的概率分布必须使得对于每一种选择,玩家都不希望改变自己的概率分布。
在这个例子中,我们可以通过计算来找到混合策略纳什均衡。
假设玩家1选择出岩石的概率为p1,则选择剪刀的概率为q1=1-p1-0=1-p1,选择布的概率为r1=0-0=0。
同样地,玩家2选择出岩石的概率为p2,则选择剪刀的概率为q2=1-p2-0=1-p2,选择布的概率为r2=0-0=0。
为了找到混合策略纳什均衡,我们需要检查每一种选择,并确保玩家对于每一种选择都不希望改变自己的概率分布。
在这个例子中,无论玩家1选择什么概率分布,玩家2都可以通过选择相应的概率分布来获得更好的结果。
所以,不存在一个混合策略纳什均衡。
总结起来,混合策略纳什均衡是博弈论中一种稳定的策略选择状态,即不存在任何参与者可以通过单独改变自己的策略来获得更好的结果。
岩石-剪刀-布游戏是一个经典的混合策略纳什均衡的例子,其中玩家的选择概率分布是关键因素。
博弈论-混合策略纳什均衡

政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析
博弈论混合策略纳什均衡名词解释

博弈论混合策略纳什均衡名词解释博弈论混合策略纳什均衡是指在博弈论中,当参与者不能确定选
择某一个策略时,采取混合策略的情况下达到的均衡状态。
具体来说,混合策略是指在一个博弈中,参与者以一定的概率选
择不同的纯策略。
而纳什均衡是指在一个博弈中,参与者无法通过单
独改变自己的选择来获得更好的结果,即不存在任何参与者可以通过
改变自己的策略来让其他参与者不再选择当前策略。
混合策略纳什均衡是指游戏中所有参与者以一定的概率选择不同
的纯策略,并且这种概率分配对于所有参与者都是最优的。
也就是说,在混合策略纳什均衡下,参与者没有更好的选择可供其采取,而其他
参与者也没有更好的概率分配可供其选择。
拓展:
在博弈论中,还有许多其他类型的均衡概念,例如纯策略纳什均衡、帕累托均衡、部分均衡等等。
纯策略纳什均衡是指游戏中参与者
以确定性的纯策略进行选择,使得没有参与者可以通过改变其策略来
获得更好的结果。
帕累托均衡是指在一个博弈中,不存在可以改善任
何一个参与者的情况。
部分均衡是指只有某些参与者达到均衡状态,而其他参与者未达到均衡状态。
博弈论是研究决策制定者在相互影响下进行决策的数学工具。
通过分析不同的博弈策略和可能的结果,博弈论可以帮助我们理解冲突和合作的情况,并提供一些决策建议。
博弈论与信息经济学-2-1纳什均衡

没有占优战略均衡
(1):多劳不多得
Baldwin & Meese (1979)
新产品研发与模仿
智猪博弈(2):多劳反而少得 小猪 按 等待
大猪
按
3, 1
2, 4
等待
7, -1
0, 0
理性与剔除劣战略
最优反应
参与人i对其他参与人选择的战略s−i的最 优反应或最优应对是为其产生最大支付 的战略s*i,即 i(s*i , s−i) i(s’i, s−i),s’i s*i 如果没有其他战略同样地好,就是严格 最优反应,否则,就是弱最优反应。
弱占优战略
一般地,si*Si 称为参与人i的占优战略, 如果对应所有的si’Si 和所有的s-iS-i, si*是i的弱占优选择,即 ui(si*,s-i)≥ui(si’,s-i),s-iS-i, si’≠si* 对应地,所有的si’≠si*被称为si*的劣战 略。
占优战略
Sherlock Holmes said, whenever you have eliminated the impossible, whatever remains – no matter how improbable – must be the truth.
占优战略
一般来说,由于每个参与人的效用(支付)是博 弈中所有参与人的战略的函数,因此每个参与 人的最优战略选择依赖于所有其他参与人的战 略选择。 在一些特殊的博弈中,一个参与人的最优战略 可能并不依赖于其他参与人的战略选择,就是 说,不论其他参与人选择什么战略,他的最优 战略是唯一的,这样的最优战略被称为占优战 略(dominant strategy)。——上策 对应地,其他战略称为 “劣战略”( dominated strategy )——下策。
《博弈论与信息经济学》纳什均衡的应用-PPT精选全文完整版

pi 2 ln Y ln N 2 ln N 1 ln n 1 ln y 1
p
N
n
2 ln Y
N
n
1 ln
N
N
n
2 ln
N
1
N n 1 ln n 1 N n 1 ln y 1
si
2 ln Y
2 ln
N
2 ln
n
2
ln
y
1
s
N
n
2 ln Y
N
n
2 ln
N
N
n
2 ln
n
2
p 2 ln y 3 ln y 6 2 ln y 3 y 6 4 ln y 4 ln 3 2 ln 2
s
4 ln y
4 4 ln y 8ln 2
s p 8ln 2 4 ln 3 2 ln 2 4 ln 3 6 ln 2 ln 81 ln 64 2 ln 9 8 0
y ,
6
2
ln
y 3
ln
y 6
每一期的消费量y1
2 3
y,y2
1 3
y
10
博弈论与信息经济学
2024/10/15
b.社会效益最大化模式 假定以整个村庄的人对公地消费的总体效用达到最大化为目标,即公地问
题的社会最优问题。
ln c1
ln c2
2 ln
y
c1 c2
2
最优条件为:
c1
pi s
p
2024/10/15
16
博弈论与信息经济学
比较的结果说明:
1 从社会整体上看,以社会利益最大化为目的的消费管理
方式优于以个人利益最大化的消费管理方式;
《博弈论与信息经济学》混合战略纳什均衡

-1
2019/1/6
1
博弈论与信息经济学
假定父母选择支助的概率为p1,选择不支助的概率为p2 1- p1 ; 儿子选择立志的概率为q1,选择不立志的概率为q2 1- q1 。那么 对两个参与人,各自的盈利函数为: v1 3 p1q1 1 p1q2 1 p2 q1 5 p1q1 p1 q1 v2 2 p1q1 p2 q1 3 p1q2 2 p1q1 q1 3 p1 v1 p 5q1 1 0 p1 p2 0.5 1 v2 1 2 p 0 q1 0.2,q2 0.8 1 q 1
p 1 甲
1/2
乙
O
2019/1/6
1/2
10
1
q
博弈论与信息经济学
解法2:代数法
* v甲 p, q 2 p 1 2q 2q 1 v甲 p 1 2q 0 p 1 2 * v乙 p, q 2q 2 p 1 2 p 1 v乙 q 2 p 1 0 q 1 2
乙 甲/乙 红(p) 黑(1-p) -1 1 红(q) 1 -1 黑(1-q) 1 -1 -1 1
例1.
甲
v甲 p, q 2 p 1 2q 2q 1 期望盈利为: v乙 p, q 2q 2 p 1 2 p 1
14
博弈论与信息经济学
A/B/C (sc=1) 1 A 2 3 A/B/C (sc=2) 1 A 2 3 A/B/C (sc=3) 1 A 2
B 1 3,3,3 2,3,3 1,3,3 2 3,2,3 2,2,3 1,2,3 B 3 3,1,3 2,1,3 1,1,3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完全信息静态博弈。)
甲/乙
乙 红(q) 黑(1-q)
红(p) -1
11
-1
甲
黑(1-p) 1
-1 -1
1
2020/8/13
期望盈利为:v甲 v乙
p, p,
q q
2p 2q
1 2p
2q 1
2q 1 2 p 1
8
博弈论与信息经济学
2020/8/13
对于甲来说,为使盈利达到最大,只有调整p。如果1 2q 0, 即q 1 ,则p越大越好,而p的最大值只能取1;如果1 2q 0,
v1
p1
v2
q1
5q1 1 0 1 2 p1 0
p1 q1
p2 0.5 0.2,q2
0.8
2020/8/13
2
博弈论与信息经济学
2020/8/13
▪ 进一步浪子博弈还可以作出如下解释:
期望盈利:v1 v2
3 p1q1 2q1 p1
p1q2 q1 p2
p2q1 3q2 p1
参与人i的期望盈利为:vi pi , pi
n
pj
sj
ui
பைடு நூலகம்
s
。
sS j1
6
博弈论与信息经济学
2020/8/13
父母/儿子
支助 父 (p1) 母 不助
(p2)
儿子
立志(q1)
不立志(q2)
32
-1 3
-1 1
00
期望盈利:
1 3 p1q1 p1q2 p2q1 0 2 2q1 p1 q1 p2 3q2 p1 0
B 2 3,2,2 6,6,6 5,6,6
B 2 3,2,1 6,6,5 5,6,5
3 3,1,3 2,1,3 1,1,3
3 3,1,3 6,5,6 5,5,6
3 3,1,1 6,5,5 9,9,9
15
博弈论与信息经济学
解:
矩阵1
A1 A2
r1 2 p1 p2 1 r2 4q1 2 p1
甲
1
1/2
乙
O
1/2
1q
10
博弈论与信息经济学
2020/8/13
▪ 解法2:代数法
v甲 p, q 2 p 1 2q 2q 1 v甲
v乙
p,
q
2q
2
p
1
2
p
1
v乙
p q
1 2q 2p 1
0 0
p* q*
1 1
2 2
▪ 例2.
甲/乙
乙 德(q) 法(1-q)
德(p) 3
21
1
甲
法(1-p) 0
K
pik 1,pik p sik 是i选择战略sik的概率,pi称为参与人i的混合战略。
k 1
i 代表i的混合战略空间,pi i 。
▪ (2)期望盈利
对于博弈G S1,..., Si ,..., Sn;u1,..., ui ,..., un,对应于s s1,..., si,..., sn 有p p1,..., pi ,..., pn ,pi i ,p表示局中人i的混合战略组合,那么,
4q1 2 2 p1 p2 4q2 1 p1 p2 8 p1 4 p2 6 0
4q1 q2 11 p1 p2 1 0
p1*
1 2
,
p2*
0,
p3*
1 2
q1*
1 2
, q2*
0, q3*
1 2
r1*
1 2
,
r2*
0, r3*
1 2
17
博弈论与信息经济学
q2
C
r1
C
r2
4r1 2 2q1 q2 4r2 1 q1 q2 8q1 4q2 6 0
4r1 r2 11 q1 q2 1 0
4r1 2 2 p1 p2 4r2 1 p1 p2 8 p1 4 p2 6 0
4r1 r2 11 p2 p2 1 0
不助 3
3 ,2 -1,1
-1,3 0 ,0
博弈论与信息经济学
▪ 父母的最佳选择p*=0.5,儿子的最佳选择q*=0.2,解释如下:
• (1)当父母选择支助的概率p>0.5时,儿子的最佳选择就是放荡;当父母选择 支助的概率p<0.5时,儿子的最佳选择就是立志。
• (2)当儿子选择立志的概率q>0.2时,父母的最佳选择就是支助;当儿子选择 立志的概率q<0.2时,父母的最佳选择就是不支助。
p*
q*
1, 1,
3,0 4 1 ,0 4
有两个纯战略均衡:(德语,德语)、(法语,法语);
一个混合战略均衡:p*, q* 3 4,1 4。
p
甲
1
3/4 乙
O 1/4
12
1q
博弈论与信息经济学
▪ 解法2:代数法
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
2
即p 1 ,则q能取任意值,即q 0,1。
2
9
博弈论与信息经济学
2020/8/13
0 如果q 1 2
1 如果q 1 2
反应函数:p 0,1如果q 1 2,q 0,1如果q 1 2
1 如果q 1 2
0 如果q 1 2
由此可知,这个博弈的纳什均衡为p* 1 2,q* 1 2。
p
2020/8/13
14
博弈论与信息经济学
2020/8/13
A/B/C (sc=1)
1 A2
3
A/B/C (sc=2)
1 A2
3
A/B/C (sc=3)
1 A2
3
1 3,3,3 2,3,3 1,3,3
1 3,3,2 2,3,2 1,3,2
1 3,3,1 2,3,1 1,3,1
B 2 3,2,3 2,2,3 1,2,3
❖ 1.混合策略与期望盈利
▪ 例:浪子博弈
• 在这一博弈中,两个参与人都不知道对方选择是否确定地选择某个策略,因此, 按照以前所学的知识无法得出均衡解。但是,如果知道对方将以某一概率对某 一策略进行选择的话,就可以得出反应函数,就可以按照纳什均衡的方法求得 解。
2020/8/13
父母/儿子 父 支助 母 不助
7
博弈论与信息经济学
❖ 2.混合战略纳什均衡
▪ 例1.
对于n人混合博弈G S1, , Sn;u1, ,un,pi si i ,如果
p* p1*, , pn* 满足vi pi*, p*i vi pi , p*i ,则称p*为该博弈
的混合战略纳什均衡。(海萨尼认为,混合战略博弈就是不
2
即q 1 ,则p越小越好,而p的最小值只能取0;如果1 2q 0,
2
即q 1 ,则p能取任意值,即p 0,1。
2
对于乙来说,为使盈利达到最大,只有调整q。如果2 p 1 0, 即p 1 ,则q越大越好,而q的最大值只能取1;如果2 p 1 0,
2
即p 1 ,则q越小越好,而q的最小值只能取0;如果2 p 1 0,
儿子
立志
放荡
32
-1 3
-1 1 0 0
1
博弈论与信息经济学
假定父母选择支助的概率为p1,选择不支助的概率为p2 1- p1 ; 儿子选择立志的概率为q1,选择不立志的概率为q2 1- q1 。那么
对两个参与人,各自的盈利函数为:
v1
3 p1q1
1
p1q2
1
p2q1
5
p1q1
p1
q1
v2 2 p1q1 p2q1 3 p1q2 2 p1q1 q1 3 p1
b.对于儿子的期望盈利v2,如果1 2 p1 0,即父母的混合战略p1 0.5,则
儿子的混合战略取最大值q1 1时,v2最大;相反,如果1 2 p1 0,父母的
混合战略p1 0.5,则儿子的混合战略取最大值q1 0时,v2最大。
儿子 父母/儿子
立志(q1) 放荡(q2)
支助 父 (p1) 母
p2
5
4q1
A3 1 r1 r2 p1 8q1 4q2 6 p2 4q1 4q2 3 9 8q1 4q2
矩阵2
BB21
r1 2q1 r2 4 p1
q2 1 2 q1
q2
5
4
p1
B3
1
r1
r2
q1
8 p1
4
p2
6
q2
4
p1
4
p2
3
9
8 p1
4 p2
矩阵3
C1 C2
0
0
p1 5q1 1 q1 1 2 p1
q1 3
p1
a.对于父母的期望盈利v1,如果5q1 1 0,即儿子的混合战略q1 0.2,则
父母的混合战略取最大值p1 1时,v1最大;相反,如果5q1 1 0,即儿子
的混合战略q1 0.2,则父母的混合战略取最小值p1 0时,v1最大。
2020/8/13
父母/儿子 父 支助 母 不助
儿子
立志
放荡
32
-1 3
-1 1 0 0
4
博弈论与信息经济学
• 从上例中可以看出,当参与人在选择战略具有不确定性, 考虑纳什均衡时,具体战略的盈利已经显得不很重要, 重要的是某个战略的概率分布,因此,纳什均衡的解也 就必须包含概率,这样的支付或盈利就称为期望盈利。
02
3
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
11
博弈论与信息经济学
2020/8/13
▪ 解法1:反应函数法