第3.2讲:纳什均衡(II):混合策略意义上的分析
浅析古诺模型的纳什均衡及应用

浅析古诺模型的纳什均衡及应用【摘要】古诺模型是博弈论中的经典模型之一,通过分析双方角色和策略的选择,可以得出纳什均衡的解。
纳什均衡是指在博弈中每个参与者采取最佳应对策略的状态,使得没有一个参与者可以通过改变自身策略来获得更高的收益。
通过计算纳什均衡,可以确定在古诺模型中各方的最优策略选择。
古诺模型在博弈论中有着广泛的应用,能够描述各种决策情形,并帮助分析各方的利益冲突。
古诺模型也存在局限性,例如假设信息完全对称等问题。
纳什均衡的意义和应用前景则在于帮助理解博弈中的策略选择规律,为实际决策提供理论指导。
通过深入研究古诺模型和纳什均衡的概念与应用,可以更好地理解博弈论在现实中的应用。
【关键词】关键词:古诺模型、纳什均衡、博弈论、角色与策略、计算方法、局限性、意义和应用前景。
1. 引言1.1 古诺模型的基本概念古诺模型的基本概念是现代博弈论的基础之一。
古诺模型是由约翰·冯·诺依曼和奥斯卡·摩根斯特恩在20世纪40年代提出的博弈论模型,被广泛应用于经济学、政治学、生物学等领域。
古诺模型主要研究多方参与的博弈中的决策问题,其基本假设是参与者都具有理性并追求最大化自身利益。
在古诺模型中,参与者被称为玩家,每个玩家有自己的策略空间和支付函数。
策略空间是玩家可以选择的所有可能行动,支付函数则是描述了每个玩家在不同策略组合下所获得的收益。
古诺模型中的策略可以是纯策略,即玩家直接选择一个确定的行动,也可以是混合策略,即以一定概率选择不同的纯策略。
通过分析古诺模型中各个玩家的策略选择和收益情况,可以得到博弈的纳什均衡。
纳什均衡即在一个博弈中,每个玩家选择的策略都是最优的,给定其他玩家的策略时,自己没有动机单方面改变策略。
纳什均衡是古诺模型中的一个重要概念,也是博弈论中的核心内容之一。
1.2 纳什均衡的概念纳什均衡是博弈论中一个重要的概念,它由约翰·纳什于1950年提出。
在一个博弈中,如果每个参与者都选择了最优的策略,且已知其他人的选择情况下仍然坚持自己的选择,那么这种情况就被称为纳什均衡。
混合战略纳什均衡及应用

混合战略纳什均衡及应用摘要:博弈论是运筹学的一个重要分支,类型众多。
其中,非合作博弈是现代博弈理论中的核心内容和重要基础。
本文在简要介绍了博弈论相关内容的基础上,重点介绍了非合作博弈中最重要、最核心的部分即Nash均衡。
在此基础上,以纳什均衡作为理论支撑点,结合得意矩阵分析解决了经济生活中的一些实际问题。
例如治理污水排放的制度设计问题。
关键词:博弈论;均衡点;得益矩阵;Nash均衡博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
非合作博弈是现代博弈理论中的核心内容和重要基础,而Nash均衡则是非合作博弈的核心部分。
要用博弈论解决现实经济生活中的决策问题,其关键在于如何根据行为中的支付矩阵得出纳什平衡点,通过分析决策者的心理活动来得到博弈模型,从而依据模型来针对生活中的实际问题制定相关的政策以预防不良现象的发生。
一、非合作博弈一般地,将不允许存在有约束力协议的博弈称为“非合作博弈”。
在该博弈中,每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策。
事实上,具有这种性质的策略组合,正是非合作博弈理论中最重要的一个概念——“纳什均衡”。
在博弈论里,有各种各样的均衡概念。
混合战略均衡是纳什均衡的一种,混合战略概念使博弈论的研究范围更加广泛。
混合战略纳什均衡在非合作博弈分析中具有十分关键的作用和地位,因此将着重介绍混合战略纳什均衡的定义。
显然,给定父母资助,儿子的最优战略是在家;给定儿子在家;父母的最优战略是不资助,给定父母不救济,儿子的最优战略是寻找工作;而给定儿子寻找工作,父母的最优战略是资助。
该博弈的显著特征是每个参与人都不能猜出对方的战略。
参与人是以一定的概率选择某种战略,故称这样的战略为混合战略。
在该博弈中,设想父母以的概率选择资助,的概率选择不资助。
那么,对儿子来说,选择寻找工作带来的期望效用为,选择在家带来的期望效用同样为。
可见,选择任何混合战略带来的期望效用都是相同的。
混合策略纳什均衡

类似地,令参与人2的纯战略期望效用相等得q : 1 2
2019/11/29
20 EXIT
社会福利博弈
假定最优混合策略存在,给定流浪汉选择混合策略
( ,1 )
政府选择纯策略救济的期望效用为:
3 (1)(1 ) 4 1
理学院 顾聪 gucong@
EXIT
4.1 严格竞争博弈和混合策略
1. 混合策略的提出——猜硬币博弈
两个参与人各拿一枚硬币,并选择出正面向上还是反面向上。若两枚硬币 是一致的(即全部正面或全部反面),则参与人2赢走参与人1的硬币;若两 枚硬币不一致(一正一反),参与人1赢得参与人2的硬币。支付矩阵如下:
• 这样,我们得到一个混合策略组合,每一个参与人的混合策略都是给 定对方混合策略是的最优选择,从而构成混合策略纳什均衡。
策略 期望收益 政府 (0.5, 0.5) -0.2 流浪汉 (0.2, 0.8) 1.5
2019/11/29
11 EXIT
既然参与人在构成混合策略时选择不同纯策略之间是无差异的,他 为什么不选择一个特定的纯策略而要以特定的概率随机地选择不同的纯 策略呢?一个参与人选择混合策略目的是给其他参与人造成不确定性。
2019/11/29
5 EXIT
• 混合策略扩展博弈:
博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就 是原博弈的“混合策略扩展博弈”。
• 混合策略纳什均衡(MNE):
由最优的混合策略构成的混合策略组合:
* (* , * ,, * )
12
n
即,如果对于所有的 i 1,2, ,n,有
E1(正面)=(-1)×r+1×(1-r)=1-2r 参与人1选取反面的期望效用为
第3章混合战略Nash均衡

All Rights Reserved, 2007, Luo Yunfeng
一、混合战略
• “猜硬币”博弈
两个参与人各握有一枚硬币,双方同时 选择是正面向上(记作O)还是背面向上(记作R), 即他们的战略空间都是{O, R}。若两枚硬币是 一致的(即全部背面向上或者全部正面向上), 参与人2赢得参与人1的硬币;若两枚硬币不一 致,则参与人1赢得参与人2的硬币。
二、混合战略Nash均衡
• 提一个问题: 在“猜硬币”游戏中,我们往往会以50%
的概率选择正面(O),以50%的概率选择反面 (R),即选择混合战略σ=(0.5,0.5)。那么有没 有参与人会偏离混合战略σi=(0.5,0.5)呢?
Control Science and Engineering, HUST
个概率分布 i
(
1 i
,
...,
K i
)
其中
j i
(
j
1,...,
K)
表示参与人i选择战略
sij
的概率,即 ij 满足:
K
0
j i
1
,
j i
1
j 1
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
All Rights Reserved, 2007, Luo Yunfeng
第三章混合战略Nash均衡
主要内容: 一、混合战略; 二、混合战略Nash均衡; 三、混合战略Nash均衡的求解。
Control Science and Engineering, HUST
混合策略纳什均衡

博弈论 第三章 混合策略纳什均衡
r*=R(q)
反应对应曲线
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
再看乙的最优反应,记为q*=R(r): 观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
若r 1 / 2 2r 1 0, q越大越好 1, q* R( r ) [0,1], 若r 1 / 2 2r 1 0,无论q选什么都无影响 0, 若r 1 / 2 2r 1 0, q越小越好
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
先看甲的最优反应,记为r*=R(q): 观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0,无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
解:Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q
f.o.c. 2r-1=0
r*=1/2
混合策略纳什均衡是甲在策略空间{红,黑}上以概率分布 p甲*= (1/2,1/2)进行选择,乙也在策略空间{红,黑}上以概率p乙*= (1/2,1/2)进行选择
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、支付最大化法
例:扑克牌对色游戏(p77)
无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q(-1)+(1-q) 1]+ (1-r)[q1+(1-q)(-1)] = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r1+(1-r)(-1)]+ (1-q)[r(-1)+(1-r)1] =2q(2r-1)-(2r-1) f.o.c. 1-2q=0 q*=1/2
混合策略纳什均衡

第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
先看甲的最优反应,记为r*=R(q): 观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0,无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
纯策略(确定性)
q*=R(r)
(陈明德语) r 1 3/4
r*=R(q)
0 1/4 1 q (钟信德语)
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡
二、反应对应法:情侣博弈
支付的帕累托优势:初步印象 π陈明=r(4q-1)+2(1-q),π钟信=q(4r-3)+(3-2r) r*=0, q*=0 纯策略(确定性)
第三节 寻找多重纳什均衡
例:情侣博弈
两个(多个)纯策略纳什均衡 问题:纳什均衡找完了吗?有无混合策略纳什均衡?
一、支付最大化法
给定混合策略p陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) r Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77) 无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q)
混合战略Nash均衡

参与人1无论选择正面(O)还是反面(R)都是无差 异的。不仅如此,参与人1此时无论以什么样 的概率分布选择正面(O)和反面(R)都是无差异 的。
• 给定参与人2的战略 2 (q,1 q) 的情况下,参与人1 的最优反应
v1 (( p,1 p),(q,1 q)) pv1 (O,(q,1 q)) (1 p)v1 ( R,(q,1 q)) (2q 1) p(2 4q)
*
K
K
k=1
k=1
命题1
• 在参与人的最优混合战略 j 对 ,有 i 0
i
( ,, 中, )
1 i
K i
vi (si , i ) vi ( , i )
j * i
• 无论参与人1的选择σ1=(p,1-p)如何,参与人2 选择σ2=(0.5,0.5,0)的所得为2.5,大于选择的 所得2。所以,σ2=(0.5,0.5,0)相对于b3占优, 也就是说,在参与人可以选择混合战略的情况 下, b3成为劣战略。
si s1 ,..., si 1 , si 1 ,..., sn
i 1 ,..., i 1 , i+1 ,..., n
i ( sik, -i )=
s-i S-i
( j ( s j )) ui ( sik,s-i )
j=1 j i
• 参与人1的期望收益在2-4q>0时随p递增;在2-4q<0 1 q 时随p递减,因此,当 2 时,参与人1的最优反 1 * q 应 p (q) 1 (即选择正面);当 ,参与人1的最优 2 * p 反应 (q) 0 (即选择反面)。
p (正面) 1
p (q )
混合策略纳什均衡

混合策略纳什均衡混合策略纳什均衡是博弈论中一个重要的概念。
纳什均衡是指在一个博弈中,每个参与者都选择了最优的策略,而且即使其他参与者知道其他参与者的策略,他们也无法从自己的策略中获得更大的利益。
而混合策略则是指参与者通过随机化选择不同策略的概率来达到最优策略。
本文将深入探讨混合策略纳什均衡的概念、特点以及计算方法。
首先,混合策略纳什均衡是指参与者通过一定概率选择不同策略的方式达到最优策略。
在混合策略中,每个参与者都拥有一个策略概率分布,表示他们在不同策略下的选择概率。
这样,在博弈中,每个参与者将根据其策略概率分布中的概率随机选择其中一种策略。
对于每个参与者而言,他们的目标是通过选择最优的策略概率分布来最大化自己的期望收益或最小化自己的期望损失。
其次,混合策略纳什均衡与纳什均衡相比具有以下特点。
首先,混合策略纳什均衡可以推翻完全信息博弈中的固定策略均衡结果。
在完全信息博弈中,参与者可以根据对其他参与者策略的了解来做出精确决策,因此均衡状态是唯一确定的。
而在混合策略博弈中,由于参与者通过概率选择不同策略,他们无法准确地预测其他参与者的策略,因此均衡状态不再是唯一确定的。
其次,混合策略纳什均衡可以引入不确定性,增加博弈的复杂性。
参与者无法准确地预测其他参与者的策略,因此他们需要通过一定的概率选择策略来平衡风险与收益。
最后,混合策略纳什均衡可以通过均衡态的共同选择来实现长期的稳定状态。
在混合策略纳什均衡中,参与者通过随机化选择策略,从而消除了其他参与者可以预测自己策略的可能性,增加了稳定性。
最后,计算混合策略纳什均衡的方法主要有以下两种。
一种是通过计算参与者的最优策略概率分布来确定混合策略纳什均衡。
这种方法主要基于线性规划技术,通过最大化或最小化参与者的期望收益或损失来确定最优的策略概率分布。
另一种方法是通过迭代算法来求解混合策略纳什均衡。
这种方法主要是通过反复更新参与者的策略概率分布,直到达到均衡状态。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 1 p c p g (1) 1 p c 1 p g
16
•
“猜硬币方”的期望得益为
u g 1 p c p g (1) p c 1 p g 2( p c p g ) 4 p c p g 1
pc 1 ,因为这样赢多输少;
1 当 p g 时, 2 p c =1
33
1 (2)当猜硬币方选择“猜正面”的概率 p g 时, “盖硬币 2
方”应该选择纯策略“盖反面” ,这就相当于在混合策略
( p c,1 p c) 中令 pc 0 ,因为这样赢多输少;
1 当 p g 时, 2 p c =0
40
确定“混合策略纳什均衡”的方法
期望得益最大化法; 期望得益等值法;
反应函数法。
41
2.纳什均衡的存在性
42
纳什定理
– 在一个有 n 个博弈方的博弈 G S1,, S n; u1,, u n 中,如果 n 是有限的,且 S i 都是有限集(对 ,则该博弈至少存在一个纳什均衡,但可 i 1,, n ) 能包含混合策略.
6
混合策略的较正式定义:
在博弈 G S1,, S n; u1,, u n 中,博弈方 i 的 纯策略空间为 S i si1, si 2,, sik , 则博弈方 i 以 概率分布 pi pi1, pi 2,, pik 随机在其 k 个可 选策略中选择的 “策略” , 称为一个 “混合策略” , 其 中 对 于 j 1,, k , 都 成 立 0 pij 1 , 且
为了不给予“猜硬币方”以可乘之机,“盖硬币方”应该选择满足 u g u g 的混合策
略。
26
1 u u pc 2
g g
•
“盖硬币方”应该采取混合策略(1/2,1/2) 。
27
期望得益等值法
博弈的混合策略纳什均衡为“盖硬币方”以1/2的概率随机选择纯策略“盖正面”, “猜硬币方”以1/2的概率随机选择纯策略“猜正面”。这与利用“期望得益最大 化法”获得的结果完全一致。
(1) 1 p c p g 1 1 p c 1 p g
17
–
对 u c 求偏微分,得到“盖硬币方”最优化的一阶条件为:
u c 2 4 pg 0 pc
– 对 u g 求偏微分,得到“盖硬币方”最优化的一阶条件为:
u g 2 4 p c 0 pg
纳什均衡的本质规定性是“均衡策略组合满足各博弈方的策略相互是对其他博弈方 策略的最佳对策”。
12
1.确定“混合策略纳什均衡”的方法
期望得益最大化法; 期望得益等值法; 反应函数法。
13
以“猜硬币博弈”为例
14
猜硬币博弈
博弈的混合策略纳什均衡为“盖硬币方”以1/2的概率随机选择纯策略“盖正面”, “猜硬币方”以1/2的概率随机选择纯策略“猜正面”。
18
Hale Waihona Puke –求解如下方程组 u c p 2 4 pg 0 c u g 2 4 p 0 c pg
19
–
在混合策略纳什均衡中,“盖硬币方”以 1/2 的概率选择“盖正 面”,以 1/2 的概率选择“盖反面”;“猜硬币方”以 1/2 的概率 选择“猜正面”,以 1/2 的概率选择“猜反面”。
31
–
首先假定“盖硬币方”的混合策略为 ( p c,1 p c) ,“猜硬币方” 的混合策略为 ( p g,1 p g ) 。那么我们可以确定一下 p c 与 p g 之间的相互决定关系。
32
1 (1)当猜硬币方选择“猜正面”的概率 p g 时,“盖硬币方”应该 2
选择纯策略“盖正面”,这就相当于在混合策略 ( p c,1 p c) 中令
* 1 pc 2 p* 1 g 2
20
期望得益等值法
21
给定“猜硬币方”选择混合策略 ( p g,1 p g ) ,那么: – “盖硬币方”选择纯战略“盖正面”的期望得益为
u c (1) p g 1 1 p g
1 2 pg
猜硬币方
盖硬币方
15
期望得益最大化法
– 首先假定“盖硬币方”的混合策略为 ( p c,1 p c) , “猜硬 币方”的混合策略为 ( p g,1 p g ) 。 那么“盖硬币方”的期 望得益为:
u c (1) p c p g 1 p c 1 p g 2( p c p g ) 4 p c p g 1
3
前述四种纳什均衡分析方法无法对如下两类博弈的博弈方的选择和博弈结果作明确 的预测,也就无法给博弈方提供明确的建议:
不存在纳什均衡的博弈,如猜硬币博弈。 纳什均衡不唯一的博弈,如夫妻之争博弈。
4
需要引入“混合策略”和“混合策略纳什均衡”概念
5
混合策略
博弈方以一定的概率分布在可选策略中随机选择的决策方式,在分析原来没有纳什 均衡的博弈时有非常重要的意义。 在博弈论中,通常把这种策略选择方式称为“混合策略”(Mixed Strategy)。与此 对应地,把博弈中原来意义上的策略称为“纯战略”(Pure Strategy)。
2 pc 1
– “猜硬币方”选择纯战略“猜反面”的期望得益为
u g (1) p c 1 1 p c
1 2 pc
25
•
当 u g u g 时,“猜硬币方”将选择纯战略“猜正面”而获益,当 u g u g 时,“猜硬币
方”将选择纯战略“猜反面”而获益。 •
37
38
–
两个反应函数的唯一交点为(1/2,1/2) ,这表
1 1 明, 在该博弈中, 只有 p c 和 p g 才是相 2 2
互对对方最佳反应的混合策略概率分布,这正 是本博弈唯一的混合策略纳什均衡.
39
混合策略反应函数法
反应函数是一博弈方对另一博弈方每种可能的决策内容的最佳反应决策组成的函 数. 在纯策略的范畴中,反应函数是个博弈方选择的纯策略对其他博弈方纯策略的反 应. 在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是以方对另 一方的概率分布的反应,同样也是一定的概率分布.
盖硬币方
9
混合策略可以看作纯策略的扩展,即如果给一个博弈的每个博弈方的纯策略空间赋 予不同的概率分布,就形成了不同的混合策略。
10
需要在混合策略的意义上定义纳什均衡
博弈方的策略从“纯策略”扩展到“混合策略”。 博弈方的策略空间从“纯策略空间”扩展到“混合策略空间”。
11
混合策略意义上的纳什均衡,简称为“混合 策略纳什均衡”。
1
第3讲: 纳什均衡(Nash Equilibrium)
——混合策略意义上的分析
2
我们已经学习了如下四种博弈的基本分析思 路和方法:
I、严格上策均衡分析 II、严格下策反复消去法 III、划线法
IV、箭头法
其中,前两种是以策略之间的绝对优劣关系为基础,后两种是以策略之间的相对优 劣关系为基础。
43
用通俗的语言,纳什定理就是说“每一个有限博弈都至 少有一个混合策略纳什均衡”.该定理说明了纳什均衡 的普遍存在性,这也就意味着纳什均衡分析在我们遇 到的大多数博弈问题中,都是一种基本的分析方法.
44
纳什均衡的普遍存在性,意味着纳什均衡分析在我们 所遇到的大多数博弈问题中,都是一种基本的分析方 法。 正是因为有普遍存在性,纳什均衡是博弈结果的“一 致预测性”的性质才有意义,纳什均衡才会成为分析 博弈和预测博弈结果的中心概念和基本出发点。
28
“期望得益等值法”的思路总结
令各个博弈方随机选择纯策略的概率分布,满足使对方或其他博弈方采用不同纯策 略的期望得益相同,从而计算出各个博弈方随机选择各纯策略的概率。
29
反应函数法
30
反应函数法
将博弈方的策略空间扩展到混合策略,将纳什均衡扩展到包括混合策略纳什均衡以 后,求纯策略纳什均衡的反应函数法也可以扩展到求混合策略纳什均衡。
1 1 当 时 p g 2 1 p c R c ( p g ) [0,1] 当 p g 时 2 1 当pg 时 0 2
36
–
同理,可以得到“猜硬币方”对“盖硬币方”的反应函数:
1 当pc 时 0 2 1 p g R g ( p c ) [0,1] 当 p c 时 2 1 当pc 时 1 2
– “盖硬币方”选择纯战略“盖反面”的期望得益为
u c 1 p g (1) 1 p g
2 p g 1
22
•
当 uc 时,“盖硬币方”将选择纯战略“盖正面”而获益,当 uc u u c 时,“盖硬币方”将选择纯战略“盖反面”而获益。 c
•
为了不给予“盖硬币方”以可乘之机,“猜硬币方”应该选择满足
pi1 pi 2 pik 1。
7
纯策略与混合策略之间的关系
纯策略可以看作为特殊的混合策略,即选择相应纯策略的概率为1,选择其余纯策 略的概率为0的混合策略。 如“猜硬币博弈”中,纯策略“盖正面”可以看做为(1,0),纯策略“盖反面” 可以看做为(0,1)。
8
猜硬币方
34
1 (3) 当猜硬币方选择“猜正面”的概率 p g 时,对 2
于“盖硬币方”来说, p c 等于任何值都一样,即不管 采用纯策略还是任何混合策略,所得到的期望得益都一 样。
1 当 p g 时, p c [0,1] 2