《博弈论与信息经济学》混合战略纳什均衡 PPT
合集下载
博弈论与信息经济学-2-2混合均衡

混合战略
• 定义: 在n个参与人博弈的战略式表述G = {S1, ..., Sn;u1, ..., un}中,假定参与人i有K个纯 战略: Si = {si1, ..., siK},那么,概率分布σ i = (σ i1,..., σ iK)称为i的一个混合战略,这里σ ik =σ (sik)是i选择Sik的概率,对于所有的k = 1,..., K,0≤σ ik ≤ 1,∑1Kσ ik = 1。 • 纯战略可以理解为混合战略的特例,比如说, 纯战略si1等价于混合战略σ i = (1,0,...,0), 即选择纯战略si1的概率为1,选择任何其他纯 战略的概率为0。
混合战略纳什均衡
• 根据上述道理,纳什均衡也可以表述如下: • 定义: σ * = (σ 1*,...,σ i* ...,σ n*)是一个 纳什均衡,如果对于所有的参与人i,
sik∈Si • 若σik等于0,则上式严格不等式成立, sik不进入混合战略;若σik不等于0,则 上式的等式成立,sik进入混合战略。
博弈论与信息经济学
第2章 完全但不完美信息静态博弈-2 ——混合战略纳什均衡
主要内容
• • • • • • 占优战略均衡、重复剔除的占优均衡 纳什均衡 库诺特寡头竞争模型 混合战略纳什均衡 纳什均衡的存在性和多重性 聚点均衡和相关均衡
纯战略纳什均衡
• 纳什均衡定义为一个满足所有参与人的 效用最大化要求的战略组合,即 (s1*,...,si*, ...,sn*)是一个纳什 均衡,当且仅当对于所有的i,si* ∈argmax ui(si,s-i*)。 • 根据这一定义,有些博弈不存在纳什均 衡。
支付最大化法
• 对上述效用函数求微分,得到政府最优化的一 阶条件为: • dυ G/dθ = 5γ – 1 = 0 • 因此, • γ * = 0.2 • 就是说,在混合战略均衡下,流浪汉以0.2的 概率选择寻找工作,以0.8的概率选择游荡。
博弈论-混合策略纳什均衡

,以达到均衡状态。
政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析
政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析
博弈论-混合策略纳什均衡PPT课件

4 1
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
vG 1, 4 1 vG 0,
0.2
13
• 解二:支付等值法
如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即:
4
§剪刀、石头、布的游戏
• 因此,秘决在于—— • 自己的策略选择不能预先被对手方知道或猜
测到,在该博弈的多次重复中,博弈方一定 要避免自己的选择具有规律性; • 观察对手方策略选择是否具有规律或者偏好, 预先猜测对手策略,从而采用针对性策略赢 得这个博弈。
5
§ 第三章 混合策略纳什均衡
• 纯策略(pure strategies):如果一个策略 规定参与人在一个给定的信息情况下只选择 一种特定的行动。
• 混合策略(mixed strategies):如果一个策 略规定参与人在给定的信息情况下,以某种 概率分布随机地选择不同的行动。
• 在静态博弈里,纯策略等价于特定的行动, 混合策略是不同行动之间的随机选择。
6
§ 期望支付
• 与混合策略(mixed strategies)相伴随的一个问 题,是局中人支付的不确定性(uncertainty).可用 期望支付(expected payoff)来描述——有个n 可能的取值X1,X2…,Xn ,并且这些取值发生的概 率分别为p1,p2,…,pn,那么我们可以将这个数 量指标的期望值定义为发生概率作为权重的所有 可能取值的加权平均,也就是
对性的策略,使自己的支付增加。
9
求解混合策略纳什均衡
1、假定政府采用混合策略:
G ,1 即政府以的概率选择救济,1 的概率选择不救济。
第3章混合战略Nash均衡

All Rights Reserved, 2007, Luo Yunfeng
一、混合战略
• “猜硬币”博弈
两个参与人各握有一枚硬币,双方同时 选择是正面向上(记作O)还是背面向上(记作R), 即他们的战略空间都是{O, R}。若两枚硬币是 一致的(即全部背面向上或者全部正面向上), 参与人2赢得参与人1的硬币;若两枚硬币不一 致,则参与人1赢得参与人2的硬币。
二、混合战略Nash均衡
• 提一个问题: 在“猜硬币”游戏中,我们往往会以50%
的概率选择正面(O),以50%的概率选择反面 (R),即选择混合战略σ=(0.5,0.5)。那么有没 有参与人会偏离混合战略σi=(0.5,0.5)呢?
Control Science and Engineering, HUST
个概率分布 i
(
1 i
,
...,
K i
)
其中
j i
(
j
1,...,
K)
表示参与人i选择战略
sij
的概率,即 ij 满足:
K
0
j i
1
,
j i
1
j 1
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
All Rights Reserved, 2007, Luo Yunfeng
第三章混合战略Nash均衡
主要内容: 一、混合战略; 二、混合战略Nash均衡; 三、混合战略Nash均衡的求解。
Control Science and Engineering, HUST
混合策略纳什均衡概述(PPT 48张)

q 1
19
博弈论第三章 第一讲 概念与方法
作业
利用反应函数法求解“社会福利博弈” 是否需要调整数据? 可得出有关社会保障体系改革的结 论?
2019年2月26日
博弈论第三章 第一讲 概念与方法
20
友军博弈
英 国 支持巴顿 支持蒙帅 支持巴顿 4,3 2,2 美国 1,1 3,4 支持蒙帅
右
-5,-5,0 -1,-1,5
丙:B
博弈论第三章 第二讲多重纳什均衡
36
第三节多重纳什均衡的选择标准
五、抗共谋均衡 (二)共谋偏离(集体偏离)均衡的激励 1.如果集体偏离(上,左,A) (1)起因:甲、乙集体偏离,选(下,右, A) (2)结果:甲的支付0→1,乙的支付0→1 (3)结论:甲、乙有集体偏离的动机, (上,左,A)非抗共谋均衡
2019年2月26日
博弈论第三章 第一讲 概念与方法
17
二、研究方法:反应函数法
三、反应函数 2. Dela : Jim卖表的概率越小, Dela 剪发越好
UDel=2q(1-3p)+2p
1 ,ifp 1 /3 ,此时 1 3 p0 ,q 越大越好 q [ 0 , 1 ], ifp 1 /3 0 ,ifp 1 /3 ,此时 1 3 p0 ,q 越小越好
2019年2月26日
博弈论第三章 第二讲多重纳什均衡
37
第三节多重纳什均衡的选择标准
五、抗共谋均衡 (二)共谋偏离(集体偏离)均衡的激励 2.如果集体偏离(下,右,B) (1)若甲、乙集体偏离,选(上,左,B) -1→-2, -1→-2 (2)若甲、丙集体偏离,选(上,右,A) -1→-5, 5→0 (3)若乙、丙集体偏离,选(下,左,A) -1→-5, 5→0 (4)结论:缺乏集体偏离的激励, (下,右,B)为 抗共谋均衡
《博弈论与信息经济学》纳什均衡的应用 PPT

Qi a c 2Nb,市场价格为:p a c 2,总利润为: a c2 4b, 每家公司的利润为:i a c2 4Nb。当N 时,Qi 0,i 0,但总产量
和总利润保持原状。
❖ 2.豪泰林(Hotelling)价格竞争模型
• 豪泰林价格模型假定产品没有差别,但产品在空间位置 上有差别,有了不同的运输成本,造成价格的差别,由 此而引起价格竞争。
b
c1 c2
x p2 p1 2t 1 a b 2。
需求函数:D1 D2
p1, p1 b x b 1 a
b
2
2
p2 p1 2t p1 p2
p2 p1
p1 t p2 t
2t 。
2t
店1和店2的利润函数为:
1 p1 c D1 p1, p2 p1 c p2 p1 t 2t 2 p2 c D2 p1, p2 p2 c p1 p2 t 2t
§5.纳什均衡的应用
❖ 1.完全竞争模型
假定有N家厂商,价格函数为p a - bQ,总产量为Q Q1 L QN,如果公司1猜测
每一家其他公司的产量为Qi,那么,价格函数为:p a b Q1 N 1Qi ,公司1
的利润函数为:1 a b Q1 N 1Qi c Q1,求出利润最大化的条件为,也就
p2 t 1
x
根据纳什均衡的定义
R1 c2
R2
c1
c1 c2
c1
c2
也就是说,对于处于地点x的消费者,既可以到店1也可以到店2去购买商品,而这对
和总利润保持原状。
❖ 2.豪泰林(Hotelling)价格竞争模型
• 豪泰林价格模型假定产品没有差别,但产品在空间位置 上有差别,有了不同的运输成本,造成价格的差别,由 此而引起价格竞争。
b
c1 c2
x p2 p1 2t 1 a b 2。
需求函数:D1 D2
p1, p1 b x b 1 a
b
2
2
p2 p1 2t p1 p2
p2 p1
p1 t p2 t
2t 。
2t
店1和店2的利润函数为:
1 p1 c D1 p1, p2 p1 c p2 p1 t 2t 2 p2 c D2 p1, p2 p2 c p1 p2 t 2t
§5.纳什均衡的应用
❖ 1.完全竞争模型
假定有N家厂商,价格函数为p a - bQ,总产量为Q Q1 L QN,如果公司1猜测
每一家其他公司的产量为Qi,那么,价格函数为:p a b Q1 N 1Qi ,公司1
的利润函数为:1 a b Q1 N 1Qi c Q1,求出利润最大化的条件为,也就
p2 t 1
x
根据纳什均衡的定义
R1 c2
R2
c1
c1 c2
c1
c2
也就是说,对于处于地点x的消费者,既可以到店1也可以到店2去购买商品,而这对
混合策略纳许均衡课件

策略纳什均衡的算法优化。
混合策略纳什均衡与人工智能
02
随着人工智能的发展,可以尝试将混合策略纳什均衡应用于机
器学习和人工智能领域,以实现更高效和智能的决策。
混合策略纳什均衡与演化博弈论的结合
03
研究混合策略纳什均衡与演化博弈论的结合,可以更好地解释
现实生活中的动态博弈现象。
06
参考文献
参考文献
定义
混合策略纳什均衡课件
CONTENTSБайду номын сангаас
• 混合策略纳什均衡简介 • 混合策略纳什均衡的数学模型 • 混合策略纳什均衡的求解方法 • 混合策略纳什均衡的应用实例 • 混合策略纳什均衡的挑战与展
望 • 参考文献
01
混合策略纳什均衡简介
定义与概念
混合策略纳什均衡是一种博弈论中的概念,它描述了在给定对手策略的情况下,参 与者如何选择最优的行动方案。
定义策略空间
为每个参与人定义一个策略选 择的空间,这些策略可以是离 散的、连续的或混合的。
定义支付函数
根据每个参与人的策略选择, 定义他们的支付函数,即每个 参与人在该策略下的期望收益。
构建博弈矩阵
根据参与人的策略空间和支付 函数,构建一个博弈矩阵,用 以表示每个参与人选择不同策
略时的收益。
模型参数解 释
纳什均衡点或满足一定的收敛条件。
优化算法
优化算法是一种基于数学优化的方法,用于求解混合策略纳什均衡。
优化算法的基本步骤包括:定义一个目标函数,然后使用优化算法(如 梯度下降法、牛顿法等)寻找目标函数的最大值或最小值,从而得到纳
什均衡点。
优化算法的优点是能够快速找到纳什均衡点,适用于大规模问题。但缺 点是需要对问题进行数学建模,且对初始点的选择敏感。
《博弈论与信息经济学》混合战略纳什均衡--ppt课件全篇

放荡
32
-1 3
-1 1 0 0
1
ppt课件
假定父母选择支助的概率为p1,选择不支助的概率为p2 1- p1 ; 儿子选择立志的概率为q1,选择不立志的概率为q2 1- q1 。那么
对两个参与人,各自的盈利函数为:
v1
3 p1q1
1
p1q2
1
p2q1
5
p1q1
p1
q1
v2 2 p1q1 p2q1 3 p1q2 2 p1q1 q1 3 p1
一个混合战略均衡:p*, q* 3 4,1 4。
p
甲
1
3/4 乙
O 1/4
12
1q
ppt课件
▪ 解法2:代数法
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
v甲
p
v乙
q
4q 1 0 4p 3 0
p*
q*
3 4 1 4
13
ppt课件
▪ 例3(三人博弈)
K
pik 1,pik p sik 是i选择战略sik的概率,pi称为参与人i的混合战略。
k 1
i 代表i的混合战略空间,pi i 。
▪ (2)期望盈利
对于博弈G S1,..., Si ,..., Sn;u1,..., ui ,..., un,对应于s s1,..., si,..., sn 有p p1,..., pi ,..., pn ,pi i ,p表示局中人i的混合战略组合,那么,
2
即q 1 ,则p越小越好,而p的最小值只能取0;如果1 2q 0,
2
即q 1 ,则p能取任意值,即p 0,1。
2
对于乙来说,为使盈利达到最大,只有调整q。如果2 p 1 0,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8
博弈论与信息经济学
❖ 2.混合战略纳什均衡
▪ 例1.
对于n人混合博弈G S1,L , Sn;u1,L ,un,pi si i ,如果
p* p1*,L , pn* 满足vi pi*, p*i vi pi , p*i ,则称p*为该博弈
的混合战略纳什均衡。(海萨尼认为,混合战略博弈就是不
完全信息静态博弈。)
甲/乙
乙 红(q) 黑(1-q)
红(p) -1
11
-1
甲
黑(1-p) 1
-1 -1
1
2020/2/17
期望盈利为:v甲 v乙
p, p,
q q
2p 2q
1 2p
2q 1
2q 1 2 p 1
9
博弈论与信息经济学
2020/2/17
1
p1q2
1
p2q1
5
p1q1
p1
q1
v2 2 p1q1 p2q1 3 p1q2 2 p1q1 q1 3 p1
v1
p1
v2
q1
5q1 1 0 1 2 p1 0
p1 q1
p2 0.5 0.2,q2
• 混合战略:参与人在给定信息下以某种概率分布选择不 同的战略,在原来纯战略的基础上,选择某个战略的概 率分布称为混合战略。
2020/2/17
6
博弈论与信息经济学
2020/2/17
混合策略的定义:在n人博弈G S1,L , Sn;u1,L ,un中,假定参与人i有 K个纯战略,即Si si1,L , siK ,则概率分布pi pi1,L , piK ,0 pik 1,
K
pik 1,pik p sik 是i选择战略sik的概率,pi称为参与人i的混合战略。
k 1
i 代表i的混合战略空间,pi i 。
▪ (2)期望盈利
对于博弈G S1,..., Si ,..., Sn;u1,..., ui ,..., un,对应于s s1,..., si,..., sn 有p p1,..., pi ,..., pn ,pi i ,p表示局中人i的混合战略组合,那么,
儿子
立志
放荡
32
-1 3
-1 1 0 0
5
博弈论与信息经济学
• 从上例中可以看出,当参与人在选择战略具有不确定性, 考虑纳什均衡时,具体战略的盈利已经显得不很重要, 重要的是某个战略的概率分布,因此,纳什均衡的解也 就必须包含概率,这样的支付或盈利就称为期望盈利。
▪ (1)混合策略
• 纯战略:参与人在给定的信息下只选择一种特定战略, 这样情况下的战略,称为纯战略。
1 如果q 1 2
0 如果q 1 2
由此可知,这个博弈的纳什均衡为p* 1 2,q* 1 2。
p
甲
1
1/2
乙
O
1/2
1q
11
博弈论与信息经济学
2020/2/17
▪ 解法2:代数法
v甲 p, q 2 p 1 2q 2q 1 v甲
v乙
12
博弈论与信息经济学
2020/2/17
▪ 解法1:反应函数法
反应函数如下:
1
p 0,1
0
如果q 1 4
1
如果q 1 4,q 0,1
如果q 1 4
0
如果p 如果p 如果q
3 3 3
4 4 ,均衡 4
p*
q*
1, 1,
4q1 q2 11 p1 p2 1 0
p1*
1 2
,
p2*
0,
p3*
1 2
q1*
1 2
, q2*
0, q3*
1 2
r1*
1 2
,
r2*
0, r3*
1 2
18
博弈论与信息经济学
父母/儿子 父 支助 母 不助
儿子
立志
放荡
32
-1 3
-1 1 0 0
2
博弈论与信息经济学
假定父母选择支助的概率为p1,选择不支助的概率为p2 1- p1 ; 儿子选择立志的概率为q1,选择不立志的概率为q2 1- q1 。那么
对两个参与人,各自的盈利函数为:
v1
3 p1q1
4q1
p1
1
6
4
p1
C 3
1
r1
r2
4q1
2
p1
p2
2
4q2
p1
p2
1
9
8 p1
4
p2
2020/2/17
17
博弈论与信息经济学
2020/2/17
A A1 A2 A3 B B1 B2 B3 C C1 C2 C3
§6.混合战略纳什均衡
❖ 1.混合策略与期望盈利
▪ 例:浪子博弈
• 在这一博弈中,两个参与人都不知道对方选择是否确定地选择某个策略,因此, 按照以前所学的知识无法得出均衡解。但是,如果知道对方将以某一概率对某 一策略进行选择的话,就可以得出反应函数,就可以按照纳什均衡的方法求得 解。
2020/2/17
矩阵2
BB21
r1 2q1 r2 4 p1
q2 1 2 q1
q2
5
4
p1
B3
1
r1
r2
q1
8 p1
4
p2
6
q2
4
p1
4
p2
3
9
8 p1
4 p2
矩阵3
C1 C2
3r1 r2
• 三个局中人的混合战略为:p,q,r • 学习如何写出三个局中人的矩阵型表达式。
2020/2/17
15
博弈论与信息经济学
2020/2/17
A/B/C (sc=1)
1 A2
3
A/B/C (sc=2)
1 A2
3
A/B/C (sc=3)
1 A2
3
1 3,3,3 2,3,3 1,3,3
1 3,3,2 2,3,2 1,3,2
v甲
p
v乙
q
4q 1 0 4p 3 0
p*
q*
3 4 1 4
2020/2/17
14
博弈论与信息经济学
▪ 例3(三人博弈)
• 三个参与人A、B、C,每个人的战略集为{1,2,3}。每个人对应于某个战略 的支付是用三个人选择战略中的最小数字乘以4,再减去自己所选择战略的值。
1 3,3,1 2,3,1 1,3,1
B 2 3,2,3 2,2,3 1,2,3
B 2 3,2,2 6,6,6 5,6,6
B 2 3,2,1 6,6,5 5,6,5
3 3,1,3 2,1,3 1,1,3
3 3,1,3 6,5,6 5,5,6
3 3,1,1 6,5,5 9,9,9
16
博弈论与信息经济学
2
即p 1 ,则q越小越好,而q的最小值只能取0;如果2 p 1 0,
2
即p 1 ,则q能取任意值,即q 0,1。
2
10
博弈论与信息经济学
2020/2/17
0 如果q 1 2
1 如果q 1 2
反应函数:p 0,1如果q 1 2,q 0,1如果q 1 2
0.8
2020/2/17
3
博弈论与信息经济学
2020/2/17
▪ 进一步浪子博弈还可以作出如下解释:
期望盈利:v1 v2
3 p1q1 2q1 p1
p1q2 q1 p2
p2q1 3q2 p1
0
0
p1 5q1 1 q1 1 2 p1
q1 3
p,
q
2q
2
p
1
2
p
1
v乙
p q
1 2q 2p 1
0 0
p* q*
1 1
2 2
▪ 例2.
甲/乙
乙 德(q) 法(1-q)
德(p) 3
21
1
甲
法(1-p) 0
02
3
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
参与人i的期望盈利为:vi pi , pi
n
pj
sj
ui
s
。
sS j1
7
博弈论与信息经济学
2020/2/17
父母/儿子
支助 父 (p1) 母 不助
(p2)
儿子
立志(q1)
不立志(q2)
32
-1 3
-1 1
00