混合策略博弈例
博弈论-混合策略纳什均衡

政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析
Chapter08混合策略同时博弈II:非零和博弈

混合策略同时博弈II:非零和博弈 和III:一般性讨论 Simultaneous-Move Games with Mixed Strategies II: Non-Zero-Sum Games and III: General Discussion 第8章 Chapter 08混合策略同时博弈:非零和博弈 Simultaneous-Move Games with Mixed Strategies: Non-Zero-Sum Games 在非零和博弈中,参与者之间没有明显的利益 冲突,也就没有普遍的理由来对对手隐藏其利 益所在。
In non-zero-sum games, player do not have clearly conflicting interests and have no general reason to want to conceal their interests from others. 因此,迷惑对手就不一定有道理。
As a result, there is no general argument for keeping the other player guessing.Slide 2由于不确定的信念导致的混合策略 Mixing Sustained by Uncertain Beliefs不过,由于是同时博弈,参与者可能不得不持 有对对手行动的某种不确定性的信念,因而也 就不能确定地给出自己的最优行动。
However, Simultaneous play can still lead players to have uncertain beliefs about the actions of a rival player and therefore to be uncertain about their own best actions.Slide 3哈里和萨莉能否会面? Will Harry Meet Sally?SALLY Starbucks Starbucks HARRY Local Latte 0, 0 2, 2 1, 1 Local Latte 0, 0Slide 4哈里和萨莉能否会面? Will Harry Meet Sally?Sally’s Payoffs2Local LatteSally’s best-response1Starbucks0 2/3Harry’s p-mix1Slide 5哈里和萨莉能否会面? Will Harry Meet Sally?Sally’s 1 q-mix2/33 Nash EquilibriaHarry’s best response02/3Harry’s p-mixSlide 61Sally’s best response哈里和萨莉能否会面? Will Harry Meet Sally?混合策略均衡下每个人的期望收益为2/3,小于任何 一个纯策略均衡(2或1)。
第三讲_混合策略纳什均衡

混合策略
◆混合策略定义:在n人博弈的策略式表述 G S1, , Sn ; u1, , un Si Si1, , SiK ,那么,概率 中,假定参与人 i 有K个纯策略: 分布 pi pi1 , , piK 称为 i 的一个混合策略,这里
pik p(sik ) 是 i 选择 sik 的概率,对于所有
这个故事曾经被很多人当作博弈论的例 子来演绎,但实际上这个故事与博弈论无关。 博弈论会假定所有局中人都是理性的,不能假 定一些局中人聪明而另一些局中人却是傻子。 当田忌出下马时,齐威王最好的选择是出下马 而不是上马。孙膑的计谋中假定齐威王是傻子 ,当田忌出下、上、中马时,他仍然按上、中 、下马出,当然要输了。事实上,当田忌出下 马时,齐威王应出下马,但齐威王出下马时, 田忌不应出下马而是出中马,但此时齐威王又 应出中马而不是下马了,……。这样,博弈不 会有纯战略的均衡。
-2,3
2,2
假定老板选择混合战略(0.2,0.8) 工人选择“偷懒”期望支付为(-1)×0.2+3×0.8=2.2 工人选择“不偷懒”(期望)支付为2×0.2+2×0.8=2 工人应选择“偷懒” 老板选择“监督” “不偷懒’……
假定老板选择混合战略(0.5, 0.5) 工人选择“偷懒”期望支付 0.5 为 (-1)×0.5+3×0.5=1 工人选择“不偷懒”期望支 0.5 付为2×0.5+2×0.5=2 工人应选择“不偷懒” 老板选择“不监督” 工人选择“偷懒’……
由 VA =VB 可得 :q=0.8 博弈方2:
VB =3q (1 q)
博 弈 方 1
A B
VC =3 p (1 p)
VD =2 p 5(1 p)
博弈论—混合策略与随机行动

第十六页,共46页。
混合策略—案例(àn lì)
• 混合战略NE • 随着(suízhe)人数n的增加,p减小,即人越
多,每个人选择报案的概率就会越小,如果n= 1,则p=1 • 社会心理学与博弈分析
混合策略—案例(àn lì)
• 报案(reporting a crime) • n个人目睹一桩罪行,每个人都希望报警,
但是都倾向于其他人打电话。特别的, 假定能从报警中得到v单位的收益,而打 电话的人需要付出c单位的成本,v>c>0。 分析这个(zhè ge)问题的纯战略NE和混 合战略NE。
第十四页,共46页。
第十二页,共46页。
怎样(zěnyàng)随机行动?
实验(shíyàn)抛硬币 抛硬币翻出正面之后再抛一次,这时出正面的可能性与抛 出反面(fǎnmiàn)的可能性相等。
无规律的随机行动(点名4/18=22%,不点名78%)。
例如:一个秘密的、足够复杂以致让人难以破解的规则。 举例:秘密
第十三页,共46页。
如果守门员选择(xuǎnzé)左边,你混合策略成功的概率: x*58%+ (1-x)* 93% 如果守门员选择(xuǎnzé)右边,你混合策略成功的概率: x*95%+ (1-x) * 70% 两者相等,求得选x=0.383
第九页,共46页。
混合策略
不管守门员选择他的左边还是右边,你的最佳混合(hùnhé) 比例都会使你得到相等的成功率 (4)以0.383:0.617的比例随机(suí jī)地选择左边或右边。 如果守门员选择左边,你混合策略成功的概率: 0.383*58%+ 0.617* 93%=79.6% 如果守门员选择右边,你混合策略成功的概率: 0.383*95%+ 0.617 * 70% =79.6%
混合策略纳什均衡

博弈论 第三章 混合策略纳什均衡
r*=R(q)
反应对应曲线
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
再看乙的最优反应,记为q*=R(r): 观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
若r 1 / 2 2r 1 0, q越大越好 1, q* R( r ) [0,1], 若r 1 / 2 2r 1 0,无论q选什么都无影响 0, 若r 1 / 2 2r 1 0, q越小越好
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
先看甲的最优反应,记为r*=R(q): 观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0,无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
解:Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q
f.o.c. 2r-1=0
r*=1/2
混合策略纳什均衡是甲在策略空间{红,黑}上以概率分布 p甲*= (1/2,1/2)进行选择,乙也在策略空间{红,黑}上以概率p乙*= (1/2,1/2)进行选择
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、支付最大化法
例:扑克牌对色游戏(p77)
无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q(-1)+(1-q) 1]+ (1-r)[q1+(1-q)(-1)] = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r1+(1-r)(-1)]+ (1-q)[r(-1)+(1-r)1] =2q(2r-1)-(2r-1) f.o.c. 1-2q=0 q*=1/2
博弈论---混合战略纳什均衡

义为:
n
vi ( i , i ) ( j (s j ))ui (s) sS j1
n个参与人的混合战略纳什均衡
让我们以两人博弈为例说明这一点。假定S1 (s11, , s1K ) ,
即参S2与人(s12有1 ,K 个, s2纯J )战略,参与人2有J个纯战略。若参与人1相
1k
2 j u1 ( s1k , s2 j )
1k 2 j u1 ( s1k , s2 j )
K 1
j 1
K 1 j1
这里,1k 2 j 是参与人1选择 s1k 且参与人2选择 s2 j 的概率,即纯 战略组合 (s1k , s2 j )发生的概率。
n个参与人的混合战略纳什均衡
混合战略纳什均衡
用上述方法:求该猜谜游 戏的混合战略纳什均衡
正面 反面
正面
1 -1,
-1 1,
反面
-1 1,
1 -1,
如何理解混合战略 ——虚张声势
一个参与人选择混合战略的目的是给其 他参与人造成不确定性,这样尽管其他 参与人知道他选择某个特定纯战略的概 率是多少,但不知道实际上对手会采用 哪个战略。正是因为它在几个战略之间 的无差异性,他的行为才难以预测,混 合战略均衡才会出现。
小猪
大猪
按 等待
按 5,1 9,-1
等待 4,4 0,0
正面
1
正面 -1,
反面
-1 1,
-1
反面 1,
1 -1,
混合战略纳什均衡
在n个参与人博弈的战略式表述 G S1,, Sn;u1,,un
中,假定参与人 i 有K个纯战略:Si Si1, , Sik ,那么,
与人关心的是其期望效用。 最优混合战略:是指使期望效用函数最大的混合
混合策略

第一节 混合策略与期望支付
二、期望支付 (一)分析 1.概率 (偷,睡)的概率:pq (偷,不睡)的概率:p(1-q) (不偷,睡)的概率:(1-p)q (不偷,不睡)的概率:(1-p)(1-q)
第一节 混合策略与期望支付
二、期望支付 (一)分析 2.期望支付 U小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1p)(1-q)=2p(5q-1) U守卫= (-2) pq+0p(1-q)+8(1p)q+0(1-p)(1-q)=2q(4-5p)
小偷与守卫博弈
无纳什均衡,如何分析?
第一节 混合策略与期望支付
一、混合策略 (二)混合策略 1.表述 参与人按照一定概率,随机从策略 组合中选择一种策略作为实际行动 随机行动的目的:使自己的行为不被 对手预测
混合策略
小偷的混合策略 以p的概率偷,(p,1-p) 守卫的混合策略 以q的概率睡(q,1-q)
第一节 混合策略与期望支付
一、混合策略 (二)混合策略 2.相对概念:纯策略 每个参与人的非随机性选择 纯粹行动计划,p=100%,1-p=0
第一节 混合策略与期望支付
一、混合策略 (二)混合策略 3.数学刻画 给定博弈G={S1,…,Sn;u1,…,un}以及参 与人i的纯策略Si= {si1,…,sik} 概率分布pi=(pi1,…,pik)为混合策略 其中:0≤ pik ≤1,∑ pik=1, pik=p( sik ) 混合策略组合p=(p1,…,pi,…pn)
两情若是久长时
足球 John 芭蕾 Candy 足球 芭蕾
2,1 0,0
-1,-1
1,2
研究方法:支付等价法
博弈论混合策略纳什均衡

博弈方1 (0.8,0.2) 2.6
博弈方2 (0.8,0.2) 2.6
夫妻之争的混合策略纳什均衡
看看这个博弈有几个均衡?
时装 妻 子
足球
时装 2, 1
丈夫
足球 0, 0
0, 0
1, 3
夫妻之争
存在两个纯策略均衡
时装 妻 子
足球
时装 2, 1
丈夫
足球 0, 0
0, 0
1, 3
夫妻之争
还存在混合策略纳什均衡
vL1,13vL0, 0.5
政府和流浪汉的博弈
• 如果政府救济的概率小于0.5; • 则流浪汉的最优选择是寻找工作; • 如果政府救济的概率大于0.5; • 则流浪汉的最优选择是游闲等待救济。 • 如果政府救济的概率正好等于0.5; • 流浪汉的选择无差异。
讨论
• 上面的均衡要求每个参与人以特定的概率选择纯策略。也就是说,一个参与人选择不同策略 的概率不是由他自己的支付决定的,而是由他的对手的支付决定的。
n
• 证明过程省略,主要根据是布鲁威尔和角谷i 的不动点定理。
• 纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。
§扑克牌对色游戏
• 甲乙玩扑克牌对色游戏,每人都有红黑两张扑克牌,约定如果出牌颜色一样,甲输乙赢,如果 出牌颜色不一样,则甲赢乙输。
• 找到这个博弈的纳什均衡。
字母说明
• 此博弈不存在纯策略纳什均衡。 • 我们用p代表税收机关检查的概率;q代表纳税人逃税的概率。
求解:混合战略纳什均衡之一
• 假定纳税人采用混合策略达到最优选择时,则税收机关在检查和不检查两种策略的期望收益 相等:
• (a-C+F) q+(a-C)(1- q)=a(1- q) • q*=C/(a+F)