博弈论-混合策略纳什均衡.ppt

合集下载

混合策略纳什均衡

博弈论简介（3）
(混合策略纳什均衡)
一个不存在纳什均衡的例子
硬币配对——“零和博弈”（zero sum game）
甲乙各持一枚硬币，同时选择手中硬币的正反面。若他们硬币的朝向相同，乙将赢得甲的硬币。反之，甲将赢得乙的硬币。
参与人乙正面H
正面H -1，+1 +1，-1
反面T
+1，-1 -1，+1
按照无差异原则，均衡中的q应使这两个表达式相等。
硬币配对博弈的混合策略均衡
参与人2
正面H(q) 参与人1 正面H 反面T -1，+1 +1，-1 反面T(1-q) +1，-1 -1，+1
• 也就是：1-2q=2q-1，即q=0.5 • 对称地，可以得到参与人1的最佳应对p=0.5 • 因此，（0.5,0.5）是这个硬币配对博弈的混合策略纳什均衡（符合直
在各自概率策略的选择下，双方的期望收益互为最大（任何单方面改变不会增加其收益）纳什证明：具有有限参与者和有限纯策略集的博弈一定存在纳什均衡（包括混合策略均衡）一般来说，找到混合策略的纳什均衡是很困难的，但在某些特定条件下能有系统的方法。
双人双策略、不含纯策略均衡的博弈——混合策略纳什均衡
考虑硬币面向的博弈
他正面H H 你 T +1，-1 -1，+1 -1，+1 反面T +1，-1
• 你若知道对方的策略是以0.7的概率出H，你会采取什么策略？如果他的概率是0.2呢？
• 你若知道对方的策略是以0.5的概率出H，你会采取什么策略？
“0.5”策略在此有什么特别？
如果对方用0.5，我出什么都
混合策略的收益计算例子

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

博弈论-混合策略纳什均衡

，以达到均衡状态。
政治学的案例分析
总结词：国际关系
详细描述：在国际关系中，混合策略纳什均衡可以用来解释国家之间的竞争和合作。例如，两个国家可能会以一定的概率选择不同的外交政策，例如结盟、中立或对抗，以达到各自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中，混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如，捕食者可能会采用追逐和放弃两种策略来捕猎猎物，而猎物也可能会采用逃跑和装死两种策略来避免被捕食。最终，捕食者和猎物都以一定的概率随机选择不同的策略，以达到均衡
非合作博弈论
研究个体如何在不知道其他个体如何行动的情况下做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体，可以是个人、组织或国
家。
行动
参与者根据给定的信息所做出的决策。
信息
参与者在进行决策时所拥有的数据、情报或知
识。
策略
参与者为达到最优结果而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词：繁殖竞争
VS
详细描述：在生物种群中，不同个体之间会存在繁殖竞争。为了最大化自己的遗传贡献，个体可能会采用不同的交配策略，例如追求高繁殖成功率的策略或避免过度竞争的策略。混合策略纳什均衡可以用来描述这种竞争状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中，生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分析繁殖过程的均衡结果，解释生物多样性的形成机制。
05 混合策略纳什均衡的案例分析
经济学的案例分析

《博弈论：混合策略》课件

决策分析
在决策分析中，通过混合策略模型来评估各种可能决策的结果和影响。
社会行为
研究社会群体中个体间的相互作用和行为决策，混合策略模型可以提供有效的分析工具。
混合策过概率调整在不同策略之间灵活选择，能够获得更好的效益。
2
缺点
需要大量的计算和建模工作，对决策者的信息和计算能力有一定要求。
各个决策者的策略选择使得不再有单方面改变策略能够提高自己效益的动机。
混合策略的解释
灯光与阴影
可以将混合策略比喻为灯光与阴影相互交错的场景，决策者通过灯光与阴影来选择不同策略。
调色板
混合策略就像调色板上的颜料，不同的搭配可以得到丰富多样的色彩。
混合策略的应用
经济领域
混合策略在市场竞争、拍卖等方面的应用，分析参与者的策略选择与结果。
总结和结论
混合策略是博弈论中重要的概念和分析工具，通过灵活的策略选择和纳什均衡理论，可以帮助决策者在不确定环境中做出最优决策。
2 随机选择
个体在选择策略时以随机概率来决定每个可行策略的选择概率。
混合策略下的纳什均衡
1
混合纳什均衡
2
是混合策略博弈中的纳什均衡概念，表
示各个决策者通过随机策略选择达到均
衡状态。
3
纳什均衡
是博弈理论中的一个重要概念，指的是在博弈过程中，每个决策者根据其他决策者的行动选择了自己对应的策略。
均衡策略
博弈论：混合策略
博弈论研究决策者在不同利益关系下的选择与策略，并分析各个决策者所能获得的效益。
博弈论的定义
博弈论研究个体或组织在面对不确定行为时的决策问题，通过数学模型来分析各种策略和其结果。涉及多种经济、社会和政治场景。
混合策略的概念

博弈论-混合策略纳什均衡PPT课件

4 1

如果一个混合策略是流浪汉的最优选择，那一定意味着政府在救济与不救济之间是无差异的，即：
vG 1, 4 1 vG 0,
0.2
13
• 解二:支付等值法
如果一个混合策略是政府的最优选择，那一定意味着流浪汉在寻找工作与游闲之间是无差异的，即：
4
§剪刀、石头、布的游戏
• 因此，秘决在于—— • 自己的策略选择不能预先被对手方知道或猜
测到，在该博弈的多次重复中，博弈方一定要避免自己的选择具有规律性； • 观察对手方策略选择是否具有规律或者偏好，预先猜测对手策略，从而采用针对性策略赢得这个博弈。
5
§ 第三章混合策略纳什均衡
• 纯策略(pure strategies)：如果一个策略规定参与人在一个给定的信息情况下只选择一种特定的行动。
• 混合策略(mixed strategies)：如果一个策略规定参与人在给定的信息情况下，以某种概率分布随机地选择不同的行动。
• 在静态博弈里，纯策略等价于特定的行动，混合策略是不同行动之间的随机选择。
6
§ 期望支付
• 与混合策略(mixed strategies)相伴随的一个问题,是局中人支付的不确定性(uncertainty).可用期望支付(expected payoff)来描述——有个n 可能的取值X1,X2…,Xn ，并且这些取值发生的概率分别为p1,p2,…,pn，那么我们可以将这个数量指标的期望值定义为发生概率作为权重的所有可能取值的加权平均，也就是
对性的策略，使自己的支付增加。
9
求解混合策略纳什均衡
1、假定政府采用混合策略：
G ,1 即政府以的概率选择救济，1 的概率选择不救济。

《博弈论与信息经济学》纳什均衡的应用-PPT精选全文完整版

pi 2 ln Y ln N 2 ln N 1 ln n 1 ln y 1
p
N
n
2 ln Y
N
n
1 ln
N
N
n
2 ln
N
1
N n 1 ln n 1 N n 1 ln y 1
si
2 ln Y
2 ln
N
2 ln
n
2
ln
y
1
s
N
n
2 ln Y
N
n
2 ln
N
N
n
2 ln
n
2
p 2 ln y 3 ln y 6 2 ln y 3 y 6 4 ln y 4 ln 3 2 ln 2
s
4 ln y
4 4 ln y 8ln 2
s p 8ln 2 4 ln 3 2 ln 2 4 ln 3 6 ln 2 ln 81 ln 64 2 ln 9 8 0
y ，
6
2
ln
y 3
ln
y 6
每一期的消费量y1
2 3
y，y2
1 3
y
10
博弈论与信息经济学
2024/10/15
b.社会效益最大化模式假定以整个村庄的人对公地消费的总体效用达到最大化为目标，即公地问
题的社会最优问题。
ln c1
ln c2
2 ln
y
c1 c2
2
最优条件为：
c1
pi s
p
2024/10/15
16
博弈论与信息经济学
比较的结果说明：
1 从社会整体上看，以社会利益最大化为目的的消费管理
方式优于以个人利益最大化的消费管理方式；

混合策略纳什均衡

03 混合策略纳什均衡的证明方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法，它首先假设与结论相反的命题成立，然后通过逻辑推理和数学推导，得出矛盾的结论，从而证明原命题的正确性。在证明混合策略纳什均衡的存在时，反证法可以用来证明当其他玩家采取了最优策略时，某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下，每个参与者都只有一个最优反应，从而避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某些博弈中，至少存在一个策略组合，使得每个参与者在给定其他参与者策略的情况下，采用混合策略是最优的。
存在性通常通过数学证明和计算机搜索等方法来证明，但并不是所有博弈都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念，它描述了在给定对手策略的情况下，参与者如何选择最优策略以最大化自己的期望收益。
代数法是一种通过数学符号和公式进行推理和证明的方法。在证明混合策略纳什均衡的存在时，代数法可以用来推导和证明纳什均衡的条件和性质，利用代数性质和技巧来证明均衡的存在。
04 混合策略纳什均衡的应用场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞争策略，特别是在不完全竞争市场和寡头垄断市场中。通过混合策略纳什均衡，可以研究企业在不确定环境下的最优反应，以及企业如何通过调整其策略来应对竞争对手的行为。

混合策略纳什均衡

博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方法
二、反应对应法
例：扑克牌对色游戏(p77)
先看甲的最优反应，记为r*=R(q)：观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0，无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
纯策略（确定性）
q*=R(r)
(陈明德语) r 1 3/4
r*=R(q)
0 1/4 1 q （钟信德语）
博弈论第三章混合策略纳什均衡
第三节寻找多重纳什均衡
二、反应对应法：情侣博弈
支付的帕累托优势：初步印象 π陈明=r(4q-1)+2(1-q)，π钟信=q(4r-3)+(3-2r) r*=0, q*=0 纯策略（确定性）
第三节寻找多重纳什均衡
例：情侣博弈
两个（多个）纯策略纳什均衡问题：纳什均衡找完了吗？有无混合策略纳什均衡？
一、支付最大化法
给定混合策略p陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) r Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2二节混合策略纳什均衡的求解方法
二、反应对应法
例：扑克牌对色游戏(p77) 无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q)

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

游闲
政府
救济不救济
政府和流浪汉的博弈
• 思考：政府会采用纯策略吗？流浪汉呢？这个博弈有没有纯策略的纳什均衡？
• ——跟你玩剪子石头布游戏一样，你会一直采用纯策略吗？
• 那么政府和流浪汉最有可能采用什么策略？ • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略，就可以采用针
对性的策略，使自己的支付增加。
§剪刀、石头、布的游戏
• 因此，秘决在于—— • 自己的策略选择不能预先被对手方知道或猜
测到，在该博弈的多次重复中，博弈方一定要避免自己的选择具有规律性； • 观察对手方策略选择是否具有规律或者偏好，预先猜测对手策略，从而采用针对性策略赢得这个博弈。
§ 第三章混合策略纳什均衡
• 纯策略(pure strategies)：如果一个策略规定参与人在一个给定的信息情况下只选择一种特定的行动。
求解混合策略纳什均衡
1、假定政府采用混合策略：
G,1 即政府的以概率选1择的救概济率，选择不
2、流浪汉的混合策略为：
L,1 即流浪的汉概以率选择 1寻的找概工率作选，择
解一:支付最大化
那么，政府的期望效用函数为：
v G G , L 3 1 1 1 0 1 5 1
• 政府选择救济策略
• 政府选择不救济策略
1
期望效用
0 期望效用
vG1, 3 11 vG0, 1 01
4 1
如果一个混合策略是流浪汉的最优选择，那一定意味着政府在救济与不救济之间是无差异的，即：
v G 1 ,4 1 v G 0 , 0 .2
• 解二:支付等值法
如果一个混合策略是政府的最优选择，那一定意味着流浪汉在寻找工作与游闲之间是无差异的，即：
E A U p 1 X 1 p 2 X 2 . .p .n X n
政府和流浪汉的博弈
• 政府想帮助流浪汉，但前提是后者必须试图寻找工作，否则，不予帮助；而流浪汉若知道政府采用救济策略的话，他就不会寻找工作。他们只有在得不到政府救济时才会寻找工作。他们获得的支付如图所示：
流浪汉
寻找工作
§剪刀、石头、布的游戏
• 我们知道—— • 如果博弈只进行一次，我们无法明确预测博
弈的结果，不管是哪个博弈方，也不管他们的选择是哪个策略，都不能保证得到较好的结果。根据我们上一章所学的方法，这个博弈没有纳什均衡。
• 那么是不是意味着这样的博弈中，你可以随意选择，结果都一样呢？
§剪刀、石头、布的游戏
对上述效用函数求微分，得到政府最优化的一阶条件为：
v G 5 1 0 0 .2
就是说，从政府的最优化条件找到流浪汉混合策略— —流浪汉以0.2的概率选择寻找工作，0 .8的概率选择游闲。
• 解一:支付最大化
• 流浪汉的期望效用函数为：
L
2 1 0
0.5
解二:支付等值法
核心概念的根本原因之一。
§扑克牌对色游戏
• 甲乙玩扑克牌对色游戏，每人都有红黑两张扑克牌，约定如果出牌颜色一样，甲输乙赢，如果出牌颜色不一样，则甲赢乙输。
• 答案是否定的。
• 事实上，局中人的选择仍然是很有讲究的，策略选择的好坏对局中人的利益仍然有很大的影响。
• 在这个零和博弈里，无论双方采用哪种策略组合，结果都是一方输一方赢，而输的一方又总是可以通过单独改变策略而反输为赢。如果哪个局中人能找到对手方的规律或者偏好，他就能猜测到对手的策略而采用针对性策略从而保证赢。
§ 第三章混合策略纳什均衡
• 混合策略与期望支付 • 计算混合策略纳什均衡的三种方法 • 支付最大值法 • 支付等值法 • 反应函数法 • 多重纳什均衡及其甄别 • 混合博弈在现实经济中的运用案例排对应的同学玩剪刀、石头、布的游戏.
• 玩二十次,将结果记下来 • 赢了十次以上同学举起手来 • 告诉我你有什么秘决 • 怎么样才能赢得多？
vL1,13vL0, 0.5
政府和流浪汉的博弈
• 如果政府救济的概率小于0.5； • 则流浪汉的最优选择是寻找工作； • 如果政府救济的概率大于0.5； • 则流浪汉的最优选择是游闲等待救济。 • 如果政府救济的概率正好等于0.5； • 流浪汉的选择无差异。
讨论
• 上面的均衡要求每个参与人以特定的概率选择纯策略。也就是说，一个参与人选择不同策略的概率不是由他自己的支付决定的，而是由他的对手的支付决定的。
• 正是由于这个原因，许多人认为混合策略纳什均衡是一个难以令人满意的概念。
• 事实上，正是因为它在几个（或全部）策略之间是无差异的，他的行为才难以预测，混合策略纳什均衡才会存在。
讨论
• 尽管混合策略不像纯策略那样直观，但它确实是一些博弈中参与人的合理行为方式。扑克比赛、垒球比赛、划拳就是这样的例子，在这一类博弈中，参与比赛的总是随机行动以使自己的行为不被对方所预测。
• 混合策略(mixed strategies)：如果一个策略规定参与人在给定的信息情况下，以某种概率分布随机地选择不同的行动。
• 在静态博弈里，纯策略等价于特定的行动，混合策略是不同行动之间的随机选择。
§ 期望支付
• 与混合策略(mixed strategies)相伴随的一个问题,是局中人支付的不确定性(uncertainty).可用期望支付(expected payoff)来描述——有个n可能的取值X1,X2…,Xn ，并且这些取值发生的概率分别为p1,p2,…,pn，那么我们可以将这个数量指标的期望值定义为发生概率作为权重的所有可能取值的加权平均，也就是
• 经济学上的监督博弈也是这样一个例子。如税收检查、质量检查、惩治犯罪、雇主监督雇员等都可以看成猜谜博弈。
纳什均衡的存在性
纳什定理：在一个由n个博弈方的博弈G {S1, Sn;u1, 中un ，}
如果n是有限的，且都S是i 有限集(对 i 1,) ，n则该博弈
至少存在一个纳什均衡，但可能包含混合策略。 • 证明过程省略，主要根据是布鲁威尔和角谷的不动点定理。 • 纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析