F-博弈论专题-4-1混合纳什均衡

合集下载

博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡？1、纳什均衡（Nash equilibrium )，又称非合作博弈均衡，是博弈论概念，指的是：一种博弈稳定结果，谁单方改变策略，谁就会损失。

两个囚徒互相揭发，就是一种纳什均衡。

对于每个囚徒来说，如果打破纳什均衡，在对方实施揭发策略时，改变揭发策略，保持沉默，自己就会由判刑2年，变成判刑5年。

也就是说，两个囚徒互相揭发是稳定博弈结果，谁单方改变策略，就会受到损失。

这也就是均衡涵义所在，两个囚徒从利己角度，都不会单方改变策略。

博弈策略稳定，博弈结果也稳定。

之所以命名为纳什均衡，是因为提出者是经济学家、博弈论创始人约翰．纳什。

之所以称为非合作博弈均衡，原因就是：两个囚徒如果合作，互相保持沉默，各自只要坐牢1年；但最终博弈结果，也就是纳什均衡显著特征，是不合作。

2、纳什均衡意义重大。

纳什均衡提出，震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说：“你只要教会鹦鹉说‘需求和供给’，它也是经济学家。

”博弈论专家坎多瑞则说：“这只鹦鹉现在必须多学一个词了，那就是‘纳什均衡’。

”诺贝尔经济学奖得主迈尔森也说：“发现纳什均衡意义，可以和生命科学中发现DNA 双螺旋结构相媲美。

”纳什也因为提出纳什均衡，创立博弈论，而获得1994年诺贝尔经济学家奖。

纳值均衡意义重大，简单来说，就是它对于经济学具有重大意义。

读友们如果了解经济学看不见的手原理，就知道，古典经济学认为，通过市场这只‘看不见的手’调节，个体追求私利行为，会促进集体利益最大化。

但纳什均衡却违反上述原理：两个囚徒分别追求私利行为，并没有促进集体（囚徒整体）利益最大化，反而是损人不利己。

这正是市场失灵软肋之处，通过博弈论视角可以得到合乎逻辑解释，更有条件找到合适解决方案。

从上述这点，读友们可以“一斑窥全豹”，感受到博弈论重要性。

更重要的是，纳什均衡非常普遍，小至个人沟通，中到公司竞争，大到国家往来，都可以观察到。

Q2：怎样运用纳什均衡？1、分析囚徒困境。

博弈论-混合策略纳什均衡

，以达到均衡状态。
政治学的案例分析
总结词：国际关系
详细描述：在国际关系中，混合策略纳什均衡可以用来解释国家之间的竞争和合作。例如，两个国家可能会以一定的概率选择不同的外交政策，例如结盟、中立或对抗，以达到各自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中，混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如，捕食者可能会采用追逐和放弃两种策略来捕猎猎物，而猎物也可能会采用逃跑和装死两种策略来避免被捕食。最终，捕食者和猎物都以一定的概率随机选择不同的策略，以达到均衡
非合作博弈论
研究个体如何在不知道其他个体如何行动的情况下做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体，可以是个人、组织或国
家。
行动
参与者根据给定的信息所做出的决策。
信息
参与者在进行决策时所拥有的数据、情报或知
识。
策略
参与者为达到最优结果而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词：繁殖竞争
VS
详细描述：在生物种群中，不同个体之间会存在繁殖竞争。为了最大化自己的遗传贡献，个体可能会采用不同的交配策略，例如追求高繁殖成功率的策略或避免过度竞争的策略。混合策略纳什均衡可以用来描述这种竞争状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中，生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分析繁殖过程的均衡结果，解释生物多样性的形成机制。
05 混合策略纳什均衡的案例分析
经济学的案例分析

博弈论混合策略纳什均衡名词解释

博弈论混合策略纳什均衡名词解释博弈论混合策略纳什均衡是指在博弈论中，当参与者不能确定选
择某一个策略时，采取混合策略的情况下达到的均衡状态。

具体来说，混合策略是指在一个博弈中，参与者以一定的概率选
择不同的纯策略。

而纳什均衡是指在一个博弈中，参与者无法通过单
独改变自己的选择来获得更好的结果，即不存在任何参与者可以通过
改变自己的策略来让其他参与者不再选择当前策略。

混合策略纳什均衡是指游戏中所有参与者以一定的概率选择不同
的纯策略，并且这种概率分配对于所有参与者都是最优的。

也就是说，在混合策略纳什均衡下，参与者没有更好的选择可供其采取，而其他
参与者也没有更好的概率分配可供其选择。

拓展：
在博弈论中，还有许多其他类型的均衡概念，例如纯策略纳什均衡、帕累托均衡、部分均衡等等。

纯策略纳什均衡是指游戏中参与者
以确定性的纯策略进行选择，使得没有参与者可以通过改变其策略来
获得更好的结果。

帕累托均衡是指在一个博弈中，不存在可以改善任
何一个参与者的情况。

部分均衡是指只有某些参与者达到均衡状态，而其他参与者未达到均衡状态。

博弈论是研究决策制定者在相互影响下进行决策的数学工具。

通过分析不同的博弈策略和可能的结果，博弈论可以帮助我们理解冲突和合作的情况，并提供一些决策建议。

混合纳什均衡

混合纳什均衡纳什均衡是指这样一种均衡：在这一均衡中，每个博弈参与人都确信，在给定其他参与人战略决定的情况下，他选择了最优战略以回应对手的战略。

”也就是说，所有人的战略都是最优的。

而讲解“纳什均衡”的最著名的案例就是“囚徒的困境”。

a,b两个囚徒，a坦白b抵赖，b判10年，a判1年.若两人均坦白则各判5年，若两人均抵赖则都判2年。

a，b 面临抉择。

显然最好的策略是双方都抵赖，结果是大家都只被判2年。

但是由于两人处于隔离的情况下无法串供，按照亚当·斯密的理论，每一个人都是一个“理性的经济人”，都会从利己的目的出发进行选择。

这两个人都会有这样一个盘算过程：假如他招了，我不招，得坐10年监狱，招了才5年，所以招了划算；假如我招了，他也招，得坐5年，他要是不招，我就只坐1年，而他会坐10年牢，也是招了划算。

综合以上几种情况考虑，不管他招不招，对我而言都是招了划算。

两个人都会动这样的脑筋，最终，两个人都选择了招，结果都被判5年刑期。

原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。

这就是著名的“囚徒困境”。

它实际上反映了一个很深刻的问题，这就是个人理性与集体理性的矛盾。

混合策略均衡求解的一个原则是混合策略均衡赋予正概率的所有纯策略的期望收益相等。

假设这是个两个玩家的游戏。

玩家a有2种纯策略a和b，不能相互支配。

玩家b有2种纯策略c和d，不能相互支配。

设a选a的几率是p，则选b的几率为1-p；设b选c的几率是q，则选d的几率为1-q当a取某一个p=p0，b获得的总效用不为自己q的取值而改变；b取某一个q=q0，a获得的总效用不为自己p 的取值而改变，此时我们说（p0，1-p0）和（q0，1-q0）是一对混合策略下的纳什均衡。

混合策略纳什均衡：在n个参与人的博弈G={S1，...Sn;u1，...un}中，混合策略组合构成一个纳什均衡，如果对于所有的i=1，2...，n下式成立：也就是说，如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略，这个策略就构成一个纳什均衡，不管这个策略是混合策略还是纯策略。

博弈论混合策略纳什均衡

字母说明
• 此博弈不存在纯策略纳什均衡。 • 我们用p代表税收机关检查的概率；q代表纳税人逃税的概率。
求解：混合战略纳什均衡之一
• 假定纳税人采用混合策略达到最优选择时，则税收机关在检查和不检查两种策略的期望收益相等：
• (a-C+F) q+(a-C)(1- q)=a(1- q) • q*=C/（a+F）
用期望支付(expected payoff)来描述——有个n可能的取值X1,X2…,Xn ，并且这些取值发生的概率分别为p1,p2,…,pn，那么我们可以将这个数量指标的期望值定义为发生概率作为权重的所有可能取值的加权平均，也就是
E A U p 1 X 1 p 2 X 2 . .p .n X n
vL1,13vL0, 0.5
政府和流浪汉的博弈
• 如果政府救济的概率小于0.5； • 则流浪汉的最优选择是寻找工作； • 如果政府救济的概率大于0.5； • 则流浪汉的最优选择是游闲等待救济。 • 如果政府救济的概率正好等于0.5； • 流浪汉的选择无差异。
讨论
• 上面的均衡要求每个参与人以特定的概率选择纯策略。也就是说，一个参与人选择不同策略的概率不是由他自己的支付决定的，而是由他的对手的支付决定的。
• 混合策略(mixed strategies)：如果一个策略规定参与人在给定的信息情况下，以某种概率分布随机地选择不同的行动。
• 在静态博弈里，纯策略等价于特定的行动，混合策略是不同行动之间的随机选择。
§ 期望支付 • 与混合策略(mixed strategies)相伴随的一个问题,是局中人支付的不确定性(uncertainty).可
时装C 妻子
足球F
丈夫
时装C

纳什均衡

纳什均衡在政治学中的应用
选举策略：候选人在竞选活动中的决策和策略选择政治谈判：国家间在谈判过程中的策略选择和利益平衡国际关系：国家间在合作与竞争中的决策和策略选择政治制度设计：政治制度设计中的决策和策略选择，如选举制度、议会制度等
纳什均衡在管理学中的应用
战略决策：企业在市场竞争中，通过纳什均衡分析，制定最优策略。组织结构：纳什均衡理论可以帮助企业优化组织结构，提高管理效率。激励机制：纳什均衡理论在企业激励机制设计中，可以指导企业制定有效的激励措施。谈判与合作：纳什均衡理论在企业谈判与合作中，可以帮助企业实现利益最大化。
纳什均衡的应用
博弈论：纳什均衡是博弈论的核心概念，用于分析各种博弈问题经济学：纳什均衡在经济学中广泛应用，如市场均衡、价格均衡等政治学：纳什均衡在政治学中用于分析政治博弈，如选举、谈判等社会学：纳什均衡在社会学中用于分析社会现象，如群体行为、社会规范等
纳什均衡的求解方法
第二章
纳什均衡的求解条件
纳什均衡
目录
CONTENTS
01 纳什均衡的概念 02 纳什均衡的求解方法 03 纳什均衡与博弈论 04 纳什均衡的局限性
05 纳什均衡纳什均衡的定义
纳什均衡是指在一个博弈中，每个参与者的策略都是对其他参与者策略的最优反应。
纳什均衡是博弈论中的一个重要概念，由约翰·纳什提出。
纳什均衡的求解步骤
确定博弈的参与者和策略集
建立支付矩阵，表示参与者在不同策略下的收益
计算每个参与者的最佳反应策略
检查是否存在纳什均衡，即每个参与者的策略都是对其他参与者策略的最佳反应
如果存在纳什均衡，则求解得到均衡策略；如果不存在，则重新调整策略集或支付矩阵，重复步骤3-4。

混合策略纳什均衡

03 混合策略纳什均衡的证明方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法，它首先假设与结论相反的命题成立，然后通过逻辑推理和数学推导，得出矛盾的结论，从而证明原命题的正确性。在证明混合策略纳什均衡的存在时，反证法可以用来证明当其他玩家采取了最优策略时，某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下，每个参与者都只有一个最优反应，从而避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某些博弈中，至少存在一个策略组合，使得每个参与者在给定其他参与者策略的情况下，采用混合策略是最优的。
存在性通常通过数学证明和计算机搜索等方法来证明，但并不是所有博弈都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念，它描述了在给定对手策略的情况下，参与者如何选择最优策略以最大化自己的期望收益。
代数法是一种通过数学符号和公式进行推理和证明的方法。在证明混合策略纳什均衡的存在时，代数法可以用来推导和证明纳什均衡的条件和性质，利用代数性质和技巧来证明均衡的存在。
04 混合策略纳什均衡的应用场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞争策略，特别是在不完全竞争市场和寡头垄断市场中。通过混合策略纳什均衡，可以研究企业在不确定环境下的最优反应，以及企业如何通过调整其策略来应对竞争对手的行为。

混合纳什均衡

混合纳什均衡混合纳什均衡是一种多人博弈模型，也被称为“混合博弈”，可以模拟多方参与者协商、合作和竞争的过程。

这种理论是基于纳什均衡的，在纳什均衡中，每个参与者都有唯一的利益，各参与者的最优策略协作，从而达到最大的利益。

混合纳什均衡是一种非零和纳什均衡，这意味着在一局游戏中，所有参与者可以实现共赢的结果，而不是某些参与者的利益以牺牲其他参与者的利益为代价。

这种理论很有用，因为它可以帮助参与者解决复杂的多方协商问题，降低买卖双方的损失。

混合纳什均衡有三类参与者：合作者、竞争者和不确定者。

这三类参与者行为的不同可能会影响混合纳什均衡的最终结果。

首先，合作者是指参与者之间相互合作，面对游戏的结果，合作者会达成有利于双方的互惠交易。

其次，竞争者是指参与者之间存在竞争，他们拼劲、追求自身最大利益，甚至牺牲他人利益也在所不惜。

最后，不确定者是指参与者对其他参与者的行为不太清楚，不确定者在游戏中会被动地接受其他参与者的影响，不会太过激进地为自身争取利益。

混合纳什均衡的应用非常广泛，它可以用来模拟经济、政治和外交等领域中的多方协商。

例如，混合纳什均衡可以用来模拟多个国家的贸易谈判，各国可以混合地拼争，双赢共赢的结果也可以从混合纳什均衡中获得。

此外，混合纳什均衡还可以用于多方竞争，各参与者一方面决策自身利益，另一方面也考虑到他人利益，以免损害自己的利益。

混合纳什均衡由一系列经典模型构成，例如拉斯维加斯博弈、巴斯-马丁斯博弈、多人贪心渐近博弈和贝叶斯优化博弈等等。

这些经典模型可以帮助参与者更容易地找到最大利益的解决方案，从而使参与者可以面对复杂的多方协商游戏实现共赢。

混合纳什均衡受到了日益普及和重视。

从商业活动到政治事务，混合纳什均衡已经被广泛地应用，而且也取得了许多成功案例。

在政治领域，混合纳什均衡可以帮助各个利益派系达成协议，减少谈判的紧张和矛盾，从而使多方收获相对平衡的政治结果。

此外，混合纳什均衡也有不足之处，例如模型的复杂性使得集成分析变得更加困难，可能引发新的潜在问题，而且由于参与者的利益不断变化，使用混合纳什均衡可能无法达到预期的最终结果。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

二、混合战略Nash均衡
问题：在“猜硬币”游戏中，我们往往会以50%
的概率选择正面(O)，以50%的概率选择反面(R)，即选择混合战略σ=(0.5，0.5)。那么有没有参与人会偏离混合战略σi=(0.5，0.5)呢？
O 1
R
2
O
R
-1,1
1,-1
1,-1
-1,1
在“猜硬币”博弈中，当双方都选择混合战略
为准）
守
左边右边
左边 -1，1 1，-1 攻
右边 1，-1 -1，1
例：石头、剪子、布
（3）石头、剪子、布
再看猎鹿博弈
风险与均衡
某种行动的概率
与期望收益：
猎鹿？猎兔？如果猎兔的概率 Nhomakorabea猎人鹿
是0.5时，均衡 1 兔子
是什么？0.6呢？
猎人2
鹿
兔子
5， 5 3， 0
0， 3 3， 3
猎鹿博弈风险上策均衡（兔子，兔子）
社会福利博弈
流浪汉
政府救济
不救济
找工作（3，2）（-1，1）
游荡（-1，3）（0，0）
课堂测试：
求解猎人的混
合纳什均衡策
略。
即，选择两种策略的期望收益
猎人鹿
无差异的概率。 1 兔子
猎人2
鹿
兔子
5， 5 3， 0
0， 3 3， 3
猎鹿博弈风险上策均衡（兔子，兔子）
察不能同时兼顾两个地方。商店价值2万元，
酒馆价值1万元。警察在这头时小偷会去另一
头行窃，但双方到底在哪边是不确定的。双方
的策略应是什么？
小偷
酒馆商店
警察
酒馆商店
3，0 2，1
1，2 3，0
警察要使损失最小化，小偷寻求收益最大化
1、如果警察以0.5的概率分别巡视两个地方，那么小偷的策略是什么？
课堂讨论
l 如果雇主能够没收雇员的抵押金F，前述两个问题的答案会发生怎样变化？如何理解这种变化？
l 根据上述分析，雇主是否会收取抵押金，如何收取？雇员是否愿交抵押金？
l 两个其它方面完全相同的企业在相互竞争中，一个收取抵押金，一个不收，说更有竞争优势？
l 从社会福利最大化角度看，作为政府是否应禁止雇主向雇员收取抵押金？为什么？
F-博弈论专题-4-1混合纳什均衡
混合纳什均衡
一、混合策略二、混合策略纳什均衡三、应用分析
一、混合策略
“对硬币”博弈的例子
两个参与人各握有一枚硬币，双方同时选择是
正面向上(记作O)还是背面向上(记作R)，即他们的策略空间都是{O, R}。若两枚硬币是一致的(即
全部背面向上或者全部正面向上)，参与人2赢得参与人1的硬币；若两枚硬币不一致，则参与人1 赢得参与人2的硬币。
博弈矩阵
O 1
R
2
O
R
-1,1
1,-1
1,-1
-1,1
对硬币博弈的特征：每位参与人都想猜透对方的策略，而每位
参与人又都不能让对方猜透自己的策略
在“对硬币”游戏中，我们会以50%的概
率选择正面(O)，以50%的概率选择反面 (R)。像这种以一定的概率分布来选择自己
策略的行为，在博弈论中称之为混合策略 (mixed strategy)。
2、警察以2/3及1/3的概率分别巡视商店和酒馆，小偷该如何？
3、混合纳什均衡策略是警察：P商店＝2/3，P酒馆＝1/3 小偷：相反
案例
推牌九及赌场每次加倍押赌，会有
什么样的结果？喝酒中的老虎、杠子、
鸡、虫，有无纯策略？
（二）监督博弈
• 税收机关与纳税人 • 雇主与雇员
这里，V是雇员的贡献，W是雇员的工资，H是雇员的付出，C是检查的成本。同时，我们假定H<W<V，W>C。在这个假设下，该博弈不存在纯战略纳什均衡。 • 求解混合战略纳什均衡得知：雇主检查的概率*=H/W，雇员偷懒的概率*=C/W。 • 求解雇主支付W为多少时，其期望收益最大。
同理，偏离也不能给参与人1带来好处。
因此，在“猜硬币”博弈中，双方都不会偏离混合战略组合σ=((0.5，0.5),(0.5，0.5))。像这样的混合战略组合我们称之为混合战略Nash均衡。
三、混合策略应用分析
（一）警察与小偷（二）监督博弈（三）社会福利博弈
（一）警察与小偷
某镇有一酒馆和商店，分在小镇的东西头，警
纯策略与混合策略
纯策略：参与人在给定信息下只选择一种特定策略(或
行动)。混合策略：
参与人给定信息下以某种概率分布随机地选择不同的行动。它可以定义为策略空间(集)上概率分布。
对比：智猪博弈与猜硬币博弈
例：点球射门
攻方的策略是：攻左边，或攻右边守方的策略是：守左边，或守右边（以守方的方向
σi=(0.5，0.5)时，双方的期望收益都为0。
E(1O)＝-1×0.5＋1×0.5＝0
E(1R) ＝1×0.5＋-1×0.5＝0
如果参与人1保持混合战略σ1=(0.5，0.5) ，那么无论参与人2选择其它什么样的混合战略，只要参与人1保持混合战略σ1=(0.5，0.5)不变，参与人2 的期望收益都为0，不会增大。也就是说，偏离并不能给参与人2带来好处。