3-混合策略的纳什均衡

合集下载

博弈论三种均衡的异同

问题：博弈论三种均衡的异同结合工作实践举一个例子，谈以下三种均衡的异同，1、占优策略均衡，2、纳什均衡，3、混合策略纳什均衡。

国企办公室当中的智猪博弈。

“大猪”们辛辛苦苦加班，工资一分也不多拿，“小猪”们一边逍遥自在，工资一分也不少拿，这种情况在国企办公室里比比皆是。

很遗憾，我就是“大猪”们中的一员，因为我们什么都缺，尤其缺能干的人，就是不缺人。

严格占优均衡（DSE）、重复剔除占优均衡(IEDE)、纯策略纳什均衡(PNE)、混合策略纳什均衡(MNE)，前一个均衡是后一个均衡的特例，后一个均衡是前一个均衡的扩展，即DSE是IEDE的子集，IEDE是PNE的子集，PNE是MNE的子集。

他们的区别如下：1、占优策略“不管你怎么做，我所做的都是我能做得最好的。

”其他人无论采取什么策略，目前你采取的策略就是最优的，永远不会改变。

2、纳什均衡:在一种策略组合上，其他人不改变策略时，那么你就不会改变策略，因为目前最优。

★“给定你的做法后，我所做的是我能做得最好的。

”★“给定我的做法后，你所做的是你能做得最好的。

”★如果你有占优策略, 你可以使用此策略, 以不变应万变;★如果你没有占优策略, 你必须随机应变。

在达到了纳什均衡之后, 所有参与者都没有动机想再变了。

纳什均衡是常态，帕累托最优几乎不存在。

经典案例：囚徒困境。

3、混合策略纳什均衡由所有参与人的混合策略构成的纳什均衡。

有些博弈不存在纳什均衡，或者纳什均衡不唯一，如猜硬币博弈。

要想为博弈方的选择和博弈结果做明细的预测，就要用到混合策略纳什均衡。

混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策，其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值，否则，一个博弈者会选择那个期望值最高的策略而排除所有其他策略，这意味着原初的状态不是一个均衡。

混合战略纳什均衡及应用

混合战略纳什均衡及应用摘要：博弈论是运筹学的一个重要分支，类型众多。

其中，非合作博弈是现代博弈理论中的核心内容和重要基础。

本文在简要介绍了博弈论相关内容的基础上，重点介绍了非合作博弈中最重要、最核心的部分即Nash均衡。

在此基础上，以纳什均衡作为理论支撑点，结合得意矩阵分析解决了经济生活中的一些实际问题。

例如治理污水排放的制度设计问题。

关键词：博弈论；均衡点；得益矩阵；Nash均衡博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

非合作博弈是现代博弈理论中的核心内容和重要基础，而Nash均衡则是非合作博弈的核心部分。

要用博弈论解决现实经济生活中的决策问题，其关键在于如何根据行为中的支付矩阵得出纳什平衡点,通过分析决策者的心理活动来得到博弈模型,从而依据模型来针对生活中的实际问题制定相关的政策以预防不良现象的发生。

一、非合作博弈一般地,将不允许存在有约束力协议的博弈称为“非合作博弈”。

在该博弈中，每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策。

事实上，具有这种性质的策略组合，正是非合作博弈理论中最重要的一个概念——“纳什均衡”。

在博弈论里，有各种各样的均衡概念。

混合战略均衡是纳什均衡的一种，混合战略概念使博弈论的研究范围更加广泛。

混合战略纳什均衡在非合作博弈分析中具有十分关键的作用和地位，因此将着重介绍混合战略纳什均衡的定义。

显然，给定父母资助,儿子的最优战略是在家；给定儿子在家；父母的最优战略是不资助，给定父母不救济，儿子的最优战略是寻找工作；而给定儿子寻找工作，父母的最优战略是资助。

该博弈的显著特征是每个参与人都不能猜出对方的战略。

参与人是以一定的概率选择某种战略，故称这样的战略为混合战略。

在该博弈中,设想父母以的概率选择资助,的概率选择不资助。

那么,对儿子来说,选择寻找工作带来的期望效用为,选择在家带来的期望效用同样为。

可见，选择任何混合战略带来的期望效用都是相同的。

3 混合纳什均衡

13
混合Nash均衡的解释（2）
纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择。因此在社会福利博弈中，* 0 . 2 ， *=0.5是唯一的混合战略纳什均衡。从反面来说，如果政府认为流浪汉选择寻找工作的概率严格小于0.2，那么政府的唯一最优选择是纯战略：不救济；
如果政府以1的概率选择不救济，流浪汉的最优选择是寻找工作，这又将导致政府选择救济的战略，流浪汉则选择游荡。如此等等。
14
混合Nash均衡的解释（3）
流浪汉
政府
流浪汉
寻找工作的概率小于0.2
概率为1：不救济
寻找工作
政府救济
15
猜谜游戏
求该猜谜游戏的混合战略纳什均衡
正面
1 -1， -1
5
社会福利博弈
寻找工作
2
流浪
3 -1，
救济
3， 1
0 0，
不救济
-1，
设：政府救济的概率：1/2 ；不救济的概率：1/2。
流浪汉：寻找工作的期望效用：1/2×2+1/2 ×1=1.5 流浪的期望效用： 1/2×3+1/2 ×0=1.5
因此，流浪汉的任何一种策略都是都是对政府混合战略的最优反应
6
社会福利博弈（2）
寻找工作
2 3， 1
流浪
3 -1， 0 0，
3r+（-1）（1-r）=4r-1
选择纯战略不救济的效用为：
-1r+0（1-r）=-r
如果一个混合战略（而不是纯战略）是政府的最优选择，一定意味着政府在救济与不救济之间是无差异的。
救济
不救济
-1，
4r-1=-r

纳什均衡概念名词解释

纳什均衡概念名词解释纳什均衡是博弈论中的一个重要概念，它描述了博弈双方在特定条件下做出的最优策略选择，这个选择不会被单方面的改变，否则对于另一方来说，选择其他策略反而更劣。

1. 概念解释纳什均衡的概念可以从两个方面进行解释。

从个人角度看，纳什均衡是指当每一个人都实施最优策略时，其它人不能从自己的策略中获得进一步的盈利收益；从社会角度看，纳什均衡则是指，当所有人都做出了最优策略时，整个社会得到了最大的总收益。

2. 纳什均衡的前提条件在博弈论中，纳什均衡并不是所有博弈都存在的。

对于一个博弈，存在纳什均衡需要满足以下条件：（1）所有博弈者都采取了最优策略，即无法通过改变策略来提高自己的收益；（2）每个博弈者的策略是对其他博弈者实施的策略的最佳反应；（3）每个博弈者都清楚地了解其他博弈者的策略。

3. 纳什均衡的类型在实际的博弈中，纳什均衡可以分为三种类型:（1）纯策略均衡：指每位参与者都只选定一个策略，并根据它的期望收益来进行决策，不存在概率因素。

（2）混合策略均衡：指每位参与者按一定的概率选定多个策略，并根据它的期望收益来进行决策，存在概率因素。

（3）多重纳什均衡：指博弈中存在多个均衡策略组合，每个均衡策略组合都符合博弈的前提条件。

4. 纳什均衡的意义和应用纳什均衡是博弈论的一个核心概念，其意义和应用非常广泛。

首先，纳什均衡可以用来预测和解释现实生活中的决策行为，如市场竞争、政府政策制定等。

其次，纳什均衡也可以用来指导协商和谈判的过程。

最后，纳什均衡还可以用来研究其他领域的决策行为，如军事战略、生态环境等。

综上所述，纳什均衡是博弈论中的一个重要概念，它描述了博弈双方在特定条件下做出的最优策略选择，是一种使得所有参与者都满意的稳定状态。

纳什均衡的应用领域非常广泛，其理论和方法也在不断地发展和完善。

混合策略纳什均衡

03 混合策略纳什均衡的证明方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法，它首先假设与结论相反的命题成立，然后通过逻辑推理和数学推导，得出矛盾的结论，从而证明原命题的正确性。在证明混合策略纳什均衡的存在时，反证法可以用来证明当其他玩家采取了最优策略时，某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下，每个参与者都只有一个最优反应，从而避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某些博弈中，至少存在一个策略组合，使得每个参与者在给定其他参与者策略的情况下，采用混合策略是最优的。
存在性通常通过数学证明和计算机搜索等方法来证明，但并不是所有博弈都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念，它描述了在给定对手策略的情况下，参与者如何选择最优策略以最大化自己的期望收益。
代数法是一种通过数学符号和公式进行推理和证明的方法。在证明混合策略纳什均衡的存在时，代数法可以用来推导和证明纳什均衡的条件和性质，利用代数性质和技巧来证明均衡的存在。
04 混合策略纳什均衡的应用场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞争策略，特别是在不完全竞争市场和寡头垄断市场中。通过混合策略纳什均衡，可以研究企业在不确定环境下的最优反应，以及企业如何通过调整其策略来应对竞争对手的行为。

混合纳什均衡

混合纳什均衡混合纳什均衡是一种多人博弈模型，也被称为“混合博弈”，可以模拟多方参与者协商、合作和竞争的过程。

这种理论是基于纳什均衡的，在纳什均衡中，每个参与者都有唯一的利益，各参与者的最优策略协作，从而达到最大的利益。

混合纳什均衡是一种非零和纳什均衡，这意味着在一局游戏中，所有参与者可以实现共赢的结果，而不是某些参与者的利益以牺牲其他参与者的利益为代价。

这种理论很有用，因为它可以帮助参与者解决复杂的多方协商问题，降低买卖双方的损失。

混合纳什均衡有三类参与者：合作者、竞争者和不确定者。

这三类参与者行为的不同可能会影响混合纳什均衡的最终结果。

首先，合作者是指参与者之间相互合作，面对游戏的结果，合作者会达成有利于双方的互惠交易。

其次，竞争者是指参与者之间存在竞争，他们拼劲、追求自身最大利益，甚至牺牲他人利益也在所不惜。

最后，不确定者是指参与者对其他参与者的行为不太清楚，不确定者在游戏中会被动地接受其他参与者的影响，不会太过激进地为自身争取利益。

混合纳什均衡的应用非常广泛，它可以用来模拟经济、政治和外交等领域中的多方协商。

例如，混合纳什均衡可以用来模拟多个国家的贸易谈判，各国可以混合地拼争，双赢共赢的结果也可以从混合纳什均衡中获得。

此外，混合纳什均衡还可以用于多方竞争，各参与者一方面决策自身利益，另一方面也考虑到他人利益，以免损害自己的利益。

混合纳什均衡由一系列经典模型构成，例如拉斯维加斯博弈、巴斯-马丁斯博弈、多人贪心渐近博弈和贝叶斯优化博弈等等。

这些经典模型可以帮助参与者更容易地找到最大利益的解决方案，从而使参与者可以面对复杂的多方协商游戏实现共赢。

混合纳什均衡受到了日益普及和重视。

从商业活动到政治事务，混合纳什均衡已经被广泛地应用，而且也取得了许多成功案例。

在政治领域，混合纳什均衡可以帮助各个利益派系达成协议，减少谈判的紧张和矛盾，从而使多方收获相对平衡的政治结果。

此外，混合纳什均衡也有不足之处，例如模型的复杂性使得集成分析变得更加困难，可能引发新的潜在问题，而且由于参与者的利益不断变化，使用混合纳什均衡可能无法达到预期的最终结果。

混合策略纳什均衡PPT课件

政府
不救济（-1，1）（0，0） 8
政府和流浪汉的博弈ห้องสมุดไป่ตู้
• 思考：政府会采用纯策略吗？流浪汉呢？这个博弈有没有纯策略的纳什均衡？
• ——跟你玩剪子石头布游戏一样，你会一直采用纯策略吗？
• 那么政府和流浪汉最有可能采用什么策略？ • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略，就可以采用针
4 1

如果一个混合策略是流浪汉的最优选择，那一定意味着政府在救济与不救济之间是无差异的，即：
vG 1, 4 1 vG 0,
0.2
13
• 解二:支付等值法
如果一个混合策略是政府的最优选择，那一定意味着流浪汉在寻找工作与游闲之间是无差异的，即：
• 答案是否定的。 • 事实上，局中人的选择仍然是很有讲究的，
策略选择的好坏对局中人的利益仍然有很大的影响。
• 在这个零和博弈里，无论双方采用哪种策略组合，结果都是一方输一方赢，而输的一方又总是可以通过单独改变策略而反输为赢。如果哪个局中人能找到对手方的规律或者偏好，他就能猜测到对手的策略而采用针对性策略从而保证赢。
16
讨论
• 尽管混合策略不像纯策略那样直观，但它确实是一些博弈中参与人的合理行为方式。扑克比赛、垒球比赛、划拳就是这样的例子，在这一类博弈中，参与比赛的总是随机行动以使自己的行为不被对方所预测。
• 经济学上的监督博弈也是这样一个例子。如税收检查、质量检查、惩治犯罪、雇主监督雇员等都可以看成猜谜博弈。
11
• 解一:支付最大化
• 流浪汉的期望效用函数为：
L
2 1 0
0.5 12
解二:支付等值法

混合策略纳什均衡

6.反应函数法进行博弈分析的目的是为了最终找到博弈的均衡解，下面先
说一种反应函数法：武大郎走后，猪八戒强烈要求孙悟空去化斋。孙悟空却
要求猪八戒去，最后，两人决定由猜枚的方法来决定由谁去：两人各准备一个黑箱，黑箱中由两人放入不同数目的黑白棋子，然后两人从对方的箱子中摸出一枚棋子，如果两枚棋子的颜色一样，则孙悟空去化斋；不一样，则由猪八戒去。那么，两人会将自己黑箱中的黑白子的比例设定为多少?
但孙悟空的付钱方法也非同常人，孙悟空也变出一个黑箱，放了3张10元人民币和7张2元人民币进去，让武大郎从中摸
4.混合策略
一张钞票作为交易的报酬，武大郎会答应这样的付钱方法吗？
武大郎的期望支付：10×0.3+2×0.7=4.2(元) 很明显，作为一个精明的生意人，武大郎是不会同意的。下面从支付矩阵的角度来讨论为什么武大郎不会同意:
用Si表示，Si={si1， si2， …，sin}，其中sik(k=1,2
…n)表示一个策略。
纳什均衡是满足一定条件的，n个局中人的策略组合。
3.支
付：局中人参与博弈能得到的利益，用u表示，符号 ui(s1j，…，sik，…，snm)，表示n个局中人分别
采用策略s1j，…，sik，…，snm时第i个局中人的支付。
4.混合策略
孙悟空
10（0.3）饼8（0.5） 2（0.7）
8
8
武大郎
水4（0.5）
10
4
2
4
10
2
武大郎的期望支付：10×0.5×0.3+ 2×0.5×0.7 + 10×0.5×0.3 + 2×0.5×0.7=4.2（元）孙悟空的期望支付：8×0.5×0.3+ 8×0.5×0.7 + 4×0.5×0.3 + 4×0.5×0.7=6（元）

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论教学/混合策略的纳什均衡
出自MyKnowledgeBase
< 博弈论教学
Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡
目录
■1 复习
■2 混合策略(Mixed strategy)
■2.1 举例/Example
■2.2 概念
■2.3 纯策略和混合策略
■2.4 混合策略的争议
■3 混合策略的纳什均衡
■3.1 基本概念
■3.2 混合策略纳什均衡的存在性/纳什定理
■3.3 学术争议与批评
■4 混合策略纳什均衡举例
■4.1 社会福利博弈Social Welfare Game
■4.1.1 博弈分析(方法1:收益无差异)
■4.1.2 博弈分析（方法2：图形分析法）
■4.1.3 博弈分析(方法3：导数(Derivative)极值法)
■4.2 普通例子
■4.3 审计博弈(Tax Game)
■4.4 激励的悖论[5]
■4.5 求解纳什均衡的一般方法
■5 多重纳什均衡
■5.1 多重纳什均衡举例
■5.1.1 夫妻之争
■5.1.2 制式问题
■5.1.3 市场机会博弈
■5.2 多重纳什均衡分析
■5.2.1 帕累托上策均衡（Pareto Dominated Equilibrium）
■5.2.1.1 帕累托最优Pareto optimality
■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium)
■5.2.1.3 举例分析
■5.2.2 风险上策均衡(Risk-dominant Equilibrium)
■5.2.3 聚点均衡(Focal Points Equilibrium)
■5.2.4 相关均衡
■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义
■7 作业
■8 参考文献
pure strategy）相对应。

混合策略：在博弈中，博弈方的策略空间为
，则博弈方i以概率分布随机在其
选策略中选择的“策略”，称为一个“混合策略”，其中，对
都成立，且。

混合策略扩展博弈：博弈方在混合策略的策略空间（概率分布空间）的选择看作
定义：在博弈中，假设是一个混合策略，如果
成立，则称是一个混合策略纳什均衡（
Equilibrium）。

如果对于局中人及其的每一个混合策略，局中人关于的期望盈利至少与局中人关于的期望盈利一样大，即则称混合策略组合是这个博弈的一个纳什均衡。

纳什定理：在一个由个博弈方构成的博弈中，如果
的战略空间都是有限集(对)，则该博弈至少存在一个纳什均衡（纯策略或者混合策略）。

设和为纳什均衡点，
，如果，则
如果，则对于任意的都是最大值；如果，则，上式取最大值。

同理，，可得，
两者的交点为(0.5,0.2)，如图所示。

图形分析方法
这个问题不存在纯策略的纳什均衡。

假设政府救济的概率为，流浪汉找工作的概率为，则
，
，让、分别对和求导数，并令，即，，可得，，最后政府的收益为，流浪汉的收益为
的概率为，博弈方
为，则对于博弈方采取何种策略，其收益是不变化
的（即其分别采取策略
，可得；同
理，可以求得；最后可得博弈方1的收益为，博弈方。