混合策略纳什均衡

合集下载

混合策略纳什均衡

混合策略纳什均衡

02
混合策略纳什均衡的基本理论
纳什均衡的定义与性质
纳什均衡的定义
在博弈中,如果每个玩家都采取自己的最优策略,那么整个博弈会达到一种均 衡状态,即所有参与者的利益达到最大化。
纳什均衡的性质
纳什均衡是一种自我稳定的状态,即使受到外部干扰,也会迅速恢复到原始状 态。此外,纳什均衡也是最优的,因为它使得每个参与者的利益都达到最大化 。
其次,现有的研究往往只关注特定的博弈模型, 对于更一般化的博弈模型,尤其是对于连续型博 弈和多阶段博弈的研究还比较缺乏。
首先,混合策略纳什均衡的概念和性质仍需进一 步深化和研究。例如,对于非完全信息博弈,如 何准确地刻画混合策略纳什均衡点的数量和分布 等问题仍需探索。
最后,现有的研究主要集中在理论层面,对于如 何将混合策略纳什均衡应用到实际问题中,如何 设计和制定有效的混合策略等问题还需要进一步 探讨。
未来研究方向与挑战
未来研究可以进一步拓展混合策略纳什均衡的应用领域,例如在经济学、政治学、社会学等领域的应 用。
另外,针对现有的研究不足,未来研究可以深入探索混合策略纳什均衡的性质和计算方法,以及如何设 计和制定有效的混合策略等问题。
此外,未来的研究还可以进一步拓展混合策略纳什均衡的理论框架,例如在多阶段博弈、不完全信息博 弈、非线性博弈等领域的研究。
略纳什均衡来分析。
在生物学领域的应用
在生物学中,混合策略纳什均衡可以用来研究生物种 群的进化稳定性和生态平衡。
在生态系统中,生物种群可以通过选择不同的繁殖、 迁徙、捕食等策略来适应环境变化,这种博弈关系可 以通过混合策略纳什均衡来分析。
在其他领域的应用
在社会学中,混合策略纳什均衡可以用来研究社会群 体中的合作与竞争关系。

混合策略纳什均衡例子

混合策略纳什均衡例子

混合策略纳什均衡例子混合策略纳什均衡是博弈论中的一个重要概念,指的是各参与者选择一个概率分布作为他们的策略,从而达到一个稳定的状态。

在混合策略纳什均衡中,没有任何参与者可以通过单独改变自己的策略来获得更好的结果。

一个经典的混合策略纳什均衡的例子是“岩石-剪刀-布”游戏。

在这个游戏中,两个参与者(称为玩家1和玩家2)可以选择出岩石、剪刀或布中的任意一种。

每一种选择都有一定的胜负规则:岩石胜剪刀,剪刀胜布,布胜岩石。

假设玩家1选择出岩石、剪刀和布的概率分别为p1、q1和r1,玩家2选择出岩石、剪刀和布的概率分别为p2、q2和r2。

两个玩家的利益可以用一个支付矩阵表示如下:| 岩石 | 剪刀 | 布-----------------------------岩石 | 0 | -1 | 1-----------------------------剪刀 | 1 | 0 | -1-----------------------------布 | -1 | 1 | 0在混合策略纳什均衡中,每个玩家选择的概率分布必须使得对于每一种选择,玩家都不希望改变自己的概率分布。

在这个例子中,我们可以通过计算来找到混合策略纳什均衡。

假设玩家1选择出岩石的概率为p1,则选择剪刀的概率为q1=1-p1-0=1-p1,选择布的概率为r1=0-0=0。

同样地,玩家2选择出岩石的概率为p2,则选择剪刀的概率为q2=1-p2-0=1-p2,选择布的概率为r2=0-0=0。

为了找到混合策略纳什均衡,我们需要检查每一种选择,并确保玩家对于每一种选择都不希望改变自己的概率分布。

在这个例子中,无论玩家1选择什么概率分布,玩家2都可以通过选择相应的概率分布来获得更好的结果。

所以,不存在一个混合策略纳什均衡。

总结起来,混合策略纳什均衡是博弈论中一种稳定的策略选择状态,即不存在任何参与者可以通过单独改变自己的策略来获得更好的结果。

岩石-剪刀-布游戏是一个经典的混合策略纳什均衡的例子,其中玩家的选择概率分布是关键因素。

博弈论-混合策略纳什均衡

博弈论-混合策略纳什均衡
,以达到均衡状态。
政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析

博弈论混合策略纳什均衡名词解释

博弈论混合策略纳什均衡名词解释

博弈论混合策略纳什均衡名词解释博弈论混合策略纳什均衡是指在博弈论中,当参与者不能确定选
择某一个策略时,采取混合策略的情况下达到的均衡状态。

具体来说,混合策略是指在一个博弈中,参与者以一定的概率选
择不同的纯策略。

而纳什均衡是指在一个博弈中,参与者无法通过单
独改变自己的选择来获得更好的结果,即不存在任何参与者可以通过
改变自己的策略来让其他参与者不再选择当前策略。

混合策略纳什均衡是指游戏中所有参与者以一定的概率选择不同
的纯策略,并且这种概率分配对于所有参与者都是最优的。

也就是说,在混合策略纳什均衡下,参与者没有更好的选择可供其采取,而其他
参与者也没有更好的概率分配可供其选择。

拓展:
在博弈论中,还有许多其他类型的均衡概念,例如纯策略纳什均衡、帕累托均衡、部分均衡等等。

纯策略纳什均衡是指游戏中参与者
以确定性的纯策略进行选择,使得没有参与者可以通过改变其策略来
获得更好的结果。

帕累托均衡是指在一个博弈中,不存在可以改善任
何一个参与者的情况。

部分均衡是指只有某些参与者达到均衡状态,而其他参与者未达到均衡状态。

博弈论是研究决策制定者在相互影响下进行决策的数学工具。

通过分析不同的博弈策略和可能的结果,博弈论可以帮助我们理解冲突和合作的情况,并提供一些决策建议。

第三讲_混合策略纳什均衡

第三讲_混合策略纳什均衡

混合策略
◆混合策略定义:在n人博弈的策略式表述 G S1, , Sn ; u1, , un Si Si1, , SiK ,那么,概率 中,假定参与人 i 有K个纯策略: 分布 pi pi1 , , piK 称为 i 的一个混合策略,这里
pik p(sik ) 是 i 选择 sik 的概率,对于所有
这个故事曾经被很多人当作博弈论的例 子来演绎,但实际上这个故事与博弈论无关。 博弈论会假定所有局中人都是理性的,不能假 定一些局中人聪明而另一些局中人却是傻子。 当田忌出下马时,齐威王最好的选择是出下马 而不是上马。孙膑的计谋中假定齐威王是傻子 ,当田忌出下、上、中马时,他仍然按上、中 、下马出,当然要输了。事实上,当田忌出下 马时,齐威王应出下马,但齐威王出下马时, 田忌不应出下马而是出中马,但此时齐威王又 应出中马而不是下马了,……。这样,博弈不 会有纯战略的均衡。

-2,3
2,2
假定老板选择混合战略(0.2,0.8) 工人选择“偷懒”期望支付为(-1)×0.2+3×0.8=2.2 工人选择“不偷懒”(期望)支付为2×0.2+2×0.8=2 工人应选择“偷懒” 老板选择“监督” “不偷懒’……

假定老板选择混合战略(0.5, 0.5) 工人选择“偷懒”期望支付 0.5 为 (-1)×0.5+3×0.5=1 工人选择“不偷懒”期望支 0.5 付为2×0.5+2×0.5=2 工人应选择“不偷懒” 老板选择“不监督” 工人选择“偷懒’……
由 VA =VB 可得 :q=0.8 博弈方2:
VB =3q (1 q)
博 弈 方 1
A B
VC =3 p (1 p)
VD =2 p 5(1 p)

混合策略纳什均衡

混合策略纳什均衡
(红 ) r 1 1/2 0 1/2 1 q (红)
博弈论 第三章 混合策略纳什均衡
r*=R(q)
反应对应曲线
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
再看乙的最优反应,记为q*=R(r): 观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
若r 1 / 2 2r 1 0, q越大越好 1, q* R( r ) [0,1], 若r 1 / 2 2r 1 0,无论q选什么都无影响 0, 若r 1 / 2 2r 1 0, q越小越好
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
先看甲的最优反应,记为r*=R(q): 观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0,无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
解:Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q
f.o.c. 2r-1=0
r*=1/2
混合策略纳什均衡是甲在策略空间{红,黑}上以概率分布 p甲*= (1/2,1/2)进行选择,乙也在策略空间{红,黑}上以概率p乙*= (1/2,1/2)进行选择
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、支付最大化法
例:扑克牌对色游戏(p77)
无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q(-1)+(1-q) 1]+ (1-r)[q1+(1-q)(-1)] = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r1+(1-r)(-1)]+ (1-q)[r(-1)+(1-r)1] =2q(2r-1)-(2r-1) f.o.c. 1-2q=0 q*=1/2

混合策略纳什均衡

混合策略纳什均衡

03 混合策略纳什均衡的证明 方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法,它首先假设与结论相反的命题成立,然后通过逻辑推理和数学推导,得出矛盾的 结论,从而证明原命题的正确性。在证明混合策略纳什均衡的存在时,反证法可以用来证明当其他玩家采取了最 优策略时,某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下,每个参与者都只有一个最优反应,从而 避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某 些博弈中,至少存在一个策略组合, 使得每个参与者在给定其他参与者策 略的情况下,采用混合策略是最优的 。
存在性通常通过数学证明和计算机搜 索等方法来证明,但并不是所有博弈 都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念,它描述了在 给定对手策略的情况下,参与者如何选择最优策略以最大化 自己的期望收益。
代数法是一种通过数学符号和公式进行推 理和证明的方法。在证明混合策略纳什均 衡的存在时,代数法可以用来推导和证明 纳什均衡的条件和性质,利用代数性质和 技巧来证明均衡的存在。
04 混合策略纳什均衡的应用 场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞 争策略,特别是在不完全竞争市场和寡头垄 断市场中。通过混合策略纳什均衡,可以研 究企业在不确定环境下的最优反应,以及企 业如何通过调整其策略来应对竞争对手的行 为。

混合策略纳什均衡

混合策略纳什均衡
11
田忌的谋士孙膑了解了田忌的困境
后,就打听到这样一个消息:尽管齐威
王的上、中、下三匹马都要比田忌的对
应上、中、下三匹马好,但碰巧的是田
忌的上马可胜齐威王的中马,田忌的中
马可胜齐威王的下马。于是,孙膑为田
忌献计:下一次比赛中第一局时田忌出
下马对齐威王的上马输一局,第二局田
忌出上马对齐威王的中马,第三局田忌
9
对于大企业,因一旦偷税就数目巨大,所 以,税务部门在随机检查时放在大企业上的可 能性就大一些;而给定税务部门检查大企业的 可能性较大,大企业偷漏税的行为就较少,否 则就容易被逮个正着。所以,偷漏税较多的就 是一些中小企业,大企业纳税的积极性较高。 同样的道理,在犯罪或对错误的监督惩罚博弈 中,也是混合博弈,人们可能总是大错不犯小 错不断。
15
混合策略均衡
◆混合策略定义:在n人博弈的策略式表述G S1,, Sn;u1,,un 中,假定参与人 i 有K个纯策略:Si Si1,, SiK ,那么,概率
分布 pi pi1,, piK 称为参与人 i 的一个混合策略,这里
pik p(sik ) 是参与人 i 选择sik 的概率,对于所有
14
混合策略均衡
◆纯策略与纯策略纳什均衡 ➢ 纯策略:肯定会被选择——以100%的概率——被
选择的策略。
➢ 纯策略纳什均衡:各个参与人都选择纯策略的纳 什均衡。
◆混合策略与混合策略纳什均衡
➢ 混合策略:以一定的概率分布选择某几个行动的 策略。
➢ 混合策略纳什均衡:由参与人的混合策略构成的 纳什均衡。
当田忌出下、上、中马时,他仍然按上、中、
下马出,当然要输了。事实上,当田忌出下马
时,齐威王应出下马,但齐威王出下马时,田
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(陈明德语 r 陈明德语) 陈明德语 1 3/4 q*=R(r)
0 1/4 1 q 钟信德语) (钟信德语)
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡
德语 r
二、反应对应法:情侣博弈 反应对应法:
陈明 法语 1-r
钟信 德语 q 法语 1-q 2 1 3 1 0 3 0 2
反应对应曲线有三个交点:三个 : 反应对应曲线有三个交点:三个NE: r*=0, q*=0 纯策略(确定性) 纯策略(确定性)
(红) r 红 1 1/2 0 1/2 1 q (红) r*=R(q) q*=R(r)
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、反应对应法
作业:社会福利博弈。使用反应对应法找到纳什均衡。 作业:社会福利博弈。使用反应对应法找到纳什均衡。
流浪汉 寻找工作 游荡 救济 政府 不救济
s1
第四节 纳什均衡的存在性
问题:是否所有的博弈都存在 (纯的或混合的)? 问题:是否所有的博弈都存在NE(纯的或混合的)? (纯策略)纳什均衡的存在性定理(Debreu,1952; 纯策略)纳什均衡的存在性定理 ; Glicksberg,1952;Fan,1952): ; : 考虑一个n人策略式博弈, 考虑一个n人策略式博弈,如果每个参与人的纯策略 空间S 是欧氏空间中的非空、 闭而有界)的凸集, 空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支 付函数u 连续且对 拟凹,则博弈存在一个纯策略Nash 连续且对s 付函数 i(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。 均衡。 (混合策略)纳什均衡的存在性定理 (Glicksberg,1952): 混合策略) : 在n人策略式博弈中,如果每个参与人的纯粹策略空 人策略式博弈中, 是欧氏空间中的非空、 闭而有界)的凸集, 间Si是欧氏空间中的非空、紧(闭而有界)的凸集,如果 支付函数u 为连续函数 为连续函数, 支付函数 i(s)为连续函数,那么博弈至少存在一个混合策 Nash均衡 均衡. 略Nash均衡.

第二节 混合策略纳什均衡的求解方法 红q 黑 1-q
红r 1 -1 -1 1 -1 1 1 -1
二、反应对应法
例:扑克牌对色游戏(p77) 扑克牌对色游戏 黑 1-r 无纯策略NE 无纯策略 给定混合策略p 给定混合策略 甲=(r,1-r); p乙=(q,1-q)
π甲(p甲, p乙)= 2r(1-2q)+(2q-1) 整理原则:一项含r,一项不含r 整理原则:一项含 ,一项不含 π乙(p甲, p乙)= 2q(2r-1)-(2r-1) 整理原则:一项含q,一项不含q 整理原则:一项含 ,一项不含 甲

第二节 混合策略纳什均衡的求解方法 红q 黑 1-q
二、支付最大化法
例:扑克牌对色游戏(p77) 扑克牌对色游戏
甲 红r 1 -1 -1 1 1 -1 无纯策略NE 无纯策略 黑 1-r 1 -1 给定混合策略p 给定混合策略 甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q⋅(-1)+(1-q) ⋅1]+ (1-r)[q⋅1+(1-q)⋅(-1)] ⋅ ⋅ ⋅ = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r⋅1+(1-r)⋅(-1)]+ (1-q)[r⋅(-1)+(1-r)⋅1] ⋅ ⋅ ⋅ ⋅ =2q(2r-1)-(2r-1) 解:Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q f.o.c. 1-2q=0 f.o.c. 2r-1=0 q*=1/2 r*=1/2
夫妻之争博弈
丈夫 时装 妻 时装 子 足球 2, 1 , 0, 0, 0 足球 0, 0 , 1, 1, 3
博弈论 第三章 混合策略纳什均衡
第四节 纳什均衡的存在性
不同均衡概念的关系
优势均衡
纯策略纳什均衡
混合策略纳什均衡
博弈论 第三章 混合策略纳什均衡
第四节 纳什均衡的存在性
问题:是否所有的博弈都存在 (纯的或混合的)? 问题:是否所有的博弈都存在NE(纯的或混合的)?
一、支付最大化法
给定混合策略p 给定混合策略 陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) r Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2r) q NE:(r*, q*)=(3/4, 1/4) :
r*=3/4, q*=1/4 混合策略(不确定性) 混合策略(不确定性) r*=1, q*=1 纯策略(确定性) 纯策略(确定性)
q*=R(r)
(陈明德语 r 陈明德语) 陈明德语 1 3/4
r*=R(q)
0 1/4 1 q 钟信德语) (钟信德语)
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡
博弈论 第三章 混合策略纳什均衡
第四节 纳什均衡的存在性
例:凹但不连续的支付函数 二人博弈:策略空间为S 二人博弈:策略空间为S1=S2= (0, 1) 支付函数: 支付函数:
s1= s2=
反应对应: 反应对应:
s2
无纳什均衡
反应对应曲线: 反应对应曲线:
1/3
1/3 博弈论 第三章 混合策略纳什均衡
(纯策略)纳什均衡的存在性定理(Debreu,1952; 纯策略)纳什均衡的存在性定理 ; Glicksberg,1952;Fan,1952): ; : 考虑一个n人策略式博弈, 考虑一个n人策略式博弈,如果每个参与人的纯策略 空间S 是欧氏空间中的非空、 闭而有界)的凸集, 空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支 付函数u 连续且对 拟凹,则博弈存在一个纯策略Nash 连续且对s 付函数 i(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。 均衡。
按照NE的条件,一个策略组合如过是一个 , 按照 的条件,一个策略组合如过是一个NE,那么其中的 的条件 每一个策略都是参与人针对其他参与人策略组合的最优反应, 每一个策略都是参与人针对其他参与人策略组合的最优反应, 在纯策略NE中 这个“最优反应” 在纯策略 中,这个“最优反应”可能是一个具体的纯策略 (离散情形 ,也可能是一个反应函数 离散情形), 离散情形 也可能是一个反应函数(reaction function,如连 如连 续情形、古诺模型)。而在一个混合策略NE中 这个“ 续情形、古诺模型 。而在一个混合策略 中,这个“最优 反应”将是一个概率或很多个概率——被称为“反应对 被称为“ 反应”将是一个概率或很多个概率 被称为 应”(reaction correspondence)
3,2 -1,3 , , -1,1 0,0 , ,
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡
例:情侣博弈
德语 r 陈明 法语 1-r 钟信 德语 q 法语 1-q 2 1 3 1 0 3 0 2
两个(多个) 两个(多个)纯策略纳什均衡 问题:纳什均衡找完了吗?有无混合策略纳什均衡? 问题:纳什均衡找完了吗?有无混合策略纳什均衡?
博弈论 第三章 混合策略纳什均衡

第二节 混合策略纳什均衡的求解方法 红q 黑 1-q
红r 1 -1 -1 1 -1 1 1 -1
二、反应对应法
例:扑克牌对色游戏(p77) 扑克牌对色游戏
甲 黑 1-r 先看甲的最优反应,记为r 先看甲的最优反应,记为 *=R(q): : 观察π 观察 甲(p甲, p乙)= 2r(1-2q)+(2q-1)
反应对应曲线
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方戏
作为NE,各个参与人的反应应该同时为最优, 作为 ,各个参与人的反应应该同时为最优,只有两个反应对应 的交点满足 NE:r*=1/2, q*=1/2 : NE支付为: π甲(p甲, p乙)= 2r(1-2q)+(2q-1)=0 支付为: 支付为 π乙(p甲, p乙)= 2q(2r-1)-(2r-1)=0
双方NE支付 双方 支付: π陈明*=3,π钟信*=2 支付 ,
r*=3/4, q*=1/4 混合策略(不确定性) 混合策略(不确定性)
双方NE支付 双方 支付: π陈明*=3/2,π钟信*=3/2 支付 ,
r*=1, q*=1
纯策略(确定性) 纯策略(确定性)
双方NE支付 双方 支付: π陈明*=2,π钟信*=3 支付 ,
0 1/4 1 q 钟信德语) (钟信德语)
博弈论 第三章 混合策略纳什均衡
第三节 寻找多重纳什均衡q 钟信法语 1-q 德语
二、反应对应法:情侣博弈 反应对应法:
陈明 再看钟信的最优反应,记为q 再看钟信的最优反应,记为 *=R(r): : 德语 r 法语 1-r 2 3 0 0 1 2 1 3
π钟信(p陈明, p钟信)=q(4r-3)+(3-2r)
若 r > 3 / 4 ⇔ 4 r − 3 > 0 , q 越大越好 1, q * = R ( r ) = [ 0 ,1], 若 r = 3 / 4 ⇔ 4 r − 3 = 0, 无论 q 选什么都无影响 0, 若 r < 3 / 4 ⇔ 4 r − 3 < 0 , q 越小越好
反应对应曲线
博弈论 第三章 混合策略纳什均衡

第二节 混合策略纳什均衡的求解方法 红q 黑 1-q
红r 1 -1 -1 1 -1 1 1 -1
二、反应对应法
例:扑克牌对色游戏(p77) 扑克牌对色游戏
甲 黑 1-r 再看乙的最优反应,记为q 再看乙的最优反应,记为 *=R(r): : 观察π 观察 乙(p甲, p乙)= 2q(2r-1)-(2r-1)
相关文档
最新文档