博弈论与信息经济学混合战略纳什均衡

合集下载

博弈论与信息经济学-2-2混合均衡

混合战略
• 定义: 在n个参与人博弈的战略式表述G = {S1, ..., Sn；u1, ..., un}中，假定参与人i有K个纯战略: Si = {si1, ..., siK}，那么，概率分布σ i = (σ i1，..., σ iK)称为i的一个混合战略，这里σ ik =σ (sik)是i选择Sik的概率，对于所有的k = 1，..., K，0≤σ ik ≤ 1，∑1Kσ ik = 1。 • 纯战略可以理解为混合战略的特例，比如说，纯战略si1等价于混合战略σ i = (1，0，...，0)，即选择纯战略si1的概率为1，选择任何其他纯战略的概率为0。
混合战略纳什均衡
• 根据上述道理，纳什均衡也可以表述如下: • 定义: σ * = (σ 1*,...,σ i* ...,σ n*)是一个纳什均衡，如果对于所有的参与人i，
sik∈Si • 若σik等于0，则上式严格不等式成立， sik不进入混合战略；若σik不等于0，则上式的等式成立，sik进入混合战略。
博弈论与信息经济学
第2章完全但不完美信息静态博弈-2 ——混合战略纳什均衡
主要内容
• • • • • • 占优战略均衡、重复剔除的占优均衡纳什均衡库诺特寡头竞争模型混合战略纳什均衡纳什均衡的存在性和多重性聚点均衡和相关均衡
纯战略纳什均衡
• 纳什均衡定义为一个满足所有参与人的效用最大化要求的战略组合，即 (s1*，...，si*, ...，sn*)是一个纳什均衡，当且仅当对于所有的i，si* ∈argmax ui(si，s-i*)。 • 根据这一定义，有些博弈不存在纳什均衡。
支付最大化法
• 对上述效用函数求微分，得到政府最优化的一阶条件为: • dυ G/dθ = 5γ – 1 = 0 • 因此， • γ * = 0.2 • 就是说，在混合战略均衡下，流浪汉以0.2的概率选择寻找工作，以0.8的概率选择游荡。

混合策略纳什均衡

02
混合策略纳什均衡的基本理论
纳什均衡的定义与性质
纳什均衡的定义
在博弈中，如果每个玩家都采取自己的最优策略，那么整个博弈会达到一种均衡状态，即所有参与者的利益达到最大化。
纳什均衡的性质
纳什均衡是一种自我稳定的状态，即使受到外部干扰，也会迅速恢复到原始状态。此外，纳什均衡也是最优的，因为它使得每个参与者的利益都达到最大化。
其次，现有的研究往往只关注特定的博弈模型，对于更一般化的博弈模型，尤其是对于连续型博弈和多阶段博弈的研究还比较缺乏。
首先，混合策略纳什均衡的概念和性质仍需进一步深化和研究。例如，对于非完全信息博弈，如何准确地刻画混合策略纳什均衡点的数量和分布等问题仍需探索。
最后，现有的研究主要集中在理论层面，对于如何将混合策略纳什均衡应用到实际问题中，如何设计和制定有效的混合策略等问题还需要进一步探讨。
未来研究方向与挑战
未来研究可以进一步拓展混合策略纳什均衡的应用领域，例如在经济学、政治学、社会学等领域的应用。
另外，针对现有的研究不足，未来研究可以深入探索混合策略纳什均衡的性质和计算方法，以及如何设计和制定有效的混合策略等问题。
此外，未来的研究还可以进一步拓展混合策略纳什均衡的理论框架，例如在多阶段博弈、不完全信息博弈、非线性博弈等领域的研究。
略纳什均衡来分析。
在生物学领域的应用
在生物学中，混合策略纳什均衡可以用来研究生物种群的进化稳定性和生态平衡。
在生态系统中，生物种群可以通过选择不同的繁殖、迁徙、捕食等策略来适应环境变化，这种博弈关系可以通过混合策略纳什均衡来分析。
在其他领域的应用
在社会学中，混合策略纳什均衡可以用来研究社会群体中的合作与竞争关系。

混合策略纳什均衡例子

混合策略纳什均衡例子混合策略纳什均衡是博弈论中的一个重要概念，指的是各参与者选择一个概率分布作为他们的策略，从而达到一个稳定的状态。

在混合策略纳什均衡中，没有任何参与者可以通过单独改变自己的策略来获得更好的结果。

一个经典的混合策略纳什均衡的例子是“岩石-剪刀-布”游戏。

在这个游戏中，两个参与者（称为玩家1和玩家2）可以选择出岩石、剪刀或布中的任意一种。

每一种选择都有一定的胜负规则：岩石胜剪刀，剪刀胜布，布胜岩石。

假设玩家1选择出岩石、剪刀和布的概率分别为p1、q1和r1，玩家2选择出岩石、剪刀和布的概率分别为p2、q2和r2。

两个玩家的利益可以用一个支付矩阵表示如下：| 岩石 | 剪刀 | 布-----------------------------岩石 | 0 | -1 | 1-----------------------------剪刀 | 1 | 0 | -1-----------------------------布 | -1 | 1 | 0在混合策略纳什均衡中，每个玩家选择的概率分布必须使得对于每一种选择，玩家都不希望改变自己的概率分布。

在这个例子中，我们可以通过计算来找到混合策略纳什均衡。

假设玩家1选择出岩石的概率为p1，则选择剪刀的概率为q1=1-p1-0=1-p1，选择布的概率为r1=0-0=0。

同样地，玩家2选择出岩石的概率为p2，则选择剪刀的概率为q2=1-p2-0=1-p2，选择布的概率为r2=0-0=0。

为了找到混合策略纳什均衡，我们需要检查每一种选择，并确保玩家对于每一种选择都不希望改变自己的概率分布。

在这个例子中，无论玩家1选择什么概率分布，玩家2都可以通过选择相应的概率分布来获得更好的结果。

所以，不存在一个混合策略纳什均衡。

总结起来，混合策略纳什均衡是博弈论中一种稳定的策略选择状态，即不存在任何参与者可以通过单独改变自己的策略来获得更好的结果。

岩石-剪刀-布游戏是一个经典的混合策略纳什均衡的例子，其中玩家的选择概率分布是关键因素。

博弈论-混合策略纳什均衡

，以达到均衡状态。
政治学的案例分析
总结词：国际关系
详细描述：在国际关系中，混合策略纳什均衡可以用来解释国家之间的竞争和合作。例如，两个国家可能会以一定的概率选择不同的外交政策，例如结盟、中立或对抗，以达到各自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中，混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如，捕食者可能会采用追逐和放弃两种策略来捕猎猎物，而猎物也可能会采用逃跑和装死两种策略来避免被捕食。最终，捕食者和猎物都以一定的概率随机选择不同的策略，以达到均衡
非合作博弈论
研究个体如何在不知道其他个体如何行动的情况下做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体，可以是个人、组织或国
家。
行动
参与者根据给定的信息所做出的决策。
信息
参与者在进行决策时所拥有的数据、情报或知
识。
策略
参与者为达到最优结果而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词：繁殖竞争
VS
详细描述：在生物种群中，不同个体之间会存在繁殖竞争。为了最大化自己的遗传贡献，个体可能会采用不同的交配策略，例如追求高繁殖成功率的策略或避免过度竞争的策略。混合策略纳什均衡可以用来描述这种竞争状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中，生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分析繁殖过程的均衡结果，解释生物多样性的形成机制。
05 混合策略纳什均衡的案例分析
经济学的案例分析

博弈论混合策略纳什均衡名词解释

博弈论混合策略纳什均衡名词解释博弈论混合策略纳什均衡是指在博弈论中，当参与者不能确定选
择某一个策略时，采取混合策略的情况下达到的均衡状态。

具体来说，混合策略是指在一个博弈中，参与者以一定的概率选
择不同的纯策略。

而纳什均衡是指在一个博弈中，参与者无法通过单
独改变自己的选择来获得更好的结果，即不存在任何参与者可以通过
改变自己的策略来让其他参与者不再选择当前策略。

混合策略纳什均衡是指游戏中所有参与者以一定的概率选择不同
的纯策略，并且这种概率分配对于所有参与者都是最优的。

也就是说，在混合策略纳什均衡下，参与者没有更好的选择可供其采取，而其他
参与者也没有更好的概率分配可供其选择。

拓展：
在博弈论中，还有许多其他类型的均衡概念，例如纯策略纳什均衡、帕累托均衡、部分均衡等等。

纯策略纳什均衡是指游戏中参与者
以确定性的纯策略进行选择，使得没有参与者可以通过改变其策略来
获得更好的结果。

帕累托均衡是指在一个博弈中，不存在可以改善任
何一个参与者的情况。

部分均衡是指只有某些参与者达到均衡状态，而其他参与者未达到均衡状态。

博弈论是研究决策制定者在相互影响下进行决策的数学工具。

通过分析不同的博弈策略和可能的结果，博弈论可以帮助我们理解冲突和合作的情况，并提供一些决策建议。

博弈论与信息经济学-2-1纳什均衡

没有占优战略均衡
(1)：多劳不多得
Baldwin & Meese (1979)
新产品研发与模仿
智猪博弈(2)：多劳反而少得小猪按等待
大猪
按
3, 1
2, 4
等待
7, -1
0, 0
理性与剔除劣战略
最优反应
参与人i对其他参与人选择的战略s−i的最优反应或最优应对是为其产生最大支付的战略s*i，即 i(s*i , s−i) i(s’i, s−i)，s’i s*i 如果没有其他战略同样地好，就是严格最优反应，否则，就是弱最优反应。

弱占优战略

一般地，si*Si 称为参与人i的占优战略，如果对应所有的si’Si 和所有的s-iS-i， si*是i的弱占优选择，即 ui(si*，s-i)≥ui(si’,s-i)，s-iS-i， si’≠si* 对应地，所有的si’≠si*被称为si*的劣战略。
占优战略

Sherlock Holmes said, whenever you have eliminated the impossible, whatever remains – no matter how improbable – must be the truth.
占优战略

一般来说，由于每个参与人的效用(支付)是博弈中所有参与人的战略的函数，因此每个参与人的最优战略选择依赖于所有其他参与人的战略选择。在一些特殊的博弈中，一个参与人的最优战略可能并不依赖于其他参与人的战略选择，就是说，不论其他参与人选择什么战略，他的最优战略是唯一的，这样的最优战略被称为占优战略(dominant strategy)。——上策对应地，其他战略称为 “劣战略”（ dominated strategy ）——下策。

《博弈论与信息经济学》纳什均衡的应用-PPT精选全文完整版

pi 2 ln Y ln N 2 ln N 1 ln n 1 ln y 1
p
N
n
2 ln Y
N
n
1 ln
N
N
n
2 ln
N
1
N n 1 ln n 1 N n 1 ln y 1
si
2 ln Y
2 ln
N
2 ln
n
2
ln
y
1
s
N
n
2 ln Y
N
n
2 ln
N
N
n
2 ln
n
2
p 2 ln y 3 ln y 6 2 ln y 3 y 6 4 ln y 4 ln 3 2 ln 2
s
4 ln y
4 4 ln y 8ln 2
s p 8ln 2 4 ln 3 2 ln 2 4 ln 3 6 ln 2 ln 81 ln 64 2 ln 9 8 0
y ，
6
2
ln
y 3
ln
y 6
每一期的消费量y1
2 3
y，y2
1 3
y
10
博弈论与信息经济学
2024/10/15
b.社会效益最大化模式假定以整个村庄的人对公地消费的总体效用达到最大化为目标，即公地问
题的社会最优问题。
ln c1
ln c2
2 ln
y
c1 c2
2
最优条件为：
c1
pi s
p
2024/10/15
16
博弈论与信息经济学
比较的结果说明：
1 从社会整体上看，以社会利益最大化为目的的消费管理
方式优于以个人利益最大化的消费管理方式；

《博弈论与信息经济学》混合战略纳什均衡

-1
2019/1/6
1
博弈论与信息经济学
假定父母选择支助的概率为p1，选择不支助的概率为p2 1- p1 ；儿子选择立志的概率为q1，选择不立志的概率为q2 1- q1 。那么对两个参与人，各自的盈利函数为： v1 3 p1q1 1 p1q2 1 p2 q1 5 p1q1 p1 q1 v2 2 p1q1 p2 q1 3 p1q2 2 p1q1 q1 3 p1 v1 p 5q1 1 0 p1 p2 0.5 1 v2 1 2 p 0 q1 0.2，q2 0.8 1 q 1
p 1 甲
1/2
乙
O
2019/1/6
1/2
10
1
q
博弈论与信息经济学
解法2：代数法
* v甲 p, q 2 p 1 2q 2q 1 v甲 p 1 2q 0 p 1 2 * v乙 p, q 2q 2 p 1 2 p 1 v乙 q 2 p 1 0 q 1 2
乙甲/乙红(p) 黑(1-p) -1 1 红(q) 1 -1 黑(1-q) 1 -1 -1 1
例1.
甲
v甲 p, q 2 p 1 2q 2q 1 期望盈利为： v乙 p, q 2q 2 p 1 2 p 1
14
博弈论与信息经济学
A/B/C （sc=1） 1 A 2 3 A/B/C （sc=2） 1 A 2 3 A/B/C （sc=3） 1 A 2
B 1 3，3，3 2，3，3 1，3，3 2 3，2，3 2，2，3 1，2，3 B 3 3，1，3 2，1，3 1，1，3

混合策略纳什均衡

03 混合策略纳什均衡的证明方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法，它首先假设与结论相反的命题成立，然后通过逻辑推理和数学推导，得出矛盾的结论，从而证明原命题的正确性。在证明混合策略纳什均衡的存在时，反证法可以用来证明当其他玩家采取了最优策略时，某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下，每个参与者都只有一个最优反应，从而避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某些博弈中，至少存在一个策略组合，使得每个参与者在给定其他参与者策略的情况下，采用混合策略是最优的。
存在性通常通过数学证明和计算机搜索等方法来证明，但并不是所有博弈都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念，它描述了在给定对手策略的情况下，参与者如何选择最优策略以最大化自己的期望收益。
代数法是一种通过数学符号和公式进行推理和证明的方法。在证明混合策略纳什均衡的存在时，代数法可以用来推导和证明纳什均衡的条件和性质，利用代数性质和技巧来证明均衡的存在。
04 混合策略纳什均衡的应用场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞争策略，特别是在不完全竞争市场和寡头垄断市场中。通过混合策略纳什均衡，可以研究企业在不确定环境下的最优反应，以及企业如何通过调整其策略来应对竞争对手的行为。

张维迎《博弈论与信息经济学》讲义-第02章-纳什均衡与一致预期

最优选择
这个博弈只要求一阶理性共识就可以预测均衡结果: 如果R相信C是理性的,R就知道C不会选择C3, 所以R的最优选择是R1; R R1 如果C相信R是理性的,C就知道R不会选择R2, 所以C的最优选择是C2. 但要C预期R不会选择R3,需要二阶理性共识; 要R不预期C会选择C1,需要三阶理性共识.
– – – – 如果R(b)C 选择C2, 如果R(b)C(b)R会选择R2; 如果R(b)C(b)R(b)C会选择C1; 如果R(b)C(b)R(b)C(b)R会选择R1
Consistently aligned beliefs (CAB)
考虑(R3,C3):对方不会犯预期错误:R选择R3,如果他认为C会选择C3;C会选择C3, 如果他认为R会选择R3. CAB CAB:每个人对别人行为的预期(信念)是正确的; Harsanyi doctrine: 如果两个理性的人具有相同的信息,他们一定会得出相同的推断和相同的结论; Robert Aumann: rational agents cannot agree to disagree.
重复剔除与理性共识
重复剔除不仅要求每个人是理性的,而且要求每个人知道其他人是理性的,每个人知道每个人知道每个人是理性的,如此等等,即理性是"共同知识"(共识) C1 R1 R2 R3 10,4 9, 9 1,98 C2 1, 5 0, 3 0,100 C3 98,4 99,8 100,98 这个博弈只要求一阶理性共识就可以预测均衡结果. 如果把(下-左) 的第一个数字改为 11呢?
纳什均衡与一致预期
张维迎教授北京大学光华管理学院
博弈的基本概念(1)
参与人(players):博弈中决策主体的集合:什么人参与博弈?每个人是什么角色? 行动(actions): 每个人有些什么样行动可以选择?在什么时候行动? 信息(information):在博弈中的知识;每个人知道些什么(包括特征,行动等)? 战略(strategies):行动计划;每个人有什么战略可供选择?战略的完备性;

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

完全信息静态博弈。）
甲/乙
乙红(q) 黑(1-q)
红(p) -1
11
-1
甲
黑(1-p) 1
-1 -1
1
2020/8/13
期望盈利为：v甲 v乙
p, p,
q q
2p 2q
1 2p
2q 1
2q 1 2 p 1
8
博弈论与信息经济学
2020/8/13
对于甲来说，为使盈利达到最大，只有调整p。如果1 2q 0，即q 1 ，则p越大越好，而p的最大值只能取1；如果1 2q 0，
v1
p1
v2
q1
5q1 1 0 1 2 p1 0
p1 q1
p2 0.5 0.2，q2
0.8
2020/8/13
2
博弈论与信息经济学
2020/8/13
▪ 进一步浪子博弈还可以作出如下解释：
期望盈利：v1 v2
3 p1q1 2q1 p1
p1q2 q1 p2
p2q1 3q2 p1
参与人i的期望盈利为：vi pi , pi
n
pj
sj
ui
பைடு நூலகம்
s
。
sS j1
6
博弈论与信息经济学
2020/8/13
父母/儿子
支助父（p1）母不助
（p2）
儿子
立志（q1）
不立志（q2）
32
-1 3
-1 1
00
期望盈利：
1 3 p1q1 p1q2 p2q1 0 2 2q1 p1 q1 p2 3q2 p1 0
B 2 3，2，2 6，6，6 5，6，6
B 2 3，2，1 6，6，5 5，6，5
3 3，1，3 2，1，3 1，1，3
3 3，1，3 6，5，6 5，5，6
3 3，1，1 6，5，5 9，9，9
15
博弈论与信息经济学
解：
矩阵1
A1 A2
r1 2 p1 p2 1 r2 4q1 2 p1
甲
1
1/2
乙
O
1/2
1q
10
博弈论与信息经济学
2020/8/13
▪ 解法2：代数法
v甲 p, q 2 p 1 2q 2q 1 v甲
v乙
p,
q
2q
2
p
1
2
p
1
v乙
p q
1 2q 2p 1
0 0
p* q*
1 1
2 2
▪ 例2.
甲/乙
乙德(q) 法(1-q)
德(p) 3
21
1
甲
法(1-p) 0
K
pik 1，pik p sik 是i选择战略sik的概率，pi称为参与人i的混合战略。
k 1
i 代表i的混合战略空间，pi i 。
▪ （2）期望盈利
对于博弈G S1,..., Si ,..., Sn;u1,..., ui ,..., un，对应于s s1,..., si,..., sn 有p p1,..., pi ,..., pn ，pi i ，p表示局中人i的混合战略组合，那么，
4q1 2 2 p1 p2 4q2 1 p1 p2 8 p1 4 p2 6 0
4q1 q2 11 p1 p2 1 0
p1*
1 2
,
p2*
0,
p3*
1 2
q1*
1 2
, q2*
0, q3*
1 2
r1*
1 2
,
r2*
0, r3*
1 2
17
博弈论与信息经济学
q2
C
r1
C
r2
4r1 2 2q1 q2 4r2 1 q1 q2 8q1 4q2 6 0
4r1 r2 11 q1 q2 1 0
4r1 2 2 p1 p2 4r2 1 p1 p2 8 p1 4 p2 6 0
4r1 r2 11 p2 p2 1 0
不助 3
3 ，2 -1，1
-1，3 0 ，0
博弈论与信息经济学
▪ 父母的最佳选择p*=0.5，儿子的最佳选择q*=0.2，解释如下：
• （1）当父母选择支助的概率p>0.5时，儿子的最佳选择就是放荡；当父母选择支助的概率p<0.5时，儿子的最佳选择就是立志。
• （2）当儿子选择立志的概率q>0.2时，父母的最佳选择就是支助；当儿子选择立志的概率q<0.2时，父母的最佳选择就是不支助。
p*
q*
1, 1,
3,0 4 1 ,0 4
有两个纯战略均衡：（德语，德语）、（法语，法语）；
一个混合战略均衡：p*, q* 3 4,1 4。
p
甲
1
3/4 乙
O 1/4
12
1q
博弈论与信息经济学
▪ 解法2：代数法
甲和乙的期望盈利：v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
2
即p 1 ，则q能取任意值，即q 0,1。
2
9
博弈论与信息经济学
2020/8/13
0 如果q 1 2
1 如果q 1 2
反应函数：p 0,1如果q 1 2，q 0,1如果q 1 2
1 如果q 1 2
0 如果q 1 2
由此可知，这个博弈的纳什均衡为p* 1 2，q* 1 2。
p
2020/8/13
14
博弈论与信息经济学
2020/8/13
A/B/C （sc=1）
1 A2
3
A/B/C （sc=2）
1 A2
3
A/B/C （sc=3）
1 A2
3
1 3，3，3 2，3，3 1，3，3
1 3，3，2 2，3，2 1，3，2
1 3，3，1 2，3，1 1，3，1
B 2 3，2，3 2，2，3 1，2，3
❖ 1.混合策略与期望盈利
▪ 例：浪子博弈
• 在这一博弈中，两个参与人都不知道对方选择是否确定地选择某个策略，因此，按照以前所学的知识无法得出均衡解。但是，如果知道对方将以某一概率对某一策略进行选择的话，就可以得出反应函数，就可以按照纳什均衡的方法求得解。
2020/8/13
父母/儿子父支助母不助
7
博弈论与信息经济学
❖ 2.混合战略纳什均衡
▪ 例1.
对于n人混合博弈G S1, , Sn;u1, ,un，pi si i ，如果
p* p1*, , pn* 满足vi pi*, p*i vi pi , p*i ，则称p*为该博弈
的混合战略纳什均衡。（海萨尼认为，混合战略博弈就是不
2
即q 1 ，则p越小越好，而p的最小值只能取0；如果1 2q 0，
2
即q 1 ，则p能取任意值，即p 0,1。
2
对于乙来说，为使盈利达到最大，只有调整q。如果2 p 1 0，即p 1 ，则q越大越好，而q的最大值只能取1；如果2 p 1 0，
2
即p 1 ，则q越小越好，而q的最小值只能取0；如果2 p 1 0，
儿子
立志
放荡
32
-1 3
-1 1 0 0
1
博弈论与信息经济学
假定父母选择支助的概率为p1，选择不支助的概率为p2 1- p1 ；儿子选择立志的概率为q1，选择不立志的概率为q2 1- q1 。那么
对两个参与人，各自的盈利函数为：
v1
3 p1q1
1
p1q2
1
p2q1
5
p1q1
p1
q1
v2 2 p1q1 p2q1 3 p1q2 2 p1q1 q1 3 p1
b.对于儿子的期望盈利v2，如果1 2 p1 0，即父母的混合战略p1 0.5，则
儿子的混合战略取最大值q1 1时，v2最大；相反，如果1 2 p1 0，父母的
混合战略p1 0.5，则儿子的混合战略取最大值q1 0时，v2最大。
儿子父母/儿子
立志（q1）放荡（q2）
支助父（p1）母
p2
5
4q1
A3 1 r1 r2 p1 8q1 4q2 6 p2 4q1 4q2 3 9 8q1 4q2
矩阵2
BB21
r1 2q1 r2 4 p1
q2 1 2 q1
q2
5
4
p1
B3
1
r1
r2
q1
8 p1
4
p2
6
q2
4
p1
4
p2
3
9
8 p1
4 p2
矩阵3
C1 C2
0
0
p1 5q1 1 q1 1 2 p1
q1 3
p1
a.对于父母的期望盈利v1，如果5q1 1 0，即儿子的混合战略q1 0.2，则
父母的混合战略取最大值p1 1时，v1最大；相反，如果5q1 1 0，即儿子
的混合战略q1 0.2，则父母的混合战略取最小值p1 0时，v1最大。
2020/8/13
父母/儿子父支助母不助
儿子
立志
放荡
32
-1 3
-1 1 0 0
4
博弈论与信息经济学
• 从上例中可以看出，当参与人在选择战略具有不确定性，考虑纳什均衡时，具体战略的盈利已经显得不很重要，重要的是某个战略的概率分布，因此，纳什均衡的解也就必须包含概率，这样的支付或盈利就称为期望盈利。
02
3
甲和乙的期望盈利：v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
11
博弈论与信息经济学
2020/8/13
▪ 解法1：反应函数法