第二章-完全信息静态博弈的基本理论(1)

合集下载

第2章_完全信息静态博弈

乙
前行
退让
前行
（-10，-10）（20，-2）
甲
退让
（-2，20）（0，0）
❖ （甲前行、乙退让）和（甲退让、乙前行）都是“斗鸡博弈” 的纳什均衡。
3．“市场争夺战”博弈
❖ 假设在市场中有两个竞争对手。一个是已经在市场中的“在位者”，另一个是企图进入市场的“潜在进入者”。
❖ 潜在进入者有两个可以选择的策略：进入、不进入。在位者也有两个可以选择的策略：斗争、默许。
（10，1）（2，2）
❖ 如果嫌疑人乙选择坦白，那么嫌疑人甲应该如何选择？ ❖ 理性的嫌疑人甲会选择坦白。 ❖ 在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。 ❖ 类似可分析其他情况
❖ 2．通过“划横线法”求解“智猪博弈”的均衡
大猪
按开关等待
小猪
按开关
等待
（5，-1）
（4，2）
（10，-2）（0，0）
❖ 如果大猪和小猪都去按压开关，然后两头猪从开关处奔向猪圈另一端的盛食槽。由于大猪跑的快，小猪跑得慢，因此大猪会比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按压开关的劳动却没有吃到食物。在此种情况下，大猪的收益为 5，小猪的收益为 -1。
❖ 如果大猪去按压开关，小猪在盛食槽旁等待。那么当大猪按下开关后，盛食槽内出现食物，小猪立即开始吃，大猪则需要花一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后，身强力壮的大猪会把小猪挤到一旁，吃光剩余的食物。在这种情况下，大猪得到的收益是 4，小猪得到的收益是 2。
❖ 将嫌疑人甲标识在支付矩阵左侧，将嫌疑人乙标识在支付矩阵上方。
❖ 嫌疑人甲有两个策略可以选择：坦白、不坦白。将嫌疑人甲可能的策略纵向排列在博弈支付矩阵左侧。

第二章完全信息静态博弈

两寡头间的囚徒困境博弈
厂商2
不突破
厂不突破商 1 突破
突破
4.5，4.5
5，3.75
3.75，5
4，4
以自身最大利益为目标：各生产 2单位产量，各自得益为4 以两厂商总体利益最大：各生产 1.5单位产量，各自得益为4.5
2.3.2 反应函数(划线法)
古诺模型的反应函数
（0，6） R1(q2)
Cont…

反应函数： *
P
* 2
P 1
1 * ( a1 d1 P 2 ) 2b 1
2.3 无限策略分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 豪泰琳模型
2.3.1 古诺的寡头模型
企业Cournot模型 (无限策略博弈) 古诺（ Cournot ,1838）比纳什（1950）定义早100年假设条件: 1. 在一个寡头市场上两企业生产销售同质产品,市场总产量Q = q1+q2 (两寡头企业就是指这两家企业垄断了某一行业的市场) 2. 市场出清价格 P = 8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 两企业同时独立地决定各自的生产产量(q1, q2) 问题：两家企业应如何决策?
2.2.2

纳什均衡与一致预期
一致预期：基于信念的选择是合理的；支持选择的信念是正确的；预期的自我实现：如何所有人认为这个结果会出现，这个结果就会出现。预期是自我实现的，预期不会错误。如果你认为我预期你将选择X，你就真的会选择X。

2.2.3 纳什均衡与严格下策反复消去法
上策均衡定是纳什均衡，但纳什均衡不一定是上策均衡命题2.1：在n个博弈方的博弈 G {S1 ,Sn ; u1 ,un } 中，如 * * 果严格下策反复消去法排除了除 (s1 , sn ) 之外的所有策 * * 略组合，那么 (s1 , sn ) 一定是该博弈的唯一的纳什均衡命题2.2：在n个博弈方的博弈中G {S1,Sn ; u1,un } 中，如 * * , sn )是果 (s1 G 的一个纳什均衡，那么严格下策反复消去法一定不会将它消去上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的

第二章完全信息静态博弈(博弈与信息-西南财大,李映东)

36
第四节混合策略纳什均衡
引例：社会福利博弈与猜谜游戏混合策略纳什均衡及其求解
混合策略纳什均衡的应用举例
关于纳什均衡的存在性与多重性
一道有趣的作业题
37
社会福利博弈
流浪汉寻找工作 ( )
政府
游荡 (1-)
-1,3 0,0
救济 ( )
不救济 (1- )
3,2 -1,1
14
占优策略与占优策略均衡

占优策略(Dominant strategy)：不论其他参与人选择什么策略，一个参与人都只存在唯一的最优策略，这样的最优策略被称为占优策略。对于所有的s-i， si*称为参与人i的严格占优策略，如果满足： – ui(si*,s-i)>ui(si',s-i) s-i, si' si* 占优策略均衡：每个参与人的占优策略组合(如果存在的话)被称为占优策略均衡。
26
练习：重复剔除劣策略的占优均衡
L
U M D 4,3 2,1 3,0
M
5,1 8,4 9,6
R
6,2 3,6 2,8
27
思考与讨论（1）
L U D

R c,d g,h
a,b e,f
当a,b,c,d,e,f,g,h之间满足什么条件时，上述博弈存在: (1)占优策略均衡；(2)重复剔出的占优均衡；(3)纯策略纳什均衡。
31
纳什均衡是两反应函数的交点
q1 a-c R2(q1) 1/2(a-c) R1(q2) R1(q2)=q1=1/2(a-q2-c) R2(q1)=q2=1/2(a-q1-c)
1/2(a-c)
a-c
q2

第二章完全信息静态博弈.

①信息集（information set）：描述i信息特征（博弈树上的所有决策结分割成不同的信息集。每个信息集是决策结集合的一个子集），该子集包括所有满足下列条件的决策结：
a、每一个决策结都是同一参与人i的决策结； b、i知道博弈进入该集合的某个决策结，但不知道自己究竟处于哪一个决策结（见教材，P141）。如房地产开发博弈I（见图2.1）：A信息集为{大，小}，B的信息集为{大}或{小}。 ②完美信息（perfect information）：i对任一对手及N的行动有准确了解，每个信息集都是单结的。（完美信息博弈：博弈中没有任何两个参与人同时行动并且所有后行动者确切地知道前行动者选择了什么行动，所有参与人观察到自然的行动）。
③在自然作选择的结上，有自然选择不同枝的概率。
④有划分每个参与人的结的信息集。
⑤在每一个终点结上都有对每一个参与人的支付。
博弈树（game tree）
博弈树（game tree）除⑤以外与扩展式都一样。在博弈树中，扩展式中的⑤点变为：5’在每一个终点结上都有结果。
“博弈树”是一个比“扩展式”更为灵活的术语，如果结果被定义为支付组合，则两者并无差别。
不开发
(4,4)
(8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1)
(0,0)
图2.1 房地产开发博弈I
（3）信息（information）
结（node）：i或N采取行动的时点（决策结），或者博弈结束的时点。
结x的后续结（successor）：已经到达x之后才有可能在随后的博弈中到达的结，并定义T(x)为x之后的所有结的集合，t(x)为x的直接后续结。
许多不完全信息博弈都是不对称信息博弈，但这两个概念并不等价。

1 完全信息静态博弈

博弈论与信息经济学
(Game Theory and Information Economics)
第2章：完全信息静态博弈
Chapter 2: Static Game of Complete Information
完全信息静态博弈

静态博弈（同时行动博弈）
所有参与人同时选择行动，而且只选择一次如，罚点球时，守门员和对方射手必须同时决策 “同时”是一个信息概念，而不一定与日历上的时间一致在博弈中，如果参与者在不知道对手如何选择的情况下行动，该博弈就是静态的。
1 囚徒困境与占优战略均衡

现实生活中其他囚徒困境的例子
曾经威胁世界整个甚至人类的军备竞赛

公共资源过度开采/公共品供给短缺
大学扩招、研究生扩招、大学贷款基建年年都有的评优评先活动各种资格考试广泛盛行备受批评却日益严重的应试教育
1 囚徒困境与占优战略均衡

如何走出囚徒困境?

基于收益矩阵的模型描述：参与人
囚徒 B 坦白抵赖囚徒B可选策略囚徒 A坦白抵赖
-8，-8 -10，0
0，-10 -1，-1
囚徒 A 的支付
囚徒 B 的支付
1 囚徒困境与占优战略均衡

博弈中参与人只拥有有限个离散型的纯战略供其选择。如篮球比赛中的运球、过人和投篮离散型策略另一些博弈中，在其他博弈中，每个参与者的纯策略可以是来自一个连续范围的一个数。如厂商定价连续策略

离散型策略静态博弈通常用支付表来表示 ——博弈的战略式表述
1 囚徒困境与占优战略均衡

从一方的角度看，选择“坦白”比选择“抵赖”好，无论他关于对方的选择持有何等信念。我们就说，对于囚徒而言，“坦白”的策略是一个占优策略，以不变应万变或者说“抵赖”的策略是一个劣策略。

第二讲完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。

在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义：在博弈 G S1,..., Sn ; u1,..., un 中，
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策，也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中，如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。合，则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中， * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡，则严格下策反复消去法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法思路对博弈中的每个策略组合进行分析，考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。如能，则从所分析的策略组合对应的得益数组引一箭头，到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

完全信息静态博弈

• （三）最优反应函数法 • 所谓最优反应，指的是对某个局中人而言，当其他人的策略给定时，使自己的收益最大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中，彼此都互为最优反应，那么，这个结果是均衡的，我们称之为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如下: p (q1 q2 ) ，边际称为常数c ，产量为 qi 。
• 首先，推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组，可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因，例如，大家都靠右边行驶。
• 交通博弈：人们可以选择靠左或靠右行驶。
•
R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争（Battle of Sexes）
•
F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球，女士偏好看戏。 • 两者既有协作，又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。三个实验：（1）你是其中之一（男士），如何选？（2）如果女士有权声明：看戏，你如何选？（cheap talk) • （3）如果女士有权发表如上声明，但放弃了，你如何选？
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白，而另一方不坦白。则坦白的一方因立功而释放；不坦白的一方因抗拒且证据确凿，从众判10年徒刑。

第二章完全信息静态博弈的基本理论

第二章完全信息静态博弈的基本理论第二章完全信息静态博弈的基本理论0．完全信息（complete information）博弈与不完全信息（incomplete information）博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识；只要有一个参与人的支付函数不是该博弈的公共知识，就意味着该博弈是不完全信息博弈。

特别提示：如果该博弈是完全信息博弈，这意味着参与人不仅知道自己是什么类型的人，也知道对手们是什么类型的人。

一．求解方法之一：剔除严格劣策略1.占优策略与劣策略。

严格占优策略与严格劣策略：不管对手采取什么策略，如果参与人采取a策略所获得的支付严格大于b策略，则称a策略是相对于b 策略的严格占优策略（strictly dominating strategy），b策略是相对于a策略的严格劣策略（strictly dominated strategy）。

弱占优策略与弱劣策略：不管对手采取什么策略，如果参与人采取a策略所获得的支付不低于b策略，且至少有一种情况下的支付会严格大于b策略，则称b策略是相对于a策略的弱劣策略（weakly dominated strategy ）；a策略则是相对于b策略的弱占优策略（weakly dominating strategy）。

占优策略就是我们平时所说的上策，劣策略就是我们平时所说的下策。

特别提示：本文对占优策略的理解与其他教材不同，本文可以将以上述方式定义出来的占优策略称为局部占优策略；如果不管对手采取什么策略，如果参与人采取a策略所获得的支付严格大于其他所有策略，则称a策略是全局严格占优策略。

类似地，可以定义局部劣策略与全局劣策略。

理性的人在博弈时绝对不会选择严格劣策略。

通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。

2.案例案例1乙坦白不坦白甲坦白－6－6－10不坦白－10－1－1案例2乙不作广告作广告甲不作广告 8810 2作广告 21044在上面的两个例子中，通过剔除严格劣策略，可以获得一个占优策略均衡（坦白，坦白），（作广告，作广告）。

博弈论日记（2）完全信息静态博弈基础理论

博弈论⽇记（2）完全信息静态博弈基础理论1.1.博弈的标准式和纳什均衡1.1A.博弈的标准式表述⾸先我们来说明⼀下什么是完全信息静态博弈，静态博弈指开始时由参与者同时选择⾏动，然后根据所有参与者的选择，每个参与者得到各⾃的结果。

完全信息博弈即每⼀个参与者的收益函数（根据所有参与者选择⾏动的不同组合决定某⼀参与者收益的函数）在所有参与者之间是共同知识。

之所以称为基础理论，是因为本⼩结要解决两个基本问题：如何描述⼀个博弈以及如何求博弈的解。

定义：在⼀个n⼈博弈的标准式的表述中，参与者的战略空间为S1，S2，……，Sn，收益函数为u1，u2，……，un，我们⽤G={S1,S2,……,Sn；u1，u2，……，un}表⽰此博弈。

1.2B.重复剔除严格劣策略上⾯是博弈论的表述⽅法，下⾯是⼀个关于博弈论的解的⽅法（虽然不常⽤）。

定义：在标准式的博弈G={S1,S2,……,S3;u1，u2，……，un}中，令Si′和Si″代表参与者i的两个可⾏战略（即Si′和Si″是Si中的元素）。

如果对其他参与者每⼀个可能的战略组合，i选择Si′的收益都⼩于其选择Si″的收益，则称战略Si′相对于Si″是严格劣战略。

ui（S1，S2,…，Si′，…，Sn；u1，u2，…，ui′，…un}<ui{S1，S2,…，Si″，…，Sn；u1，u2，…，ui″，…un}1/2 L2 R2 M2L1 1,0 1,2 0,1R1 0,3 0,1 2,0参与⼈1有两个可选策略，S1={L1,R1}，参与⼈2有三个可选策略S2={L2,R2,M2}。

在这个博弈中，对参与⼈1来说L1和R1都不是严格占优的。

因为如果参与⼈2选择L2，参与⼈1L1优于R1；参与⼈2选择R2，参与⼈1L1优于R1;参与⼈2选择R2，参与⼈1R1优于L1;但对参与⼈2来讲，M2是严格劣于R2的，因此理性的参与⼈2是不可能选择M2的，就可以把M2在战略空间中剔除，如果参与⼈1知道参与⼈2是理性的，那么他就可以将这个博弈视为下图：1/2 L2 R2L1 1,0 1,2R1 0,3 0,1此时⼜产⽣了⼀个新的情况，对于参与⼈1来讲，R1⼜是严格劣与L1的，因此就可以将R1在参与⼈1的战略空间中剔除，博弈⼜变成了如下情况:1/2 L2 R2L1 1,0 1,2此时双产⽣了⼀个新的情况，对于参与⼈2来讲，L2⼜是严格劣与R2的，因此就可以将L2在参与⼈2的战略空间中剔除，博弈双变成了如下情况:1/2 R2L1 1,2上述的过程就可以称为“重复剔除严格劣策略”。

第2章完全信息静态博弈

存在问题
▪ 伯特兰德模型之所以会得出这样的结论，与它的前提假定有关。从模型的假定看至少在以下两方面的问题：
▪ ①假定企业没有生产能力的限制。如果企业的生产能力是有限的，它就无法供应整个市场，价格也不会降到边际成本的水平上。
▪ ②假定企业生产的产品是完全替代品。如果企业生产的产品不完全相同，就可以避免直接的价格竞争。
演唱会
李亚
足球
2，1
鹏
演唱会－1，－1
0，0 1，2
某策略组合只有指向的箭头，没有指离的箭头，则为稳定性的策略组合
猜硬币方
盖
硬币
正面
方反面
正面
方面
－1，1 1，－1
1，－1 －1，1
博
弈上方
1
下
博弈方2
左
中
右
1，0 1，3 0，1
0，4 0，2 2，0
1.3 画线法
由于决策的原则是使自己的得益尽可能的大。同时由于一方的得益取决于其他方的策略。
s
令p 为商店i的价格，D (p ,p ) 为需求函数， i=1,2。
i
i 12
如果住在x左边的将都在商店1购买，而住在xs右边的将在商店 s 2购买，需求分别为：
D =x，D =1-x，
1
2
这里x满足 p1+tx=p2+t(1-x)
解上式，得需求函数分别为： D1(p1，p2)=x=(p2-p1+t)/2t D2(p1，p2)=1-x=(p1-p2+t)/2t
第二章
博弈论——完全信息静态博弈
static games of complete formation
完全信息静态博弈

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第二章完全信息静态博弈的基本理论0．完全信息（complete information）博弈与不完全信息（incomplete information）博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识；只要有一个参与人的支付函数不是该博弈的公共知识，就意味着该博弈是不完全信息博弈。

特别提示：如果该博弈是完全信息博弈，这意味着参与人不仅知道自己是什么类型的人，也知道对手们是什么类型的人。

一．求解方法之一：剔除严格劣策略1.占优策略与劣策略。

严格占优策略与严格劣策略：不管对手采取什么策略，如果参与人采取a策略所获得的支付严格大于b策略，则称a策略是相对于b策略的严格占优策略（strictly dominating strategy），b策略是相对于a策略的严格劣策略（strictly dominated strategy）。

占优策略就是我们平时所说的上策，劣策略就是我们平时所说的下策。

类似地，可以定义局部劣策略与全局劣策略。

理性的人在博弈时绝对不会选择严格劣策略。

通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。

2.案例案例1乙甲坦白不坦白案例2乙不作广告甲不作广告作广告在上面的两个例子中，通过剔除严格劣策略，可以获得一个占优策略均衡（坦白，坦白），（作广告，作广告）。

3.请思考下面这个例子是否存在占优策略均衡？经过重复剔除严格劣策略，可以获得一个占优策略均衡（上，中），这就是求解方法之一——严格劣策略的迭代剔除方法。

思考：占优策略均衡（上，中）是通过不断剔除严格劣策略而获得的，为了成功地进行剔除，需要什么样的前提条件？由此可以理解公共知识的重要性。

4.思考：下面这个博弈是否存在占优策略均衡？5．社会（或集体）困境（dilemma）、合作与非合作博弈、占优策略均衡（1）案例案例1：霍布斯博弈假设鲁滨逊与星期五生活在一个自然状态之中。

为了生存，他们各自有两个选择：自己生产财富或掠夺对方的财富。

博弈情形如下：乙甲生产掠夺思考：面对囚徒困境、广告博弈、霍布斯博弈，请思考如何解决社会困境？（答案略；最低价格承诺实际上就是为解决寡头之间的串谋困境提供了有效的解决机制）案例2：1964年以前，美国香烟的电视广告非常普遍，1964年卫生总监的报告宣布以后，美国四大烟草公司经过协商与联邦政府达成协议，决定不再做电视广告，协议于1971年生效。

各大烟草公司的利润得以大幅增加。

（2）合作博弈与非合作博弈A合作博弈：参与人直接事先达成具有约束力的协议，以集体协商的方式选择策略，故又可称之为联盟博弈。

由此形成的策略选择与支付被称为博弈的合作解，通常以帕累托最优作为度量标准。

合作博弈其实就是指参与人在行动前能够实现进行沟通、交流，且沟通交流达成的协议是有约束力的。

B非合作博弈：又称策略博弈，参与人以独立的方式选择策略。

由此形成的策略选择与支付被称为博弈的非合作解。

C一般所说的博弈论是指非合作博弈理论。

（3）社会（或集体）困境与占优策略均衡A所谓社会（或集体）困境就是指博弈的不合作解与合作解相悖。

B凡是存在社会（或集体）困境问题的场合必定存在占优策略均衡，即社会（或集体）困境问题是存在占优策略均衡的重要博弈类型。

C注意：不要认为占优策略均衡都一定意味着社会（或集体）困境。

以下面的政治博弈为例：甲乙作为竞选的对手，分别有三种立场可以选择：左中右；选民的分布是对称的；甲乙均追思考：该博弈存在占优策略均衡吗？该博弈存在社会困境吗？从这个博弈可以看出，只有中间立场在政治上被充分表达，绝大多数的非中间立场的选民的立场被严重忽视。

（4）占优策略均衡在制度设计中有着广泛的应用价值。

二．求解方法之二：最优反应法——符合理性人性质的方法，博弈论最重要的求解方法1.最优反应策略：给定其他所有参与人策略选择的情况下，能够给某参与人带来最大收益的策略，其思维过程为：如果对手采用……，某参与人就应该采用……。

这是一种相对优势策略。

通过最优反应方法所获得的博弈解称之为纳什均衡。

2.如何寻找纳什均衡？划线法（仅适合二人有限策略博弈）案例2 选址博弈甲乙两家百货公司考虑开店，可供选择的地址有四个：市郊、市中心、城市东部、城市西部。

具体支付情况如下：3.纳什均衡：它是由全部参与人所选择的策略构成的这样一个组合，在这个组合中，每个参与人的策略都是针对其他参与人人策略选择的最优反应。

特别注意，均衡是针对策略组合的，而不是支付组合的，即在上面的博弈中，（下，右）才是均衡，（6 6）是这个博弈的均衡结果，不要把均衡与均衡结果混淆，这显然与微观经济学不同，在微观经济学中均衡是针对结果而言的。

4.关于纳什均衡的体会：纳什均衡具有策略稳定性，在均衡状态之下没有人愿意单方面改变自己的策略选择，因此，纳什均衡具有自我实施特征。

特别说明：策略稳定性不同于均衡稳定性。

5.纳什均衡与占优策略均衡（1）占优策略均衡肯定也是纳什均衡，但是纳什均衡不一定是占优策略均衡。

（2）纳什均衡与占优策略均衡都是博弈的非合作解。

6.多重纳什均衡问题（1）寻找下列博弈的纳什均衡案例1 节目选择博弈案例2 夫妻博弈妻夫足球芭蕾上述两个例子的共同特点就是存在多个纳什均衡，这是纳什均衡的最大缺陷，降低了纳什均衡解的预测能力，因为一旦参与人的预期不一致，就可能出现极为糟糕的结局。

（2）多重纳什均衡的精炼（refine ）所谓精炼就是通过附加另外的合理的标准，使得某些不合理的纳什均衡被剔除掉，以减少纳什均衡的个数，提高理论分析对现实的预测能力（因为纳什均衡只是涵盖了理性的一个方面：最优反应）。

精炼方法之一：寻找支付帕累托占优均衡乙甲推不推通过比较发现，精炼方法之二：寻找风险占优均衡通过比较发现，在上面的博弈中，（不推，不推）在风险上优于（推推）精炼方法之三：寻找焦点(focus)或谢林点（schelling point）所谓焦点就是指那些依据某种线索或信号（如：历史、习俗、惯例、经验、自然或社会标志物）能够成为所有博弈参与人共识的纳什均衡。

特别说明：一方面，习俗和惯例能够为多重纳什均衡提供解，另一方面，习俗和惯例的稳定性正在于它们是纳什均衡。

虽然依据某些线索或信号，某个纳什均衡更有可能发生，成为博弈的焦点，但是并不是所有存在多重纳什均衡的博弈都有焦点。

三．求解方法之三：最大最小（maxmin）方法，一种非常保守稳健的方法1.最大最小策略：首先确定参与人在每一个策略下所能够获得的最小支付，在所有的最小支付中最大那个支付所对应的策略就是最大最小策略。

由所有参与人的最大最小策略所构成的策略组合就是博弈的最大最小解，2.案例案例1：抢答博弈乙甲按不按案例2：开车博弈乙甲等待前行3.最大最小解与纳什均衡的关系（1）零和博弈与非零和博弈；常数和博弈与非常数和博弈零和博弈：在任何博弈策略组合下所有参与人的支付总和均为零。

非零和博弈：在任何博弈策略组合下所有参与人的支付总和并不都是零。

常数和博弈：在任何博弈策略组合下所有参与人的支付总和为一个常数，其实任何常数和博弈均可以转化为零和博弈。

非常数和博弈：在任何博弈策略组合下所有参与人的支付总和不是一个常数。

（2）在常数和博弈中，最大最小解与纳什均衡解是一致的。

在非常数和博弈中，最大最小解与纳什均衡解可能不一致。

采用最大最小方法的逻辑在于无论我选择什么策略，对手的最佳反应是采取使我支付最低的策略，故这个方法特别适合于零和博弈。

特别注意：最大最小方法并不适用于求解所有的零和博弈，如配硬币博弈就是一个例子。

案例：配硬币博弈乙甲正面反面（3）当最大最小解与纳什均衡解不一致时，采用哪种方法更加合理？一般来说，纳什均衡解更加合理，但是一旦存在多重纳什均衡且无法进行精炼，博弈存在极大的不确定性时，采用最大最小方法更加合理。

思考：配硬币博弈是否存在纳什均衡？乙甲正面反面四．混合策略纳什均衡1.在配硬币博弈以及儿童常玩的“石头、剪刀、布”一类的游戏中，按照我们前面给出的寻找纳什均衡的方法，不存在纳什均衡。

对这类游戏，人们的一个经验就是避免行为的规律性，随机地选择自己的策略，使得对手摸不着北，然后看能否凭运气击败对手，即使自己的策略选择具有不可预测性。

2. 混合策略(mixed strategy)与纯策略（pure strategy）（1）混合策略：参与人策略集上的概率分布，即参与人以随机方式选择策略。

假设参与人拥有两个策略，则混合策略可以写成（p,1-p）；假设参与人拥有三个策略，则混合策略可以写成（p,r,1-p-r）（2）纯策略：参与人以非随机的方式选择策略，其实，纯策略是一种特殊的混合策略。

纯策略其实就是指博弈矩阵旁边标示的策略，或者说参与人策略集中所包括的策略。

3．参与人的期望支付（1）一旦参与人采取混合策略，参与人的支付就必须用期望支付来表示。

（2）一个实例：计算甲乙参加配硬币博弈的期望支付乙甲正面反面假设甲选择正面的概率为p EU 甲＝(11(1))p q q -•+•-＋(1)(1(1)(1))p q q -•+-•-＝(21)(12)q p -- EU 乙＝(21)(21)q p --（3）二人博弈中计算期望支付的一般公式1mi EU ==∑甲1ni j ijj p q a=∑1mi EU ==∑乙1nij ijj p q b=∑依据：当对手正在进行随机选择时，他一定会选择这样的概率组合，使得我选择任意纯策略的期望收益均相等，从而使我无从下手，所以我也将进行随机选择，而且我选的概率组合也会使得对手无所适从。

于是所有参与人的混合策略就构成了一个纳什均衡。

4．混合策略纳什均衡（1）混合策略纳什均衡是指这样一个策略组合，每个参与人的混合策略都是针对其他参与人所选择的混合策略的最优反应。

相应地，过去所说的纳什均衡就叫纯策略纳什均衡。

（2）如何计算混合策略纳什均衡？案例1：计算配硬币博弈的混合策略纳什均衡（答案略）案例2：计算夫妻博弈的混合策略纳什均衡，并且将混合策略均衡下参与人的支付与纯策略情况下的支付进行比较（答案略，注：协调博弈下的混合策略纳什均衡是不稳定的，只要略为偏离该概率分布，参与人的最优反应策略就是纯策略）。