微观经济学第十章 博弈论初步.ppt
微观经济学-第十章-博弈论初步PPT课件

[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
高鸿业,微观经济学,第七版,课后答案,西方经济学18第十章博弈论初步

第十章 博弈论初步第一部分 教材配套习题本习题详解一、简答题1.什么是纳什均衡?纳什均衡一定是最优的吗?解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。
(2)不一定。
如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。
例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是 最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。
如:囚徒 困境。
2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的纳什均衡最多可有几个?为什么?解答:在只有两个参与人 (如 A和 B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。
例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。
A 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211a a a aB 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211b b b b例如:a 11=a 12=a 21=a 22,b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。
具体事例为: 73737373⎡⎤⎢⎥⎣⎦3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。
试举一例说明。
解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的 纳什均衡可能有4个、3个、2个、1个和0个五种情况,所以可能有3个。
例如,当参与 人A与B的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。
A 的支付矩阵= ⎥⎦⎤⎢⎣⎡22211211a a a a B 的支付矩阵=11122122b b b b ⎡⎤⎢⎥⎢⎥⎣⎦ A 、B 共同的支付矩阵=1111121222222121a b a b a b a b ⎡⎤⎢⎥⎢⎥⎣⎦具体事例为: 76157323⎡⎤⎢⎥⎣⎦4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所 有的纯策略纳什均衡?解答:可使用条件策略下划线法。
博弈论讲义完整PPT课件

如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
博弈论ppt完整版

不能用重复剔除求解的博弈
许多博弈没有占优均衡,也没有重复剔除的占优 均衡。
左中右 上 1, 0 1, 3 0, 1 下 0, 4 0, 2 2, 3
实用性较强的博弈分析方法,必然是以策略之间的 相对优劣关系,而不是绝对优劣关系为基础的,根据 这样的思路,很容易导出博弈分析的“划线法”。
划线法
价格制度
——人类为达到合作和解决冲突所发明的重要制度之一
传统的新古典经济学就是以价格为研究对象的,故 又称为价格理论。其基本假设:
市场参与者的数量足够多,从而市场是竞争性的 参与者之间不存在信息不对称问题
- 传统经济学的假设及其局限性
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格” 参数之中
因此,以上五个 策略都不可能被 双方接受!
五、纳什均衡与一致性预期
纳什均衡:所有参与人的最优战略的组合, 即给定战略中别人的选择,没有人有积极性 改变自己的选择。
构成纳什均衡的策略一定是重复剔除严格劣 策略过程中不能被剔除的策略,当然,逆定 理是不存在的。
许多不存在占优策略均衡或重复剔除的占 优策略均衡的博弈,也存在纳什均衡。
企业利润最大化的条件为:
Π1 q1
a 2q1
q2
c
0
Π 2 q2
a q1
2q2
c
0
q1
R(q2
)
a
2
c
q2 2
q2
R(q1 )
a
2
c
q1 2
纳什均衡产量为:
q1NE
q2NE
ac 3
纳什均衡利润为:
第十章博弈论(微观经济学-南开大学刘骏民)

⒋寻求纳什平衡 首先思索A的战略,关于B的每一个给定战略,找出A
的最优战略,在其对应的支付下划一横线,再用相似的方 法找出B的最优战略。完成这个进程后,假设某个支付组 合的两个数字下都有线,这个支付组合所对应的战略组合 就是一个纳什平衡。
表10-7 寻求纳什均衡Βιβλιοθήκη 参与人BLC
R
参与人A
U
0,2 1,4
三、博弈的要素
博弈的要素包括参与人、举动、信息、战略、支付、 结果战争衡,其中,参与人、战略和支付是描画一个博 弈所需求的最基本的要素,参与人、举动和结果统称为 博弈规那么。
①参与人:指一个博弈中的决策主体在囚徒困境模 型中,有两个参与人,即〝囚徒A〞和〝囚徒B〞。
②举动:是参与人在博弈的某个时点的决策变量。 在囚徒困境模型中,囚徒A、B都只要两种举动可供选择, 即〝坦率〞和〝供认〞。
一切参与人占优战略的组合称为占优战略平衡。
⒉重复剔除的占优平衡
思索〝智猪博弈〞例子。猪圈里围着中间猪,一头大 猪,一头小猪。猪圈的一头有一个猪槽,另一头装置了一 个按钮,控制着猪食的供应。按下一按钮会有8个单位的 猪食进槽,但按下按钮的猪需求付出2个单位的本钱。假 定大猪先到,大猪吃到7个单位,小猪只能吃1个单位;假 定同时到,大猪吃5个单位,小猪吃3个单位;假定小猪先 到,大猪和小猪各吃4个单位。表10-5的Ⅰ表列出对应不同 战略组合的支付水平,如第一格表示中间猪同时按下按钮, 就会同时走到猪食槽,大猪吃5个单位,小猪吃3个,扣除 2个单位的本钱,支付水平区分为3和1。
20世纪70年代以后,经济学家末尾强调团体理性。
⒉博弈论与主流经济学 博弈论进入主流经济学,反映了经济学开展的以下几
个趋向:①经济学研讨的对象越来越转向集体,坚持了一 些没有微观基础的假定;②经济学越来越转向人与人之间 竞争与协作的研讨,特别是经济学留意到理性人的团体理 性行为能够招致的团体非理性;③经济学越来越注重对信 息的研讨。
博弈论最全完整ppt讲解

人们在日常生活中进行着博弈,与配偶,朋友,陌 生人,老板/员工,教授等。
类似的博弈也在商业活动、政治和外交事务、战争 中进行着——在任何一种情况下,人们相互影响以 达成彼此有利的协议或者解决争端。
博弈论为众多学科提供了分析的概念和方法:经济 学和商学,政治科学,生物学, 心理学和哲学。
案例1:囚犯困境
支付 嫌疑人A
嫌疑人 B
抵赖
坦白
抵赖 -1,-1 0,-9
坦白 -9,0 -6,-6
均衡与均衡结果
均衡战略(坦白,坦白) 均衡支付(-6,-6)
第二节 纳什均衡
占优战略均衡 重复剔除的占优战略均衡
纳什均衡
完全信息静态博弈的几点特性
同时出招,出招一次; 知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的
如何在博弈中获胜?
…… 真的能在博弈中(总是)获胜吗? 对手和你一样聪明! 许多博弈相当复杂,博弈论并不能提供
万无一失的应对办法。
例1:无谓竞争(The GPA Rat Race)
你所注册的一门课程按照比例来给分:无论卷面分数是 多少,只有40%的人能够得优秀,40%的人能得良好。
所有学生达成一个协议,大家都不要太用功,如何?想 法不错,但无法实施!稍加努力即可胜过他人,诱惑大矣。
与战略式表述
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行为发生直 接相互作用时候的决策以及这种决策的均衡问题。
博弈的战略式表述:G={N,(Si)iN,(Ui)iN} 有三个基本要素: (1)参与人(players)iN={1,2,…,n} ; (2)战略(strategies),siSi(战略空间); (3)支付(payoffs),ui=ui(s-i,si)。
【精品】微观经济学PPT课件(完整版)

Q =f( P, Pc, T, Pf, G E…) Q =f (P) P Q =-c+d·
s s
s
2.6 供给量的变动与供给的变动
2.6.1 供给量的变动 由商品自身价格变化导致的变化
1.6.2 供给的变动
由价格以外的因素的变化导致的变化
3 均衡价格的决定
3.1 均衡价格和均衡数量
均衡价格 指某种商品的市场需求量和市场供给量相等时的价格。 均衡数量 在均衡价格水平下的相等的供求数量 均衡点 需求曲线和市场供给曲线相交的交点
轿车供给量增加的可能原因
—轿车价格上涨
—油价下降 —摩托车价格上升 —自动化水平提高 —工人工资下降 —减少进口汽车配件的关税 —轿车将大规模进入家庭
2.3 供给定理
在其他条件不变的情况下,某商品的供给量与价格之间成 同方向变动。
2.4 供给表与供给曲线
某商品的供给表
某商品的供给曲线
2.5 供给函数
供给点弹性的图形
4.3.4 影响供给弹性的因素
(1)长期和短期
(2)技术状况:技术含量
技术类型
(3)生产周期
案例:为什么石油输出国组织不能长久保持石油的高价格?
案例:禁毒增加还是减少了与毒品相关的犯罪?
5 供求理论与经济政策
5.1 最高价格/限制价格
优点:有利于社会的安定和 平等。 缺点:1、短缺(排队,配给) 2、浪费 3、黑市
微观经济学
主要内容
第1章导论 第2章 供求理论 第3章 消费者行为理论 第4章生产理论 第5章 成本理论 第6章 市场理论 第7章 分配理论 第8章 福利经济学 第9章 市场失灵
第1章
导 言
经济学的研究对象 微观经济学的基本内容 微观经济学的研究方法 学习微观经济学的意义
博弈论PPT资料整理

博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。
1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。
2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。
博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。
于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。
中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。
博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。
生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。
而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。
特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。
由此可见,博弈论是适合所有人的科学。
在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。
博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。
可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。
从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损如果势均力敌,则应考虑到对手的反击手段。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当B选择U时,A会选择R,因为 5;当3 B选择D时,A会选择R,因为 。2 当0 A选择L时,B会选择U,因为 选择R时,B会选择D,因为 1。 0因此,依据纳什均衡定义,可知 D,是R纳什均衡。
4; 3当A
5.囚徒困境 囚徒困境的博弈模型的假设条件是:甲、乙两个被怀疑为合谋偷窃的嫌疑犯被警方抓获,但警方对他们偷窃的 证据并不充分。他们每一个人都被单独囚禁,并单独进行审讯,即双方无法互通信息。警方向这两个嫌疑犯交待的 量刑原则是:如果一方坦白,另一方不坦白,则坦白者从宽处理,判刑1年;不坦白者从重处理,判刑7年。如果两 人都坦白,则每人都各判刑5年。如果两个都不坦白,则警方由于证据不足,只能对每个人各判刑2年。表10-6的支 付矩阵描述了这一博弈。表中的报酬均为负数,以表示判刑的年数。
表10-5 寡头博弈:合作与不合作
【例10.2】考虑两寡头厂商A和B的如下支付矩阵,二者的(纳什)均衡策略组合为( )。
A.(U,L) B.(D,R)
C.(U,R) D.(D,L)
【答案】Bຫໍສະໝຸດ 【解析】在一个纳什均衡里,任何一个参与者都不会改变自己的最优策略.如果其他参与者均不改变各自的最
优策略,即要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。对于本题,
A.一个混合策略纳什均衡,即两人都以80%概率选择“避让”,以20%的概率选择“冲过去” B.两个混合策略纳什均衡,即每个青年人轮流采取避让或者冲过去 C.一个混合策略纳什均衡,即一人以80%的概率选择“避让”,另一人以20%的概率选择“冲过去” D.一个混合策略纳什均衡,即两人都以40%的概率选择“避让”,以60%的概率选择“冲过去” 【答案】A 【解析】根据题中条件可写出两人的收益矩阵,如表10-8所示。
2.混合策略[北京交通大学2004研;东北大学2007研;华中科技大学2008研] 答:混合策略是指在博弈中,博弈方的决策内容不是确定性的具体的策略,而是在一些策略中随机选择的概率 分别的策略。混合策略情况下的决策原则有以下两个: (1)博弈参与者互相不让对方知道或猜到自己的选择,因而必须在决策时利用随机性来选择策略,避免任何 有规律性的选择。 (2)博弈参与者选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性倾向的某一种 策略而在博弈中占上风。
表10-1 支付矩阵
二、同时博弈:纯策略均衡 “同时博弈”是参与人同时进行决策或行动的博弈。在同时博弈中,在给定其他参与人的策略时,某个参与人 的最优策略称之为该参与人的条件优势策略(简称条件策略),而包括该参与人的条件策略以及这些条件在内的所 有参与人的策略组合称之为该参与人的条件优势策略组合(简称条件策略组合)。 1.占优策略 在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。也就是说,无论其他参与人采取 什么策略,该参与人的最优策略是惟一的,这样的策略称之为占优策略。如表10-2所示,通过对支付矩阵的分析可 以看出,如果A、B两厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个 厂商都会选择做广告。这种策略均衡称之为占优策略均衡(equilibrium in dominant strategies)。
表10-2 广告博弈的支付矩阵
2.纳什均衡 并不是每个博弈的各个参与人都有一个占优策略。如表10-3所示,通过对支付矩阵的分析可以看出,现在厂商 A没有占优策略,它的最优决策取决于厂商B的选择。如果厂商B做广告,则厂商A最好也做广告;但如果厂商B不做 广告,厂商A不做广告又是最好的选择。这种均衡就是纳什均衡(Nash equilibrium)。所谓纳什均衡,指的是参与 人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。即如果在一个策略组合中, 当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
【例10.3】在一条狭窄巷子里,两个年青人骑着自行车相向而行。每人都有两个策略,即或者选择“冲过去” 或者选择“避让”。如果选择“避让”,不管对方采取什么策略,他得到的收益都是0。如果其中一个人采取“冲 过去”的策略,如果对方采取“避让”,那么他得到的收益是9;如果对方不避让,那么他得到的收益是-36。这个 博弈有两个纯策略纳什均衡和( )。
【例10.1】下列说法错误的是( )。 A.占优策略均衡一定是纳什均衡 B.纳什均衡不一定是占优策略均衡 C.占优策略均衡中,每个参与者都是在针对其他参与者的某个特定策略而做出最优反应 D.纳什均衡中,每个参与者都是在针对其他参与者的最优反应策略而做出最优反应 【答案】C 【解析】占优策略均衡中,不论其他参与者采取何种策略,每个参与者都会选择其自身的最优策略。
10.3 名校考研真题详解 一、名词解释 1.纳什均衡(Nash equilibrium)[浙江大学2005研;厦门大学2006、2008研;中南财经政法大学2007、2009 研;财政部财政科学研究所2008研;西安交通大学2009研] 答:纳什均衡(Nash Equilibrium)又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰·纳什的名字 命名。 纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略决定的情况下, 他选择了最好的策略。纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略, 任何个人都没有积极性去选择其他战略,从而这个均衡没有人有积极性去打破。 与其相联系的一个概念是占优策略均衡。占优策略均衡指这样一种均衡,不管其对手采取什么策略,该竞争者 采取的策略都是最优策略。纳什均衡指每一个竞赛者都确信,在给定竞争对手策略决定的情况下,他选择了最好的 策略。占优均衡是一种纳什均衡。占优均衡若存在,只存在惟一均衡,而纳什均衡可能存在多重解。
4.寻找纳什均衡的方法——条件策略下划线法 对于一个简单的“二人同时博弈”,可以用一个以二元数组为元素的支付矩阵来表示,并用“条件策略下划线 法”来确定它的纳什均衡。具体步骤如下: (1)把整个博弈的支付矩阵分解为两个参与人的支付矩阵。 (2)在第一个(即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线。 (3)在第二个(即位于整个博弈矩阵上方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线。 (4)将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵。 (5)在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合代表的策略 组合就是博弈的纳什均衡。
表10-7 社会福利博弈
所有参与人的混合策略的组合构成“混合策略组合”。混合策略组合与参与人的支付的乘积之和为参与人的期 望支付。当其他参与人的混合策略确定之后,某个参与人选择的可以使自己的期望支付达到最大的混合策略是该参 与人的条件混合策略(其几何表示为“条件混合策略曲线”)。不同参与人的条件混合策略曲线的“交点”就是混 合策略条件下的纳什均衡。可以证明,混合策略均衡总是存在的。
表10-6 囚徒困境
通过分析可以看出,囚徒困境的博弈有一个占优策略均衡(坦白、坦白)。但是,如果两人都是选择不坦白 (即合作),则都可以获得最好的结局。很清楚,囚徒困境的占优策略均衡反映了一个矛盾:即个人理性和团体理 性的冲突。
三、同时博弈:混合策略均衡 并不是所有的博弈都存在纳什均衡。比如,如表10-7所示。这博弈就不存在纯策略纳什均衡,但却存在混合策 略纳什均衡。混合策略纳什均衡是这样一种均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都 为自己确定了选择每一种策略的最优概率。
表10-8 两人的收益矩阵
乙 冲过去
避让
选择概率
冲过去
-36,-36
9,0
r
甲
避让
0,9
0,0
1 r
选择概率
c
1 c
从收益矩阵可看出,这个博弈有两个纯策略纳什均衡(冲过去,避让),(避让,冲过去)。设甲选择冲过去的概
率为 r ,乙选择冲过去的概率为 c 。对于甲来说,应该使冲过去的期望收益等于避让的期望收益,即 36r 91 r 0
图10-1 博弈树 在序贯博弈中,可能存在多个纳什均衡的情况。在多个纳什均衡中,有些可能并不合理。所谓对纳什均衡的 “精炼”,就是要从众多的纳什均衡中进一步确定“更好”的纳什均衡。纳什均衡的精炼方法通常是使用所谓的 “逆向归纳法”,具体包括以下两个步骤: 第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的 其他策略删除,从而得到原博弈的一个简化博弈。 第二步,再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。这个最简博弈,就是原博 弈的解;而在存在多重纳什均衡时,它就是对纳什均衡的精炼。
【例10.4】在下面的博弈树中,确定纳什均衡和逆向归纳策略。
答:纳什均衡是(决策1,决策3)、逆向归纳策略也是(决策1,决策3)。分析如下: (1)(决策1,决策3)是一个纳什均衡。在该策略组合上,没有哪个参与人愿意单独改变自己的策略。首先, 参与人B不会单独改变自己的策略。如果它单独改变策略,即将原来的决策3变为决策4,参与人B的支付将从原来的 3下降到0。其次,参与人A也不会单独改变自己的策略。如果它单独改变策略,即将原来的决策1变为决策2,则策 略组合就成为(决策2,决策3),参与人A的支付将从原来的1下降到0。 (2)采用逆向归纳法,可以判断出逆向归纳策略也是(决策1,决策3)。首先,如果参与人A选择决策1,参 与人B肯定不会选择决策4。另一方面,如果参与人A选择决策2,参与人B肯定不会选择决策4。在此情况下,考察参 与人A的选择。由博弈树可以看出,参与人A的最优选择是决策1。最终结果是,参与人A选择决策1,参与人B选择决 策3,即最优策略组合为(决策1,决策3)。
表10-3 广告博弈的支付矩阵
3.纳什均衡与占优策略均衡的区别 每一个占优策略均衡一定是纳什均衡,但并非每一个纳什均衡都是占优策略均衡。纳什均衡是有条件的占优策 略均衡。 一个博弈可能存在一个以上的纳什均衡,但是一个博弈也可能不存在纯策略纳什均衡,如表10-4所示。