寻找三个纳什均衡
纳什均衡

1.纳什均衡:给出对方的策略,你所选的是最优的(至少不比其它策略差),如果每个局中人都是这样,那么所构成的策略组合(对局),就称为纳什均衡。
2.效用:消费者偏好与收入之间的相互作用导致人们做出消费选择,效用则是人们从这种消费选择中所获得的愉悦或满足。
3.边际产量:当其他要素不变时,可变要素增加一个单位所带来的总产量的增加量。
4.生产成本:经营一个企业,为达到利润最大化,必须支付一些资金来维持运营,如建造厂房,采购机器及原料,雇用员工等支出都可视为厂家的生产成本。
5.帕累托标准:如果一种变化可以改善某些人的处境,同时对其他人都没有伤害。
则这种变化是好事,应该给予实行。
6.恩格尔系数:是食品支出总额占个人消费支出总额的比重。
一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购买食物的支出将会下降。
恩格尔系数是用来衡量家庭富足程度的重要指标。
7.效用:消费者偏好与收入之间的相互作用导致人们做出消费选择,效用则是人们从这种消费选择中所获得的愉悦或满足。
8.价格管制:是指政府对新药定价以及上市药品价格上涨实施严格的管制,企业不能自由定价,而是由政府和制药企业谈判决定新药的价格。
9.软着陆:当一个国家经过强劲的经济增长后,仍维持缓和的增长,并未因此转入衰退,即使“软着陆”。
10.硬着陆:一个国家的经济在高速增长的同时伴随着高度通货膨胀,使得经济迅速从增高长直接走入低增长甚至衰退。
11.通货膨胀:平均物价水平持续上扬的状态,通货膨胀率通常是以消费者物价指数(CPI)的变化率来表示。
指数上升→物价上升,货币购买力下降。
12.再贴现率:一般商业银行可以直接向中央银行借贷的利率。
所谓“贴现”:通过一定的方式把发生在未来(或不同时间)的费用和效益转化为现值的方式就叫贴现。
13.机会成本:在资源一定的情况下,多生产一个单位的某种产品,就要以少生产若干单位的另一种产品为代价。
博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡在纳什均衡中,你不一定满意其他的策略,但你的策略是回馈对手招数的最佳策略。
从囚徒困境中我们会发现,作为博弈各方的行动就是针对对方行动而确定的最佳对策,而一旦知道对方在做什么,就没人愿意改变自己的做法。
博弈论学把这么一个结果称为均衡。
这个概念是有普林斯顿大学数学家约翰·纳什提出的,因此被称为纳什均衡。
诺贝尔经济学奖获得者萨缪尔森有句名言,你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词,供给与需求。
博弈论专家坎多瑞引申说:“要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是纳什均衡”。
1950年,还是一名研究生的纳什写了一篇论文,题为《n人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。
纳什的贡献是,他证明了在这一类的竞争中,在很广泛的条件下是有稳定解存在的,只要是别人的行为确定下来,竞争者就可以有最佳的策略。
那么,什么纳什均衡呢?简单说,就是一策略组合中,所有的参与者面临这样的一种情况:给定你的策略,我的策略是我最好的策略。
给定我的策略,你的策略也是你最好的策略,即双方在对方给定的策略下不愿意调整自己的策略。
纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具,所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展,甚至说是一场革命。
纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战,按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果,从纳什均衡引出一个悖论:从利己的目的触发,结果损人不利己。
“囚徒困境”就是如此,从这个意义说,纳什均衡提出的悖论实际上动摇了西方经济学的基石。
纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。
这个法则如下:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。
所谓博弈均衡,它是一稳定的博弈结果。
均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。
3 混合纳什均衡

13
混合Nash均衡的解释(2)
纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最 优选择。因此在社会福利博弈中,* 0 . 2 , *=0.5是唯一的混合战略 纳什均衡。 从反面来说,如果政府认为流浪汉选择寻找工作的概率严格小于0.2, 那么政府的唯一最优选择是纯战略:不救济;
如果政府以1的概率选择不救济,流浪汉的最优选择是寻找工作,这 又将导致政府选择救济的战略,流浪汉则选择游荡。如此等等。
14
混合Nash均衡的解释(3)
流浪汉
政府
流浪汉
寻找工作的概率小于0.2
概率为1:不救济
寻找工作
政府 救济
15
猜谜游戏
求该猜谜游戏 的混合战略纳什 均衡
正面
1 -1, -1
5
社会福利博弈
寻找工作
2
流浪
3 -1,
救济
3, 1
0 0,
不救济
-1,
设:政府救济的概率:1/2 ;不救济的概率:1/2。
流浪汉:寻找工作的期望效用:1/2×2+1/2 ×1=1.5 流浪的期望效用: 1/2×3+1/2 ×0=1.5
因此,流浪汉的任何一种策略都是都是对政府混合战略的最优反应
6
社会福利博弈(2)
寻找工作
2 3, 1
流浪
3 -1, 0 0,
3r+(-1)(1-r)=4r-1
选择纯战略不救济的效用为:
-1r+0(1-r)=-r
如果一个混合战略(而不是纯战略) 是政府的最优选择,一定意味着政府 在救济与不救济之间是无差异的。
救济
不救济
-1,
4r-1=-r
第二讲纳什均衡

诚实 游客 游客收益10 商户收益5 不购买 游客收益0 商户收益-5 购买
欺诈 游客收益5 商户受收益10 游客收益0 商户收益0
案例讨论
2008年的美国总统大选让我们看到一 幕大戏。这场大戏的精彩部分并不是 迷住当与共和党的总统选举对决,而 是民主党总统候选人的提名选举。 民主党的提名竞选,最终只在希拉里 和奥巴马之间进行。在2008年之前, 奥巴马只是一个默默无闻的小角色, 他那年才46岁,只有3年的国会参议员 和伊利诺伊州参议员的工作经历,但 他是当时国会中唯一一位黑人参议员, 也是
2、纳什均衡一定是在重复剔除严格劣战略过 程中没有被剔除掉的战略组合,但没有被剔除 的战略组合不一定是纳什均衡,除非它是唯一 的。(这句话并不适用于弱劣战略剔除的情况)
第二节
纳什均衡
三、寻找纳什均衡的方法 (一)劣势策略反复消去法 民主党 主动增税 被动增税 2,2 1,4 主动增税 共和党 4,1 3,3 被动增税
纳什均衡
纳什均衡:(被动增税,被动增税) 巨额赤字
试一试:劣势策略反复消去法
上 参与人1 下 参与人2 左 中 右
1,0
0,4
1,3
0,2
0,1
2,0
第二节
纳什均衡
三、寻找纳什均衡的方法 2000:军费支出 (二)相对优势策略划线法 -∞:丧失主权 8000:掠夺者赢利 0:军费支出为零,和平 原苏联 共处 扩军 裁军 -2000,-2000 8000,-∞ 扩军 美国 -∞,8000 0, 0 裁军
2 TR TC p2 (a p2 bp1 ) (a p2 bp1 )c
伯川德模型
通过令一阶导数为零,得到:
纳什均衡3

• 如果潜在进入者选择不进入,在位者选择斗争,那么潜在进入者的收 益为 0,在位者的收益为 20。
• 如果潜在进入者选择不进入,在位者选择默许,那么潜在进入者的收 益为 0,在位者的收益为 15
知己知彼 百战不殆 27
• 采用“划横线法”寻找“市场争夺战”博弈的纳什均衡
在位者 斗争 进入 (-10,-10) 默许 ( 5, 5 )
3,0
33
1 纳什均衡与占优策略均衡的关系? 2 举出纳什均衡的问题,建立模型进行分析。
知己知彼 百战不殆
34
Thank you!
LOO
知己知彼,百战不殆
LOO
知己知彼,百战不殆
LOO
主要内容
1. 什么是纳什均衡 2. 如何寻找纳什均衡 3. 纳什均衡怎么应用 4. 小结与思考
LOO
1、什么是纳什均衡
乙 B1 A1 甲 A2 A3 (500,150) (400,200) (400,400) (450,150) (150, 450) (350,350) (450,450) B2 (150,500) B3 (200, 400)
知己知彼,百战不殆
LOO
• 假设在市场中有两个竞争对手。一个是已经在市场中的“在位者”, 另一个是企图进入市场的“潜在进入者”。
• 潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个 可以选择的策略:斗争、默许。
• 如果潜在进入者选择进入,在位者选择斗争,那么激烈的市场竞争会 使得双方均亏损,双方收益均为 -10。 • 如果潜在进入者选择进入,在位者选择默许,那么双方在市场中均可 获得收益 5。
R2
R3
4,0
3,5
0,4
3,5
纳什均衡的数学定义

纳什均衡的数学定义哎呀呀,啥是纳什均衡呀?对于我这个小学生(初中生)来说,一开始听到这四个字,简直就像听到了外星语言一样,完全摸不着头脑!咱们先来说说啥叫均衡。
就好比玩跷跷板,两边重量差不多,谁也压不下去谁,这就叫均衡。
那纳什均衡又是啥呢?假设咱们班组织了一场拔河比赛,分成两队,每队都想赢。
如果我们队使足了劲儿,对方没使多大劲儿,那我们可能一下子就把对方拉过来了,这就不均衡。
可要是我们两队都使出了差不多的力气,谁也拉不过谁,这是不是就有点像均衡啦?这其实就有点像纳什均衡的意思。
再打个比方,就像两个商家在卖同样的东西。
如果一家拼命降价,另一家不降价,那降价的那家可能生意就特别好,这不均衡。
但要是两家价格都差不多,谁也没法通过降价或者涨价来获得更多的顾客,这是不是就均衡啦?想象一下,在一个小镇上有两家超市,一家叫小红超市,一家叫小蓝超市。
小红超市的老板想:“我要是把价格降得特别低,那大家不都来我这买东西啦?”可他又一想:“不行呀,如果我降价,小蓝超市也跟着降价,那最后大家都赚不到钱,这可咋办?”小蓝超市的老板也在琢磨呢:“我要是涨价,会不会大家都去小红超市买东西啦?”这时候,纳什均衡就出现啦!两家超市的价格都差不多,服务也差不多,谁也不敢轻易变动,因为一旦变动,可能自己的利益就受损啦。
这就好像两个人在走钢丝,谁要是乱动,就可能掉下去。
所以他们都小心翼翼地保持着平衡,不敢轻易打破这个状态。
你说这纳什均衡神奇不神奇?它好像无处不在,影响着我们的生活。
比如说交通,大家都遵守交通规则,不抢行,这不就是一种纳什均衡嘛。
反正我觉得吧,纳什均衡虽然听起来挺复杂,但仔细想想,在我们身边到处都能看到它的影子。
它让这个世界变得好像有规律可循,大家都在一种平衡的状态里寻找着自己的利益。
我觉得吧,了解纳什均衡能让我们更明白这个世界是怎么运转的,能让我们在做决定的时候多想想,可太有用啦!。
纳什均衡

弈
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
2, 1 0, 0
0, 0 1, 3
课堂习题
• 用划线法求出均衡解
C1
C2
C3
R1
0,4 4,0 5,3
R2 4,0 0,4 5,3
R3 3,5 3,5 6,6
箭头法
• 思路:
– 对博弈中的每一个策略组合进行分析,考察在每个策略组合 处各个博弈方能否通过单独改变自己的策略而增加得益
– 与划线法一样都是基于策略之间的相对优劣关系进行分析的, 所得到的结果也是一致的。
– 如果能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后策略组合对应的得益数组
– 最后,只有指向,没有离开的策略组合为均衡解--稳定- -没有人愿意单独改变
箭头法
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
经典博弈故事之二--情侣博弈
•
大海和小丽正在热恋。难得的周末又到了,安排什么节目呢?周末晚上,
中国足球队要在世界杯外围赛中和伊朗队做生死之战。大海是个超级球迷,国
内的甲级联赛都不肯放过,何况是不争气的国家队的生死大战?也正好是这个
周末的晚上,俄罗斯一个著名芭蕾舞团莅临该市演出芭蕾舞剧《胡桃夹子》。
丽娟最崇尚钢琴、芭蕾这样的高雅艺术,对斯拉夫民族的歌唱和芭蕾更是崇拜
– 稳定的和自我强制的,所以是真正可预测的 – 反之,不具有一致预测性的博弈结果,则难以避免预测和行为之间的
矛盾,甚至是自我否定的。
•只有纳什均衡才具有一致预测的性质 •一致预测性是纳什均衡的本质属性 •一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致 的可能
第二讲纳什均衡

习题:齐威王田忌赛马矩阵
上中下 上中下
田忌
上下中 中上下 中下上 下中上 下上中
+3,-3 +1,-1 +1,-1 -1,+1 +1,-1
+1,-1 +3,-3 -1,+1 +1,-1 +1,-1
+1,-1 +1,-1 +3,-3 +1,-1 -1,+1
+1,-1 +1,-1 +1,-1 +3,-3 +1,-1
在第二行1 下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
20
第三节 纳什均衡
三、寻找纳什均衡的方法 (二)相对优势策略划线法 3.设定甲靠左行(第一行) 乙: 1>-1 乙相对优势策略:靠左行
在第一列 1下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
21
第三节 纳什均衡
四、古诺模型 max i 2.企业i的目标: π1=?,π2=? 3.企业利润最大化的一阶、二阶条件
1 0 q1 2 0 q2
2015年12月6日
2 1 2 0 2 q1 2 2 2 0 2 q 2
博弈论第二章 第二讲纳什均衡
35
第三节 纳什均衡
27
第三节
纳什均衡
要点:(1)箭 头指向的支付 大;(2)只有 一方单独改变 策略
三、寻找纳什均衡的方法 (三)箭头指向法 2.分析:(适度放牧,过度放牧) (1)给定乙不变,甲改变:0→10 (箭头向上) (2)给定甲不变,乙也不变
2015年12月6日
博弈论第二章 第二讲纳什均衡
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.首先将原始数据带入博弈计算程序,可以得到如下的答案:可以看到其中一个是纯策略,两个是混合策略。
2.首先用划线法找出可以找到第一个纯策略。
纯策略下张三和李四的收益组合为:(60,76),张三和李四的策略分别为(0,1,0)和(0,0,1)3.用消去法消去划线的两行
这样得到一个新的组合,
P
1-P
假设新的组合是符合混合纳什均衡策略 那么 张三选上下的策略为P ,1-P ; 李四选左中的策略为S,1-S.
根据纳什均衡的条件:李四的策略概率S ,1-S ,使得张三选择上下策略收益相同: 得到一个等式:12S+42(1-S)=72S+36(1-S). S=1/11 1-S=10/11; 此时张三的收益为:=12×1/11+42×10/11 = 432/11 = 39.27;
同样张三的概率P,1-P,使得李四选择左中的收益相等: 得等式:83P+47(1-P)=56P+95(1-P) P=16/25;1-P=9/25; 此时李四的收益:=83×16/25+47×9/25=53.12+16.92=70.04
综上为第二个混合策略纳什均衡张三和李四的策略分别为:(16/25,0,9/25)和(1/11,10/11,0),张三和李四的收益为(39.27,70.04) 第三步:一般的混合纳什均衡
设张三选择上中下的策略概率分别为p,q,1-p-q ;李四选择左中右的策略概率分别为s,t,1-s-t ; 李四的策略要使张三的策略收益相同:
12s + 42t + 42(1-s-t)=24s + 12t + 60(1-s-t)=72s + 36t + 42(1-s-t) s=1/27, t=10/27, 1-s-t= 16/27
此时张三的收益 张三收益 = 12*1/27+42*10/27+42*16/27=(12+420+672)/27=1104/27=40.89
同上可知张三需要确定一个行动概率,以使李四的选择在其收益上没有差异,得等式: 83p + 12q +47(1-p-q) = 56p + 42q + 95(1-p-q)=45p + 76q + 59(1-p-q) p=113/200, q=5/16, 1-p-q=49/400
此时李四的收益为 李四收益 =83*113/200+12*5/16+47*49/400=46.895+3.755.7575=56.40
综上,此混合策略纳什均衡相对于张三和李四的策略选择用概率分别表述为(113/200,5/16, 49/400)和(1/27,10/27,16/27),收益分别为(40.89,56.40)
第四步:最后策略
三个策略的收益为:(60,76)(39.27,70.04)和40.89,56.40)
通过帕累托上策为(60,76)对双方来说收益最大,所以张三(0,1,0),李 四(0,0,1)的纳什均衡点应是实际行为最可能的结果。
1-S
S。