混合策略纳什均衡多重均衡

1 引论:博弈三要素 2 同时决策博弈 3 混合策略纳什均衡

囚徒困境与纳什均衡的应用
? 例如,2000年我国几家生产彩电的大厂商 合谋将彩电价格维持高位,他们搞了一个 “彩电厂家价格自律联盟”,并在深圳举 行了由多家彩电厂商首脑参加的“彩电厂 商自律联盟高峰会议”。
? 寡头厂商在光天化日之下进行价格合谋, 并且还通过媒体大肆炒作,这在发达国家 是不可思议的。

? “彩电厂商自律联盟”只不过是一种
“囚徒困境”,彩电价格不会上涨。在
高峰会议之后不到二周,国内彩电价格
不是上涨而是一路下跌。这是因为厂商
们都有这样一种心态:无论其他厂商是
否降价,我自己降价是有利于自己的市
场份额扩大的。
长虹
低价
高价
3
1
康佳 低价 3
6
6
5
高价 1
5

商家价格战与零利润定理
出售同类产品的商家之间本来可以通过共同将价格维持在高位 而获利,但实际上却是相互杀价,结果都赚不到钱。
当一些商家共谋将价格抬高,消费者实际上不用着急,因为商 家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩 溃【如果对方高价,我低价可以卖得更多而占便宜;如果对方低价, 我不出低价就会让对方卖得更多而占便宜】,价格就会掉下来。
长期来看,在一个竞争行业中,任何企业的经济利润都会趋于 零。 注意:区分经济利润和会计利润,经济利润不是简单的账面盈余, 经济利润不但要减去企业自身的会计成本,还要减去社会平均的正 常利润(所用资本的机会收益),而社会平均的正常利润非常微薄。

麦琪的礼物
吉姆 卖表买梳 -4 不卖 3
德拉
剪发买 表链
-4 2
2 1
不剪
3
1

师生博弈( ) Dixit和Skeath
两位交往甚密的学生在杜克大学修化学课。两人在小考、实
验和中期考中都表现甚优,成绩一直是A。在其末考试前的周末,
他们非常自信,于是决定去参加弗吉尼亚大学的一场聚会。聚会
太尽兴结果周日这天就睡过了头,来不及准备周一上午的化学期
末考。他们没有参加考试,而是向教授撒了个谎,说他们本已从
弗吉尼亚大学往回赶,并安排好时间复习准备考试,但途中轮胎
爆了。由于没有备用胎,他们只好整夜呆在路边等待救援。现在
他们实在太累了,请求教授可否允许他们隔天补考?教授想了想
,同意了。
两人利用周一晚上好好准备了一番,胸有成竹地来参加周二
上午的考试。教授安排他们分别在两间教室做答。第一个题目在
考卷第一页,占了10分,非常简单。两人都写出了正确答案,心
情舒畅地翻到第二页。第二页只有一个问题,占了90分。题目是
:“
?”
请问破的是哪只轮胎?

1 引论:博弈三要素 2 同时决策博弈 3 混合策略纳什均衡

混合策略纳什均衡
猜硬币游戏
甲 正面 -1 反面 1
乙 正面
1 1
-1 -1
反面
-1
1

反应函数法
正面p -1

反面1-p 1
乙 正面 q
1 1
-1 -1
反面 1-q
-1
1

多重纳什均衡及甄别
? 标准一:帕累托占优
猎鹿博弈Stag Hunt Game
两个猎人以狩猎为生,主要有两种 猎物——鹿和兔子,两人一起猎 鹿,才能猎获一只鹿,如果单枪 匹马,只能打到4只兔。
乙 猎鹿
10
甲 猎鹿 10
0
0
打兔 4
4
打兔
4
4

帕累托改进
? 就是一项政策能够至少有利于一个人,而 不会对任何其他人造成损害。所谓“帕累 托最优”就是上述一切帕累托改进的机会 都用尽了,再要对任何一个人有所改善, 就不得不损害另外一些人。
? 帕累托最优的想法是从多目标数学规划得 到的。

? 比如城市交通,除了政府办的公共交通, 私人也能办小公交,和大公交竞争;
? 在医疗系统除了原有的低收费的系统,另 外开辟了专家挂号,收费高一些;
? 学校有公立的,也有了私立的。
? 股票市场也有双轨制,原有的股票是非流 通股,新股票可以自由买卖,是流通股。
? 新人新办法、老人老办法也是双轨制。
? 这些措施大大地缓解了改革中可能有的矛 盾,谁的利益都没有受损。
? 房地产市场是一步取消了福利分房,没有 经过双轨制就建立了房地产市场。

标准二:风险占优
偏离损失比较法 两害相权取其轻



9
8
上9
0

0
7
下8
7

帕累托占优与风险占优的关系
?对参与人的基本假定存在差异: 帕累托占优适用于 符合完全理性假定的参与人 风险占优适用于 判断搭档(对手)会犯错误,不信任; 判断对手很可能是风险厌恶型的参与人。 基本原则:“在怕累托标准和风险标准之间,理论给帕累
托占优以优先权,而风险占优只有在参与人面临不知道选哪 个均衡好的不确定性时,才变得重要。当一个均衡符合帕累 托占优时,参与人一定选择这个均衡,不确定性也就不存在
了。”

聚点均衡focal point equilibrium
Schelling, 1960
现实生活中,参与人可能会使用某些被 博弈模型抽象掉的信息来达到一个均衡, 这些信息往往跟社会文化习惯、参与人过 去知识传统、博弈的历史和经历有关。
共同知识 情侣博弈? 靠左还是靠右行驶?

课堂实验
? Q1: 设想在没有事先交流的情况下,必须在 深圳选择一个地点与另一个人会面。请问你 选择在哪里与之会面?
? Q2:设想在没有事先交流的情况下,必须 在深圳大学选择一个地点与另一个同学会面。 请问你选择在哪里与之会面?

世界之窗 华强北
深圳大学 Q1 万象城
中心书城 地王大厦
深大地铁站
文科楼 桂庙
深大正门 Q2 文山湖
科技楼 图书馆
西门 新西南

Q1
Q1选择地点 深大 世界之窗 万象城 地王大厦
选择人数 25 14 7 3

Q2
Q2选择地点 文山湖 深大正门 图书馆 新图书馆 新西南 科技楼 文科楼 西门
选择人数 11 11 10 8 5 4 4 3

问题1

平新乔《微观经济学十八讲》课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第 10 讲策略性博弈与纳什均衡 跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。 以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。 1.假设厂商 A与厂商 B的平均成本与边际成本都是常数, MC A 10, MC B 8,对厂商产出的需求函数是 Q D 500 20p ( 1)如果厂商进行 Bertrand 竞争,在纳什均衡下的市场价格是多少? ( 2)每个厂商的利润分别为多少? ( 3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行 Bertrand 竞争,纳什均衡下的市场价格是 p B 10 , p A 10 ,其中是一个极小的正数。理由如下: 假设均衡时厂商 A 和 B 对产品的定价分别为 p A 和 p B ,那么必有 p A 10 , p B 8 ,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,p A和 p B 都不会严格大于 10。否 则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足p A 10, p B 10。但是由于 p A 的下限也是10,所以 均衡时 p A 10。给定 p A 10,厂商 B的最优选择是令 p B 10 ,这里是一个介于 0到2 之间的正数,这时厂商 B可以获得整个市场的消费者。综上可知,均衡时的价格为p A 10 , p B 10 。 ( 2)由于厂商 A 的价格严格高于厂商 B 的价格,所以厂商 A 的销售量为零,从而利润也是零。下面来确定厂商 B 的销售量,此时厂商 B是市场上的垄断者,它的利润最大化问题为: max pq cq ① 其中 p 10 ,q 500 20 10 ,把这两个式子代入①式中,得 到: max 10 0 8 500 20 10 解得0 ,由于必须严格大于零,这就意味着可以取一个任意小的正 数, 所以厂商 B的利润 为: 500 20 10 10 。 (3)这个结果不是帕累托有效的。因为厂商 B 的产品的价格高于它的边际成本,所以 如果厂商 B和消费者可以为额外 1 单位的产品协商一个介于 8 到10 之间的价格,那么厂商 B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商 A的剩余(因为A 的利润还是零)。

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡 1 ?假设厂商A与厂商B的平均成本与边际成本都是常数,MC A=10, MC B =8,对厂 商产出的需求函数是 Q D二500 -20 p (1)如果厂商进行Bertrand竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand竞争,纳什均衡下的市场价格是p B =10 一;,p A =10 , 其中;是一个极小的正数。理由如下: 假设均衡时厂商A和B对产品的定价分别为p A和p B,那么必有p A刃0 , p B K8,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,p A和p B都不会严格大于10。否 则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高 自己的利润。所以均衡价格一定满足p A空10 , p B?「0。但是由于p A的下限也是10,所以均衡时P A =10。给定P A =10 ,厂商B的最优选择是令 P B =10- ;,这里:是一个介于0到2 之间的正数,这时厂商B可以获得整个市场的消费者。综上可知,均衡时的价格为P A =10 , P B =10 -;。 (2)由于厂商A的价格严格高于厂商B的价格,所以厂商A的销售量为零,从而利润也是零。下面来确定厂商B的销售量,此时厂商B是市场上的垄断者,它的利润最大化问题为: max pq —cq ①其中p =10 _ q =500 -20 107、把这两个式子代入①式中,得到: max (10 —芯―)500 —20(10 —名卩 解得;=0,由于;必须严格大于零,这就意味着;可以取一个任意小的正数,所以厂商 B 的利润为:||500-20 10 -; 10-;。 (3)这个结果不是帕累托有效的。因为厂商B的产品的价格高于它的边际成本,所以 如果厂商B和消费者可以为额外1单位的产品协商一个介于8到10一;之间的价格,那么厂商B的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A的剩余(因为A的利润 还是零)。 2.(单项选择)在下面的支付矩阵(表10-1 )中,第一个数表示A的支付水平,第二个数表示B的支付水平,a、b、c、d是正的常数。如果A选择“下”而B选择“右”,那么: (1) b .1 且 d :::1

3-混合策略的纳什均衡

博弈论教学/混合策略的纳什均衡 出自MyKnowledgeBase < 博弈论教学 Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡 目录 ■1 复习 ■2 混合策略(Mixed strategy) ■2.1 举例/Example ■2.2 概念 ■2.3 纯策略和混合策略 ■2.4 混合策略的争议 ■3 混合策略的纳什均衡 ■3.1 基本概念 ■3.2 混合策略纳什均衡的存在性/纳什定理 ■3.3 学术争议与批评 ■4 混合策略纳什均衡举例 ■4.1 社会福利博弈Social Welfare Game ■4.1.1 博弈分析(方法1:收益无差异) ■4.1.2 博弈分析(方法2:图形分析法) ■4.1.3 博弈分析(方法3:导数(Derivative)极值法) ■4.2 普通例子 ■4.3 审计博弈(Tax Game) ■4.4 激励的悖论[5] ■4.5 求解纳什均衡的一般方法 ■5 多重纳什均衡 ■5.1 多重纳什均衡举例 ■5.1.1 夫妻之争 ■5.1.2 制式问题 ■5.1.3 市场机会博弈 ■5.2 多重纳什均衡分析 ■5.2.1 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.1 帕累托最优Pareto optimality ■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.3 举例分析 ■5.2.2 风险上策均衡(Risk-dominant Equilibrium) ■5.2.3 聚点均衡(Focal Points Equilibrium) ■5.2.4 相关均衡 ■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义 ■7 作业 ■8 参考文献

平新乔《微观经济学十八讲》课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲 策略性博弈与纳什均衡 跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。 以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。 1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂 商产出的需求函数是 50020D Q p =- (1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =, 其中ε是一个极小的正数。理由如下: 假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,A p 和B p 都不会严格大于10。否 则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足10A p ≤,10B p ≤。但是由于A p 的下限也是10,所以均 衡时10A p =。给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。综上可知,均衡时的价格为10A p =,10B p ε=-。 (2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为: max pq cq ε>- ① 其中10p ε=-,()5002010q ε=-?-,把这两个式子代入①式中,得到: ()()0 max 1085002010εεε>----???? 解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为:()()500201010εε-?--????。 (3)这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本,所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1)中,第一个数表示A 的支付水平,第二个数表示B 的支付水平,a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”,那么:

混合策略纳什均衡多重均衡

1 引论:博弈三要素 2 同时决策博弈 3 混合策略纳什均衡

囚徒困境与纳什均衡的应用
? 例如,2000年我国几家生产彩电的大厂商 合谋将彩电价格维持高位,他们搞了一个 “彩电厂家价格自律联盟”,并在深圳举 行了由多家彩电厂商首脑参加的“彩电厂 商自律联盟高峰会议”。
? 寡头厂商在光天化日之下进行价格合谋, 并且还通过媒体大肆炒作,这在发达国家 是不可思议的。

? “彩电厂商自律联盟”只不过是一种
“囚徒困境”,彩电价格不会上涨。在
高峰会议之后不到二周,国内彩电价格
不是上涨而是一路下跌。这是因为厂商
们都有这样一种心态:无论其他厂商是
否降价,我自己降价是有利于自己的市
场份额扩大的。
长虹
低价
高价
3
1
康佳 低价 3
6
6
5
高价 1
5

商家价格战与零利润定理
出售同类产品的商家之间本来可以通过共同将价格维持在高位 而获利,但实际上却是相互杀价,结果都赚不到钱。
当一些商家共谋将价格抬高,消费者实际上不用着急,因为商 家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩 溃【如果对方高价,我低价可以卖得更多而占便宜;如果对方低价, 我不出低价就会让对方卖得更多而占便宜】,价格就会掉下来。
长期来看,在一个竞争行业中,任何企业的经济利润都会趋于 零。 注意:区分经济利润和会计利润,经济利润不是简单的账面盈余, 经济利润不但要减去企业自身的会计成本,还要减去社会平均的正 常利润(所用资本的机会收益),而社会平均的正常利润非常微薄。

纳什均衡中的几个概念的整理 占优策略(dominant strategy):在囚徒

纳什均衡中的几个概念的整理占优策略(dominant strategy):在囚徒 纳什均衡中的几个概念的整理 占优策略(dominant strategy):在囚徒困境中,我们发现,一个局中人的最优策略选择不依赖另一个局中人的策略选择,即无论其他局中人选择什么策略,他,的最优策略是唯一的(在囚徒困境中,如果双变量矩阵中的得益的具体数字 0-1,-6,-9换成任意的、、、,只要满足>>>,上述结论依然成立),TRPST R P S 我们把这样的最优策略称为“占优策略”(dominant strategy). 严格劣策略(strictly dominated strategy):在标准型博弈G,{S1,…,Sn;u1,…,un}中,令si,和si,代表局中人i的两个可行策略(即是Si中的元素)。如果对其他局中人每一个可能的策略组合,i选择si,的收益都小于其选择si,的收益,则称策略si,相对于策略si,是严格劣策略: ,, usssusssss(,,,,)(,,,,,,),iiniiiin11111,,, 对其他局中人在其策略空间S1,…,S i,1,…,Sn中每一组可能的策略 (s1,…,si,1,…,sn)都成立。也就是说严格劣策略就是不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。 占优策略均衡:在标准型博弈G,{S1,…,Sn;u1,…,un}中,如果对于所有 , si,是局中人i的占优策略,那么,策略组合s〞=(s〞1, …,s〞n)称为的i 占优均衡(dominant,strategy equilibrium)。一个博弈的某个策略组合中的所有策略都是各个博弈方各自的占优策略,必然是该博弈比较稳定的结果。 terated Elimination of Strictly Dominated 重复剔除的占优均衡(I

混合策略纳什均衡

目录[隐藏]1 什么是混合策略纳什均衡2 解混合策略纳什均衡的方法 3 混合策略纳什均衡的经典博弈——猜谜博弈[1] 4 混合策略纳什均衡博弈与其他均衡的关系[1] 5 参考文献 [编辑] [编辑] [编辑] 混合策略纳什均衡 混合策略纳什均衡(Mixed Strategy Nash Equilibrium )什么是混合策略纳什均衡 混合策略纳什均衡:在n 个参与人的博 弈G={S 1 ,... S n ; u 1 ,...u n }中,混合策略组合 构成一个纳什均衡,如果对于 所有的i =1,2...,n 下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都 是相对于其他参与人的策略的最佳策略,这个策略就构成 一个纳什均衡,不管这个策略是混合策略还是纯策略。 混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。 解混合策略纳什均衡的方法 1、最大化支付法:即最大化各个参与人的效用函数。 2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。 混合策略纳什均衡的经典博弈——猜谜博弈[1] 两个局中人A 、B 手里各拿一枚硬币,每人可以选择正面向上或反面向上,然后同时亮出,如果两枚硬币正反面相同,B 付 给A1元钱,如果两枚硬币正反面不相同,A 付给B1元钱。在这种情况下,局中人A 、B 如何选择呢?下图给出这个博弈的双变量收益矩阵。 这是一个两人零和博弈,在每一个结局中一方所得即为另一方所失,即两个局中人的收益之和恰好等于零。在双变量收益矩阵中采用画线的方法,在这个博弈中找不到纯策略纳什均衡。 那么,猜谜博弈是否存在混合策略纳什均衡呢?1950年纳什证明了任何有限博弈都至少存在一个纳什均衡(包括纯策略纳什均衡

相关文档
最新文档