纳什均衡中的几个概念的整理 占优策略(dominant strategy):在囚徒

纳什均衡中的几个概念的整理 占优策略(dominant strategy):在囚徒
纳什均衡中的几个概念的整理 占优策略(dominant strategy):在囚徒

纳什均衡中的几个概念的整理占优策略(dominant

strategy):在囚徒

纳什均衡中的几个概念的整理

占优策略(dominant strategy):在囚徒困境中,我们发现,一个局中人的最优策略选择不依赖另一个局中人的策略选择,即无论其他局中人选择什么策略,他,的最优策略是唯一的(在囚徒困境中,如果双变量矩阵中的得益的具体数字

0-1,-6,-9换成任意的、、、,只要满足>>>,上述结论依然成立),TRPST R P S

我们把这样的最优策略称为“占优策略”(dominant strategy). 严格劣策略(strictly dominated strategy):在标准型博弈G,{S1,…,Sn;u1,…,un}中,令si,和si,代表局中人i的两个可行策略(即是Si中的元素)。如果对其他局中人每一个可能的策略组合,i选择si,的收益都小于其选择si,的收益,则称策略si,相对于策略si,是严格劣策略:

,, usssusssss(,,,,)(,,,,,,),iiniiiin11111,,,

对其他局中人在其策略空间S1,…,S i,1,…,Sn中每一组可能的策略

(s1,…,si,1,…,sn)都成立。也就是说严格劣策略就是不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。

占优策略均衡:在标准型博弈G,{S1,…,Sn;u1,…,un}中,如果对于所有

, si,是局中人i的占优策略,那么,策略组合s〞=(s〞1, …,s〞n)称为的i 占优均衡(dominant,strategy equilibrium)。一个博弈的某个策略组合中的所有策略都是各个博弈方各自的占优策略,必然是该博弈比较稳定的结果。

terated Elimination of Strictly Dominated 重复剔除的占优均衡(I

Strategies):如果s〞=(s〞1, …,s〞n)它是重复剔除严格劣策略后剩下的策略组合,策略组合s〞=(s〞1, …,s〞n) 称为重复剔除的占优均衡。如果这种唯一的策略组合是存在的,我们就说该博弈是重复剔除占优可解的。纳什均衡与占优均衡的关系:在有n个局中人的标准型博弈G,{S1,…,Sn;u1,…,un}中,如果重复剔除严格劣策略剔除了除策略组合{s1*,……,sn*}外的所有策略,那么这唯一的策略组合为该博弈的惟一纳什均衡,反之则不一定。即纳什均衡一定是重复剔除严格劣策略的过程完成后没有被剔除的策略组合,但没有被剔除的策略组合不一定是纳什均衡,除非它是唯一的。

同时,在n个博弈方的博弈中G,{S1,…,Sn;u1,…,un}中,如果{s1*,……,sn*}是一个纳什均衡,那么严格剔除劣策略一定不会将它剔除。不同纳什均衡的关系:

纳什均衡的存在性:在n个局中人的标准型博弈G,{S1,…,Sn;u1,…,un}中,如果n是有限的,且对每个i,Si是有限的,则博弈存在至少一个纳什均衡,均衡可能包含混合策略。

纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。

策略(strategy):参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。纯策略(pure

strategy):如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动,该战略为纯策略。

混合策略(mixed strategy):如果一个策略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动,则该策略为混合策略。对标准型博弈

G={S1,…,Sn;u1,……,u n},假设Si={sil,…,sik}。那么,局中人i的一个混合策略为概率分布pi=(pil,…,pik),其中对所有k=1,…,K,0?Pik?1,且pil+…+pik=1。

假设局中人i有K个纯策略:Si={sil,…sik},则局中人i的一个混合策略是一个概率分布(Pil,……,Pik),其中Pik表示对所有k=1,…,K,局中人i选择策略sik 的概率,由于pik是一个概率,对所有k=1,…,K,有0?pik?1且Pil+…+Pik=1。我们用Pi表示基于Si的任意一个混合策略,其中包含了选择每一个纯策略的概率,正如我们用si表示Si内任意一个纯策略一样。

纯策略可以理解为混合策略的特例,即在诸多策略中,选该纯策略si的概率为1,选其他纯策略的概率为0。

扩展的纳什均衡(mixed-strategy Nash Equilibrium):在两个局中人标准型博弈G={S1,S2;u1,u2}中,混合策略(p1*,p2*)是纳什均衡的充要条件为:每一局中人的混合策略是另一局中人混合策略的最优反应。

加入了混合策略后纳什均衡的关系:

平新乔《微观经济学十八讲》课后习题详解(策略性博弈与纳什均衡)

第10讲 策略性博弈与纳什均衡 1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是 50020D Q p =- (1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。理由如下: 假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,A p 和B p 都不会严格大于10。否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足10A p ≤,10B p ≤。但是由于A p 的下限也是10,所以均衡时10A p =。给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。综上可知,均衡时的价格为10A p =,10B p ε=-。 (2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为: max pq cq ε>- ①

其中10p ε=-,()5002010q ε=-?-,把这两个式子代入①式中,得到: ()()0 max 1085002010εεε>----???? 解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为: ()()500201010εε-?--????。 (3)这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本,所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1)中,第一个数表示A 的支付水平,第二个数表示B 的支付水平,a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”,那么: 表10-1 博弈的支付矩阵 (1)1b >且1d < (2)1c <且1b < (3)1b <且c d < (4)b c <且1d < (5)1a <且b d <

平新乔《微观经济学十八讲》课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第 10 讲策略性博弈与纳什均衡 跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。 以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。 1.假设厂商 A与厂商 B的平均成本与边际成本都是常数, MC A 10, MC B 8,对厂商产出的需求函数是 Q D 500 20p ( 1)如果厂商进行 Bertrand 竞争,在纳什均衡下的市场价格是多少? ( 2)每个厂商的利润分别为多少? ( 3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行 Bertrand 竞争,纳什均衡下的市场价格是 p B 10 , p A 10 ,其中是一个极小的正数。理由如下: 假设均衡时厂商 A 和 B 对产品的定价分别为 p A 和 p B ,那么必有 p A 10 , p B 8 ,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,p A和 p B 都不会严格大于 10。否 则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足p A 10, p B 10。但是由于 p A 的下限也是10,所以 均衡时 p A 10。给定 p A 10,厂商 B的最优选择是令 p B 10 ,这里是一个介于 0到2 之间的正数,这时厂商 B可以获得整个市场的消费者。综上可知,均衡时的价格为p A 10 , p B 10 。 ( 2)由于厂商 A 的价格严格高于厂商 B 的价格,所以厂商 A 的销售量为零,从而利润也是零。下面来确定厂商 B 的销售量,此时厂商 B是市场上的垄断者,它的利润最大化问题为: max pq cq ① 其中 p 10 ,q 500 20 10 ,把这两个式子代入①式中,得 到: max 10 0 8 500 20 10 解得0 ,由于必须严格大于零,这就意味着可以取一个任意小的正 数, 所以厂商 B的利润 为: 500 20 10 10 。 (3)这个结果不是帕累托有效的。因为厂商 B 的产品的价格高于它的边际成本,所以 如果厂商 B和消费者可以为额外 1 单位的产品协商一个介于 8 到10 之间的价格,那么厂商 B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商 A的剩余(因为A 的利润还是零)。

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡 1 ?假设厂商A与厂商B的平均成本与边际成本都是常数,MC A=10, MC B =8,对厂 商产出的需求函数是 Q D二500 -20 p (1)如果厂商进行Bertrand竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand竞争,纳什均衡下的市场价格是p B =10 一;,p A =10 , 其中;是一个极小的正数。理由如下: 假设均衡时厂商A和B对产品的定价分别为p A和p B,那么必有p A刃0 , p B K8,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,p A和p B都不会严格大于10。否 则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高 自己的利润。所以均衡价格一定满足p A空10 , p B?「0。但是由于p A的下限也是10,所以均衡时P A =10。给定P A =10 ,厂商B的最优选择是令 P B =10- ;,这里:是一个介于0到2 之间的正数,这时厂商B可以获得整个市场的消费者。综上可知,均衡时的价格为P A =10 , P B =10 -;。 (2)由于厂商A的价格严格高于厂商B的价格,所以厂商A的销售量为零,从而利润也是零。下面来确定厂商B的销售量,此时厂商B是市场上的垄断者,它的利润最大化问题为: max pq —cq ①其中p =10 _ q =500 -20 107、把这两个式子代入①式中,得到: max (10 —芯―)500 —20(10 —名卩 解得;=0,由于;必须严格大于零,这就意味着;可以取一个任意小的正数,所以厂商 B 的利润为:||500-20 10 -; 10-;。 (3)这个结果不是帕累托有效的。因为厂商B的产品的价格高于它的边际成本,所以 如果厂商B和消费者可以为额外1单位的产品协商一个介于8到10一;之间的价格,那么厂商B的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A的剩余(因为A的利润 还是零)。 2.(单项选择)在下面的支付矩阵(表10-1 )中,第一个数表示A的支付水平,第二个数表示B的支付水平,a、b、c、d是正的常数。如果A选择“下”而B选择“右”,那么: (1) b .1 且 d :::1

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲 策略性博弈与纳什均衡 1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是 50020D Q p =- (1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。理由如下: 假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,A p 和B p 都不会严格大于10。否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足10A p ≤,10B p ≤。但是由于A p 的下限也是10,所以均衡时10A p =。给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。综上可知,均衡时的价格为10A p =,10B p ε=-。 (2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为: max pq cq ε>- ① 其中10p ε=-,()5002010q ε=-?-,把这两个式子代入①式中,得到: ()()0 max 1085002010εεε>----???? 解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为:()()500201010εε-?--????。 (3)这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本,所以 如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1)中,第一个数表示A 的支付水平,第二个数表示B 的支付水平,a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”,那么: 表10-1 博弈的支付矩阵

3-混合策略的纳什均衡

博弈论教学/混合策略的纳什均衡 出自MyKnowledgeBase < 博弈论教学 Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡 目录 ■1 复习 ■2 混合策略(Mixed strategy) ■2.1 举例/Example ■2.2 概念 ■2.3 纯策略和混合策略 ■2.4 混合策略的争议 ■3 混合策略的纳什均衡 ■3.1 基本概念 ■3.2 混合策略纳什均衡的存在性/纳什定理 ■3.3 学术争议与批评 ■4 混合策略纳什均衡举例 ■4.1 社会福利博弈Social Welfare Game ■4.1.1 博弈分析(方法1:收益无差异) ■4.1.2 博弈分析(方法2:图形分析法) ■4.1.3 博弈分析(方法3:导数(Derivative)极值法) ■4.2 普通例子 ■4.3 审计博弈(Tax Game) ■4.4 激励的悖论[5] ■4.5 求解纳什均衡的一般方法 ■5 多重纳什均衡 ■5.1 多重纳什均衡举例 ■5.1.1 夫妻之争 ■5.1.2 制式问题 ■5.1.3 市场机会博弈 ■5.2 多重纳什均衡分析 ■5.2.1 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.1 帕累托最优Pareto optimality ■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.3 举例分析 ■5.2.2 风险上策均衡(Risk-dominant Equilibrium) ■5.2.3 聚点均衡(Focal Points Equilibrium) ■5.2.4 相关均衡 ■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义 ■7 作业 ■8 参考文献

纯策略纳什均衡

纯策略纳什均衡 纯策略纳什均衡(Pure Strategy Nash Equilibrium ) 什么是纯策略纳什均衡 纯策略纳什均衡 是指在一个纯策略组合中,如果 给定其他的策略不变,该节点不会单方面改变自己的 策略,否则不会使节点访问代价变小。 如果重复博弈中有惟一纯策略纳什均衡,那么我 们怎么找出它的纯策略纳什均衡呢?首先看下面囚徒 的困境的博弈的例子: 我们现在考虑该博弈重 以理解成给囚徒两次坦白机 会,最后的得益是两个阶 段博弈中各自得益之和.在两次博弈过程中,双方知 道第一次博弈的结果再进行二次博弈.用逆推归纳法 来分析,先分析第二阶段,也就是第二次重复时两 博 存在纯策略纳什均衡的有限次重复博弈 [1] 复两次的重复博弈,这可

弈方的选择.很明显,这个第二阶段仍然是两囚徒之 间的一个囚徒的困境博弈,此时前一阶段的结果已成 为既成事实,此后又不再有任何的后续阶段,因此实 现自身当前的最大利益是两博弈方在该阶段决策中的 惟一原则. 因此我们不难得出结论,不管前一次的博弈得到 的结果如何,第二阶段的惟一结果就是原博弈惟一的 纳什均衡 (坦白,坦白 ) ,双方得益 (-5 ,-5) . 现在再回到第一阶段,即第一次博弈.理性的博 弈方在第一阶段就对后一阶段的结局非常清楚,知道 第二阶段的结果必然是 (坦白,坦白 ) ,因此不管第一 阶段的博弈结果是什么,双方在整个重复博弈中的最 终得益,都将是第一阶段的基础上各加 -5 .因此从第 一阶段的选择 来看,这个 于是我们可以得出惟一纯策略均衡的 有限次重复 博弈的结果就是重复原博弈惟一的纯策略纳什均衡, 这就是 这种重复博弈惟一的 子博弈完美纳什均衡 路 径. 重复博弈 与图 l 表示的一次性博弈实际上是完全等价的. 中得益矩阵

纯策略纳什均衡

纯策略纳什均衡 纯策略纳什均衡(Pure Strategy Nash Equilibrium)[编辑] 什么是纯策略纳什均衡 纯策略纳什均衡是指在一个纯策略组合中,如果 给定其他的策略不变,该节点不会单方面改变自己的策略,否则不会使节点访问代价变小。 [编辑] 存在纯策略纳什均衡的有限次重复博弈[1] 如果重复博弈中有惟一纯策略纳什均衡,那么我们怎么找出它的纯策略纳什均衡呢?首先看下面囚徒的困境的博弈的例子: 我们现在考虑该博弈重复两次的重复博弈,这可以理解成给囚徒两次坦白机会,最后的得益是两个阶

段博弈中各自得益之和.在两次博弈过程中,双方知道第一次博弈的结果再进行二次博弈.用逆推归纳法来分析,先分析第二阶段,也就是第二次重复时两博弈方的选择.很明显,这个第二阶段仍然是两囚徒之间的一个囚徒的困境博弈,此时前一阶段的结果已成为既成事实,此后又不再有任何的后续阶段,因此实现自身当前的最大利益是两博弈方在该阶段决策中的惟一原则. 因此我们不难得出结论,不管前一次的博弈得到的结果如何,第二阶段的惟一结果就是原博弈惟一的纳什均衡(坦白,坦白),双方得益(-5,-5). 现在再回到第一阶段,即第一次博弈.理性的博弈方在第一阶段就对后一阶段的结局非常清楚,知道第二阶段的结果必然是(坦白,坦白),因此不管第一阶段的博弈结果是什么,双方在整个重复博弈中的最终得益,都将是第一阶段的基础上各加-5.因此从第一阶段的选择来看,这个重复博弈与图l中得益矩阵表示的一次性博弈实际上是完全等价的.

于是我们可以得出惟一纯策略均衡的有限次重复博弈的结果就是重复原博弈惟一的纯策略纳什均衡,这就是这种重复博弈惟一的子博弈完美纳什均衡路径. 如果重复博弈中有多个纯策略纳什均衡,设某一市场有两个生产同样质量产品的厂商,他们对产品的定价同有高(H)、中(M)、低(L)三种可能.设高价时市场总利润为10个单位,中价时市场总利润为6个单位,低价时市场总利润为2个单位.再假设两厂商同时决定价格,价格不等时低价格者独享利润,价格相等时双方平分利润.这时候两厂商对价格的选择就构成了一个静态博弈问题.我们看一个三价博弈的重复博弈的例子:

效用函数与纳什均衡

效用函数与纳什均衡李保明 (山东大学产权研究所,济南,250100) 刘家壮 (山东大学数学与系统科学院,济南,250100) 摘 要 本文引入效用函数将博弈问题描述为收入形式和效用形式两种模型,使得纳什均衡与参与人效用函数联系起来,并得到结论:(1)效用函数的变化对纯策略纳什均衡不产生影响,却改变真混合策略纳什均衡;(2)效用函数严格拟凹时,真混合策略纳什均衡是稳定的;(3)效用函数严格拟凸时,真混合策略纳什均衡不存在. 关键词 效用函数,博弈论,纳什均衡 1.引言 近二十年来,博弈论在经济学领域产生重大影响,并有从根本方法上改写经济学的趋势.博弈论在经济分析中的广泛适应性是因为它更好地描述了经济问题,并为决策者提供了一套可丢行的决策方法.其中的关键概念纳什均衡为相互影响的决策者提供了博弈可能结果的一致性预测,也是理性决策者最优决策的结果,从而为决策者指明了决策方向.但是博弈论本身的缺陷阻碍了经济理论的发展,其中之一就是纳什均衡的多重性,由纳什均衡不唯一性导致经济(或博弈)问题的一致性预测结果很多,决策者仍然面临不确定性问题.如何在众多的纳什均衡中选择更为合理的一个?目前仍然博弈论中的理论难点.泽尔腾的子博弈完美纳什均衡和颤抖的手完美均衡以及梅耶森的适度均衡都是精炼纳什均衡所作的努力.但是仍不能得到满意结果(即唯一的均衡),考尔伯格和默顿提出稳定均衡的概念(Stable equilibria ),并说明没有单一的策略组合能满足所有要求,因此均衡解应是某些策略组合的集合而不是单一的策略组合,这似乎给均衡精炼下了一个“不能达到唯的”结论,然而这对博弈论在经济学上的应用和解决经济问题产生巨大障碍.海萨尼、泽而滕(Harsanyi ,Selten ,1988)提出纳什均衡选择的收入占优和风险占优分析方法,但它引起许多争议,并与Cooper ,Dejong ,Forsythe ,和Ross (1990)等人的实验结果不相符.尽管如此,参与人的决策总是选择一个策略,而不是多个策略,在下面的讨论中,我们引入效用函数描述参与人的这种选择. 在所有的博弈描述中,它都是由参与人、参与人策略和各种策略组合下的结果(参与人支付)所组成.根据博弈问题的不同,它还有不同的信息结构.对于完全信息的博弈,上述三要素是参与人的共同知晓的共同知识(Common knowledge ).但是,应该看到在博弈论描述的经济问题中,决策者(或称参与人)是根据其效用选择其策略的,参与人知道自己的效用函数却不能保证他知道其他参与人的效用函数,也就是说实际决策所需的效用函数不是参与人共知的共同知识;那么,作为共同知识的支付只能是各种策略组合下参与人的收入.在纳什(Nash , 第17卷第4期2000年12月 经 济 数 学MA THEMA TICS IN ECONOMICS Vo1117 No.4Dec.2000 收稿日期:2000-05-23

纯策略纳什均衡

纯策略纳什均衡 纯策略纳什均衡(Pure Strategy Nash Equilibrium) [编辑] 什么就是纯策略纳什均衡 纯策略纳什均衡就是指在一个纯策略组合中,如果给定其她得策略不变,该节点不会单方面改变自己得策略,否则不会使节点访问代价变小。 [编辑] 存在纯策略纳什均衡得有限次重复博弈[1] 如果重复博弈中有惟一纯策略纳什均衡,那么我们怎么找出它得纯策略纳什均衡呢?首先瞧下面囚徒得困境得博弈得例子: 我们现在考虑该博弈重复两次得重复博弈,这可以理解成给囚徒两次坦白机会,最后得得益就是两个阶段博弈中各自得益之与.在两次博弈过程中,双方知道第一次博弈得结果再进行二次博弈.用逆推归纳法来分析,先分析第二阶段,也就就是第二次重复时两博

弈方得选择.很明显,这个第二阶段仍然就是两囚徒之间得一个囚徒得困境博弈,此时前一阶段得结果已成为既成事实,此后又不再有任何得后续阶段,因此实现自身当前得最大利益就是两博弈方在该阶段决策中得惟一原则. 因此我们不难得出结论,不管前一次得博弈得到得结果如何,第二阶段得惟一结果就就是原博弈惟一得纳什均衡(坦白,坦白),双方得益(-5,-5). 现在再回到第一阶段,即第一次博弈.理性得博弈方在第一阶段就对后一阶段得结局非常清楚,知道第二阶段得结果必然就是(坦白,坦白),因此不管第一阶段得博弈结果就是什么,双方在整个重复博弈中得最终得益,都将就是第一阶段得基础上各加-5.因此从第一阶段得选择来瞧,这个重复博弈与图l中得益矩阵表示得一次性博弈实际上就是完全等价得. 于就是我们可以得出惟一纯策略均衡得有限次重复博弈得结果就就是重复原博弈惟一得纯策略纳什均衡,这就就是这种重复博弈惟一得子博弈完美纳什均衡路径.

混合策略纳什均衡多重均衡

1 引论:博弈三要素 2 同时决策博弈 3 混合策略纳什均衡

囚徒困境与纳什均衡的应用
? 例如,2000年我国几家生产彩电的大厂商 合谋将彩电价格维持高位,他们搞了一个 “彩电厂家价格自律联盟”,并在深圳举 行了由多家彩电厂商首脑参加的“彩电厂 商自律联盟高峰会议”。
? 寡头厂商在光天化日之下进行价格合谋, 并且还通过媒体大肆炒作,这在发达国家 是不可思议的。

? “彩电厂商自律联盟”只不过是一种
“囚徒困境”,彩电价格不会上涨。在
高峰会议之后不到二周,国内彩电价格
不是上涨而是一路下跌。这是因为厂商
们都有这样一种心态:无论其他厂商是
否降价,我自己降价是有利于自己的市
场份额扩大的。
长虹
低价
高价
3
1
康佳 低价 3
6
6
5
高价 1
5

商家价格战与零利润定理
出售同类产品的商家之间本来可以通过共同将价格维持在高位 而获利,但实际上却是相互杀价,结果都赚不到钱。
当一些商家共谋将价格抬高,消费者实际上不用着急,因为商 家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩 溃【如果对方高价,我低价可以卖得更多而占便宜;如果对方低价, 我不出低价就会让对方卖得更多而占便宜】,价格就会掉下来。
长期来看,在一个竞争行业中,任何企业的经济利润都会趋于 零。 注意:区分经济利润和会计利润,经济利润不是简单的账面盈余, 经济利润不但要减去企业自身的会计成本,还要减去社会平均的正 常利润(所用资本的机会收益),而社会平均的正常利润非常微薄。

纳什均衡中的几个概念的整理 占优策略(dominant strategy):在囚徒

纳什均衡中的几个概念的整理占优策略(dominant strategy):在囚徒 纳什均衡中的几个概念的整理 占优策略(dominant strategy):在囚徒困境中,我们发现,一个局中人的最优策略选择不依赖另一个局中人的策略选择,即无论其他局中人选择什么策略,他,的最优策略是唯一的(在囚徒困境中,如果双变量矩阵中的得益的具体数字 0-1,-6,-9换成任意的、、、,只要满足>>>,上述结论依然成立),TRPST R P S 我们把这样的最优策略称为“占优策略”(dominant strategy). 严格劣策略(strictly dominated strategy):在标准型博弈G,{S1,…,Sn;u1,…,un}中,令si,和si,代表局中人i的两个可行策略(即是Si中的元素)。如果对其他局中人每一个可能的策略组合,i选择si,的收益都小于其选择si,的收益,则称策略si,相对于策略si,是严格劣策略: ,, usssusssss(,,,,)(,,,,,,),iiniiiin11111,,, 对其他局中人在其策略空间S1,…,S i,1,…,Sn中每一组可能的策略 (s1,…,si,1,…,sn)都成立。也就是说严格劣策略就是不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。 占优策略均衡:在标准型博弈G,{S1,…,Sn;u1,…,un}中,如果对于所有 , si,是局中人i的占优策略,那么,策略组合s〞=(s〞1, …,s〞n)称为的i 占优均衡(dominant,strategy equilibrium)。一个博弈的某个策略组合中的所有策略都是各个博弈方各自的占优策略,必然是该博弈比较稳定的结果。 terated Elimination of Strictly Dominated 重复剔除的占优均衡(I

纳什均衡中的几个概念的整理占优策略dominantstrategy在囚徒

纳什均衡中的几个概念的整理 占优策略(dominant strategy ):在囚徒困境中,我们发现,一个局中人的最优策略选择不依赖另一个局中人的策略选择,即无论其他局中人选择什么策略,他的最优策略是唯一的(在囚徒困境中,如果双变量矩阵中的得益的具体数字0,-1,-6,-9换成任意的T 、R 、P 、S ,只要满足T >R >P >S ,上述结论依然成立),我们把这样的最优策略称为“占优策略”(dominant strategy ). 严格劣策略(strictly dominated strategy ):在标准型博弈G ={S1,…,Sn ;u1,…,un}中,令si '和si "代表局中人i 的两个可行策略(即是Si 中的元素)。如果对其他局中人每一个可能的策略组合,i 选择si '的收益都小于其选择si "的收益,则称策略si '相对于策略si "是严格劣策略: 对其他局中人在其策略空间S1,…,S i -1,…,Sn 中每一组可能的策略(s1,…,si-1,…,sn)都成立。也就是说严格劣策略就是不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。 占优策略均衡:在标准型博弈G ={S1,…,Sn ;u1,…,un}中,如果对于所有的i , si "是局中人i 的占优策略,那么,策略组合s 〞=(s 〞1, …,s〞n)称为占优均衡(dominant -strategy equilibrium )。一个博弈的某个策略组合中的所有策略都是各个博弈方各自的占优策略,必然是该博弈比较稳定的结果。 重复剔除的占优均衡(Iterated Elimination of Strictly Dominated Strategies):如果s 〞=(s 〞1, …,s〞n)它是重复剔除严格劣策略后剩下的策略组合,策略组合s 〞=(s 〞1, …,s〞n) 称为重复剔除的占优均衡。如果这种唯一的策略组合是存在的,我们就说该博弈是重复剔除占优可解的。 纳什均衡与占优均衡的关系:在有n 个局中人的标准型博弈G ={S1,…,Sn ;u1,…,un}中,如果重复剔除严格劣策略剔除了除策略组合{s1*,……,sn*}外的所有策略,那么这唯一的策略组合为该博弈的惟一纳什均衡,反之则不一定。即纳什均衡一定是重复剔除严格劣策略的过程完成后没有被剔除的策略组合,但没有被剔除的策略组合不一定是纳什均衡,除非它是唯一的。 同时,在n 个博弈方的博弈中G ={S1,…,Sn ;u1,…,un}中,如果{s1*,……,sn*}是一个纳什均衡,那么严格剔除劣策略一定不会将它剔除。 不同纳什均衡的关系: 11111(,,,,)(,,,,,,) i i n i i i i n u s s s u s s s s s --+''<

混合策略纳什均衡

目录[隐藏]1 什么是混合策略纳什均衡2 解混合策略纳什均衡的方法 3 混合策略纳什均衡的经典博弈——猜谜博弈[1] 4 混合策略纳什均衡博弈与其他均衡的关系[1] 5 参考文献 [编辑] [编辑] [编辑] 混合策略纳什均衡 混合策略纳什均衡(Mixed Strategy Nash Equilibrium )什么是混合策略纳什均衡 混合策略纳什均衡:在n 个参与人的博 弈G={S 1 ,... S n ; u 1 ,...u n }中,混合策略组合 构成一个纳什均衡,如果对于 所有的i =1,2...,n 下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都 是相对于其他参与人的策略的最佳策略,这个策略就构成 一个纳什均衡,不管这个策略是混合策略还是纯策略。 混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。 解混合策略纳什均衡的方法 1、最大化支付法:即最大化各个参与人的效用函数。 2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。 混合策略纳什均衡的经典博弈——猜谜博弈[1] 两个局中人A 、B 手里各拿一枚硬币,每人可以选择正面向上或反面向上,然后同时亮出,如果两枚硬币正反面相同,B 付 给A1元钱,如果两枚硬币正反面不相同,A 付给B1元钱。在这种情况下,局中人A 、B 如何选择呢?下图给出这个博弈的双变量收益矩阵。 这是一个两人零和博弈,在每一个结局中一方所得即为另一方所失,即两个局中人的收益之和恰好等于零。在双变量收益矩阵中采用画线的方法,在这个博弈中找不到纯策略纳什均衡。 那么,猜谜博弈是否存在混合策略纳什均衡呢?1950年纳什证明了任何有限博弈都至少存在一个纳什均衡(包括纯策略纳什均衡

相关文档
最新文档