平新乔《微观经济学十八讲》课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡

跨考网独家整理最全经济学考研真题，经济学考研课后习题解析资料库，您可以在这里查阅历年经济学考研真题，经济学考研课后习题，经济学考研参考书等内容，更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验，从前辈中获得的经验对初学者来说是宝贵的财富，这或许能帮你少走弯路，躲开一些陷阱。

以下内容为跨考网独家整理，如您还需更多考研资料，可选择经济学一对一在线咨询进行咨询。

1．假设厂商A 与厂商B 的平均成本与边际成本都是常数，10A MC =，8B MC =，对厂

商产出的需求函数是

50020D Q p =-

（1）如果厂商进行Bertrand 竞争，在纳什均衡下的市场价格是多少？

（2）每个厂商的利润分别为多少？

（3）这个均衡是帕累托有效吗？

解：（1）如果厂商进行Bertrand 竞争，纳什均衡下的市场价格是10B p ε=-，10A p =，

其中ε是一个极小的正数。理由如下：

假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ，那么必有10A p ≥，8B p ≥，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，A p 和B p 都不会严格大于10。否

则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足10A p ≤，10B p ≤。但是由于A p 的下限也是10，所以

均衡时10A p =。给定10A p =，厂商B 的最优选择是令10B p ε=-，这里ε是一个介于0到2之间的正数，这时厂商B 可以获得整个市场的消费者。综上可知，均衡时的价格为10A p =，10B p ε=-。

（2）由于厂商A 的价格严格高于厂商B 的价格，所以厂商A 的销售量为零，从而利润也是零。下面来确定厂商B 的销售量，此时厂商B 是市场上的垄断者，它的利润最大化问题为：

max pq cq ε>- ① 其中10p ε=-，()5002010q ε=-?-，把这两个式子代入①式中，得到：

()()0

max 1085002010εεε>----???? 解得0ε=，由于ε必须严格大于零，这就意味着ε可以取一个任意小的正数，所以厂商B 的利润为：()()500201010εε-?--????。

（3）这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本，所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格，那么厂商B 的利润和消费者的剩余就都可以得到提高，同时又不损害厂商A 的剩余（因为A 的利润还是零）。

2．（单项选择）在下面的支付矩阵（表10-1）中，第一个数表示A 的支付水平，第二个数表示B 的支付水平，a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”，那么：

表10-1 博弈的支付矩阵

（1）1b >且1d <

（2）1c <且1b <

（3）1b <且c d <

（4）b c <且1d <

（5）1a <且b d <

【答案】（3）

【分析】由于（下，右）是均衡策略，所以给定B 选择“右”，“下”是A 的最优选择，这就意味着c d <；同样的，给定A 选择“下”，“右”也是B 的最优选择，这就意味着1b <。

3．史密斯与约翰玩数字匹配游戏。每一个人选择1、2或者3。如果数字相同，约翰支付给斯密3美元。如果数字不同，斯密支付给约翰1美元。

（1）描述这个对策的报酬矩阵，并且证明没有纯策略纳什均衡策略组。

（2）如果每一个局中人以13

的概率选择每一个数字，证明这个对策的混合策略确实有一纳什均衡。这个对策的值是什么？

解：（1）根据题意，构造如下的支付矩阵（表10-2）（其中每一栏中前一个数字是史密斯的支付，后一个数字是约翰的支付）：

表10-2 玩数字匹配游戏的支付矩阵

首先由史密斯来选择，假设史密斯选择1，并期望约翰选择1，从而使自己得到3的支付。但是，如果史密斯选择1，则约翰一定会选择2或者3，从而使自己得到1，而不是-3。假设约翰选择2，他期望史密斯选择1或者3，以使得自己得到1，而实际上史密斯会选择2，使得约翰得到-3，等等。不断的循环反复，最终也无法达成一个使得双方都能够接受的方案。因此，这个对策没有一个纯策略纳什均衡。

（2）假设均衡时，约翰选择1、2、3的概率分别为1x 、2x 和121x x --，那么此时史密

斯在选择1、2、3之间是没有区别的，即：

()()()121212121212313131x x x x x x x x x x x x ----=-+---=--+--

从而解得

1212113

x x x x ==--= 类似的方法可以解得史密斯在均衡状态下选择1、2、3的概率分别为1/3。

4．假定世界上氪的整个供给由20个人控制，每一个人拥有这种强有力的矿物10000克。世界对氪的需求是

10001000Q p =-

其中p 是每克的价格。

（1）如果所有拥有者合谋控制氪的价格，他们设置的价格是多少？他们能够卖出的量是多少？

（2）为什么（1）中计算的价格是不稳定的？

（3）通过改变要求保持市场价格的产出，在没有厂商能够获利的意义下存在一个稳定的均衡时，氪的价格是多少？

解：（1）所有拥有者合谋控制氪的价格，此时总的利润函数为： 111000Q Q π??=- ???

利润最大化的一阶条件为：

d 110d 500

Q Q π=-= 解得总供应量为500Q =（克）。此时111000.50Q p =-

=，每个厂商的供应量为500/2025=（克）

。（2）对第一个厂商而言，给定其他每个厂商的供应量为25克，那么他的利润最大化问题为：

111525max 1000

q q q - 根据一阶条件解得：

1262.5q =

可见在其他厂商的供应量为25克的条件下，厂商1增加供应量会提高自己的利润。类似的结论对市场上的其他厂商也成立，所以合谋是不稳定的。

（3）题目要求完全竞争市场的均衡结果。令p MC =，得到氪的价格为零。市场上的总供给量为1000克，每个成员的出售量为50克。

5．在下表所示的策略型博弈（表10-3）中，找出占优均衡。

表10-3 博弈的支付矩阵

答：对于行为人2而言，R 优于M ，所以行为人2将会剔除掉M 策略，只在R 、L 这两个策略中进行选择；对于行为人1来说，知道了行为人2会在L 、R 策略中选择，则U 占优于M 和D 策略。当行为人2知道行为人1选择了U 策略时，他则最终会选择L 策略。所以，最终的占优均衡为（U ，L ）。

6．模型化下述划拳博弈：两个老朋友在一起划拳喝酒，每个人有四个纯策略：杆子、

老虎，鸡和虫子。输赢规则是：杆子降考虎，老虎降鸡，鸡降虫子，虫子降杆子。两个人同时出令。如果一个打败另一个，赢者的效用为1，输者的效用为-1；否则，效用均为0。写出这个博弈的收益矩阵。这个博弈有纯策略纳什均衡吗？计算出混合策略纳什均衡。

答：（1）该题的支付矩阵（表10-4）为：

表10-4 划拳博弈的支付矩阵

（2）这是一个零和博弈，没有纯策略纳什均衡。这是因为：

对两个参与者，给定对方策略时，本方的占优策略对应的支付以下划线标注，均衡存在当且仅当在同一栏中出现两个下划线。由此可知，该博弈没有纯策略纳什均衡。

（3）记游戏者1分别选择各个策略的概率为{}1234,,,p p p p ，游戏者2分别选择各个策

略的概率为{}1234,,,q q q q 。

当游戏者2分别以概率{}1234,,,q q q q 选择四个策略时，游戏者1的四个策略的收益应该

相等（根据同等支付原则）：

()()()()2413241311111111q q q q q q q q ?+-?=-?+?=-?+?=?+-?

又因为12341q q q q +++=，可以得到：123414

q q q q ====。同理，当对于游戏者1分别以概率{}1234,,,p p p p 选择四个策略时，游戏者2的四个策略

的收益应该相等（根据同等支付原则）：

()()()()2413241311111111p p p p p p p p ?+-?=-?+?=-?+?=?+-?

又因为12341p p p p +++=，可以得到：123414

p p p p ====

。因此混合策略纳什均衡为：（1σ，2σ），其中 111114444σ??= ???，，，，211114444σ??

= ???

，，，

7．巧克力市场上有两个厂商，各自都可以选择去市场的高端（高质量），还是去低端（低质量）。相应的利润由如下收益矩阵（表10-5）给出：

表10－5 巧克力商的博弈

（1）如果有的话，哪些结果是纳什均衡？

（2）如果各企业的经营者都是保守的，并都采用最大最小化策略，结果如何？

（3）合作的结果是什么？

（4）哪个厂商从合作的结果中得好处最多？哪个厂商要说服另一个厂商需要给另一个厂商多少好处？

解：（1）纳什均衡的结果是（高，低）和（低，高），相应的收益分别为（100，800）和（900，600）。

（2）如果1选择低，则有{}min 20,90020-=-；如果1选择高，则有{}min 100,5050=。因此如果1想要最大化它的最小支付，其最优决策为：

{}{}{}{}max min 20,900,min 100,50max 20,5050-=-=

所以1会选择高。类似的分析表明2也会选择高，因此两个人都采用最大最小策略的均衡结果为（高，高），相应的支付为（50，50）。

（3）如果双方进行合作，那么他们的目标就是总利润最大化，这样最终的结果就是（低，高），相应的支付为（900，600）。

（4）厂商1从合作的结果中获得的好处多。为了使得厂商2不选择另外一个纳什均衡（高，低），厂商1应当给厂商2一笔800600200-=的支付。

8．考虑在c ，f ，g ，三个主要汽车生产商之间的博弈。每一个厂商可以生产要么大型车，要么小型车，但不可同时生产两种型号的车。即，对于每一个厂商i ，i c =，f ，g ，他的行动集合为{},AI SM LG =。用i α代表i 所选择的行动，i I A α，(),,I c f g πααα代表厂商i 的利润。假设，每个厂商的利润函数定义如下：

i πγ≡，如果j LG α=，j c =，f ，g ；

γ，如果j SM α=， j c =，f ，g ；

α，如果i LG α=，且j SM α=，j i ≠；

α，如果i SM α=，且j LG α=，j i ≠；

β，如果i j LG αα==，且k SM α=，j k i ≠≠；

β，如果i j SM αα==，且k LG α=，j k i ≠≠；

（1）当0αβγ>>>时，是否存在纳什均衡？请证明。

（2）当0αγβ>>>时，是否存在纳什均衡？请证明。

证明：该博弈的支付矩阵如表10-6和10-7所示。

表10-6 G 汽车厂生产SM 型汽车

表10-7 G 汽车厂生产LG 型的汽车

（1）该博弈存在纳什均衡。首先考虑三家选择的行动相同，那么任一个厂家都将得到数量为γ的利润。因为αβγ>>，所以任何厂商只要选择和其他两个工厂生产不同型号的产品，就可以获得更高的利润，所以三家工厂生产相同的产品不是纳什均衡。如果三个工厂生产不同的产品，比如说()(),,,,c f g SM LG SM ααα=，因为αβγ>>，所以C 厂已经获得了它可能获得的最高利润，因此它不会背叛；给定其他厂商的选择，F 厂生产LG 型号的汽车只能获得数量为β的利润，高于它生产SM 型号的汽车获得的数量为γ的利润，所以F 厂也不会背叛；给定其他厂商的选择，G 厂在生产两种型号的汽车之间是没有差异的，因为无论那种情况下，他都只能获得数量为β的利润，所以G 厂同样不会背叛。

综上可知()(),,,,c f g SM LG SM ααα=是一个纳什均衡。类似的分析表明，只要三个工厂生产不同的产品，就是纳什均衡。

（2）只要三个工厂生产的汽车型号不完全相同，这样的结果就是纳什均衡。分析类似于第（1）问。

9．考虑下列策略型博弈（表10-8）：

表10-8 博弈的支付矩阵

请问，该博弈里有几个均衡？为什么？

答：（1）该博弈的纯策略均衡为（D ，R ）。

（2）下面分析混合策略均衡。设参与人A 分别选择策略U 、

M 和D 的概率为{}123,,p p p ；设参与人B 分别选择策略L 、M 和R 的概率为{}123,,q q q ；下面分三种情况讨论：

①达到混合均衡时，如果参与人A 分别选择策略U 、M 和D 的概率都严格大于零，那么他选择策略U 、M 和D 的期望收益就要相等，即：1212322q q q q q -=-+=

从而解得123q q q ==-，矛盾，所以对参与人B 而言，不存在使得1q ，2q ，3q 同时大于

零的混合均衡；对参与人A 也有类似的结论成立。

②尽管如此，以上的分析并不能说明不存在混合均衡。因为达到均衡时，有可能存在参与人选择某一行动的概率为零的可能。对A 而言，在U 、M 、D 三个行动中选择某一行动的概率等于零的情况共有三种可能。对B 也是一样，这样均衡时共有九种可能的情况，下面分别讨论：

a ．A 选择行动D 的概率为零，B 选择行动R 的概率为零，即330p q ==，从而得到如表10-9所示的支付矩阵：

表10-9 博弈的支付矩阵

达到均衡时，A 选择M 和U 应当得到相同的期望支付，即121222q q q q -=-+，整理得到

12q q =；又因为30q =，所以121q q +=。从而解得120.5q q ==；同理可得120.5p p ==。所以{}1230.5,0.5,0q q q ===和{}1230.5,0.5,0p p p ===就是一个混合均衡。

b ．A 选择行动D 的概率为零，B 选择行动M 的概率为零，采用类似于①的做法可知，在这种情况下，不存在混合均衡。

c ．A 选择行动D 的概率为零，B 选择行动L 的概率为零，采用类似于①的做法可知，在这种情况下，不存在混合均衡。

d ．A 选择行动M 的概率为零，B 选择行动R 的概率为零，采用类似于①的做法可知，在这种情况下，不存在混合均衡。

e ．A 选择行动M 的概率为零，B 选择行动M 的概率为零，采用类似于①的做法可知，在这种情况下，不存在混合均衡。

f ．A 选择行动M 的概率为零，B 选择行动L 的概率为零，采用类似于①的做法可知，在这种情况下，不存在混合均衡。

g ．A 选择行动U 的概率为零，B 选择行动R 的概率为零，采用类似于①的做法可知，在这种情况下，不存在混合均衡。

h ．A 选择行动U 的概率为零，B 选择行动M 的概率为零，采用类似于①的做法可知，在这种情况下，不存在混合均衡。

i ．A 选择行动U 的概率为零，B 选择行动L 的概率为零，采用类似于①的做法可知，在这种情况下，不存在混合均衡。

综合上述分析可知，唯一的混合均衡就是：{}0.5,0.5,0A σ=，{}0.5,0.5,0B σ=。

③均衡时，如果A 选择某两个行动的概率都等于零，即A 只能选择一个行动。这就要求在B 的行动中，至少有一对行动可以给自己带来相同的支付，但是由支付矩阵可知，这一条件并不满足，这样均衡时，B 也只能选择一个行动，这就退化成了纯策略均衡。所以A 选择某两个行动的概率都等于零的混合均衡是不存在的；同理B 选择某两个行动的概率都等于零的混合均衡也是不存在的。

综合上述分析可知，该博弈只有唯一的混和均衡，即：

{}1230.5,0.5,0q q q ===和{}1230.5,0.5,0p p p ===

10．考虑如表10-10和10-11所示的策略型博弈

表10-10 参与人3选择A时的支付矩阵

表10-11 参与人3选择B时的支付矩阵

每一格左边的数字是游戏者1的得益，中间的数字为游戏者2的得益，右边的数字为游戏者3的得益。游戏者3的策略是选A矩阵或选B矩阵。

（1）上述博弈中有几个纯策略纳什均衡？为什么？

（2）如果三个游戏者中可以有两个人结盟共同对付另一个人，会出现什么结果？

解：（1）上述博弈中有两个纯策略纳什均衡。它们分别为（U，L，A）和（D，R，B）。对任意的参与人，给定其他两个参与者的行动，他的占优行动用下划线表示出来，由此可以得到这两个纯策略纳什均衡。

（2）若三人中有两人结盟，则不外乎下面三种情况：

①参与人1和2结盟，支付矩阵如表10-12所示，该博弈的均衡是（DR，B）。

表10-12 参与人1和2结盟后博弈的支付矩阵

②参与人1和3结盟，支付矩阵如表10-13所示，该博弈的均衡是（UA，L）和（DB，R）。

表10-13 参与人1和3结盟后博弈的支付矩阵

③参与人2和3结盟，支付矩阵如表10-14所示，该博弈的均衡是（LA，U）和（RB，D）。

表10-14 参与人2和3结盟后博弈的支付矩阵

若参与人1和2结盟，博弈的结果只能是（D，R，B）。由于结果（U，L，A）对应的支付对每个人而言都优于（D，R，B）对应的支付，所以不结盟至少可以使每个人的境况和参与人1，2结盟时一样好，所以不结盟相对参与人1和2而言反而更优。

若参与人1和3结盟，博弈的结果完全同不结盟。

若参与人2和3结盟，博弈的结果完全同不结盟。

综合上述分析可知，在这个博弈中，任何两方都不会有结盟的动机。

11．在表10-15所示的策略型博弈里，什么是占优解？什么是纯策略纳什（Nash）均衡解？

表10-15 博弈的支付矩阵

解：（1）这个博弈没有占优均衡。理由如下：在这个问题中，对于游戏者1而言，T占优于D，因此可以将D排除掉。此时博弈的支付矩阵如表10-16所示。当游戏者1的可选策略只有T和M时，对游戏者2而言，R占优于M，因此可以把M排除掉，此时博弈的支付矩阵如表10-17所示。至此，用剔除法寻找占优均衡的方法无法继续进行，所以这个博弈没有占优均衡。

表10-16 排除掉D以后的支付矩阵

表10-17 排除掉M以后的支付矩阵

（2）纯策略纳什均衡为（M，L），（T，R）。由表10-17可知，当游戏者2选择L时，游戏者1的最优策略为M，当游戏者2选择R时，游戏者1的最优策略是T。同样，当游戏者1选择T时，游戏者2的最优策略是R，当游戏者1选择M时，游戏者2的最优策略

为L 。因此，纯策略纳什均衡为（M ，L ），（T ，R ），此时游戏者得到的支付为（3，4），（4，2）。

12．判断对错，并简要说明理由。

（1）占优均衡一定是纳什均衡。

（2）在囚徒困境中，如果每一个囚犯都相信另一个囚犯会抵赖，那么两个人都会抵赖。

（3）一个将军有两个纯策略，要么把所有的部队从陆地运输，要么把所有的部队从海洋上运输。那么把1/4的部队从陆地运输，把其余3/4的部队从海洋运输构成一个混合策略。

答：（1）正确。理由如下：如果在博弈中，每个参与人都有自己的占优策略，这就意味着对任何一个参与人而言，无论其他参与人的策略如何，该参与人的占优策略对他而言都是最优的，特别地，当其他的参与人也选择自己的占优策略时，该参与人的占优策略对他还是最优的，根据纳什均衡的定义，可知占优均衡一定是纳什均衡。

（2）错误。理由如下：在囚徒困境中，如果每一个囚犯都相信另一个囚犯会抵赖，那么对每个囚犯而言，坦白将是他的最优选择。如果两个囚犯都这样考虑，那么均衡的结果就是两个人都坦白。

（3）错误。因为混合策略是在纯策略集合上确定的一个概率分布，而在本题中，将军分割军队的决定事实上是扩大了纯策略的集合，即将军的决定仍然是一个纯策略。

13．一个小镇中，有N 个人，每人有100元钱，如果每人都向一个集资箱中捐一笔钱（可以为零）而共收集到F 元，那么从一个基金中拿出相同数量的钱放入集资箱，最后当集资被分配时，每人获得2/F N 元，求解这一博弈的均衡。

解：假设参与人i 的捐款为i F ，他的收益为i π，又记i i F F F -=-，那么给定i i F F --=，参与人i 的收益为：

()

2221i i i i i i F F F F F N N N π--??=+-=-+ ??? 特别地，i π是i F 的线性函数，所以：

（1）当2N >时，

210N -<，所以参与人i 的最优选择是0i F =。（2）当2N =时，210N

-=，所以无论参与人的捐款数量为多少，都不会影响他的收益，从而()0,i F ∈+∞。

（3）当1N =时，210N

->，这时参与人的捐款数量会趋向于正无穷，即i F →+∞。由于所有行动者的行为相同，所以当2N >时，纳什均衡为0i F =，1i =，2，…，N ；当2N =时，纳什均衡为()0,i F ∈+∞，1i =，2；

当1N =时，纳什均衡为i F →+∞。

14．Frank 和Nancy 约定下一周的某一天在小镇的咖啡厅见面，但他们如此兴奋以至于忘记了在哪一个咖啡厅约会，所幸的是小镇上只有两个咖啡厅，“夕阳”和“海湾”，并且他们知道彼此的偏好。事实上，如果二人都去了“夕阳”，Frank 的效用是3而Nancy 的效

用是2，如果二人都去了“海湾”，Frank 的效用是2而Nancy 的效用是3，如果二人去的地方不同，则效用水平都是0。

（1）这一博弈存在纯策略纳什均衡吗？存在混合均衡吗？

（2）这一博弈存在占优策略均衡吗？

答：（1）这一博弈存在纯策略纳什均衡和混合均衡。

①此博弈的支付矩阵如表10-18所示，根据支付矩阵可知该博弈的纯策略均衡为两个人都去相同的咖啡厅，即：（夕阳，夕阳）和（海湾，海湾）。

表10-18 约会博弈的支付矩阵

②假设Frank 去夕阳咖啡厅的概率为p ，那么他去海湾咖啡厅的概率就是1p -，均衡时的概率应当使得Nancy 去夕阳或海湾咖啡厅的期望效用相等，即：

()231p p =-

解得0.6p =，则10.4p -=，即Frank 去夕阳餐厅的概率为0.6，去海湾餐厅的概率为0.4；同理可得Nancy 去夕阳餐厅的概率为0.4，去海湾餐厅的概率为0.6。

（2）这一博弈不存在占优策略均衡。若Nancy 选择去夕阳，则Frank 的最优策略是去夕阳；若Nancy 去海湾，则Frank 的最优策略是去海湾，因此对于Frank 而言不存在占优策略。同样，对于Nancy 来说也不存在一个占优策略，因此这一博弈不存在占优策略均衡。

以上内容为跨考网整理的经济学考研课后习题答案解析的一部分，限于篇幅原因，如果同学还想获得更多经济学课后习题资料，可以关注微信公众平台索要经济学考研资料,你想要的资料都在这儿→jjxkyzs 。想了解经济学考研高分的秘密吗？请点击>>>:经济学考研解题技巧

跨考经济学考研辅导提醒您: 成功的原因千千万,失败的原因就那么几个，加入我们的经济学考研交流群，考研经验交流，规避风险，锁定名校一次进!

纳什均衡

纳什均衡简介纳什均衡，又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。在一个博弈过程中，无论对方的策略选择如何，当事人一方都会选择某个确定的策略，则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略，那么这个组合就被定义为纳什均衡。一个策略组合被称为纳什均衡，当每个博弈者的均衡策略都是为了达到自己期望收益的最大值，与此同时，其他所有博弈者也遵循这样的策略。纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果，是约翰·纳什在普林斯顿大学攻读博士学位时完成的。实际上，博弈论的研究起始于1944年冯·诺依曼（ Von Neumann）和奥斯卡·摩根斯坦（Oscar Morgenstern）合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念，并在包含“混合策略（mixed strategies）”的情况下，证明了纳什均衡在n人有限博弈中的普遍存在性，从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈（Non-cooperative Game）”理论，进而对“合作博弈（Cooperative Game）”和“ 非合作博弈”做了明确的区分和定义。阿尔伯特·塔克（Albert tucker）教授评价其论文，“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的，至今尚未涉及的问题。在概念和方法两方面，该论文都是作者的独立创造。” 纳什均衡例子博弈论中一个著名的例子就是囚徒困境。囚徒困境是一个非零和博弈，说的是两个嫌疑犯甲和乙私人民宅联手作案，被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被判刑3个月，对方将被判刑10年；若两人都不招供则因未获证据但私人民宅将各拘留1年；如果两人均招供，每人将被判刑5年。于是，两个人同时陷入招供还是不招供的两难处境。结果是，尽管甲不知乙是否招供，但他认为自己选择“招供”最好，因而甲会选择“招供”，同样乙也会选择“招供”，两人各判5年。而两人都选择不招供，虽证据不足但因私人民宅将各拘留1年的结果是不会出现的。博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年；乙判刑三个月不招供

博弈论与纳什均衡

《博弈论与纳什均衡理论》姓名张贺祺学号 2010010404 专业政治经济学指导老师张秉云

摘要博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法，也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。关键字：博弈论；纳什均衡；合作博弈；非合作博弈

目录摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) （一）博弈论的主要思想 (4) （二）博弈论的分类 (5) 三、经典案例 (7) （一）博弈论的经典案例 (7) （二）纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) （一）博弈论的重要影响 (8) （二）纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论一、引言近代对于博弈论的研究，开始于策墨咯（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。 1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。博弈论（Game Theory）:亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：（Nash equilibrium）又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。二、博弈论与纳什均衡的主要内容（一）博弈论的主要思想一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P：为局中人，博弈的参与者，也称为博弈方，局中人是能够独立决策，独立承担责任的个人或组织，局中人以最终实现自身利益最大化为目标。决策人：在博弈中率先做出决策的一方，这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者：在博弈二人对局中行动滞后的那个人，与决策人要做出基本反面的决定，并且他的动作是滞后的、默认的、被动的，但最终占优。他的策略可能依赖于决策人劣势的策略选择，因此对

平新乔《微观经济学十八讲》课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第 10 讲策略性博弈与纳什均衡跨考网独家整理最全经济学考研真题，经济学考研课后习题解析资料库，您可以在这里查阅历年经济学考研真题，经济学考研课后习题，经济学考研参考书等内容，更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验，从前辈中获得的经验对初学者来说是宝贵的财富，这或许能帮你少走弯路，躲开一些陷阱。以下内容为跨考网独家整理，如您还需更多考研资料，可选择经济学一对一在线咨询进行咨询。 1．假设厂商 A与厂商 B的平均成本与边际成本都是常数， MC A 10， MC B 8，对厂商产出的需求函数是 Q D 500 20p （ 1）如果厂商进行 Bertrand 竞争，在纳什均衡下的市场价格是多少？（ 2）每个厂商的利润分别为多少？（ 3）这个均衡是帕累托有效吗？解：（1）如果厂商进行 Bertrand 竞争，纳什均衡下的市场价格是 p B 10 ， p A 10 ，其中是一个极小的正数。理由如下：假设均衡时厂商 A 和 B 对产品的定价分别为 p A 和 p B ，那么必有 p A 10 ， p B 8 ，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，p A和 p B 都不会严格大于 10。否则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足p A 10， p B 10。但是由于 p A 的下限也是10，所以均衡时 p A 10。给定 p A 10，厂商 B的最优选择是令 p B 10 ，这里是一个介于 0到2 之间的正数，这时厂商 B可以获得整个市场的消费者。综上可知，均衡时的价格为p A 10 ， p B 10 。（ 2）由于厂商 A 的价格严格高于厂商 B 的价格，所以厂商 A 的销售量为零，从而利润也是零。下面来确定厂商 B 的销售量，此时厂商 B是市场上的垄断者，它的利润最大化问题为： max pq cq ① 其中 p 10 ，q 500 20 10 ，把这两个式子代入①式中，得到： max 10 0 8 500 20 10 解得0 ，由于必须严格大于零，这就意味着可以取一个任意小的正数，所以厂商 B的利润为： 500 20 10 10 。（3）这个结果不是帕累托有效的。因为厂商 B 的产品的价格高于它的边际成本，所以如果厂商 B和消费者可以为额外 1 单位的产品协商一个介于 8 到10 之间的价格，那么厂商 B 的利润和消费者的剩余就都可以得到提高，同时又不损害厂商 A的剩余（因为A 的利润还是零）。

博弈论和纳什均衡

博弈论和纳什均衡文件管理序列号：[K8UY-K9IO69-O6M243-OL889-F88688]

关于博弈论和纳什均衡你应该知道这些腾讯财经[]2015-05-25 10:05 我要分享 [摘要]纳什在与命运的博弈中找到均衡，纪念大师最好的方式就是尝试了解博弈论。腾讯财经综合报道（风生）奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸，两人均不幸遇难。事发当时，这辆出租车失控撞向栏杆，两人均被抛出车外。约翰-纳什因发表两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即着名的纳什均衡。不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生，曾在麻省理工学院任教，晚年为普林斯顿大学担任数学系教授，死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名，1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。

纳什在数学领域上取得多项突破，但他同时深受精神分裂症困扰，其生平故事在2001年被改编成电影《美丽心灵》，赢得包括最佳电影在内的4项奥斯卡奖项。尽管西维亚-纳萨斯（Sylvia Nasars）广为人知的小说《美丽心灵》（A Beautiful Mind）和改编自该书的、由拉塞尔-克罗（Russell Crowe）主演的同名奥斯卡电影探究了纳什错综复杂的生平，但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界，人们普遍认为，与牛顿和爱因斯坦的数学理论相比，纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题，而纳什的数学却可以应用在生物学和社会学领域。如若不是精神疾病的困扰，纳什今天可能已与那些科学伟人齐名。尽管如此，他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就，他与约翰海萨尼（John Harsanyi）和莱茵哈德-泽尔腾（Reinhard Selten）一起获得了1994年诺贝尔经济学奖。什么是博弈论与纳什均衡博弈论 :亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争

博弈论和纳什均衡

关于博弈论和纳什均衡你应该知道这些美股腾讯财经[微博]2015-05-25 10:05 我要分享 139 [摘要]纳什在与命运的博弈中找到均衡，纪念大师最好的方式就是尝试了解博弈论。腾讯财经综合报道（风生）奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸，两人均不幸遇难。事发当时，这辆出租车失控撞向栏杆，两人均被抛出车外。约翰-纳什因发表两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生，曾在麻省理工学院任教，晚年为普林斯顿大学担任数学系教授，死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名，1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。纳什在数学领域上取得多项突破，但他同时深受精神分裂症困扰，其生平故事在2001年被改编成电影《美丽心灵》，赢得包括最佳电影在内的4项奥斯卡奖项。尽管西维亚-纳萨斯（Sylvia Nasars）广为人知的小说《美丽心灵》（A Beautiful Mind）和改编自该书的、由拉塞尔-克罗（Russell Crowe）主演的

同名奥斯卡电影探究了纳什错综复杂的生平，但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界，人们普遍认为，与牛顿和爱因斯坦的数学理论相比，纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题，而纳什的数学却可以应用在生物学和社会学领域。如若不是精神疾病的困扰，纳什今天可能已与那些科学伟人齐名。尽管如此，他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就，他与约翰海萨尼（John Harsanyi）和莱茵哈德-泽尔腾（Reinhard Selten）一起获得了1994年诺贝尔经济学奖。什么是博弈论与纳什均衡博弈论 :亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰-纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。近代对于博弈论的研究，开始于策墨咯，波雷尔及冯-诺伊曼。1928年，冯-诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯-诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰-福布斯-纳什利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡 1 ?假设厂商A与厂商B的平均成本与边际成本都是常数，MC A=10， MC B =8，对厂商产出的需求函数是 Q D二500 -20 p (1)如果厂商进行Bertrand竞争，在纳什均衡下的市场价格是多少？ (2)每个厂商的利润分别为多少？ (3)这个均衡是帕累托有效吗？解：(1)如果厂商进行Bertrand竞争，纳什均衡下的市场价格是p B =10 一；，p A =10 , 其中；是一个极小的正数。理由如下：假设均衡时厂商A和B对产品的定价分别为p A和p B,那么必有p A刃0 , p B K8，即厂商的价格一定要高于产品的平均成本。其次，达到均衡时，p A和p B都不会严格大于10。否则，价格高的厂商只需要把自己的价格降得比对手略低，它就可以获得整个市场，从而提高自己的利润。所以均衡价格一定满足p A空10 , p B?「0。但是由于p A的下限也是10,所以均衡时P A =10。给定P A =10 ,厂商B的最优选择是令 P B =10- ；，这里：是一个介于0到2 之间的正数，这时厂商B可以获得整个市场的消费者。综上可知，均衡时的价格为P A =10 , P B =10 -；。 (2)由于厂商A的价格严格高于厂商B的价格，所以厂商A的销售量为零，从而利润也是零。下面来确定厂商B的销售量，此时厂商B是市场上的垄断者，它的利润最大化问题为： max pq —cq ①其中p =10 _ q =500 -20 107、把这两个式子代入①式中，得到： max (10 —芯―)500 —20(10 —名卩解得；=0,由于；必须严格大于零，这就意味着；可以取一个任意小的正数，所以厂商 B 的利润为：||500-20 10 -; 10-;。 (3)这个结果不是帕累托有效的。因为厂商B的产品的价格高于它的边际成本，所以如果厂商B和消费者可以为额外1单位的产品协商一个介于8到10一；之间的价格，那么厂商B的利润和消费者的剩余就都可以得到提高，同时又不损害厂商A的剩余(因为A的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1 )中，第一个数表示A的支付水平，第二个数表示B的支付水平，a、b、c、d是正的常数。如果A选择“下”而B选择“右”，那么： (1) b .1 且 d ：：：1

博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较【摘要】均衡概念是构成整个博弈论的基石，对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。本文首先将博弈划分为不同的类型，并对主要的均衡概念进行了数学描述，最后对不同的均衡概念进行了比较。【关键词】博弈论；纳什均衡；重复博弈博弈论在现代经济学中占据着相当重要的位置，在微观经济学的本科教学环节中，如果将博弈论这一部分排除在外，那么教学内容是不完整的，并且和现代微观经济学的发展严重脱节。但是由于课时以及学生接受能力的限制，对博弈论的内容进行全面深入地讲解难以做到，因此，将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。在博弈论的基本概念当中，最重要的当属博弈均衡的概念，这些概念的掌握有助于学生把握博弈论的整体框架，并对博弈论的后续学习至关重要。因此，本文将主要的博弈均衡概念进行分类和表述，并对不同的博弈概念进行比较，以期对博弈论的教学有所助益。一、博弈的主要类型博弈构成的基本要素包括：1、参与人（1～N）；2、各个参与人各自可选择的行动集合Ai={ai}；3、参与人i的策略Si，给定信息集，该策略决定在博弈的每一阶段他选择的行动；4、参与人的收益Ui （S1，S2…SN）。依据不同的分类标准，博弈可以被划分为不同的类型。 1、静态博弈、动态博弈和重复博弈博弈各方同时选择策略的博弈称为静态博弈，如猜硬币、投标等，静态博弈一般可以用支付矩阵来表达。动态博弈是指博弈各方按照一定的先后次序进行策略的选择，典型的例子如对弈，动态博弈一般可以用“博弈树”来表达。Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。重复博弈是指同一个博弈（静态或动态）反复进行所构成的博弈过程，如体育比赛中的多局赛制等。 2、完全信息和不完全信息博弈完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈，不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。 3、完美信息和不完美信息博弈在动态博弈中，一参与人完全了解在自己行为之前的博弈进程，则称此参与人为有完美信息的参与人，如果博弈中所有的参与人都具有完美信息，则称此动态博弈为完美信息的动态博弈。反之，如果在存在具有不完美信息的参与人（参

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡在纳什均衡中，你不一定满意其他的策略，但你的策略是回馈对手招数的最佳策略。从囚徒困境中我们会发现，作为博弈各方的行动就是针对对方行动而确定的最佳对策，而一旦知道对方在做什么，就没人愿意改变自己的做法。博弈论学把这么一个结果称为均衡。这个概念是有普林斯顿大学数学家约翰·纳什提出的，因此被称为纳什均衡。诺贝尔经济学奖获得者萨缪尔森有句名言，你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词，供给与需求。博弈论专家坎多瑞引申说：“要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是纳什均衡”。 1950年，还是一名研究生的纳什写了一篇论文，题为《n人博弈的均衡问题》，该文只有短短一页纸，可就这短短一页纸成了博弈论的经典文献。纳什的贡献是，他证明了在这一类的竞争中，在很广泛的条件下是有稳定解存在的，只要是别人的行为确定下来，竞争者就可以有最佳的策略。那么，什么纳什均衡呢？简单说，就是一策略组合中，所有的参与者面临这样的一种情况：给定你的策略，我的策略是我最好的策略。给定我的策略，你的策略也是你最好的策略，即双方在对方给定的策略下不愿意调整自己的策略。纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具，所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展，甚至说是一场革命。纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战，按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果，

从纳什均衡引出一个悖论：从利己的目的触发，结果损人不利己。“囚徒困境”就是如此，从这个意义说，纳什均衡提出的悖论实际上动摇了西方经济学的基石。纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。这个法则如下：走完寻找优势策略和剔除劣势策略的捷径之后，下一步就是寻找这个博弈的均衡。所谓博弈均衡，它是一稳定的博弈结果。均衡是博弈的一结果，但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的，因而是可以预测的。在囚徒困境中存在唯一的纳什均衡点，即两个囚犯均选择“招认”，这是唯一稳定的结果。有些博弈的纳什均衡点不止一个，如下述夫妻博弈中有两个纳什均衡点。丈夫和妻子商量晚上的活动，丈夫喜欢看拳击，而妻子喜欢欣赏歌剧，但两个人都希望在一起度过夜晚。在这个夫妻博弈中有两个纳什均衡点：要么一同去看歌剧，要么一同去看拳击。在有两个或两个以上纳什均衡点的博弈中，其最后的结果难以预测。在夫妻博弈中，我们无法知道，最后结果是一同欣赏歌剧还是一同看拳击。是不是所有的博弈均存在纳什均衡点呢？不一定存在纯策略纳什均衡点，但至少存在一个混合策略均衡点。这里所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略，所谓混合策略是指参与者采取的不是唯一的策略，而是其策略空间上的概率分布。我们下面将在警察与小偷的博弈中给出混合策略的说明。在西部片里，我们常能看到这样的故事：某个小镇上只有一名警察，他要负责整个镇的治安，现在我们假定，小镇的一头有一家酒馆，另一头有一家银行，再假定该地有一个小偷，要实施偷盗。因为分身乏术，警察一次只能在一个地方

博弈论与纳什平衡

博弈论与纳什平衡博弈论（game theory）对人的基本假定是：人是理性的（rational，或者说自私的）,理性的人是指他在具体策略选择时的目的是使自己的利益最大化，博弈论研究的是理性的人之间如何进行策略选择的。纳什（John Nash）编制的博弈论经典故事"囚徒的困境"，说明了非合作博弈及其均衡解的成立，故称"纳什平衡"。所有的博弈问题都会遇到三个要素。在囚徒的故事中，两个囚徒是当事人(players)又称参与者；当事人所做的选择策略(strategies)是承认了杀人事实，最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认杀人，另外一个抵赖，不承认杀人，那么承认者将会得到减刑处理，而抵赖者将会得到最严厉的死刑判决，在纳什故事中两个人都承认了犯罪事实，所以两个囚徒得到的是中间的结果。类似的：我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。在互联网这个原始丛林中：最优策略是如何产生的呢？一、博弈中最优策略的产生艾克斯罗德（Robert Axelrod）在开始研究合作之前，设定了两个前提：一、每个人都是自私的；二、没有权威干预个人决策。也就是说，个人可以完全按照自己利益最大化的企图进行决策。在此前提下，合作要研究的问题是：第一、人为什么要合作；第二、人什么时候是合作的，什么时候又是不合作的；第三、如何使别人与你合作。社会实践中有很多合作的问题。比如国家之间的关税报复，对他国产品提高关税有利于保护本国的经济，但是国家之间互提关税，产品价格就提高了，丧失了竞争力，损害了国际贸易的互补优势。在对策中，由于双方各自追求自己利益的最大化，导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。 A和B各表示一个人，他们的选择是完全无差异的。选择C代表合作，选择D代表不合作。如果AB都选择C合作，则两人各得3分；如果一方选C，一方选D，则选C的得零分，选D的得5分；如果AB都选D，双方各得1分。显然，对群体来说最好的结果是双方都选C，各得3分，共得6分。如果一方选C，一方选D，总体得5分。如果两人都选D，总体得2分。对策学界用这个矩阵来描述个体理性与群体理性的冲突：每个人在追求个体利益最大化时，就使群体利益受损，这就是囚徒困境。在矩阵中，对于A来说，当对方选C，他选D得5

博弈论与纳什均衡

第22卷哈尔滨师范大学自然科学学报 Vol .22,No .42006 第4期 NAT URAL SC I E NCES JOURNAL OF HARB I N NOR MAL UN I V ERSI TY 博弈论与纳什均衡郭　鹏 (中国矿业大学) 杨晓琴 (鸡西大学) 【摘要】　纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础. 关键词:博弈论;纳什均衡;非合作博弈收稿日期:2006-02-15 0　引言博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论.两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽.作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期.然而,它过于抽象,实用性不强,其局限性日益暴露出来.50年代以来,纳什(Nash )、泽尔腾(Selten )、海萨尼(Harsanyi )等人使博弈论成熟并最终进入实用.最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究.1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情.博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具. 简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡.博弈论由3个基本要素组成:一是决策主体(Player ),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是效用(U tility ),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数.参与人、策略集和效用构成了一个基本的博弈. 1　博弈论的主要思想一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失. 博弈论模型可以用五个方面来描述:G ={P,A,S,I,U ) P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标. A:为各局中人的所有可能的策略或行动的集合.根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等.

3-混合策略的纳什均衡

博弈论教学/混合策略的纳什均衡出自MyKnowledgeBase < 博弈论教学 Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡目录 ■1 复习 ■2 混合策略(Mixed strategy) ■2.1 举例/Example ■2.2 概念 ■2.3 纯策略和混合策略 ■2.4 混合策略的争议 ■3 混合策略的纳什均衡 ■3.1 基本概念 ■3.2 混合策略纳什均衡的存在性/纳什定理 ■3.3 学术争议与批评 ■4 混合策略纳什均衡举例 ■4.1 社会福利博弈Social Welfare Game ■4.1.1 博弈分析(方法1:收益无差异) ■4.1.2 博弈分析（方法2：图形分析法） ■4.1.3 博弈分析(方法3：导数(Derivative)极值法) ■4.2 普通例子 ■4.3 审计博弈(Tax Game) ■4.4 激励的悖论[5] ■4.5 求解纳什均衡的一般方法 ■5 多重纳什均衡 ■5.1 多重纳什均衡举例 ■5.1.1 夫妻之争 ■5.1.2 制式问题 ■5.1.3 市场机会博弈 ■5.2 多重纳什均衡分析 ■5.2.1 帕累托上策均衡（Pareto Dominated Equilibrium） ■5.2.1.1 帕累托最优Pareto optimality ■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.3 举例分析 ■5.2.2 风险上策均衡(Risk-dominant Equilibrium) ■5.2.3 聚点均衡(Focal Points Equilibrium) ■5.2.4 相关均衡 ■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义 ■7 作业 ■8 参考文献

智猪博弈论与纳什均衡

智猪博弈理论介绍在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪也行动的话，小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本，以下纯收益计算相同)，而小猪等待的话，则可以获得4个单位的纯收益，等待优于行动；在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果小猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择：

从矩阵中可以看出，当大猪选择行动的时候，小猪如果行动，其收益是1，而小猪等待的话，收益是4，所以小猪选择等待；当大猪选择等待的时候，小猪如果行动的话，其收益是-1，而小猪等待的话，收益是0,所以小猪也选择等待。综合来看，无论大猪是选择行动还是等待，小猪的选择都将是等待，即等待是小猪的占优策略。在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种明智的选择。这时候有所不为才能有所为！高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。博弈与制度由智猪博弈故事得到的启示在这个例子中，对小猪而言，无论大猪是否踩动踏板，不去踩踏板总比踩踏板好。反观大猪，明知小猪不会去踩踏板，但是去踩踏板总比不踩强，所以只好亲历亲为了。这个案例令我们不得不思考—— 【博弈与制度】 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中，每一方都要想方设法攻击对方、保护自己，最终取得胜利；但同时，对方也是一个与你一样理性的人，他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学，博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说，博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问，因此也有人把它称为“对策论”。

论博弈论与纳什均衡的影响及局限

论博弈论与纳什均衡的影响及局限摘要：纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。同时，纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础。关键词：纳什均衡、博弈论、影响、局限引言：Nash平衡是指博弈中这样的局面，对于每个参与者来说，只要其他人不改变策略，他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下，Nash平衡一定存在。以两家公司的价格大战为例，Nash 平衡意味着两败俱伤的可能：在对方不改变价格的条件下，既不能提价，否则会进一步丧失市场；也不能降价，因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局，通过谈判寻求新的利益评估分摊方案，也就是Nash平衡。纳什均衡理论正如克瑞普斯①书中所说，?在过去的一二十年内，经济学在方法论以及语言、概念等方面，经历了一场温和的革命，非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。? 博弈论是研究决策主体的行为发生直接相互作用时候的决

以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。一．博弈论的影响一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即各博弈方做出决策选择后的所得和所失。博弈论所研究的是理性的决策者之间冲突及合作的理论，可以为实际决策提供理论基础和方向指导。其最终追求结果是使博弈方达到利益最大化的均衡。博弈论不仅仅存在于数学的运筹学中，也正在经济学中占据越来越重要的地位，但如果你认为博弈论的应用领域仅限于此的话，那你就大错了。实际上，博弈论甚至在我们的工作和生活中无处不在！在工作中，你在和上司博弈，也在和下属博弈，你也同样会跟其他相关部门人员博弈；而要开展业务，你更是在和你的客户以及竞争对手博弈。在生活中，博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。诺贝尔经济学奖获得者包罗·萨缪尔逊如是说：要想在现代社会

博弈论复习题及答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t

博弈论复习题与答案

博弈论判断题（每小题1分，共15分）囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t

博弈论-纳什均衡(非合作博弈均衡)

完全理性：理性指一种行为方式，它适合实现指定目标，而且在给定条件和约束的限度之内。在不同的学科领域，理性所涵盖的内容存在着差异完全理性的内涵具有完全理性的行为人是个无所不知的超人，他具有纵向和横向方面完备的知识。在纵向方面，他可以预测未来；在横向方面，他通晓资源、交易伙伴和环境等情况。具体而言，行为人的完全理性包括以下隐含内容。 (1)不存在不确定性，即使存在不确定性，也可以预知不确定性的概率分布。也就是说，对于具有完全理性的行为人来说，一切信息都是确定的。 (2)行为人具有可以确定的效用函数(消费者的效用函数和厂商的利润函数可以统称为效用函数)，同时行为人具有同质性以及一致性的偏好体系。 (3)选择结果具有描述不变性、程序不变性和前后关系独立性。描述不变性要求行为人选择的先后顺序不应依赖于所描述或显示的选项，也就是说如果行为人经过再三思考，将两种描述视为同一问题的同义表达，那么它们必定导致相同的选择——即这种思考不存在异处；程序不变性要求不同方式的等价学说揭露相同的偏好次序；前后关系独立性指一项选择与其他替代方案互为独立的原则，它要求在给定Z而不提供有关X或Y 的新的信息的情况下，X 与Y的优先权顺序不应该依赖于Z是否有效。 (4)行为人具备完备的计算和推理能力，可以像计算机一样在数秒内从事无穷尽的计算步骤，同时也不存在感性因素对选择的干扰。 (5)选择意味着在各种方案或选择集中进行比较和挑选，因此完全理性的行为人可以设计出所有的被选方案，以及各项方案所产生的全部后果。 (6)一个确定的报酬函数，即行为人可以确定地赋予每项行动结果一个具体的量化价值或效用。 (7)确定性的结果，也就是行为人町以实现效用最大化或最优目标(消费者效用最大化和企业利润最大化)。在上述条件下，建立在完全理性假设的基础上的主流经济学的方法论，即行为人的选择或决策意味着在资源约束的条件下实现效用最大化或利润最大化。行为人在选择过程中，可以遵循确定性原则、极大极小法则、边际原理以及概率法则(也就是主观期望原则)。主流经济学的选择理论建立得如此简洁和完美，使得诸多该领域的学者为之倾倒。并且，这种理论可以使我们不用站起身来实际观察人类行为，便能坐在椅子里预测它们(正确或错误的预见)。正如主流经济学的典型代表弗里德曼的著名论断所述“彻底的‘现实主义’显然无法实现；看一个理论是否‘足够’现实，只能看它就眼下意图而言，是否能做出充分好的预见，或做出比其他理论更好的预见”。主流经济学的完全理性假设致使其形成令人称赞的完美体系和预测能力，但是这种完美只是抽象上的理想模式和方法，不仅经不起经济学内部的逻辑推敲，也经不起实践和现实的考验。完全信息（Complete Information）完全信息（Complete Information），是指市场参与者拥有的对于某种经济环境状态的全部知识。在现实经济中，没有人能够拥有各个方面经济环境状态的全部知识，完全信息博弈完全信息博弈是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。