第五章-博弈论与竞争策略

第五章博弈论与竞争策略

第一节第二节第三节博弈论的基本概念完全信息静态博弈重复博弈和序列博弈

在现实经济社会，完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力，又面临很大的竞争压力。厂商之间具有相关性和依存性。因此，可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家：纳什（Nash）、泽尔腾（Selten）和海萨尼（Harsanyi），他们都对博弈论在经济学中的应用作出了贡献。

70年代以来，博弈论已经发展成为现代经济学的基础重要基础之一，改变了传统经济学的结构，这主要有两

个方面的原因：

1．传统经济学着重研究市场机制和价格制度，分析完全竞争市场中的最优决策，不考虑决策者之间的相互影响。但是，现实经济运行中市场是不完全竞争的，行为主体之间的决策具有相互影响。

2．完全竞争市场是以完全信息为条件的，这在现实经济运行中也难以保证。在信息不对称条件下，考虑行为主体相互影响的非价格制度可以用博弈论分析。

当然，应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外，关键是正确估计各参与者的策略空间和收益函数。

第一节博弈论的基本概念

一．博弈论及其特点

1．博弈和博弈论

博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。

博弈论（Game Theory）也称对策论，它是一种分析博弈过程和结果的数学方法，研究具有理性的多个行为主体的决策和行动直接相互作用和影响时，事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。

2．特点：

（1）参与者具有各自的目标：

（2）参与者都是理性行为者；

（3）参与者之间具有相关性；

（4）事态发展的结果取决于全部参与者的共同行为；

（5）参与者要根据对其他参与者的判断决定自己的行动，因而是对策。

可见，博弈论是与优化论不同的决策理论。优化论是一种单人决策理论；博弈论所揭示的规律是一种多人决策理论。

二．博弈论的基本概念

在博弈论中，博弈的基本要素被概括为以下概念：

1）参与者Players （玩家）：即参加博弈过程的行为和决策主体，也是利益主体。在一个博弈中，最少要有两个参与者。

2）策略Strategies （战略或策略行为）：即参与者在某个博弈时点，根据其掌握的有关博弈信息而选择的决策变量和行动计划，一个参与者的全部可行策略称为他的策略空间。

接上页

3）收益Payoff（支付、得益）和收益函数：收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略，称为收益函数。

4）结局 outcome（结果）：指博弈的结果，指既定策略组合条件下全部参与者所得收益的集合。

5）均衡 Equilibrium （均势）：指达到稳定的策略组合或结局。

6）博弈规则：指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。

例：

可口可乐与百事可乐（参与者）的价格决策：

双方都可以保持价格不变或者提高价格（策略）

博弈的目标和得失情况体现为利润的多少（收益）

利润的大小取决于双方的策略组合（收益函数）

博弈有四种策略组合，其结局是：

（1）如果双方都不涨价，各得利润10单位；

（2）如果可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润-30；

（3）如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润30；

（4）如果双方都涨价，可口可乐利润140，百事可乐利润35；

博弈的稳定状态有两个：都不涨价或者都涨价（均衡），均衡称为博弈的解，它是由博弈规则（即参与者采取

什么策略会取得什么结局，市场的需求弹性、交叉价格弹性等）决定的。

三．博弈的表述方法

博弈一般用数学模型表达，分为标准和扩展模型两种。

1. 博弈的标准模型包括三个要素：参与者、每个参与者可以选择的策略以及收益函数。

在两个参与者的有限博弈中，标准模型可以用收益矩阵表示。如上例的可乐价格博弈可以表示如下：

在收益矩阵中，包含了标准博弈模型的基本信息，表格中各组数字表示不同策略组合条件下的结局。在每个结局中，第一个数字代表参与者1 的收益，第二个数字代表参与者2的收益。

2. 博弈的扩展模型

包括五个要素：参与者、决策时点、策略空间、信息和收益函数。在简单的博弈中，扩展模型可以用博弈树

表示。如上例的可乐价格博弈可表示如图下：

博弈树一般用来分析动态博弈。在博弈过程中，从某一个决策点开始，参与者在已有行动的基础上开始选择，到博弈结束，称为“子博弈”。子博弈是相对的，从事态发展的历史来看，所有的博弈都是子博弈。

四．博弈的分类

（1）合作博弈与非合作博弈根据参与者之间能否通过谈判达成具有约束力的协议或合同来划分。

可以达成协议的为合作博弈cooperative game，合作博弈强调集体理性和整体最优。如买卖双方讨价还价后成交。

不能达成协议的为非合作博弈non-cooperative game，非合作博弈强调个体理性和局部最优。如寡头之间的竞争博弈，双方的利益和目标有冲突，难以达成可以实施的协议，双方都有欺骗和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领域。

接上页

（2）静态博弈与动态博弈根据参与者选择策略的关系划分。

参与者同时或独立选择策略的博弈是静态博弈。

参与者按照一定的次序选择策略，后选择者了解先选择者的行动，这种博弈是动态博弈。

（3）完全信息博弈与不完全信息博弈根据参与者对其他参与者的特征、策略空间、收益函数等信息的了解程度划分。

全部相互了解即为完全信息博弈，否则是不完全信息博弈。

第二节完全信息静态博弈

一．囚徒的困境与纳什均衡

1．囚徒的困境：假设有两个嫌疑犯作案后被抓获，并在不同的房间审讯。警察告诉他们，如果两人都坦白，各判刑8年；如果两人都抵赖，各判刑1年；如果其中一人坦白而另一人抵赖，坦白者释放，抵赖者判刑10 年；这样，每个犯人就有两种策略，即坦白和抵赖。这个博弈的收益矩阵如下

在这个博弈中，（坦白，坦白）是博弈的解，即均衡结局。因为不管对方怎样行动，两个囚徒都会选择坦白。囚徒的困境说明，个人理性（最优）与集体理性（最优）可能不一致。如寡头之间的广告投入、产量控制等。2．纳什均衡

在这个博弈中，出现了两个纳什均衡，参与者不能判断对方会采取什么策略，因而可能出现非均衡的结局（涨价，不涨价）和（不涨价，涨价）；或者对双方不利的均衡（不涨价，不涨价）。因此，纳什均衡只说明均衡存在的可能，不能解释均衡的结果。

纳什均衡是指由所有参与者的最优策略组成的策略组合。在这种情况下，没有人可以从改变策略中得到好处，因而形成了一种均衡（僵局）。

一种制度或者协议要能够自动实行（即得到自觉遵守），必须满足纳什均衡的条件。

可以通过画圈的方法求解纳什均衡。即设定一个参与者的策略，然后把另一个参与者将会选择的策略可以带来的收益圈起来。如果收益矩阵中某个策略组合中的两个收益都被圈起来，则这个策略组合就是纳什均衡。例如，前述可乐定价博弈收益矩阵可以确定有（涨价，涨价）和（不涨价，不涨价）两个纳什均衡。

二．支配性策略dominant strategy均衡

支配性策略均衡也称上策均衡或优势策略均衡。在博弈中，对有些参与者来说，不管对手采取什么策略，他的策略都保持不变。这种不取决于对手选择的最优策略称为支配性策略（上策或优势策略）。

当存在支配性策略时，可以首先确定支配性策略，然后确定对手的选择，从而得出博弈的均衡解。例如，两个寡头厂商的广告博弈收益矩阵如下：

在这个博弈中，百事可乐有一个支配性策略，即不管可口可乐是否有广告，他都会有广告。在此基础上，可口可乐必然也会有广告。博弈的结果就是（有广告，有广告）。这种均衡称为支配性策略均衡。它也是纳什均衡，但纳什均衡不一定是支配性策略。

三．合作的诱惑

在类似囚徒的困境这样的博弈中，个体理性往往导致集体的非理性。在有多个纳什均衡的博弈中，参与者判断失误，或者某个参与者非理性行为，都会导致双方的严重损失。因此，存在着通过合作（共谋、勾结和串通）改善博弈结果的诱惑，这样可以是大家的收益都得到改善。

例如，在上述广告博弈中，如果双方都不做广告，比都做广告收益高。但这种合作难以自动实现。

1．对社会无害的合作，往往通过某些规则实现。

如香烟广告，交通规则，重复建设。

下图列出了斗鸡博弈的收益矩阵。设两辆汽车同时到达一个十字路口，每个驾驶员都有开和等两种选择，博弈

结果如下：

在这个博弈中，（开，等）和（等，开）是两个纳什均衡，但在完全信息静态博弈中，可能由于判断失误导致

交通事故，或无谓地延误时间。因此通过交通规则引导博弈。

避免重复建设

例如两个厂商进行产品开发博弈的收益矩阵。两个厂商同时开发一个市场（麦片），市场需要甜和脆两种产品，每个厂商只能生产其中一种产品。从收益矩阵可以看出，在理性行为条件下博弈的两个纳什均衡是（脆，甜）和（甜，脆）。但由于推出甜的厂商有较多利润，可能导致（甜，甜）的重复建设结果。因此，应该通过发布信息和政策引导。国外不允许厂商之间勾结分割市场，主要靠准确的市场信息。

2．对社会有害的合作，设法制止

在囚徒的困境博弈中，如果两个囚徒可以互相协商，并形成攻守同盟，则罪犯得到好处，对社会不利。例如在

寡头厂商的定价博弈中，勾结定高价对双方都有好处，但对社会不利，因此受到反垄断法的严密监控。

寡头厂商的价格博弈收益矩阵如下：

四．最大最小策略

纳什均衡是建立在参与者理性行为基础上的，这就使参与者的决策时面临可能出现某些非理性行为的风险。为了降低风险，决策者可以采取最大最小策略以便降低风险，即在各种策略的最小收益中，选择具有最大收益的策略。其代价是放弃最优策略。

下图是一个产品开发博弈的收益矩阵。其中，按照理性行为会有两种纳什均衡，（无新产品，有新产品）以及（有新产品，无新产品）。但如果采取最大最小策略，两个企业都不推出新产品。

支配性策略

在有些情况下，为了避免陷入被动，采取最大最小策略十分必要。在下图的博弈中，乙方采取“右”是一个支配性策略。因为不管甲方选什么，乙方采取右的策略都比左的策略好，可以得到1的收益。在期望乙方采取右的情况下，甲方应该采取“下”，并得到2的收益。这样，支配性策略均衡为（下，右）。

如果甲方比较慎重，考虑到乙方可能不一定理性，或者可能故意捉弄甲方，则应该采取最大最小策略，形成（上，右）的博弈结果。

第三节重复博弈和序列博弈

在现实经济社会，完全信息静态博弈的条件并不经常可以得到满足。特别是在市场竞争中，厂商之间的竞争不是一次性的，而是长期和反复的。同时，厂商之间的行为往往是有先后次序的，决策者可以先了解对手的行动，在充分掌握信息的基础上，然后再决定自己的对策。这种情况称为完全信息动态博弈。它对于分析具有多个纳什均衡的博弈结果很有帮助。

一．重复博弈Repeated game

重复博弈是指参与者之间的博弈不是一次性的，而是可以重复的。这样，参与者就可以通过分析对手的行动采

取相应的策略。

1．摆脱囚徒的困境的条件

以寡头之间的价格竞争为例，在下图的价格博弈中，如果是静态博弈，厂商很容易陷入囚徒的困境（低价，低价）。但如果博弈可以无限重复下去，则厂商的最佳策略是“以牙还牙”。这样，考虑到对手会以牙还牙，从长远和整体来看，降低价格不会有什么好处，博弈可能达到合作的结果。

2．合作的条件和困难

在现实经济运行中，寡头之间的价格默契并不容易，主要原因有：

1）如果博弈重复是有限的，则最后一次博弈会采取低价策略，理性的结果是抢先低价，一直到第一次博弈；

但是，只要以牙还牙的理性行为有一定折扣或（怀疑），合作以避免价格战的结果仍然会出现。

2）厂商较多，使以牙还牙（对欺骗者进行报复和惩罚）难以实现，合作就十分困难。如航空运输市场

3）厂商之间的成本差别较大，需求和成本变化很快，难以达成默契。

二．序列博弈Sequential game

在现实中，较常见的是序列博弈，即一方先行动，另一方后行动。

1．先行者优势

在序列博弈中，先行者处于有利地位，可得到竞争优势。在下图中，两家厂商进行产品开发的博弈，如果是静态博弈，两家厂商必须同时宣布决策。根据最大最小原则，可能大家都无新产品。但如果其中某一厂商具有研发优势，可以率先推出新产品，则另一厂商只好放弃进入该市场的打算。

2．空头威胁、承诺和策略性行动

在序列博弈中，先行者可以用既成事实获得竞争优势。在这种情况下，怎样才能获得先行优势呢？理性的厂商都知道先行者优势，并希望让竞争者确信自己一定会推出新产品，从而放弃新产品。怎样才能做到这一点呢？（1）空头威胁如果厂商的努力不足以使对手相信自己肯定会推出新产品，如制造舆论、研究与开发投入、广告宣传等，这种努力称为空头威胁。它不能吓退竞争者。

（2）承诺和策略性行动如果厂商想要吓退竞争者，必须作出一定推出新产品的承诺commitment，它是一种无法反悔的行动。承诺与空头威胁的界限在哪里呢？

接上页

要使对手确信自己的承诺，必须做到如果不推出新产品，会导致自己更大的损失。在上图中，推出新产品的最大损失是5，空头威胁变为承诺的转折点就是如果不推出新产品将会导致大于5的损失。

怎样作出承诺呢？必须有策略性行动，该行动使得空头威胁变为承诺。即通过某种限制自己选择范围的行动，改变竞争者对自己行动的预期，从而迫使竞争者选择对自己有利的策略，达到限制对手的目的。

在上图表示的博弈中，策略性行动可以是超过5的广告投入、基建投入或交易合同，如果不能推出新产品，这些投入将全部损失。因此必将全力以赴推出新产品。可见，承诺和策略性行动是有代价的。它必须先限制自己的选择余地，断掉退路。“破釜沉舟”，“背水一战”就是这个道理。

承诺和策略性行动是有风险的，其效果在很大程度上取决于参与者对各自收益函数的估计和行为准则。适当的非理性行为的名声（勇敢、疯狂等），将有助与取得先行者优势。

3．对进入的威慑

在许多行业中都存在现有厂商（在位者）与潜在进入者（进入者）之间关于进入与反进入之间的博弈。这也是一种序列博弈，在位者可以采取一定的策略性行动形成对进入的威慑。

下图列出了一个进入博弈的收益矩阵。显然，默许是在位者的支配性策略（上策），商战是一个空头威胁，潜在的进入者将会选择进入。

为了使商战的威胁具有可信性和效果，在位者可以用策略性行动作出承诺，一旦进入发生，它将以低价回击。比如，它可以建造并维持一定的剩余生产能力，这将使它的垄断利润减少30，博弈的收益矩阵变为：这样，高价不再是一个上策，均衡可能是（高价，不进入）。在重复博弈的情况下，厂商可能不仅考虑短期收益，而且更重视长期利益。因此，为了维持长期的垄断利润，厂商可能以牺牲短期利益为代价把进入者驱逐出去。这种在博弈中采取一定非理性行为的方法，形成进入威慑的另一种途径，即建立不惜一切代价粗暴对待进入者的名声，而不需要有具体的承诺。（实际上是把牺牲短期利益作为承诺）

思考:

运用博弈论思想分析我国产业重复建设的问题.

运用博弈论思想分析我国企业的竞争策略.

第五章-博弈论与竞争策略

第五章博弈论与竞争策略第一节第二节第三节博弈论的基本概念完全信息静态博弈重复博弈和序列博弈在现实经济社会，完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力，又面临很大的竞争压力。厂商之间具有相关性和依存性。因此，可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家：纳什（Nash）、泽尔腾（Selten）和海萨尼（Harsanyi），他们都对博弈论在经济学中的应用作出了贡献。 70年代以来，博弈论已经发展成为现代经济学的基础重要基础之一，改变了传统经济学的结构，这主要有两个方面的原因： 1．传统经济学着重研究市场机制和价格制度，分析完全竞争市场中的最优决策，不考虑决策者之间的相互影响。但是，现实经济运行中市场是不完全竞争的，行为主体之间的决策具有相互影响。 2．完全竞争市场是以完全信息为条件的，这在现实经济运行中也难以保证。在信息不对称条件下，考虑行为主体相互影响的非价格制度可以用博弈论分析。当然，应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外，关键是正确估计各参与者的策略空间和收益函数。第一节博弈论的基本概念一．博弈论及其特点 1．博弈和博弈论博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。博弈论（Game Theory）也称对策论，它是一种分析博弈过程和结果的数学方法，研究具有理性的多个行为主体的决策和行动直接相互作用和影响时，事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。 2．特点：（1）参与者具有各自的目标：（2）参与者都是理性行为者；（3）参与者之间具有相关性；（4）事态发展的结果取决于全部参与者的共同行为；（5）参与者要根据对其他参与者的判断决定自己的行动，因而是对策。可见，博弈论是与优化论不同的决策理论。优化论是一种单人决策理论；博弈论所揭示的规律是一种多人决策理论。二．博弈论的基本概念在博弈论中，博弈的基本要素被概括为以下概念： 1）参与者Players （玩家）：即参加博弈过程的行为和决策主体，也是利益主体。在一个博弈中，最少要有两个参与者。 2）策略Strategies （战略或策略行为）：即参与者在某个博弈时点，根据其掌握的有关博弈信息而选择的决策变量和行动计划，一个参与者的全部可行策略称为他的策略空间。接上页 3）收益Payoff（支付、得益）和收益函数：收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略，称为收益函数。 4）结局 outcome（结果）：指博弈的结果，指既定策略组合条件下全部参与者所得收益的集合。 5）均衡 Equilibrium （均势）：指达到稳定的策略组合或结局。 6）博弈规则：指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。例：可口可乐与百事可乐（参与者）的价格决策：双方都可以保持价格不变或者提高价格（策略）博弈的目标和得失情况体现为利润的多少（收益）利润的大小取决于双方的策略组合（收益函数）博弈有四种策略组合，其结局是：（1）如果双方都不涨价，各得利润10单位；（2）如果可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润-30；（3）如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润30；

第十三章博弈论和竞争策略.

第十三章博弈论和竞争策略教学目的通过本章的学习，使学生掌握博弈论的基本内容，并能够用博弈论历来分析厂商的竞争策略。教学内容博弈与决策、占优策略、纳什均衡、重复博弈、序贯博弈、威胁、承诺和可信性、对进入的威慑教学重点与难点占优策略、纳什均衡、重复博弈、序贯博弈教学方法教师讲授与讨论相结合具体内容第一节博弈和决策博弈论(game theory)，又译为对策论，就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论的基本概念参与人，又称局中人，是指博弈中选择行动以实现自身利益最大化的决策主体(可以是个人，也可以是团体，如厂商、政府、国家)。行为：指参与人的决策变量，如消费者效用最大化决策中的各种商品的购买量；厂商利润最大化决策中的产量、价格等。策略：又称战略，是指参与人选择其行为的规则，也就是指参与人应该在什么条件下选择什么样的行动，以保证自身利益最大化。信息：是指参与人在博弈过程中的知识，特别是有关其他参与人(对手)的特征和行动的知识。即该参与人所掌握的其他参与人的、对其决策有影响的所有知识。收益：又称支付，是指参与人从博弈中获得的利益水平，它是所有参与人策略或行为的函数，是每个参与人真正关心的东西，如消费者最终所获得的效用、厂商最终所获得的利润。结果：是指博弈分析者感兴趣的要素集合。均衡：是指所有参与人的最优策略或行动的组合。博弈的分类：静态博弈与动态博弈完全信息博弈与不完全信息博弈合作博弈与非合作博弈：若参与者能够达成有约束力的协议，即为合作博弈；反之为非合作博弈。第二节占优策略

占优策略：无论竞争者如何行动，该策略都是最优的。占优策略均衡：不管竞争对手的策略如何，每一家企业的行为总是最优的，这样一个博弈的结构成为占优策略均衡。第三节纳什均衡纳什均衡：给定对方的阿行动，自己的行动是最优策略组合。最大最小策略：限制最小可能收益中的最大值。纯策略：博弈方做出某个具体的限制或者采取某个具体的行动的策略。混合策略：参与者以某种概率分布在两种或更多的行动中随机限制。第四节重复博弈重复博弈：博弈方不断采取行动，同时不断受到效应的收益的博弈。以牙还牙策略：在一个重复博弈中，限制前一轮对手所选择的行动的一种策略，该策略将与合作者保持合作，而报复不合作者。第五节序贯博弈序贯博弈：参与者根据对手的行动和反应轮流行动的博弈。博弈树；先发优势第三节威胁、承诺和可信性策略性行动：限制自身的行动空间从而为自己带来战略好处的行动。空头威胁；承诺和可信性第四节对进入的威慑课程的考核要求：理解重复博弈和序列博弈，掌握占优策略均衡和纳什均衡【复习思考题】 1、什么是占优策略？为什么一个上策的均衡是稳定的？ 2、上策均衡与纳什均衡的区别和联系。 3、什么是“以牙还牙”策略？为什么它是无限重复囚徒困境的理性策略？