博弈论的实例分析

合集下载

博弈论的定义

博弈论的定义1. 博弈论的基本概念博弈论，是现代数学的一个分支学科，研究在多人决策环境中人们的策略选择以及可能产生的结果。

从经济学、管理学、政治学、心理学等方面来分析和解决问题时，博弈论可以为人们提供决策的基础。

因此，博弈论不仅在学术上很有价值，在实践中也具有很高的应用价值。

2. 博弈论的应用范围博弈论的应用范围广泛，如军事策略、商业竞争、政治谈判、社会决策、环境决策等领域。

另外，也被广泛应用于运输、公共建设、医学治疗等社会实践活动中。

3. 博弈论的基本元素博弈论的基本元素是“参与者”、“策略”、“收益”和“信息”。

“参与者”是指在某一决策环境中的所有相关人员，如消费者、企业、政府或其他组织和个人等。

“策略”是参与者在决策过程中选择的行动方案，也是促进参与者在决策中优化收益的关键。

“收益”或“效用”是参与者最终得到的结果，通常在博弈论中用数字来表示，这些数字可以是财务收入、数字权益等。

“信息”也是参与者在决策中极为重要的因素。

它可以分为完全信息和不完全信息两种，完全信息是指参与者对决策过程中的所有信息都有充分了解，而不完全信息是指参与者对决策过程中的某些信息存在不确定性。

因此，在不完全信息博弈中，有时决策者需要采取一些策略来“模糊化”自己的策略，以避免让其他人知道他们实际上所做的决策。

4. 博弈论的经典模型- 零和博弈零和博弈是博弈论的基本模型之一，是指参与者的利益总和为零。

在这种情况下，一个人赢得的收益等于另一个人失去的收益，如象棋、扑克等所有参与者的输赢情况总是相互抵消的。

- 非零和博弈非零和博弈是一种参与者的利益总和不为零的博弈。

在这种情况下，一方的收益可以与另一方的收益同时增加，如合作博弈中的合作关系。

- 合作博弈合作博弈是指参与者可以在决策中合作以实现双方或多方的利益最大化。

在此类博弈中，参与者通常需要通过协商和合作达成共识。

- 非合作博弈非合作博弈是指参与者在决策中只考虑自己的利益。

博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境”摘要：“囚徒困境”模型是博弈论中的经典范例，它是1950年Tucker提出的，其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握，成为解释生活现象的有力工具。

其实“囚徒困境”模型随着博弈论的深入发展，具有各种不同的形式，通常分为：完全信息的静态博弈，完全信息的动态博弈，不完全信息的静态博弈及不完全信息的动态博弈四种形式。

本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。

关键词：博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。

它的基本模型是：警察抓住了两个合伙犯罪的罪犯，由于缺乏足够的证据指证他们的罪行，所以希望这两人中至少有一人供认犯罪，就能确认罪名成立。

为此警察将这两个罪犯分别关押以防止他们串供，并告诉他们警方的政策是“坦白从宽，抗拒从严”：如果两人中只有一人坦白认罪，则坦白者立即释放，而另一人则将重判5年徒刑；如果两个同时坦白认罪，则他们将各判3年监禁。

当然罪犯知道如果他们两人都拒不认罪，则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。

用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益，第二个数字是囚徒2的得益) ：囚徒2囚徒1（表1）假定两个罪犯熟悉彼此，这便是一个同时行动的完全信息静态博弈。

容易看出，由于对于每个囚徒而言，无论对方选择什么策略，坦白都是自己的最优策略，所以(坦白，坦白) 是博弈的Nash均衡。

二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行，比如犯罪团伙会被警方多次审讯，日常生活中买卖会重复进行，国际间的战争此伏彼起。

而且人们也发现基本博弈的重复进行并非基本博弈的简单累加，比如商业中的回头客问题。

下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。

首先观察“囚徒困境”的有限博弈，以T记基本博弈的重复次数。

海盗分金博弈论的故事

海盗分金博弈论的故事海盗分金--博弈论的故事(一)海盗分金5名海盗分100枚金币。

规则是大家抽签分出1-5号，并按顺序提方案。

1号首先提方案，5人表决，当超半数同意时有效；否则1号将被抛入大海。

然后，2号提方案，4人表决，评判方式同上。

以此类推。

假定每个人都很聪明，1号提出什么方案，能使自己收益最大?答案是：(97、0、1、0、2)或(97、0、1、2、0)。

推理：假定1-3号都抛入大海，那末4号也活不了，所以，4号必须保住3号。

据此，3号可提方案(100、0、0)。

2号推知3号方案，可提出(98、0、1、1)方案，来拉拢4号和5号。

1号推知2号方案，可推出上述方案，拉拢住3号，以及4号或5号中的1人。

(二)博弈论与博弈类型博弈(Game)，本是游戏、竞赛的意思。

所要解决的核心问题是：参与博弈的其他人员会怎么做?我应采取怎样的对策来取得最佳效果?博弈的例子到处可见：讨价还价、划拳、小孩猜拳、下棋、打牌，以及"三十六计"、"田忌赛马"等。

博弈论作为一种理论，最先是由美国经济学家冯·诺伊曼在1937年提出来的，他与经济学家奥斯卡·摩根斯坦于1944年合著的《博弈论与经济行为》公认为博弈论诞生的标志。

今天，博弈论已为数学的一个较为完善的分支，并在许多领域被运用。

在经济学领域的影响被称为"现代经济学的一次大的革命"。

博弈类型：1.静态博弈与动态博弈。

前者指参与者同时行动、同时出牌或亮招，如招标、考试等；后者指参与者的行动有先后次序，如下棋、战争、商业竞争等。

2.完全信息博弈与不完全信息博弈。

前者指参与者互相都"知己知彼"，否则就是后者。

3.零和博弈与非零和博弈。

前者指"你赢的就是我输的"，如打麻将、下棋等；后者指大家的得失总和不为零，如势均力敌的战争会使两败俱伤，而商业合作会使"双赢"。

纳什讨价还价博弈模型与实例

纳什讨价还价博弈模型与实例在经济学中，博弈论是研究决策制定和策略选择的重要理论工具。

纳什讨价还价博弈模型是博弈论中的一种典型模型，用于分析参与者在讨价还价过程中的策略选择和效用最大化问题。

本文将介绍纳什讨价还价博弈模型的基本概念和数学表达，并结合实际案例进行解析。

一、纳什讨价还价博弈模型的基本概念纳什讨价还价博弈模型是由约翰·纳什提出的，用于分析多方参与者在讨价还价过程中的策略选择和达成协议的问题。

在博弈模型中，每个参与者都会追求自己的最大化利益，通过制定合适的策略来达到目标。

在讨价还价过程中，参与者可以选择不同的策略，例如提出高价、低价或中等价位，以实现自己的利益最大化。

而其他参与者也会根据自身利益制定策略，双方需要在博弈中找到最优解，即双方都无法通过改变策略来获得更好的结果。

二、纳什讨价还价博弈模型的数学表达纳什讨价还价博弈模型可以用数学符号来表示。

假设有两个参与者，分别记作P1和P2，他们的讨价还价策略分别为x和y。

参与者的效用函数分别为U1(x,y)和U2(x,y)。

在纳什讨价还价博弈模型中，每个参与者的目标是最大化自己的效用函数。

P1的效用函数可以用如下形式表示：U1(x,y) = p1(x) - c(x,y)其中，p1(x)表示P1根据策略x所能获得的收益，c(x,y)表示为了达成协议而付出的代价。

同样地，P2的效用函数可以表示为：U2(x,y) = p2(y) - c(x,y)参与者P2的收益p2(y)和代价c(x,y)的定义与参与者P1类似。

参与者P1和P2的决策是相互影响的，通过博弈求得双方最优解，即纳什均衡。

三、纳什讨价还价博弈模型的实例为了更好地理解纳什讨价还价博弈模型，我们可以通过一个实际案例来进行分析。

假设有两个公司A和B在进行价格谈判，他们希望通过讨价还价策略来确定最终的交易价格。

公司A可以选择提出高价、低价或中等价位，记作x1、x2和x3。

公司B也可以做出相应的选择，记作y1、y2和y3。

博弈论讨价还价模型的案例

行并购价格的谈判活动。

讨价还价模型实例例如，在价格阶段讨论中，想要试探对方对价格有无回旋的余地，就可提议：“如果我方增加购买数额，贵方可否考虑优惠价格呢？”然后，可根据对方的开价，进行选择比较，讨价还价。

通常情况，任何一块“石头”都能给对方进一步进行了解，而且对方难以拒绝。

报价策略交易谈判的报价是不可愈越的阶段，只有在报价的基础上，双方才能进行讨价还价。

(关于此部分叙述，可参照前面在“谈判的磋商阶段”中的论述，在此不作评述)。

抬价压价战术在谈判中，通常是没有一方一开价，另一方就马上同意，双方拍板成文的，都要经过多次的抬价、压价，才相互妥协，确定一个一致的价格标准。

由于谈判时抬价一方不清楚对方要求多少，在什么情况下妥协，所以这一策略运用的关键就是抬到多高才是对方能够接受的。

一般而言相关漫画，抬价是建立在科学的计算，精确的观察、判断、分析基础上，当然，忍耐力、经验、能力和信心也是十分重要的。

在讨价还价中，双方都不能确定双方能走多远，能得到什么。

因此，时间越久，局势就会越有利于有信心、有耐力的一方。

压价可以说是对抬价的破解。

如果是买方先报价格，可以低于预期进行报价，留有讨价还价的余地，如果是卖方先报价，买方压价，则可以采取多种方式：1．揭穿对方的把戏，直接指出实质。

比如算出对方产品的成本费用，挤出对方报价的水分。

2．制定一个不价格让步策略价格让步的方式幅度直接关系到让步方的利益，理想的方式是每次作递减式让步，它能做到让而不乱，成功地遏止了对方能产生无限制让步的要求，这是因为：1．每次让步都给对方一定的优惠，表现了让步方的诚意，同时保全了对方的面子，使对方有一定的满足感。

2．让步的幅度越来越小，越来越困难，使对方感到我方让步不容易，是在竭尽全力满足对方的要求。

3．最后的让步方式不大，是给对方约警告，我方让步到了极限，也有些情况下，最后一次让步幅度较大、甚至超过前一次、这是表示我方合作的诚意，发出要求签约的信息。

纳什讨价还价博弈模型与实例

纳什讨价还价博弈模型与实例纳什讨价还价博弈模型是博弈论中常用的一种模型，它被广泛应用于经济学、管理学等领域，用于分析博弈双方在讨价还价过程中的策略选择和最终达成的协议。

本文将从基本概念、模型规定和一个实际案例等方面逐步回答相关问题，全面解读纳什讨价还价博弈模型。

一、基本概念纳什讨价还价博弈模型是由美国数学家约翰·福布斯·纳什提出的，它是博弈论中的一个重要分支。

在讨价还价博弈中，至少有两个参与方，他们在进行讨价还价的过程中，会根据对方的策略进行选择，以期达成对自身最有利的协议。

讨价还价博弈模型适用于许多实际情境，比如企业与供应商之间的谈判、员工与雇主之间的薪资谈判等。

二、模型规定在纳什讨价还价博弈模型中，假设有两个参与方A和B，他们在讨价还价的过程中，需要先各自提出一个预期值，然后根据对方的预期值和自身的预期值进行策略选择。

具体而言，假设A和B的预期值分别为a和b，那么a和b可以是一个数值或者一个区间。

在博弈的每一轮中，A和B需要分别作出策略选择，即提出一个讨价方案。

这个方案可以是两个预期值的平均值、某个参考值周围的某个比例、前一轮讨价结果上下浮动的某个比例等。

双方的策略选择会对协议的最终结果产生重要的影响。

三、一个实际案例为了更好地理解纳什讨价还价博弈模型的应用，我们可以以一家电子产品公司与一个供应商之间的谈判过程为例。

假设该电子产品公司希望从供应商处购买更低廉的零件，并打算与供应商进行协商。

首先，双方需要确定自己的预期值。

假设该公司认为合理的价格范围为每单位零件100-150美元，供应商认为合理的价格范围为每单位零件120-160美元。

然后，在博弈的每一轮中，双方需要采取策略来提出讨价方案。

假设电子产品公司首先提出100美元，供应商提出120美元。

在下一轮中，公司可能选择提出110美元，供应商可能选择提出130美元。

双方的策略选择会受到对方提出的讨价方案以及自身预期值的影响。

博弈论及经典案例简介

博弈论及经典案例简介前言博弈论是运筹学中的一个重要分支，研究决策者在不确定性条件下做出决策时所采用的策略，及其战略互动的一种数学理论。

本文将从博弈论的定义、基本概念、博弈模型及解答方法、博弈论的应用领域和经典案例五个方面对博弈论进行简介。

一、博弈论的定义博弈论是一种数学工具，它以数学方法来研究自然界和人类社会的竞争、协作和任意随机行为的问题。

从高层次上来说，它是一种研究互动决策的数学方法，它的核心问题是，如何通过策略选择与博弈对手产生协同或竞争效应，达到最大的利益和最小的代价，并从中得到最佳的结果。

二、博弈论的基本概念1. 纯策略和混合策略在博弈中，一个参与者所采用的一项动作或策略叫做纯策略。

比如，打石头剪刀布游戏中，选择石头、剪刀和布就是三种纯策略。

对于一个参与者某项策略的选择和实施，可能不仅仅是一种确定的策略，还可能是按照不同的概率随机地选择多种策略，这就是混合策略。

2. 双人零和博弈双人零和博弈是指，参与者只有两个，并且每位参与者在特定的胜利条件下都追求自己的最大利益，而且参与者的盈亏是互相抵消的。

3. 堆叠式博弈和延迟式博弈考虑到博弈论用于的领域比较广泛，基本上它是由两个基本方面组成的：动态和静态。

动态博弈的基本特点是在某个时刻存储参与者做出决策的结果。

它是由两种基本类型组成的：堆叠式和延迟式。

延迟式博弈在每一时刻都会有一个奖励，而堆叠式博弈只有当所有决策都结束之后，奖励才会到来。

4. 常用解答方法（1）支配策略法：如果博弈中一个参与者的一个策略对于另一个参与者来说都是更优的，那么那一策略就成了支配策略，这个被支配策略就可以被消去。

（2）纳什均衡：参与者的策略都是正好达到收益最大化使博弈结果稳定的状态，如果所有参与者都是这样博弈，则称之为纳什均衡。

（3）均衡水平：指一个博弈里所有参与者的动作或策略共同导致的结果，不能通过单个参与者的行动得到更好的结果。

三、博弈论的模型及解答方法1. 线性规划模型线性规划模型是一种建模方法，旨在通过最大化达到获得最大利润来解决博弈问题。

博弈论完全信息静态博弈

max u1 max(6q1 q1q2 q12 )
q1
1 q1 R1 (q2 ) (6 q2 ) 2
同样有： 2 max u1 max(6q2 q1q2 q2 )
q2
1 q2 R2 (q1 ) (6 q1 ) 2
2.3.2 反应函数
古诺模型的反应函数
个博弈方的各一个策略组成的某个策略组合 (s1*,…,sn*)中，任
一博弈方 i的策略si*，都是对其余博弈方策略的组合 (s1*,…, si1 *,
si+1* ,…,sn*) 的最佳对策，也即
* * ui ( si* , si*1 , si* , si*1 ,...sn ) ui ( si* , si*1 , sij , si*1 ,...sn )
q2
(0,6)
R1 (q2 )
q1 R1 (q2 ) 1 (6 q2 ) 2 q2 R2 (q1 ) (6 q1 )
1 2
(0,3)
R2 (q1 )
(3,0) (6,0)
q1
古诺模型的反应函数图示

对一个一般的博弈，只要得益是策略的多元连续函数，我们都可以求每个博弈方针对其他博弈方策略的最佳反应构成的函数，也即反应函数，而解出的各个博弈方反应函数的交点就是纳什均衡。这种利用反应函数求博弈的纳什均衡的方法称为“反应函数法”。
本部分主要内容
2.1 基本分析思路和方法
2.2 纳什均衡
2.3 无限策略博弈分析和反应函数 2.4 混合策略和混合策略纳什均衡
2.5 纳什均衡的存在性
2.6 纳什均衡的选择和分析方法扩展
2.1 基本分析思路和方法
2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法

博弈论及经典案例简介

博弈论及经典案例简介博弈论及经典案例简介一、博弈论1.1 定义与简介1.2 博弈论的发展历程1.3 博弈论的基本概念1.3.1 策略和策略组合1.3.2 纳什均衡1.3.3 康托尔集合理论1.3.4 微分博弈1.3.5 合作博弈1.3.6 零和博弈与非零和博弈1.4 博弈论的应用领域1.4.1 经济学中的博弈论1.4.2 政治学中的博弈论1.4.3 生物学中的博弈论1.4.4 计算机科学中的博弈论1.4.5 社会科学中的博弈论二、经典案例介绍2.1 互惠博弈案例：囚徒困境2.1.1 案例描述2.1.2 策略分析2.1.3 纳什均衡的存在与稳定性 2.1.4 应用实例2.2 合作博弈案例：国际气候谈判 2.2.1 案例描述2.2.2 合作与各方利益2.2.3 策略分析与合作方案2.2.4 实际应用与效果评估2.3 非零和博弈案例：市场竞争2.3.1 案例描述2.3.2 战略选择与竞争均衡2.3.3 市场行为分析2.3.4 合作与竞争策略2.4 洞察博弈案例：拍卖机制2.4.1 案例描述2.4.2 不完全信息与最优出价2.4.3 纳什均衡分析2.4.4 拍卖机制的优化附件：1.博弈论相关研究文献2.相关案例数据和分析报告3.附录：博弈论的数学模型和计算方法法律名词及注释：1.康托尔集合理论：康托尔集合理论是博弈论中用来描述博弈参与者可行策略的集合关系的一种数学模型。

2.纳什均衡：纳什均衡是博弈论中的一个重要概念，指的是在博弈参与者选择最优策略的情况下，没有人可以通过单方面改变策略来获取更好收益的状态。

3.微分博弈：微分博弈是一种对动态博弈进行数学建模的方法，通过微分方程来描述博弈参与者的策略演化。

4.合作博弈：合作博弈是指博弈参与者通过合作达到一种互利的状态，合作结果通常由各方自愿通过谈判达成。

5.零和博弈与非零和博弈：零和博弈是指博弈参与者的收益总和为零，互相之间存在完全的对立；非零和博弈指的是博弈参与者的收益总和可以不等于零，互相之间可以存在合作和竞争。

生活中的博弈论

生活中的博弈论博弈论在生活中的运用博弈论是一种研究决策过程的数学理论，它的是如何在竞争或合作的环境下做出最优决策。

在经济学、政治学、生物学等多个领域，博弈论都发挥着重要作用。

本文将通过生活中的实例，从不同方面介绍博弈论的运用。

以一个简单的例子来说明博弈论在生活中的应用。

假设有两个人都想买同一款手机，但库存只有一部。

他们出价的高低将决定谁最终获得这部手机。

出价高者获得手机，出价低者失去机会。

这种情况下，双方都会考虑对方可能的出价，以及自己获胜的概率，然后做出最优决策。

这就是一个典型的博弈论模型。

在博弈论中，常见的策略类型有很多，比如静态策略、动态策略和混合策略。

静态策略是指在一次博弈中，不论对手如何反应，参与者都会选择相同的策略。

动态策略则是指参与者的策略会根据对手的行为进行调整。

混合策略则是指参与者以一定的概率选择不同的策略。

这些策略在不同场景下都有广泛的运用。

例如，在求职过程中，面试官和求职者就构成了一个博弈关系。

面试官会考虑求职者的能力和经验，以及公司需要的人才类型，然后决定是否录用。

而求职者则会考虑公司的实力、发展前景，以及自己的薪酬期望，然后决定是否接受offer。

这是一个动态策略的博弈过程，双方都会根据对方的决策做出相应的调整。

在博弈论中，合作类型也是很重要的一部分。

囚徒困境就是一个经典的合作类型博弈论模型。

在这个模型中，双方参与者都有合作和背叛两种选择。

如果双方都选择合作，则双方都能获得较高的收益。

但如果一方选择背叛，则另一方往往会遭受较大的损失。

因此，在这个模型中，双方都会陷入困境，难以达成合作。

然而，在现实生活中，人们往往可以通过达成协议、签署合同等方式实现合作。

例如，在供应链管理中，供应商和零售商可以通过合作来优化库存、降低成本。

在团队协作中，成员之间也可以通过分工合作来提高整体效率。

这些都可以看作是博弈论中合作类型的实际应用。

当然，合作与竞争并不是完全对立的关系。

在很多情况下，合作与竞争是相互依存的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论的实例分析一．“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。

讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。

在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。

可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。

Ａ和Ｂ均坦白是这个博弈的纳什均衡。

这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。

即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。

反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。

结果，两个人都选择了坦白，各判刑８年。

在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。

二．电信价格竞争根据我国电信业的实际情况，我们来构造电信业价格战的博弈模型。

假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争，一开始的价格都是P0。

A（中国电信）是老牌企业，实力雄厚，占据了绝大多数的市场份额；B（中国联通）则刚刚成立不久，翅膀还没有长硬，是政府为了打破垄断鼓励竞争而筹建起来的。

正因为B是政府扶植起来鼓励竞争的，所以B得到了政府的一些优惠，其中就有B的价格可以比P0低10％。

这一举动，还不会对A产生多大的影响，因为A的根基实在是太牢固了。

在这样的市场分配下，A、B可以达到平衡，但由于B在价格方面的优势，市场份额逐步壮大，到了一定程度，对A造成了影响。

这时候，A该怎么做？不妨假定：A降价而B维持，则A获利15，B损失5，整体获利10；A维持且B也维持，则A获利5，B获利10，整体获利15；A维持而B降价，则A损失10，B获利15，整体获利5；A降价且B也降价，则A损失5，B损失5，整体损失10。

从A角度看，显然降价要比维持好，降价至少可以保证比B好，在概率均等的情况下，A降价的收益为15×50％－5×50％＝5，维持的收益为5×50％－10×50％＝－2．5，为了自身利益的最大化，A就不可避免地选择了降价。

从B角度看，效果也一样，降价同样比维持好，其降价收益为5，维持收益为2．5，它也同样会选择降价。

在这轮博弈中，A、B都将降价作为策略，因此各损失5，整体损失10，整体收益是最差的。

这就是此博弈最终所出现的纳什均衡。

我们构造的这一电信业价格战博弈模型是典型的囚徒困境现象，各个局部都寻求利益的最大化，而整体利益却不是最优，甚至是最差。

许多其他行业的价格竞争都是典型的囚徒困境现象，如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。

三．OPEC组织成员国之间的合作与背叛“囚徒困境”告诉我们，个人理性和集体理性之间存在矛盾，基于个人理性的正确选择会降低大家的福利，也就是说，基于个人利益最大化的前提下，帕累托改进得不到进行，帕累托最优得不到实现。

上述我们在对电信价格竞争的博弈分析中，只是一次性的“囚徒困境”博弈，因此得到了互相降价的纳什均衡。

而在现实生活当中，信任与合作很少达到如此两难的境地，无论在自然界还是在人类社会，“合作”都是一种随处可见的现象。

比如中东石油输出国组织（ＯｒｇａｎｉｚａｔｉｏｎｏｆＰｅｔｒｏｌｅｕｍＥｘｐｏｒｔｉｎｇＣｏｕｎｔｒｉｅｓ简称ＯＰＥＣ）的成立，本身就是要限制各石油生产国的产量，以保持石油价格，以便获取利润，是合作的产物。

OPEC之所以能够成立，各组织成员国之间之所以能够合作，是因为囚徒困境如果是一次性博弈(One shot game)的话，基于个人利益最大化，得到纳什均衡解，但如果是多次博弈，人们就有了合作的可能性，囚徒困境就有可能破解，合作就有可能达成。

连续的合作有可能成为重复的囚徒困境的均衡解，这也是博弈论上著名的“大众定理”(Folk Theorem)的含义。

但合作的可能性不是必然性。

博弈论的研究表明，要想使合作成为多次博弈的均衡解，博弈的一方（最好是实力更强的一方）必须主动通过可信的承诺(Credible commitment) ，向另一方表示合作的善意，努力把这个善意表达清楚，并传达出去。

如果该困境同时涉及多个对手，则要在博弈对手中形成声誉，并用心地维护这个声誉。

这里“可信的承诺”是一个很牵强的翻译，“Credible commitment”并不是什么空口诺言，而是实实在在的付出。

所以合作是非常困难的。

所以OPEC组织经常会有成员国不遵守组织的协定，私自增加石油产量。

每个成员国都这样想，只要他们不增加产量，我增加一点点产量对价格没什么影响，结果每个国家都增加产量，造成石油价格下跌，大家的利润都受到损失。

当然，一些产量增加较少的国家损失更多，于是也更加大量生产，造成价格进一步下降--结果，陷入一个困境：大家都增加产量，价格下跌，大家再增加产量，价格再下跌……。

理论上，几乎所有的卡特尔都会遭到失败，原因就在于卡特尔的协定（类似囚犯的攻守同盟）不是一个纳什均衡，没有成员有兴趣遵守。

那么是不是不可能有卡特尔合作成功了？理论上，如果是无限期的合作，双方考虑长远利益，他们的合作是会成功的。

但只要是有限次的合作，合作就不会成功。

比如合作１０次，那么在第九次博弈参与人就会采取不合作态度，因为大家都想趁最后一次机会捞一把，反正以后我也不会跟你合作了。

但是大家料到第九次会出现不合作，那么就很可能在第八次就采取不合作的态度。

第八次不合作会使大家在第七次就不合作……一直到，从第一次开始大家都不会采取合作态度。

所以，博弈论在核心指标一定的前提下会出现不同的情形，其原因便在于合作的次数。

如果合作的次数是有限的话，而且合作者都是理性的，只追求自身利益的最大化时，就会陷入“囚徒效应”，最后导致的结果便是自己利益的最大化，但非整体利益的最大化。

如果合作次数是无限的话，即使有合作者做出背叛的决定以后，但由于双方都是理性的，会考虑到长远利益，所以二者会进行串谋，最终实现一个动态的平衡状态，但最终的趋势还是整体利益的最大化。

有两位乘客分别带着相同的古董坐飞机去度假，但行李在途中丢失了。

航空公司的代表要求他们分别申请补偿，并告知他们：“我公司知道两位行李中的物品是一模一样的，而且价值在5,000 到20,000 元之间。

请两位在不互相沟通的情况下，分别报出你希望获赔的金额（必须在5,000-20,000 元之间）。

我公司的赔偿政策是：按照两位申报的金额中较小的那个进行赔偿；另外，如果两位申报的金额不同，那么申报金额较低的乘客会在赔偿金的基础上再得到500 元奖励，而申报金额较高的那位则会在赔偿金中被扣掉500 元。

申报的金额必须以‘元’为单位。

”1. 写出这个博弈的参与人、参与人可选的策略、以及不同情况下参与人的收益。

2. 对于每个参与人而言，有没有劣战略？如果有的话，这个博弈的结果应该是什么？请写出具体的分析过程。

3. 现在把航空公司的赔偿政策改变一下：“如果两位申报的金额不同，那么申报金额较低的乘客会在赔偿金的基础上再得到5,000 元奖励，而申报金额较高的那位则会在赔偿金中被扣掉5,000 元。

”重新分析上面的第2 问，答案会有所不同吗？4. 如果你是其中一位乘客，在额外奖励/惩罚为500 元时你会怎么做？把额外奖励/惩罚提高到5,000 元时，你的行动会有所改变吗？请解释原因。

1、博弈的参与人是两位乘客，我们以A、B来表示，第一种策略组合：A、5000，B、5000，在这种情况下，A和B的收益都是5000。

第二种策略组合：A、5000-20000，B、5000，在这种情况下，A的收益是4500，B的收益是5500第三种策略组合：A、5000，B、5000-20000 在这种情况下，A的收益是5500，B的收益是4500第四种策略组合：A、B、都是5000-20000，其中A大于B B的收益比A多1000，且大于5500第五种策略组合：A、B、都是5000-20000，其中B大于A A的收益比B多1000，且大于55002、两个人的劣势策略都一样，即报价为20000。

这个博弈的结果应该是第一种策略组合，因为双方都要比对方的开价少，才会使自己的收益最大化。

3、答案还是一样的。

4、如果是我的话，就选择5000。

（1）案例来源：网易新闻：《虚高房价这样与百姓博弈100天，开发商仍在力挺》，2005年7月13日[案例内容]：现在离3月26日国务院调控楼市的“国八条”出台已逾百天，房地产市场交易凋零至冰点，但开发商们仍在力挺虚高房价，博弈市场。

博弈之一：联手造势5、6月间，上海的开发商们不只开了一次“碰头会”，达成的“共识”都是不降价，“坚决挺到市场回暖的那天”。

6月底，上海市房地产行业协会一负责人甚至鼓吹“目前房价不具备回探、回弹和大跌的可能，回涨将众望所归”；本月初，上海某地产集团董事长竟公然宣称，中央房地产调控政策“造成了消费恐慌”。

博弈之二：集体捂盘按常规，五、六月份是楼市销售旺季，而今年长三角等楼市敏感地区，许多具备销售条件的楼盘纷纷延迟开盘。

以宁波为例，去年前5个月的新开楼盘达22个，而今年同期只开了5个。

上海、南京、杭州5月以来新盘推出的节奏明显放缓。

开发商们声称只要能坚决“捂住”，最快到九、十月份行情就可能恢复。

更有甚者，反正房子卖不出去，一部分开发商干脆挂高房价，试探市场。

博弈之三：死守高价。

即便是面对连续几个月一套没卖的局面，大的开发商也不轻言降价。

一些中小开发商迫于生计，调价也采取了小幅迂回战术，一百元一百元地下调。

优惠后的房价依旧远高于去年10月新一轮疯长之前的价格。

位于上海闸北区的一个分批销售的项目，去年10月，一期开盘合同均价为7817元／平方米，而今年3月推出的第三批房源均价已升至1.1万元/平方米。

尽管五、六两月连续“零成交”，其第四批房源合同均价还是高达10386元/平方米。

问题：为什么开发商能联手推高房价？你有什么建议让开发商降价？答：开发商能联手推高房价是因为如今民用房和商品房都比较紧缺，买家都是希望自己能够买到中意的房子，开发商正是利用了他们这一选择，同行之间联手推高房价还提高自己的收益。

要想让开发商降价，首先，可把房地产开发商之间的价格同盟看作是重复博弈。

如果博弈只有一次，则每个局中人只关心一次性支付，降价也许是有利的。

但若博弈重复多次，则局中人可能会为长远利益而牺牲眼前利益。

博弈论的实例分析

博弈论的定义

博弈论“囚徒困境”的四种形式

海盗分金博弈论的故事

纳什讨价还价博弈模型与实例

博弈论讨价还价模型的案例

纳什讨价还价博弈模型与实例

博弈论及经典案例简介

博弈论 完全信息静态博弈

博弈论及经典案例简介

生活中的博弈论

博弈论完全信息静态博弈