第七章 博弈的三个模型2

合集下载

第七章 博奕论(Game Theory教材课程

第七章  博奕论(Game Theory教材课程

max

u1
即该博奕的纳什均衡解
max u 2
maxu1 maxu2
U1 Uq12
q2
6q2 6q1
2q1 2q2
0 0
的解,
求解上述方程组:
q 1 * q 2 * 2 , Q 4 u 1 1 , u 2 4 , u 1 u 2 8
标志着博奕论的初步形成。 50年代,合作博奕发展到鼎盛阶段,非合作博奕开始出现 纳什和夏普里的讨价还价模型, 塔克的“囚徒困境” 60年代以后,selten,Haysany,Krops,Wilseen
“信誉问题模型” (动态不完全信息博弈) 最近十多年,博弈论几乎贯穿了整个微观经济学,产业组
织理论和企业制度理论,并扩展到宏观经济学,环境、劳动、 福利经济学等领域。
新厂商的市场进入问题
B
打入
A
打击
(0,10)
和平共处
(-2,3)
(5,5)
6.博奕进程的信息
完美信息博奕:在动态博奕中,博弈方对博弈的进程, 即次此行为前各博奕方的行为完全了解
非完美信息博弈:
完全信息博弈:博奕各方完全了解所有博奕方各种策 略组合下得益情况 非完全信息博弈:
7.2.2博弈的主要分类
1 3、赢得(利益):参加博奕各方从博奕中所获得的 利
益 支付矩阵,博弈树
零和博奕:各博奕方赢得的代数和为零 非零和博奕:各博奕方赢得的代数和不为零
4.均衡:所有博奕方的最优策略的组合
博奕分析的目的是使用博奕规则决定均衡
5.得益的信息
完全信息博奕:博奕各方完全了解所有博奕方各种策略 组合下得益情况的博奕,如囚徒困境和田忌赛马。
7。3 完全信息静态博奕——纳什均衡

《西方经济学》第七章 博弈论

《西方经济学》第七章 博弈论

21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼 精炼 贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡 这个概念是完全信息动态博弈的子博弈精炼纳 什均衡与不完全信息静态均衡的贝叶斯纳什均 衡的结合.具体来说,精炼贝叶斯均衡是所有 参与人战略和信念的一种结合.它满足如下条 件:第一,在给定每个参与人有关其他参与人 类型的信念的条件下,该参与人的战略选择是 最优的.第二,每个参与人关于其他参与人所 属类型的信念,都是使用贝叶斯法则从所观察 到的行为中获得的.
22
贝叶斯法则 贝叶斯法则是概率统计中的应用所观察 到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23


1. 什么是占优策略均衡?什么是重复剔除的占优策 略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性 博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品 的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产 多少产量?各获得多少利润?
25

第七章
第一节 第三节 第四节 第五节
博弈论
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
第一节 博弈问题概述
一,博弈的基本概念 二,博弈的分类
2
一,博弈的基本概念
博弈论 博弈论(game theory)是研究决策主体的 行为发生直接相互作用时候的决策以及这 种决策的均衡问题的. 博弈论的基本概念包括:参与人 行动 参与人,行动 参与人 行动, 战略,信息 支付函数,结果 均衡. 信息,支付函数 结果,均衡 战略 信息 支付函数 结果 均衡

博弈模型汇总

博弈模型汇总

博弈模型汇总如下:
1.合作博弈与非合作博弈:这是根据参与者之间是否可以达成具
有约束力的协议来划分的。

合作博弈强调团队合作和协作,目标是达成共赢;而非合作博弈则强调个人利益最大化,不考虑其他参与者的利益。

2.静态博弈与动态博弈:这是根据参与者做出决策的时间顺序来
划分的。

静态博弈是指所有参与者同时做出决策,或者决策顺序没有影响;动态博弈是指参与者的决策有先后顺序,后行动者可以观察到先行动者的决策。

3.完全信息博弈与不完全信息博弈:这是根据参与者对其他参与
者的偏好、策略和支付函数了解的程度来划分的。

完全信息博弈是指所有参与者都拥有完全的信息,能够准确判断其他参与者的策略和支付函数;不完全信息博弈则是指参与者只拥有部分信息,无法准确判断其他参与者的策略和支付函数。

4.零和博弈与非零和博弈:这是根据所有参与者的总收益是否为
零来划分的。

零和博弈是指所有参与者的总收益为零,一方的收益等于另一方的损失;非零和博弈则是指所有参与者的总收益不为零,各方的收益和损失不一定相关。

5.竞争博弈与合作博弈:这是根据参与者之间是否存在竞争或合
作关系来划分的。

竞争博弈是指参与者之间存在竞争关系,目标是追求个人利益最大化;合作博弈则是指参与者之间存在合作关系,目标是追求共同利益最大化。

6.微分博弈与离散博弈:这是根据决策变量的连续性来划分的。

微分博弈是指决策变量是连续变化的,需要考虑时间、速度等因素;离散博弈则是指决策变量只有有限个可能的取值,通常只考虑状态的变化而不考虑时间、速度等因素。

博弈均衡模型及其举例

博弈均衡模型及其举例

博弈联均衡模型博弈论模型图示博弈可划分为合作博弈和非合作博弈,1人们一般讲到的都是指非合作博弈,它有四种不同类型的博弈,即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。

这四种均衡中最为基本的是纳什均衡。

2完全信息静态博弈——纳什均衡、完全信息动态博弈——子博弈精炼纳什均衡不完全信息静态博弈——贝叶斯纳什均衡、、不完全信息动态博弈——精炼贝叶斯纳什均衡,与上述相对应的是、、、。

这四种均衡中最为基本的是纳什均衡。

完全信息静态博弈(纳什均衡)债务人强硬妥协1这两者的区别主要在于人们的行为相互作用时,当事人能否达成一个有约束力的协议:如能达成就是合作博弈;反之就是非合作博弈。

合作博弈强调团体理性,强调效率和公平,非合作博弈强调理性个人的最优决策,其结果是否有效率则是不确定的。

2所谓纳什均衡,指的是所有参与人最优选择的一种组合,在这种组合下,给定其他人的选择,没有任何人有积极性做出新的选择。

纳什均衡的哲学思想是:给定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。

换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。

当博弈中的所有参与人事先达成一项协议,给出每个人的行为规则。

在没有外在强制力约束时,当事人是否会自觉地遵守这个协议?或者说这个协议是否可以自动实施?如果当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡。

参见张维迎:“经济学家看法律、文化与历史”,载张维迎《产权、政府与信誉》,三联书店2001年版。

囚徒困境□ 文/柯华庆“囚徒困境”最早是由美国普林斯顿大学数学家曾克1950年提出来的。

他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论。

这个故事后来成为博弈论最经典的案例。

故事的内容如下:两个犯罪嫌疑人被捕并受到指控,但除非至少其中至少有一个人供认犯罪,警方缺乏足够的证据指证他们所犯的罪行,从而将他们按罪判刑。

博弈论与经济模型第7章

博弈论与经济模型第7章

第七章 重复博弈7.1 启发性例子博弈论中最为著名的模型大概是第二章中介绍的“囚徒困境”模型,它告诉我们一个局中人之间非合作的故事。

按照博弈论中关于局中人为理性人的假定:“囚徒困境”中局中人之间的不合作似乎是必然的结果。

但是,从另一方面看,现实生活中存在着诸多的合作现象,并且,对于经济学家来说,制度的形成及演化必定需要合作行为作为其基础。

因此,研究在一个长期环境中合作是否和怎样得以维持是非常重要的。

更为一般地,如果博弈是重复进行的,其结果是不是有所不同呢?当“囚徒困境”中的小偷在出狱后还会再次联合作案时,他们就不得不考虑今次出卖同伙会在今后受到同伙惩罚的可能,因而其选择“坦白”的战略就增加了一个额外的成本。

我们要探求的是在什么样的条件下,在他们两个人之间的长期关系会有助于他们之间的合作。

表7.1 囚徒困境21 抵赖坦白在性别战博弈中(见表7.2,其中F 表示“足球”,B 表示“芭蕾”),(F ,F )和(,)B B 都是纳什均衡,并且分别给出收入或者支付向量(2,1)和(1,2)(还有第三个纳什均衡,但它给出一个较低的总期望收入)。

如果这个博弈重复进行许多次,可不可达到((F ,F )和(C ,C )在各个时期交替出现,得到期望收入(1.5,1.5)?或者,我们是否能达到对于任意a ∈(0,1)的支付向量(2(1-),2(1-)a a a a ++)?这些就是我们需要回答的问题。

表7.2 性别战(其中F 表示“足球”,C 表示“芭蕾”)21 F B我们将只讨论无限次重复博弈的情形。

有两个理由使得我们这样做:首先,关于有限次重复博弈,如果阶段博弈只有一个纳什均衡,假定局中人极大化每个时期获得收入的贴现和,则重复博弈也只有一个平凡的完美纳什均衡,即阶段博弈纳什均衡的重复。

这意味着在有限次合伙作案中,囚徒们每次被逮住都会如实招供的。

所以,此时重复博弈并不能带来合作。

其次,我们认为一个长久且有着确定性结束时刻的关系是相当不现实的。

博弈模型汇总

博弈模型汇总

博弈模型汇总博弈模型是博弈论的重要工具,用于描述博弈参与者之间的策略和利益关系。

在博弈论中,通过建立合适的博弈模型,可以帮助我们分析和理解各种不同类型的博弈情境,并预测博弈参与者的行为和可能的结果。

下面将对几种常见的博弈模型进行汇总和介绍。

1. 零和博弈模型:零和博弈模型是博弈论中最简单和最基本的模型之一。

在零和博弈中,博弈参与者的利益完全相反,一方的利益的增加必然导致另一方的利益的减少。

这种博弈模型常常用于描述双方的冲突和竞争情境。

常见的零和博弈模型有二人零和博弈和多人零和博弈。

2. 非合作博弈模型:非合作博弈模型是博弈论中较为常见的模型之一。

在非合作博弈中,博弈参与者之间的行动和决策是相互独立的,每个博弈参与者都追求自身的最大利益。

在非合作博弈模型中,博弈参与者可以选择不同的策略,根据对手的行动做出最优的响应。

常见的非合作博弈模型有纳什均衡模型和博弈树模型。

3. 合作博弈模型:合作博弈模型是博弈论中另一个重要的模型。

在合作博弈中,博弈参与者之间可以进行协作和合作,共同追求最大化整体利益。

合作博弈模型通常用于描述多个博弈参与者之间的联盟和合作情境。

常见的合作博弈模型有核心模型和合作博弈解。

4. 演化博弈模型:演化博弈模型是博弈论中较为新颖和有趣的模型之一。

在演化博弈中,博弈参与者的行动和策略可以随时间变化和演化。

演化博弈模型通常用于描述博弈参与者之间的适应性和进化过程。

常见的演化博弈模型有进化博弈动力学模型和演化博弈解。

博弈模型的应用广泛,不仅在经济学中有重要的地位,也在其他学科领域得到广泛运用。

博弈模型可以帮助我们分析和解决各种决策和策略问题,对于理解社会、经济和生物系统中的行为和演化具有重要意义。

总结起来,博弈模型是博弈论的核心工具之一,用于描述和分析博弈参与者之间的策略和利益关系。

常见的博弈模型包括零和博弈模型、非合作博弈模型、合作博弈模型和演化博弈模型。

这些模型在各个领域中都有广泛的应用,对于理解和解决各种决策和策略问题具有重要意义。

第七章 博弈论实验讲解

第七章 博弈论实验讲解

Cooper等调查了允许无约束事前交流来解决 协助问题的可能性。在允许交流的情况下, 选择策略2的百分比变为80%,而被试者中 申明未协调选择的比重只有71%。
7.2.2.4 n人博弈的实验
n人博弈实验的目的是为了观察同一批参与人反复进 行同一博弈的结果。这样可以使得谈判博弈具有 合作性。
G.Kalisch等做了一组n人博弈实验。在3人博弈中, 被试者被蒙住了眼睛,只能通过手势向仲裁人示 意他们的行动。在4人博弈中,每个被试人都坐在 其他人看不到的地方,他将自己的行动写在纸上。 3人博弈规则如下:
二种情况下,3个参与人都得0.
实验结果表明,被试者选择等待策略的比 重只占了33%,而由一个被试者叫价另一 个接受而形成联盟的策略出现的比例较高。 实验结果说明同一批人反复进行同一个博 弈有利于形成合作博弈。
7.3完全信息动态博弈实验
7.3.1基础知识 逆向归纳法:该方法适用于有限次博弈, 并且参与人都是理性的,都清楚的知道博 弈树结构,参与人首先从博弈树的末端开 始,求解末端的子博弈均衡,然后继续向 前求解,直至起点。
假设有两个被试者PP和ZZ,他们已掌握零和博弈论, 同时知道冯.诺依曼-摩根斯坦非零和博弈论,但他 们不清楚纳什均衡理论。
支付矩阵如表所示:
纳什均衡策略为(2,1)
如果允许单边支付,冯.诺依 曼-摩根斯坦的非零和博弈 解是策略(1,2)。
Merrill报告了100次实验的结 果,pp得到0.4美元,zz得 到0.65美元。如此看来, 在现实的讨价还价中并没 有达到纳什均衡。
混合策略纳什均衡:参与人根据一组选定的 概率,在两种或两种以上可能的行动中随 机选择中得到纳什均衡。
7.2.2实验研究
7.2.2.1纳什均衡与冯.诺依曼-摩根斯坦博弈解

管理经济学讲义(新)管理经济学第七章博弈论与竞争策略

管理经济学讲义(新)管理经济学第七章博弈论与竞争策略

四.博弈的分类
• (1)合作博弈与非合作博弈根据参与者之间能否通过谈判达成
具有约束力的协议或合同来划分。
• 可以达成协议的为合作博弈cooperative game,合作博弈强调集 体理性和整体最优。如买卖双方讨价还价后成交。
• 不能达成协议的为非合作博弈non-cooperative game,非合作博 弈强调个体理性和局部最优。如寡头之间的竞争博弈,双方的 利益和目标有冲突,难以达成可以实施的协议,双方都有欺骗 和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领 域。
• 在有些情况下,为了避免陷入被动,采取最大最小策略十分 必要。在下图的博弈中,乙方采取“右”是一个支配性策略。
因为不管甲方选什么,乙方采取右的策略都比左的策略好,
可以得到1的收益。在期望乙方采取右的情况下,甲方应该采
取“下”,并得到2的收益。这样,支配性策略均衡为(下,
右)。
• 如果甲方比较慎重,考虑到乙方可能不一定理性,或者可能 故意捉弄甲方,则应该采取最大最小策略,形成(上,右) 的博弈结果。
甜 20,10 -8,-8
2.对社会有害的合作,设法制止
• 在囚徒的困境博弈中,如果两个囚徒可以互相协商, 并形成攻守同盟,则罪犯得到好处,对社会不利。 例如在寡头厂商的定价博弈中,勾结定高价对双方 都有好处,但对社会不利,因此受到反垄断法的严 密监控。
• 寡头厂商的价格博弈收益矩阵如下:
厂商2
高价
二.支配性策略dominant strategy均衡
• 支配性策略均衡也称上策均衡或优势策略均衡。在博弈中,对 有些参与者来说,不管对手采取什么策略,他的策略都保持不 变。这种不取决于对手选择的最优策略称为支配性策略(上策 或优势策略)。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
静态竞争,是指在寡头垄断市场上,各竞争参与人只竞 争一次,同时作出决策且对各参与人可能有的策略和相 应的得益都完全了解的竞争模式。 对本节中所分析的模型先作五个比较强的假设: 1.消费者是价格接受者。 2.所有厂商生产同质的(完全相同的)产品,消费者从中察 觉不任何差异。 3.没有其他厂商进入该行业,这样在观察期内厂商数目保 持不变。在本章分析中一般假设市场上只有两个厂商。 4.厂商集体地拥有市场力量,它们能将价格设定于边际成 本之上。 5.每一厂商仅设定其价格或产量。 在特定的具体模型中,我们将放松其中的某些假定。
我们首先来看古诺模型的结果。在上述例子中,社会的 总产量Q=4;此时两家厂商的利润u1=u2=4,两厂商利润总和 为8;市场出清价格P=4。 我们再从另外一个角度来考察这个问题。如果两家厂商 联合起来像一个垄断者一样在市场上行动,以总体利益最大 化为目标来考虑市场的最佳产量,容易求出使得总得益最大 的总产量Q*=3,最大总得益u*=9。将此结果与两厂商独立决 策、只追求自身利益时的博弈结果相比,总产量较少,而总 利润较高。
• • • • • • •
那么,企业1和企业2的利润π1和π2分别为: π1=(P-C)q1=(a-b(q1+q2)-c)q1 π2=(P-C)q2=(a-b(q1+q2)-c)q2 为实现利润最大化,一阶条件为: q1=(a-c)/2b-q2/2 (1) q2=(a-c)/2b-q1/2 (2) 从式(1)、(2)可以看到,企业1和企业2选择自己的利润最大的行动 必须依赖于对方的行为。我们把这种反映厂商间相互关系的方程 式成为最佳反应函数,更一般地表示为:qi=R(qj)。从(1)和(2)我 们可以求解得: • q*1=(a-c)/3b • 因为q*是实现两企业利润最大的产量。因此,他们都将生产q*, 而不会选择其他。因而,q*成为市场的均衡产量,一般称之为古 诺均衡。此时的均衡价格P*=(a+2c)/3。
结果分析:
这是两厂商根据自身利益最大化原则同时独立作出产量决策 的古诺模型均衡结果。这个结果有没有使两厂商真正实现自 身利益的最大化?从社会总体的角度来看效率又如何?
• 下面可以分析古诺均衡下的社会福利情况。因为市场的需求曲线是 P=a-bQ,因此,a是消费者愿意支付的最高价格。那么,我们有理由 相信a>c,否则,企业将不会选择生产,因为生产就意味着亏损。 我们从而得到:(a+2c)/3>c。这意味着,古诺模型中的均衡价格 P要高于完全竞争均衡中价格等于边际成本的水平。 • 但是,如果市场是完全垄断的话,从需求曲线得到边际收益MR为: • MR=a-2bQ • 那么,按照MC=MR得: • Q*=(a-c)/2b • 那么,P*=(a+c)/2 • 因为a>c,那么,(a+c)/2-(a+2c)/3=(a-c)/6>0 • 这意味着古诺均衡的价格要比垄断市场的价格低,但是比完全竞争 时的均衡价格要高。因此,古诺均衡的社会福利水平比垄断市场有 所改善,但不如完全竞争市场实现的福利,处于两者之间。
伯特兰德模型
古诺模型有力的解释了厂商间的数量均衡,但面介 绍的模型解释假定厂商现在选取的决策变量不再是产量 而是价格时的博弈均衡。
伯特兰德模型
• 伯川德模型假定: • (1)市场上只有两个厂商,企业A和企业B; • (2)产品同质,即两家厂商的产品完全相同。 那么,市场的总产量Q=qA+qB;
古诺模型
• 古诺模型是法国数学家奥古斯汀· 古 诺于1838年首先建立的。这是有关博弈 论思想的第一个较为成熟的模型。虽然 模型提出较早,但至今仍被广泛应用。 该模型最早用于分析双寡头垄断市 场,后来被应用于分析任意数量厂商的 市场均衡。我们先分析双寡头垄断市场 的古诺均衡。
• 古诺模型假定厂商独立行动,并首先选择产量作为决 策变量,以实现利润最大化。 • 为便于分析,古诺模型里还假定: • (1)市场上只有两个厂商,企业1和企业2,不会有别 的企业进入; • (2)产品同质,即两家厂商的产品完全相同。那么, 市场的总产量Q=q1+q2; • (3)厂商的成本只表现为变动成本,并且边际成本都 等于固定数量的C,即MC1=MC2=C; • (4)市场只存在一个时期,那么厂商之间的博弈也将 是单期的; • (5)市场的需求为P=a-bQ。
尽管双方都了解这种合作的好处,但如没有足够强制力, 这种合作是不可能实现的,即这个合作是不能自动实施的。
这里再次呈现集体非理性。但这个不合作的结果对 整个社会来说是有效率的,因为其增加了产量,降低了 价格。这也就是为什么传统的西方国家的产业规制政策 要严格限制垄断的原因。 古诺模型在现实中有很多例子。如在一个偏远的农 产品市场上的两大西瓜垄断种植商之间的产量竞争。另 一个很好的例子就是石油输出国组织(OPEC)的限额被突 破。
• 1、古诺均衡下的社会总产量,市场出清 价格是多少?利润总和是多少? • 2、若是二者联合垄断则收益最大时候的 产量是多少,最大收益是多少? • 3、若一个合作(产量为1.5),另一个则不 合作把自己的产量定在3--1.5/2的水平上 (1.5,1.5不是个纳什均衡 )会是什么结果。
• 1、 (Q=4), (P=4) • 2、 (Q=3) (R=9) • 3、U1=3.375;U2=5.06
古诺模型 问题 举例: 设在市场上有代号为1、2的两个寡头垄断厂商,他们
生产相同的产品,消费者从中察觉不出任何差异。市场出 清价格由两家厂商的总产量决定。设厂商1的产量为q1, 厂商2的产量为q2,则市场的总产量Q=q1+q2。设P为市场出 清价格,则P是市场总产量Q的函数,即反需求函数。在本 例中,我们假定反需求函数为:P=P(Q)=8-Q 。 再假设两厂商的生产都无固定成本,且每增加一单位 产量的边际生产成本相等,C1=C2=2,即他们分别生产q1和 q2产量的成本为2q1和2q2。最后,这两个厂商是同时决定各 自的产量以达到各自的利润最大化,即在决策前是不知道 另一方的产量的。
相关文档
最新文档