第四章(重复博弈)

合集下载

[经济学]4 重复博弈--博弈论

[经济学]4 重复博弈--博弈论

策略、子博弈和均衡路径
得益
总得益 / 平均得益
贴现系数
T
1 223 T 1T
t 1 t
t 1
12 23 t1t
h
t1
4
4.2 有限次重复博弈
4.2.1 有限次重复的囚徒困境博弈 4.2.2 连锁店悖论 4.2.3 有限次重复猜硬币博弈 4.2.4 ★有限次两企业、两差别市场重复博弈 4.2.5 民间定理
Med Q 9,4
12,10 10, 18
Low Q 3, 6 20, 8
18, 15
Saudi Arabia
h
16
重复博弈
合理的猜想:
石油生产和出口年年持续进行,OPEC的制约和协调按 理说总是有一定作用的。各国不可能对合作的巨大好处 无动于衷,再加上我们要考虑到成员国中最大的产油国, 如沙特阿拉伯在其中会起一定的积极作用,带头克制自 己的行为。因此OPEC这个是否突破限额的重复博弈的结 果理应比完全没有制约独立决定产量的结果要好得多。
第一阶段 第二阶段
(A , B)
(B , A)
(B , A)
(A , B)
(A , B)
(A , B)
(B , A)
(B , A)
混合策略
混合策略
(A , B)
(B , A) 混合策略 混合策略
混合策略 混合策略
(B , A) (A , B)
平均(期望)得益
企业1
企业2
2.5
2.5
2.5
2.5
1
4
4
不少非OPEC成员国加入市场,使得OPEC的限产作用失 效,白白丧失许多市场份额和利润。
OPEC成员之间地位不平衡,部分成员觉得限额不公平从 而相继突破限额。

博弈论(重复博弈)

博弈论(重复博弈)
第四章 重复博弈 (p129~)
§4.1 基本概念
一、什么是重复博弈 二、重复博弈的分类 三、重复博弈的策略 四、重复博弈的收益
§4.2 有限次重复博弈
一、2人零和博弈的重复 二、有唯一纯策略NE的有限次重复博弈 三、连锁店悖论(Chainstore Paradox)
H
L
4,4
5,0
0,5
1,1
ห้องสมุดไป่ตู้
可以证明,当贴现因子 较大时,上述 策略组合构成了SPNE:
1)TS 是 NE 2)这个NE是SPNE
2.无限次重复博弈的民间定理 (p133,定理5.1)
一个n人有限博弈G中,设(x1, x2,… xn)是G的任意可 实现收益,那么无限次重复博弈G(∞, δ) 中必存在一个 SPNE,各局中人的平均收益即为(x1, x2,… xn),只要 满足如下条件: 1) 时间偏好率 r =0 或是充分小的正数; 2)博弈在任意阶段结束的概率为0或是充分小的正数; 3)支付组合的元素是n维的,且严格帕累托优于G的最 小最大收益组合。
若干无限次充分博弈的例
1.“单边”的囚徒困境 博弈(p139)
抵赖 抵赖 坦白 5,5
10,-5
坦白
-5,10
购买 高质 低质 5,5
10,-5
抵制 0,0 0,0
0,0
2.产品质量博弈(p143)
均衡成立应满足的条件: 激励相容 竞争 市场出清
3.消费者转换成本博弈(p146)
马尔可夫过程 寻求马尔可夫策略(Markov st.)
合作收益集

B1 (开发A) B2 (开发B) a1 (开发A) 3,3 a2 (开发B) 4,1 1,4 0,0

博弈论课件4-重复博弈

博弈论课件4-重复博弈

4.1.1 为什么研究重复博弈 4.1.2 基本概念


生活中的重复博弈
——你到菜场去买菜,当你担心上当受骗而犹豫不决时,
卖菜的摊主便会对你说:“你放心好了,我天天在这里卖菜, 不会骗你的,如果菜不好你回来找我!‛他强调自己‚天天‛ 在这里卖菜,你通常便会放下心来,与之成交。因为他的这 句话翻译成经济学的语言就是‚我跟你是‘重复博弈’‛! ———而一次性的买卖往往发生在双方以后不再有买卖机会 的时候,特点是尽量谋取暴利并且带欺骗性,比如车站、码 头、旅游景点的东西往往质次价高,其原因就在于买卖双方 很少有‚重复博弈‛的机会。

两人零和博弈的有限次重复博弈 惟一纯策略纳什均衡的有限次重复博弈 多个纯策略纳什均衡的有限次重复博弈 有限次重复博弈的无名氏定理
4.2.1 两人零和博弈的有限次重复博弈

猜硬币博弈
正 面 盖 硬 币 方 正 面 反 面 -1, 1 1, -1
猜硬币方 反 面 1, -1 -1, 1


零和博弈是严格竞争的,重复博弈并不改变这一点。 重复零和博弈不会创造出新的利益。
4.2.1 两人零和博弈的有限次重复博弈



以零和博弈为原博弈的有限次重复博弈与猜硬币博 弈的有限次重复博弈一样,博弈方的正确策略是重 复一次性博弈中的纳什均衡策略。 可用逆推归纳法来证明 可以推广到非零和或多个博弈方,但博弈方的利益 严格对立,没有纯策略纳什均衡的其他严格竞争博 弈中 产生原因:利益关系严格对立,矛盾不可调和

有限次重复博弈民间定理
设原博弈的一次性博弈有均衡得益数组优于w, 那么在该博弈的多次重复中,所有不小于个体理性 得益的可实现得益,都至少有一个子博弈完美纳什 均衡的极限的平均得益来实现它们。

第四讲 重复博弈

第四讲 重复博弈
6
二、正式合同与非正式合约


ห้องสมุดไป่ตู้

市场的本质是交易。交易出现的必要条件:(一) 交 易能带来总收益(社会效率) 的增加,从而使得交易双 方受益,(二),当事人都有充分的信心预期对方能履行 承诺。否则,即使交易能带来社会剩余,交易也不会发 生。发达经济的一个标志是复杂商品的非现货交易. 设想A 与B 事前签署一个合同,规定A 为B 生产这件 物品,B 在收到该物品之后再给A 支付价格P。 那么,A 是基于什么因素作出对B 履行承诺的判断呢? 一个因素是B 的个人品德。但是,在商业社会,交易一 方对另一方的了解是非常有限的,许多交易活动都是 在不认识的人之间进行的。
14
信誉机制发生作用的条件


第三, 当事人的不诚实行为能被及时观察到。这一点 说明,一个高效率的信息传递系统对信誉机制的建立 具有至关重要的意义。一个信息流动缓慢的社会,一 定是一个信誉贫乏的社会。 第四, 当事人必须有足够的积极性和可能性对交易对 手的欺骗行为进行惩罚。“以牙还牙,以眼还眼”不 仅不是不道德的行为,而且是维持社会信用制度的必 不可少的手段。进一步,我们可以说,过分原谅欺骗行 为本身就是不道德的行为。为了使信誉机制发挥作 用,该惩罚而没有采取惩罚措施的人必须受到惩罚 (Abreu , 1988) 。 15
张维迎
2002年,他关于中国 企业的核心竞争力、中国 企业如何做大、如何重建 社会信任和企业信誉的阐 述,引起人们对这三大问 题的空前关注和讨论,当 选为“CCTV2002年中国经 济年度人物”。
5
市场秩序的信誉基础:
一、引言:案例 据《北京晚报》2001年6月20日报道,2001年2月 14日,魏女士到北京建设银行甘家口分理处支取了5 万元现金,随即到相距不到30米的工商银行甘家口储 蓄所存入。工商银行工作人员从中验出两张100元的 假钞。魏女士称,两张假钞是刚在建行取出的一整捆 1万元的现金中发现的,当时封条都没有拆。魏女士 立即返回建设银行要求赔偿,但银行称,钱出了大门, 难以确认假钞是从哪一个环节出现的,银行不能承担 责任。魏女士因此向法院提出诉讼,法院判决魏女士 败诉。

第四讲重复博弈详解

第四讲重复博弈详解
1
重复博弈和信誉问题


如果博弈不是一次的,而是重复进行的,参与 人过去行动的历史是可以观察到的,参与人就 可以将自己的选择依赖于其他人之前的行动, 因而有了更多的战略可以选择,均衡结果可能 与一次博弈大不相同。 重复博弈理论的最大贡献是对人们之间的合作 行为提供了理性解释;在囚徒困境中,一次博 弈的唯一均衡是不合作(即坦白)。但如果博 弈无限重复,合作就可能出现。
7
市场秩序的信誉基础

经济发展史表明,在本来不认识的人之间建立相互之 间的信任关系是交易范围扩大和经济发展的关键, 而 制度作为博弈的规则 ,是建立和维持人们之间信任的 关键(Milgrom、North和Weingast,1990)。如果 制度安排使得当事人履行契约比不履行契约更有利 可图,使得人们有积极性为了交易带来的长远利益而 抵挡短期的机会主义行为的诱惑,人们之间的信任就 可以建立起来.正是从这个意义上,我们说信任是一个 制度问题.
9
市场秩序的信誉基础

但新制度经济学证明,法律制度的作用被大大地 夸大了(Greif , 1996) , 法律制度并不是合同得 以执行的唯一制度安排。即使不借助于国家的 权威,非正式的合约也可以支持交易的进行。经 验研究表明,即使在象美国这样法律制度最健全 的国家,大部分的交易活动也是通过非正式的合 约安排进行的, 商业纠纷的解决常常并不借助法 律的裁决(Macaulay , 1985 ; Macneil , 1985) 。
张维迎
2002年,他关于中国 企业的核心竞争力、中国 企业如何做大、如何重建 社会信任和企业信誉的阐 述,引起人们对这三大问 题的空前关注和讨论,当 选为“CCTV2002年中国经 济年度人物”。
5
市场秩序的信誉基础:

第四章 重复博弈

第四章  重复博弈

假设某参与人在无限次重复博弈的一个均衡 路径上各阶段博弈的收益为πt,则该参与人 无限次重复博弈的总收益(即各阶段收益 的贴现值)为
PV 1 2 2 3 t 1 t
t 1
定义: 给定一个博弈G,无限次重复进行G博弈的 过程称为G的“无限次重复博弈”,记为 G(∞,δ),其中δ是参与人收益的贴现系数 (是所有参与人共同的贴现系数)。并且 在进行第t阶段(第t次重复)博弈之前,参 与人都能看到(t-1)阶段博弈的结果。 各参与人在G(∞,δ)中的收益等于各阶段收 益的贴现值。
4、子博弈完美纳什均衡 参与人2的收益:
(1)参与人2不合作
U 5 1 1 1 5
2 3

1
(2)参与人2合作
V 4 V 4 V 1
(3)参与人合作的条件:V≥U
4 5 1 1 1 4
1 当 4
– 平均期望收益为(1.5,3)。
• 第一次是混合战略均衡,第二次是纯战略均衡(B, A);
– 平均期望收益为(3,1.5)。
4、三次重复
–三次重复博弈中,除了有与上述类似的均衡战略组合 外,还有以下战略可以构成子博弈完美纳什均衡
• 厂商1的战略:
第一阶段博弈选A; 第二阶段的行动选择取决于第一阶段的结果 第三阶段无条件选B。
参与人正确的战略就是在每次重复博弈中都采
用一次性博弈的纳什均衡策略。
三、有限次重复博弈—囚徒的困境
假设:
有两个惯犯,每次判刑都不是很重。在刑 满释放之后再作案,作案之后再判刑; 刑满释放之后又作案,如此反复。 他们反复作案之后接受隔离审查过程就是 一个重复博弈的过程。
重复两次:
逆向归纳法求解

第四章 重复博弈

第四章 重复博弈

双方策略为: 博弈方1:第一次选h; 如第一次结果为(H,H), 则第二次选M,否则选L 博弈方2:同博弈方1
厂商2 厂 商 1 H M L H 5,5 6,0 2,0 M 0,6 3,3 2,0 L 0,2 0,2 1,1
三价博弈
触发策略(Trigger Strategy):两博弈方先试探合 作,一旦发现对方不合作则也用不合作报复。 触发策略是重复博弈实现合作和高效的关键机制。
2
Cont…
但从第二阶段开始,厂商1将报复性地永远采用 古诺产量2,这样厂商2也被迫永远采用古诺产 量,从此得利润4。因此,无限次重复博弈第一 阶段偏离的情况下总得益的现值为: 4 5.0625 4 5.0625 1
2
当 上述策略是厂商2对厂商1的同样触发策略的最 佳反应,否则偏离是最佳反应。
1、个体理性得益:博弈方 i 的最大最小值
vi min max U i ( i , i )
i A i i Ai
2、可实现得益:博弈中所有纯策略组合得益 的加权平均数组
4.3 无限次重复博弈
4.3.1 两人零和博弈的无限次重复博弈 4.3.2 唯一纯策略纳什均衡博弈 的无限次重复博弈 4.3.3 无限次重复古诺模型 4.3.4 有效工资率 4.3.5信用问题 4.3.6 若干建议与启示
二、重复博弈的分类
1、有限次重复博弈:给定一个基本博弈G (可以是静态博弈,也可以是动态博 弈),重复进行T次G,记为G(T)。
而G则称为G(T)的“原博弈”。G(T)中的 每次重复称为G(T)的一个“阶段”。
2、无限次重复博弈:一个基本博弈G一直 重复博 弈下去的博弈,记为G( ). 注:1、无法验证某个重复博弈会一直重复 下去。 2、如果主观上认为博弈会不断进行下 去,那么博弈就可无限次重复下去。

@第4章 重复博弈

@第4章 重复博弈
*
*
*
最后这个不等式正是存在有效工资率,工作激励有效的基 131 本条件。
三 、 无 限 次 重 复 博 弈
(四)效率工资博弈
综上所述,在满足 y w 0和w w e 1 e (1 p)
* * 0
的条件下,双方的触发策略构成一个纳什均衡。而上述两式 实际上意味着 1 y e w e (1 p)
131
(一)两人零和博弈的无限次重复博弈
两人零和博弈无限次重复与有 限次重复博弈的结果并不会有什 么不同,所有阶段都不可能发生 合作,博弈方会一直重复原博 弈的混合策略纳什均衡。
三 、 无 限 次 重 复 博 弈
131
(二)唯一纯策略纳什均衡无限次重复博弈 两种情况
三 、 无 限 次 重 复 博 弈
*
e
s
0
0
努力是工人的最佳选择。
反过来,设工人已采用上述触发策略。若厂商给的工资率满 足上式条件,并且威胁一旦产量降低就解雇工人,则各阶段 的得益为 y w,无限次重复博弈得益现值为 ( y w ) (1 ) 。 * 若不愿给 w ,则解雇工人,以后得益为0。因此只要y w 0 厂商选择前述触发策略就是最佳反应。
131
(二)唯一纯策略纳什均衡无限次重复博弈
【例】两寡头竞价博弈(P132)
H2
H1
L2
L1
4,4 5,0
0,5 1,1
该博弈一次性博弈均衡是都采用低价,是囚徒困境型博弈
三 、 无 限 次 重 复 博 弈
131
(二)唯一纯策略纳什均衡无限次重复博弈
【例】两寡头竞价博弈(P132)
【了解】无限次重复博弈的“民间定理”(P134)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2 (1 p) 1
,进一步第三
阶段的期望得益的现在值为: 2 (1 p) 3 (1 p) 2 (1 p) t 1 t 1 1 t t 2 t 1 1 (1 ) (1 ) t 1 t 1
1 2 2 3 T 1 T t 1 t
t 1
T
在无限次重复博弈路径下,某博弈方各阶段得 益为 1 , 2 ,, ,则该博弈方总得益的现在值就是:
1 2 3 t 1 t
第四章

重复博弈
重复博弈引论; 有限次重复博弈; 无限次重复博弈。
第一节
重复博弈引论
一、重复博弈分类 重复博弈(Repeated Games)是指基本博弈重复进 行构成的博弈过程。重复博弈是静态或动态博弈的重复 进行,或者说重复进行的过程。 1、有限次重复 定义:给定一个基本博弈G(可以是静态博弈,也 可以是动态博弈),重复进行T次G,并且在每次重复G 之前,各博弈方都能观察到以前博弈的结果,这样的博 弈过程称为 “G的T次重复博弈”,记为G(T)。而G 则称为G(T)的 “原博弈”。G(T)中的每次重复称 为 G(T)的一个“阶段”。
2、无限次重复 某个重复博弈没有可以预见的结束时间,各博弈
方主观上认为博弈会不断进行下去,那么就可以看作
是无限次重复博弈。 3、随机结束博弈 重复博弈的次数虽然是有限的,但重复的次数或 博弈结束的时间却是不确定的。这种重复博弈可以称
为“随机结束的重复博弈”。
二、重复博弈的策略、子博弈和均衡路径

而成的。

如果原博弈有m种策略组合,那么重复两次就有 m 2
条博弈路径,重复T次就有 mT 条博弈路径;当 T或 m较大时,重复博弈的路径数是很大的。
三、重复博弈的得益与博弈方的行为选择
1、要从整体上把握博弈的得益 重复博弈的得益与一次性博弈有所不同,因为它 们的每个阶段本身就是一个博弈,各个博弈方都有得 益,而不是整个博弈结束后有一个总的得益,如果博 弈方是根据当前阶段得益选择,那么等于把重复博弈 割裂成了一个个基本博弈,重复博弈就失去了意义。 因此重复博弈中,博弈方的行为、策略选择不能只考 虑本阶段的得益,必须兼顾其他阶段的得益,或者说 要考虑整个重复博弈过程得益的总体情况。
2、各阶段的时间间隔对博弈方行为的影响 重复博弈每个阶段的得益有时间上的先后之分, 这在只有少数几次重复且每次重复间隔时间并不很长
的情况下可能并不重要。但对于重复次数很多且每次
重复间隔时间又较长的有限次重复博弈,或者是无限 次重复博弈时,得益的时间先后就不能不考虑。因为 由于心理作用和资金有时间价值的原因,不同时间获 得的单位利益对人们的价值是有差别的,忽略这一点
2 t 1
无限次重复博弈也写成 G(, ) 。
四、随机停止和贴现率
可理解为通过抽签来决定是否停止重复,设抽 到停止的概率是 p ,重复下去的概率为 1 p 。 设某博弈方的阶段得益为
1 p
t
,利率为

,因
为在第一次博弈以后能继续下一次重复的可能性是
,第二阶段的期望得益为
3 (1 p) 2 (1 ) 2
1 p 其中最后一个等式是通过令 1
得到的。由此就把 已知概率的随机停止重复博弈与无限次重复博弈统一 起来了。
第二节 有限次重复博弈
重复次数较少的有限次重复博弈可以不考虑不同阶段得 益的贴现问题。 一、两人零和博弈的有限次重复博弈 重复零和博弈不会创造出新的利益。如重复进行猜硬币 博弈,不管两个博弈方如何选择,每次重复的结果都是一方 赢一方输,得益相加为0。因此在零和博弈或者它们的重复博 弈中,双方合作的可能性根本不存在。 二、惟一纯策略纳什均衡博弈的有限次重复博弈 如果原博弈惟一的纳什均衡没有达到帕累托效率,在有 限次重复博弈中能不能实现合作和提高效率呢?
重复博弈中博弈方的一个策略就是在每个阶段 (即每次重复),针对每种情况(以前阶段的结果) 如何行为的完整计划。

重复博弈的子博弈就是从某个阶段(不包括第一 阶段)开始,包括此后所有阶段的重复博弈部分。

重复博弈也是动态博弈,也有路径概念。但重复博
弈的所有博弈方在每个阶段都必须行为,因此重复
博弈的路径是由每个阶段各博弈方的行为组合串联
就不可能得出符合实际的分析结论。
那么如何处理未来得益对当前决策的影响呢? 解决这个问题的方法是引进将后一阶段得益折算 成当前阶段得益的贴现系数 。有了贴现系数 ,如 果一个T 次重复博弈的某博弈方某一均衡下各阶段得 益分别为 1 , 2 ,, T ,则考虑时间价值的重复博弈总 得益现在值为:
(二)一般结论

原博弈有惟一的纯策略纳什均衡的博弈,则有限次重复
博弈的惟一均衡即各博弈方在每阶段(即每次重复)中
都采用原博弈的纳什均衡策略。

定理 设原博弈 G有惟一的纯策略纳什均衡,则对任意正 整数T,重复博弈G(T)有惟一的子博弈完美纳什均衡, 即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方
(一)有限次重复囚徒的困境博弈
囚徒2
坦白
囚 坦白 徒 1 抵赖
抵赖
囚 坦白 徒 1 抵赖
囚徒2
坦白
-10,-10 -13,-5
抵赖
-5,-13 -6, -6
-5,-5 0,-8 -8, 0
-1,-1
图4-1 囚徒困境博弈
图4-2逆推归纳法和等价博弈
上图所示囚徒的困境博弈,考虑两次重复该博弈。 用逆推归纳法来分析该重复博弈,先分析第二阶段,由于该阶段仍然 是一个囚徒困境博弈,结果还是原博弈惟一的纳什均衡(坦白,坦白), 双方得益(-5,-5)。回到第一阶段,理性的博弈方会知道第二阶段的结 果必然是(坦白,坦白),因此可以把第二阶段的得益直接加到第一阶段 对应得益上(如图4-2),结果与一次性博弈一样,最终两次重复囚徒的困 境仍然相当于一次性囚徒的困境博弈的简单重复。
相关文档
最新文档