第六章:重复博弈与合作行为
第六讲 重复博弈

at a1 a2 aT
t 1 T 1 t 1
T
• 无限次重复博弈的总得益的现值就是
t 1
t 1
at a1 a2
T 1
aT
• 平均得益:如果一个常数A作为重复博弈的各个阶段 的得益,能产生与得益序列a1,a2, …,aT相同的现在 值,就称A为a1,a2, …,aT的平均得益。 • 如果不考虑贴现因素,可让贴现率为1,就可以同样 适用上述定义。 • 在无限次重复博弈中,当每一阶段的得益都是A时, A 现在值就是
• 重复博弈的各阶段有时间次序,各阶段的得益也有时 序。重复次数不多或时间间隔不长,得益的时序问题 无关紧要,但若是次数较多,或时间较长,比如是无 限阶段重复博弈,就必须考虑得益的时序问题。 • 一般是把各阶段的得益折合成现值来计算。若利率为r, 则贴现系数为 1
1 r
• 则重复T次,各阶段的得益分别为a1,a2, …,aT时的总 得益的现值就是
• 2.基本概念 • (1)设G是一个基本博弈(动静都可以,但一 般研究静态),重复进行T次,并且每次重复之 前各博弈方都能看到此前的博弈结果,这样的博 弈过程称为“G的T次重复博弈”,记为G(T), G称为G(T)的原博弈,每一次重复称为G(T) 的一个阶段。 • 重复博弈的每一个阶段都是独立的博弈,各方都 有得益。这是与一般动态博弈的重要不同。另一 方面,重复博弈中各阶段的博弈方和博弈内容都 必须相同,与一般的动态博弈也不同。
1 p (1 p) A a1 a2 a3 2 1 r (1 r )
2 (1 p) 1 p t 1 at at , 其中 t 1 (1 r ) 1 r t 1 t 1 t 1
第六章 重复博弈和策略行动(博弈论教程-石家庄经济学院,于振英)汇编

三、重复次数不确定:随时终止 (二)案例研究 D:defection C:collabrate 1.符号设定与矩阵 H:high L:low 乙 背叛 合作 背叛 D,D H,L 甲 H C D C,C 合作 L,H
2018年12月16日
L
29
博弈论第六章 重复博弈的类型
5 1 1
2 博弈论第六章 重复博弈的类型
5
1
18
第一节
重复博弈的类型
二、无限次重复 (一)案例:寡头削价竞争 3.证明:触发策略即为纳什均衡 (2)情形二:寡头2合作 寡头2:选择“高价”,第一阶段得益 =4 寡头1:合作,永远选择“高价” 寡头2:其余阶段选择“高价”,得益 V 4 V =δ·V,总得益
t 1
2018年12月16日
博弈论第六章 重复博弈的类型
12
第一节 重复博弈的类型
一、有限次重复 (四)重复博弈的要素 1.策略 博弈方在每个阶段针对每种情况如 何行为的计划 2.子博弈 从某个阶段(不包括第一阶段)开 始,包括此后所有的重复博弈部分
2018年12月16日
博弈论第六章 重复博弈的类型
2018年12月16日
博弈论:重复博弈 策略行动与可信性
36
第二节 策略行动与可信性
一、策略行动 (二)研究前提:先行一步 1.先行动者的行动具有可观察性 狗能够观察到人蹲下
你不蹲下, 我怎么知道 你要打我?
2018年12月16日
博弈论:重复博弈 策略行动与可信性
37
第二节 策略行动与可信性
27
第一节
重复博弈的类型
三、重复次数不确定:随时终止 (一)引入下阶段博弈结束的概率:p 3.p、δ与博弈策略 p大→R(背叛的即时收益)小→合作 策略 δ 大→R (背叛的即时收益)小→合作 策略 1
第六章重复博弈与合作行为

第6章重复博弈与合作行为张维迎教授北京大学光华管理学院序惯博弈与重复博弈•序惯博弈(sequential game):参与人在前一个决策点的选择决定随后的子博弈的结构,因此,从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次;•重复博弈(repeated game):同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈”(stage game).重复博弈的三个特征•阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构;•所有参与人观察到博弈过去的历史;•参与人的总支付(报酬)是所有阶段博弈支付的贴现值之和;重复博弈和信誉问题•如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。
•重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。
但如果博弈无限重复,合作就可能出现。
囚徒困境博弈合作不合作合作不合作3,3-1,4 4,-10,0A B重复博弈与战略空间的扩展•假定上属博弈重复多次或无限次;那么,每个参与人有多个可以选择的战略:仅举几例:•All-D: 不论过去什么发生,总是选择不合作;•All-C: 不论过去什么发生,总是选择合作;•合作-不合作交替进行;•tit-for-tat: 从合作开始,之后每次选择对方前一阶段的行动;•trigger strategies: 从合作开始,一直到有一方不合作,然后永远选择不合作。
“囚徒困境”的一般表示合作不合作合作不合作T ,T S ,RR ,SP ,P满足:R>T>P>S; (S+R)<T+T支付函数•双方都不合作:•对的解释:–贴现率;–博弈继续的概率;–二者的结合;–一般化:未来收益的重要程度δδδδ−=++++=11...d)-all d,-all (32PP P P P V δ无名氏定理(Folk Theorem)•在无限次重复博弈中,如果参与人对未来足够重视(足够大),那么,任何程度的合作都可以通过一个特定的子博弈精炼纳什均衡得到。
博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理

博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理博弈论与信息经济学第6章完全且完美信息动态博弈——重复/超级博弈-连锁店悖论-无名氏定理经济学院丁言强内容提要重复博弈与战略空间有限次重复博弈:连锁店悖论无限次重复博弈冷酷战略与针锋相对战略无名氏定理阿伯罗定理: 两期战略序贯博弈与重复博弈序贯博弈的特征是,参与人在前一个阶段的行动选择决定随后的子博弈的结构,因此,从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈,或者说,同样结构的子博弈只出现一次。
动态博弈的另一种特殊但是非常重要的类型是所谓的“重复博弈”,就是同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。
在每个阶段博弈,参与人可能同时行动,也可能不同时行动,在后一种情况下,每个阶段博弈本身就是一个动态博弈。
重复博弈的3个基本特征重复博弈可能是不完美信息博弈,也可能是完美信息博弈,但在博弈论中一般指的是前一种情况。
(1)阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段博弈的结构;(2)所有参与人都观测到博弈过去的历史;(3)参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。
重复博弈的战略空间战略是一套完备的相机行动规则,它必须说明在每一种可能的状态下参与人的行动选择,即使参与人并不预期这种状态真的会出现。
因为可以观察到其他参与人过去行动的历史,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史。
所以,参与人在重复博弈中的战略是定义在博弈历史上的每个阶段博弈中的行动选择规则,即从博弈历史到行动空间的映射。
重复博弈的战略空间参与人在重复博弈中的战略空间远远大于且复杂于在每一个阶段博弈中的战略空间。
比如说,即使囚徒困境博弈只重复5次,每个囚徒的纯战略数量大于20亿个,战略组合的数量更多。
所以,重复博弈可能带来一些“额外的”均衡结果,这些均衡结果在一次博弈中是从来不会出现的。
[小学教育]重复博弈
![[小学教育]重复博弈](https://img.taocdn.com/s3/m/a00a243d2f60ddccda38a07c.png)
博弈论与信息经济学
2018年9月10日10时10分
经济管理学院 曹正勇
博弈论与信息经济学
2018年9月10日10时10分
经济管理学院 曹正勇
博弈论与信息经济学
2018年9月10日10时10分
经济管理学院 曹正勇
博弈论与信息经济学
重复博弈的得益
平均得益:如果一常数 作为重复博弈(有限次 重复博弈或 无限次重复博弈)各个 阶段的得益,能产生与 得益序列
L 0,2 0,2 1,1
厂 H 商 M 1 L
H 8,8 7,1 3,1
L 1,3 1,3 2,2
三种可选战略博弈
两次重复三种可选战略博弈的等价模型
触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复 博弈方1:第一次选h;如第一次结果为(H,H),则第二次选M,否则选L 博弈方2:同博伊方1
博弈论与信息经济学
1、重复博弈的定义及特征 (1) 定义: 重复博弈指同样结构的博弈重复多次, 其中每次博弈称为阶段博弈。 (2) 特征: A、阶段博弈之间没有“物质”上的联系,即 前一阶段的博弈不改变后一阶段博弈的结构; B、所有参与人都观测到博弈过去的历史; C、参与人的总支付是所有阶段博弈支付的 贴现值之和或加权平均值。
例:有限次重复囚徒困境博弈
2018年9月10日10时10分
经济管理学院 曹正勇
博弈论与信息经济学
如果我们以该博弈作为原博弈G进行重复博弈,
结果是否会与一次性博弈有所不同,还是仍然是一次
性博弈的简单重复呢? 如果重复的次数是两次,则该重复博弃的现实意 义可以理解为官方给这两个囚徒两次机会,他们最后 的得益(被关年数的负值表示的负效用)是两个阶段博
弈中各自得益之和(当然在第二阶段开始之前是让每
以德报德,以直报怨——重复博弈战略

重复博弈战略是博弈论中的一个重要概念,它指的是在一个博弈过程中,双方参与者不仅仅有一次的决策,而是需要多次反复进行决策。
在这种情况下,双方的策略选择不仅受到对方当前行为的影响,还受到对方未来可能的回应的影响。
在这种情况下,参与者的决策可能会考虑自己的长期利益,而不仅仅是眼前的利益。
而以德报德、以直报怨则是在重复博弈中的一种普遍策略。
以德报德这一策略强调的是合作、信任和责任。
在重复的博弈中,如果双方能够建立起互相信任的关系,相互协作,相互帮助,就能够达成双赢的局面。
在这种情况下,双方都有动力去遵守之前达成的协议,因为他们知道良好的合作关系对双方都是有利的。
这种策略在实际生活中也得到了广泛的应用,比如商业合作中的长期合作伙伴关系、国际关系中的互惠互利原则等等。
以直报怨这一策略则是强调对于对方行为的实时回应。
在重复博弈中,如果一方采取了不公平或者对自己不利的行为,另一方可以通过采取类似的回应来进行反制。
这种策略可以有效地制衡对方的不良行为,保护自己的利益。
另外,以直报怨也可以通过对方的正当行为进行回报来增进双方的合作和信任。
这种策略在博弈论中被广泛研究,并得到了丰富的实例证明。
在现实生活中,以德报德、以直报怨这两种策略都具有重要的指导意义。
比如在企业管理中,建立合作、信任和责任的企业文化能够提高员工之间的协作效率,激励员工为企业的长期利益而努力工作。
在国际关系中,秉持互惠互利原则,遵守国际法规和公平贸易原则,能够更好地维护世界和平与稳定。
以德报德、以直报怨是在重复博弈中能够取得最优结果的普遍策略。
在实际生活中,我们也可以借鉴这些策略,促进合作、信任和责任,维护自身利益的同时也考虑对他人的尊重和回报。
只有在这样的基础上,我们才能够真正实现和谐共赢,推动社会和国际关系朝着更加美好的方向发展。
在现实生活中,我们可以看到许多成功的案例,这些案例都充分体现了以德报德和以直报怨这两种重复博弈策略的重要性。
有些企业在面对市场竞争时,选择与供应商建立长期稳定的合作关系,这样不仅能够获得更好的供应和服务,还能够建立供应商信任,形成良好的合作生态。
重复博弈.ppt

中科院博弈论课程-乔晗
4
重复博弈的三个特征
1. 阶段博弈之间没有物理上的联系,即前一阶段博 弈的结果不改变后一阶段的结构(比如剪刀、石 头、布的重复);
2. 所有参与人观察到博弈过去的历史; 3. 参与人的总支付(报酬)是所有阶段博弈支付的
贴现值之和(局中人关心的不仅是现阶段收益, 还包括未来收益,因而有积极性做出不同于一次 性博弈的最优选择)。
{合作,不合作} {不合作,合作} {不合作,不合作} • 三阶段博弈? • N阶段博弈?
中科院博弈论课程-乔晗
7
重复博弈的策略空间
• 单阶段博弈:局中人的选择无法建立在对手前阶 段行动的基础上
• 重复博弈:过去的行动历史可以被观察到,局中 人的选择可以建立在其他局中人过去行动的基础 上
如:过去你欺骗我,这次我不与你合作
中科院博弈论课程-乔晗
动;(针锋相对)
• trigger strategies: 从合作开始,一直到有一方不合作,然后 永远选择不合作。(触发)
……
局中人1
合作 不合作
局中人2
合作
不合作
3,3
-1,4
4,-1
0,0
中科院博弈论课程-乔晗
9
重复博弈的策略空间
• 重复博弈中,局中人可以选择的策略空间变大 • 新策略的出现使得局中人可以对对方过去的行动
1 L1 2
R1 2
L2 1
R2 1
L2 1
R2 1
L1
R1
L1
R1
L1
R1
L1
R1
2
2
2
2
2
2
2
2
L2
R2 L2
博弈论课件4重复博弈

5 1 1 2 5
如果博弈方2采用H,总得益现值为:
1
V 4 V
因此当 1/ 4时,此触发策略纳什均衡策略。
4.3.2 惟一纯策略纳什均衡的无限次重复博弈
无限次重复博弈民间定理(弗里德曼,1971)
设G是一个完全信息的静态博弈,用(e1, , en )记G的纳什均衡得益,
用(x , 1
重复囚徒困境悖论和连锁 店悖论
☻理论和实践的直觉矛盾,现实 中寡头之间的价格战问题并 不十分普遍,重复次数较大 的实验研究的结果(重复200 次的囚徒困境)
☻泽尔腾(1978),“连锁店悖论” (导论中的先来后到博弈), 实际中对开头几个市场的进 入者不计代价的打击
☻问题的症结与蜈蚣博弈类似, 在于在较多阶段的动态博弈 中逆推归纳法的适用性T t1t 1t1 2 23
t1
t 1
t
4.1.2 基本概念
平均得益:如果一常数作为重复博弈(有限次重复博弈或
无限次重复博弈)各个阶段的得益,能产生与得益序列
1, 2,相同的现在值,则称为1, 2,的平均得益
无限次重复博弈时
2 (1 )
1 2 23
4.2.3 多个纯策略纳什均衡的有限次重复博弈
三价博弈的两次重复博弈
+1
厂H 商M
1L
H
5,5 6,0 2,0
厂商2
M 0,6 3,3 2,0
L
0,2 0,2 1,1
+3
厂H 商M 1L
H
8,8 7,1 3,1
厂商2 M
1,7 4,4 3,1
L
1,3 1,3 2,2
三价博弈
两次重复三价博弈的等价博弈
有限次重复博弈民间定理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方L
1P
Q
H
5,5 6,0 2,0 0,0 0,0
博弈方2
M
0,6 3,3 2,0 0,0 0,0
L
0,2 0,2 1,1 0,0 0,0
P
0,0 0,0 0,0 4,1/2 0,0
Q
0,0 0,0 0,0 0,0 1/2,4
博弈方1:在第一阶段采用H,如果第一阶段结果是(H,H),那么第 二阶段采用M,否则采用P;
➢ 无限次重复博弈:一个基本博弈G一直重复博弈下去的 博弈,记为G(∞)
6
基本概念
➢ 策略:博弈方在每个阶段针对每种情况如何行 为的计划。
➢ 子博弈:从某个阶段(不包括第一阶段)开始, 包括此后所有的重复博弈部分。
➢ 均衡路径:由每个阶段博弈方的行为组合串联 而成。
7
重复博弈的得益
平均得益:如果一常数作为重复博弈(有限次重复博弈或
➢ 零和博弈是严格竞争的,重复博弈并不改变这一点。
➢ 以零和博弈为原博弈的有限次重复博弈与猜硬币博弈 的有限次重复博弈一样,博弈方的正确策略是重复一 次性博弈中的纳什均衡策略。
盖 正面
硬
币 反面
方
猜硬币方
正面 -1, 1
反面 1, -1
1, -1
-1, 1
11
唯一纯策略纳什均衡博弈的有限次重复博弈
0,0
两个罪犯的得益矩阵
不合作 R,S
P,P
满足:R>T>P>S; (S+R)<T+T
9
支付函数
➢ 双方都不合作:
V (all - d,all - d) P P 2P 3P ... P 1 1
➢ 对 的解释:
✓ 贴现率; ✓ 博弈继续的概率; ✓ 一般化:未来收益的重要程度
10
两人零和博弈的有限次重复博弈
17
两市场博弈及重复博弈各均衡的平均得益
➢ 不同策略组合、均衡得益图示
厂商2 得益
(1,4) (1.5,3) (3,3)
(2.5,2.5)
(2,2) (3,1.5)
(4,1)
厂商1得益
18
触发策略
➢ 厂商1:第一阶段选A;如果第一阶段结果是(A, A),则第二阶段选A,如果第一阶段结果是(A, B),则第二阶段选B;第三阶段无条件选B。
max8 1.5 q q 2q max4.5 q q
q2
2
2
2
q2
2
2
q2 2.25,此时他的利润为 5.0625
➢ 高于触发策略第一阶段得益4.5。但从第二阶段开始,厂 商1将报复性地永远采用古诺产量2,这样厂商2也被迫 永远采用古诺产量,从此得利润4。因此,无限次重复 博弈第一阶段偏离的情况下总得益的现值为:
博弈方2:在第一阶段采用H;如果第一阶段结果是(H,H),那么 第二阶段采用M,否则采用Q。
16
两市场博弈的重复博弈(重复两次)
厂 商
A
1B
厂商2
A
B
3,3
1,4
4,1
0,0
两市场博弈
➢ (A,B)+(A,B) OR (B,A)+(B,A)——(1,4)(4,1) ➢ 连续两次采用混合策略——(2,2) ➢ (A,B)+(B,A) OR (B,A)+(A,B)——(2.5,2.5)轮换策略 ➢ 一次纯策略+一次混合策略——(1.5,3)(3,1.5)
➢ 定理:设原博弈G有唯一的纯 策略纳什均衡,则对任意正整数 T,重复博弈 G(T)有唯一的子 博弈完美纳什均衡,即各博弈 方每个阶段都采用G的纳什均 衡策略。各博弈方在G(T)中的 总得益为在G中得益的T倍,平 均得益的等于原博弈G中的得 益。
囚徒2
坦 白 不坦白
囚 徒
坦白
-5,-5
0,-8
1 不坦白 -8,0 -1,-1
触发策略:第一阶段采用H,如果前t-1阶段的结果都是 (H,H),则继续采用H,否则采用L。
如果博弈方2采用L,总得益现值为
5 1 1 2 5 1
如果博弈方2采用H,总得益现值为
V 4 V 因此当 1/ 4 时,此触发策略纳什均衡策略
23
两寡头削价竞争无限次重复博弈的民间定理
厂商2 得益
3
重复博弈的三个特征
➢ 阶段博弈之间没有“物质上”的联系(no physical links),也就是说,前一阶段的博弈 不改变后一阶段的结构;
➢ 所有参与人都观察到博弈过去的历史; ➢ 参与人的总支付是所有阶段博弈支付的贴现值
之和。
4
影响重复博弈均衡结果的因素
➢ 博弈重复的次数 ✓ 重复次数的重要性来自于参与人在短期利益和长远 利益之间的权衡。这是重复博弈分析给出的一个强 有力的结果,为现实中观测到许多合作行为和社会 规范提供解释。
否则从此永远是 w 0 。 工人的策略是如果 w w 则接受,否则宁
0
愿作个体户得到 w ,并在以前各期结果都是(w* , y) 0
和当前工资率为 w* 时努力工作,否则偷懒。
33
考虑如下的触发策略
设厂商已采用上述触发策略。由于 w* w0 ,
工人接受工作是最佳反应。用 V 记工人努 e
力工作时无限次重复博弈得益的现值,则
无限次重复博弈)各个阶段的得益,能产生与得益序列
1, 2,相同的现在值,则称为1, 2,的平均得益
有限次重复博弈不一定考虑贴现因素
无限次重复博弈必须考虑贴现问题 (1 ) t1t t 1
8
“囚徒困境”的一般表示
合作 A
不合作
合作 3,3
B 不合作
-1 ,4
合作
合作 T, T
不合作 S, R
4 , -1
第六章
重复博弈与合作行为
1
序惯博弈(sequential game)
➢ 序惯博弈:参与人在前一个决策点的选择决定随后的
子博弈的结构,因此,从后一个决策点开始的子博弈
不同于从前一个决策点开始的子博弈,或者说,同样
结构的子博弈只出现一次;
乙
借
甲
分
不分
不借 (1,0)
(2,2)
乙
(-1,0) (0,4)
* 8 2q* q* 2q* 6 2q* q*
max q2
8
q2* q* 1
62
q22q*
1
q*qd2
6 q*
2 24
29
低水平的合作
d
1
c
6 q* 2
4 4 1
6 2q* q* 1 6 q* 2 4 4 1
q* 29 5
9
30
效率工资(efficiency wage)
2
重复博弈(repeated game)
➢ 重复博弈:同样结构的博弈重复多次,其中的每次 博弈被称为“阶段博弈” (stage game).
➢ 以囚徒困境为例,如果每次判刑不是很重(至少不 是无期徒刑),那么,两个囚徒在刑满释放之后再 作案,作案之后再判刑,释放之后再作案,如此等 等,他们之间进行的就是重复博弈,其中每次作案 是一个阶段博弈。
➢ 信息的完备性(completeness)
✓ 当一个参与人的支付函数(特征)不为其他参与人 所知时,该参与人可能有积极性建立一个“好”声 誉以换取长远利益。这一点可以解释为什么那些本 质上并不好的人在相当长的时期内干好事。
5
基本概念
➢ 有限次重复博弈:给定一个基本博弈G(可以是静态博 弈,也可以是动态博弈),重复进行T次G,并且在每 次重复G之前各博弈方都能观察到以前博弈的结果,这 样的博弈过程称为“G的T次重复博弈”,记为G(T)。 而G则称为G(T)的“原博弈”。G(T)中的每次重复称为 G(T)的一个“阶段”。
即
V (w* e) V
e
e
V (w* e) (1 ) e
34
考虑如下的触发策略
用 V 记工人选偷懒时无限重复博弈得益的现值,则:
s
V
w* ( pV
(1 p)
14
触发策略的进一步讨论
厂H 商M 1L
H
5,3,3 2,0
三价博弈
L
0,2 0,2 1,1
厂H 商M 1L
H
8,8 9,3 5,3
厂商2 M
3,9 6,6 5,3
L
3,5 1,3 4,4
重复三价博弈的等价博弈:不可信报复
15
触发策略可信性较强的博弈
H
博 弈
M
➢ 厂商2:第一阶段选A,第二阶段无条件选B,如果第 一阶段结果是(A,A),则第三阶段选A;如果第一 阶段结果是(B,A),则第三阶段选B。
➢ 均衡路径:(A,A)—(A,B)—(B,A)
19
有限次重复博弈的民间定理(Folk Theorem)
厂商2 得益
(1,4)
w=(1(1,.11) )
➢ 个体理性得益(Individual Rationality Payoff) : 不管其它博弈方的行为如何,一博弈方在 某个博弈中只要自己采取某种特定的策略, 最低限度保证能获得的得益
(-5,-5)
囚徒2
坦 白 不坦白
囚 坦白 -10,-10 -5,-13
徒 1
不坦白
-13,-5
-6,-6
(-10,-10)
12
有限次重复博弈:连锁店悖论(chain_store paradox)
进 进入 入 者 不进入
在位者
默许
斗争
40,50
-10,0
0,300
0,300
市场进入博弈
有唯一纯策略纳什均衡 (40,50) 有限次重复的结果仍然是 (进入,默许)