同时博弈与序贯博弈转换
14 序贯博弈

J
R
J
等 0,10 跑
跑 5,0
华南理工大学经济与贸易学院
5,0
第十四章 序贯博弈
14.1 遏制进入的战略投资者 14.2 序贯博弈的概念 14.3 再看西班牙叛乱 14.4 蜈蚣博弈 14.5 反击
华南理工大学经济与贸易学院
14.5 反击
在冷战时期,美国与西德等几个欧洲国家结盟共同抵抗苏联。苏联在 欧洲部署着更多的陆军,如果攻击,就能很快占领西德。 为了防止苏联攻击,美国在西德境内驻军,然而美国愿意提供给西德 的军队远不能抵抗苏联攻击,“用来战斗人数太少,如果死伤,人数 又太多” 吓退苏联进攻的不是部属在西德的军队,而是美国大规模反击甚至核 武器的威慑,然而,威慑未必都是可信的,就像前面的一些例子 下图是假定美国没有任何驻军时,美苏的博弈情况
J R
等
J
等
R
等 10,10 跑 0,20
跑 5,0
J得到5个椰子就跑
跑 0,10 15,0
跑
华南理工大学经济与贸易学院
14.4 蜈蚣博弈
J
等
R
等
J
等
R
等 10,10 跑
跑 5,0
J
跑 0,10 等
R
跑 15,0 等
J
0,20 等 0,20 跑
跑 5,0 等 0,10
跑 15,0 等 15,0 跑 0,10
华南理工大学经济与贸易学院
第十四章 序贯博弈
14.1 遏制进入的战略投资者 14.2 序贯博弈的概念 14.3 再看西班牙叛乱 14.4 蜈蚣博弈 14.5 反击
华南理工大学经济与贸易学院
14.4 蜈蚣博弈
A和B分坛子里的一笔钱 第1阶段: A选择“抓”坛子里的钱,B得到较少的钱 A选择“传”,坛子中钱的总额增加 第2阶段: B选择“抓”,A得到较少的收益 B选择“传”,坛子中钱的总额进一步增加,最后两人 平分收益
序贯决策博弈相关资料(ppt 26页)

虚线排除确定法的缺陷
该方法可以找到纳什均衡,但找不到博弈 的最终结果。
均衡是策略的组合,而结果则是行动的组 合。
因此,我们一般用倒推法(Backwards Induction)来寻找序贯博弈的结果。
三、寻找序贯博弈的结果——倒推法
从动态博弈的最后一个阶段博弈方的行为开始分析, 逐步倒推回前一个阶段相应博弈方的行为选择,一 直到第一个阶段的分析方法,称为“逆推归纳法”。
男●
足球
女 足球
●
芭蕾
芭蕾 ×
女 足球
●
芭蕾
◆ (2,1) × ◆ (0,0) × ◆ (-1,-1)
◆(1,2)
练习
• 开金矿博弈
乙
借
×不借
甲
分
×
(2,2) 打 ×
(1,0) 不分 乙
不打
(1,0)
(0,4)
倒推法的评价
逆推归纳法只能分析明确设定的博弈问题,要求 博弈的结构,包括次序、规则和得益情况等都非 常清楚,并且各个博弈方了解博弈结构,相互知 道对方了解博弈结构。这些可能有脱实际的可能
“先下手为强”
足球 女●
男 足球
◆ (1,2)
●
芭蕾 × ◆ (-1,-1)
芭蕾× 男 足球 × ◆ (0,0) ●
芭蕾
◆(2,1)
序贯博弈中的性别战
举例:情侣博弈中往往是先动一方,比如 女方已经买好了电影票,再比如男方曾经 多次告诉女方,世界杯就算不上班也要看D!
后动优势
后动优势:后行动的得益比先行动的得益 大的情况。
谁先动?潜在进入者
如何表示该博弈?
进入障碍博弈
进入者 ●
容忍 垄断者
第四章序贯决策

假设垄断企业的老板交给你这样的策略: {对抗,容忍},你明白应该如何行动吗?
策略就是一个完整的行动计划,使得你可 以把它交给另外一个人,让他知道如何代 表你去执行这个策略。
什么是计划:“如果对手选A,我将采取行 动X,如果…,我将采取行动…。”
行动与策略
在同时决策博弈中,行动就是策略。 但在序贯决策博弈中,行动是指每一个决
借 甲
打 (-1,0)
乙
不分 乙
不借 (1,0)
不打 (0,4)
3.2.3 逆推归纳法
借 甲
分
乙 不分
不借 (1,0)
(2,2)
(0,4)
3.2.3 逆推归纳法
乙
借
不借
(0,4)
(1,0)
练习2:有法律保障的开金矿博弈
借 甲 分
(2,2) 打
(1,0)
乙 不借
(1,0) 不分 乙
不打
(0,4)
用箭头排除确定法寻找纳什均衡
将以上策略在博弈书中用粗线表示。
将存在单独改变激励的策略用箭头标示。方法如下:
(1)找到第二阶段两根粗线所对应的支付。
(2)比较这两个支付前面的数字,如果大的数字所 对应的那条“树枝”是细的,则男方存在单独偏离 的动机,则男方的策略选择用箭头标示。
(3)比较男方选择的树枝对应女方选择所获得支付 (这两个支付后面的数字).其中对应第一阶段“树枝” 是细的那个数字可以不再考虑,因为男方没选这个 方向。它是“虚”的。
A:40%
B(60%)
C(80%)
实验:海盗分宝
五个海盗抢到100颗宝石,他们决定按如下方 法来分配:先抽签决定顺序(1,2,3,4,5); 然后先由1号提出分配方案,其余的人进行 表决,当且仅当半数和超过半数的人同意 时,则按1号所提方案分配,否则将1号扔进 大海喂鲨鱼,当1号方案被否决,则由2号提 出分配方案,其余的人进行表决,以此类 推,假定这些海盗都是理性人,问第一个 海盗应提出怎样的分配方案才能获得通过 并使自己的收益最大?
14 序贯博弈

华南理工大学经济与贸易学院
14.2 序贯博弈的概念
子博弈:在博弈的扩展式中,子博弈就是一系列分支,包括从定义明确的单个节 点(完全信息节点)引出的分支,以及有他所引出的选择节点引出的分支 因此,下图每个椭圆界定了一个子博弈,其中一个从选择节点PA引出,另一个是 从选择节点PB引出。另外,整个博弈也是一个子博弈。 通常,每个博弈至少包括一个子博弈,即其自身。 除博弈自身以外的其他子博弈统称为适当子博弈 基本子博弈和复合子博弈:最大的区别 在于子博弈中是否含有更小的子博弈, 如果没有则是基本子博弈,否则都是复 合子博弈 像PA和PB一类的节点称为完全信息节 点(complete information node ) ,每 个完全信息节点都是子博弈的起始点, 即所有子博弈都起始于完全信息节点。
博弈论
2016 4
华南理工大学经贸学院物流工程系 Email:gxzhang@
华南理工大学经济与贸易学院
第十四章 序贯博弈
也称为动态博弈,各博弈方的决策不是同时进行,而是 只能按一定的顺序选择战略,或者是只能在特定条件下或 一定时间过后,才能实施他们的战略 市场进入博弈
华南理工大学经济与贸易学院
A
B
华南理工大学经济与贸易学院
14.2 序贯博弈的概念
再看蓝鸟与金雀博弈,这个博弈 有两个纳什均衡,但是它们有所 不同 左上角的战略组合是子博弈完美 均衡
右下角的战略组合不是子博弈完美 均衡,金雀打价格战的威胁是不可 信的
蓝 鸟 进入 不进入 金雀 如果蓝鸟进 入,就容纳 它;如果蓝 鸟不进入, 就维持原状 3,5 0,10 如果蓝鸟进 入,就发动 价格战;如 果蓝鸟不进 入,就维持 原状 -5,2 0,10
3-序贯博弈(完全动态静态博弈)

2
E C M N B U A
产量 3单位 1.5单位 得益 4.5 2.25
模型) 如果把第二章静态博弈中的古诺模型改为厂商1先选择 ,厂商2后选择,而非同时选择。可以得到:
B选择产量q2
c1 c2 2
先行优势
例6:劳资博弈(Leontief,1946)
该博弈假设工人的工资水平完全由工会决定,但厂商
开发
A
不开发
E C M N B U A
开发 (-1,-1)
B 开发 (0 , 1) B 不开发 (0 , 0)
开发一栋写字楼。由于市场需求有限,如果他们都开 发,则在同一地段会有两栋写字楼,超过了市场对写 字楼的需求,难以完全出售,空置房太多导致各自亏 损1百万。当只有一家开发商在这个地段开发一栋写字 楼时,它可以全部售出,赚得利润1百万。假定A先决 策,B在看见A的决策后再决策是否开发写字楼。
3、后动优势:网球博弈的演绎
DL
李娜
CC
科维托娃
DL DL K CC
E C M N B U A
DL CC
50 , 50 90,10
80,20 20 , 80
DL (50) (10,90)
(50,50)
L CC DL L CC
(80,20)
DL
K CC DL K CC
(90,10)
L
(20,80)
5
100 0 1
100 0 1 0
98 0
0
1Hale Waihona Puke 02E C M N B U A
案例分析: 美国波音和欧盟 空中客车的补贴案之争
课堂小游戏
E C M N B U A
序贯博弈问题

序贯博弈问题一、序贯博弈到底是什么?你有没有听过“博弈”这个词?不是打牌那种博弈,指的是一种决策上的游戏,参与者之间的互动决定了每个人的选择与结果。
这就好比你和朋友去吃火锅,火锅店菜单上有各种菜品。
你点了一个菜,等着对方点菜。
可对方不急,先看你点了啥,准备做出反应。
这个过程中,谁先动手,谁后行动,都得影响到最终结果。
大家都在试图猜测对方的想法,自己能得到什么好处。
你以为自己点的牛肉最划算,结果对方一看,“牛肉不行,还是羊肉好”,再调整策略。
你们俩这一来一回的“反应”,就构成了一个典型的序贯博弈。
再想象一下,假设你和朋友去参加一个选秀节目。
节目组规定,选手只能按照先后顺序选择道具,先选的选手能占得先机,但后选的可以看到前面选了什么,再做决定。
这个就类似于序贯博弈的模式。
每一位参与者的决策,都不仅仅是独立的,而是会受到前一个人决策的影响。
在这样的情况下,谁先动手,谁就能占得先机,这个先后顺序决定了最后的胜负。
二、谁先出手更有利?在序贯博弈中,先出手的玩家不一定就能稳赢,但他们肯定比后出手的更占优势。
为什么呢?因为先出手的人往往能掌控局面,虽然选择的范围有限,但可以设置一些“陷阱”,让后出手的人不得不按自己的节奏来。
有点像是你在打麻将时,摸到一张牌,感觉对自己有利,但是如果你不出这个牌,对方可能会“碰”了,结果变得一团乱。
所以,谁先出手,谁就能为自己争取更多的空间。
想象一下,如果你是第一个选择道具的人,你可以挑选最适合自己或者最具战略性的道具,不管其他选手怎么选,你都可以稍微有些预判。
而如果你是第二个选手,虽然知道了对方的选择,但你却没法直接“修正”自己的策略,因为对方的选择可能已经给你造成了一些限制。
这种情况放到生活中也一样。
比如你想约一个朋友去看电影,如果你是先提出邀请的人,你可以选择一部自己感兴趣的电影。
如果对方是先出手的,他就能决定电影的类型,虽然你可以根据他的选择做出反应,但你心里总有些“被动”的感觉。
10章博弈论

寡头厂商之间的博弈: 博弈论初步 •博弈论的基本概念及其分类; •完全信息静态博弈 •完全信息的动态博弈;
•不完全信息的静态博弈
思考:子博弈精练纳什均衡的特点是什么?
•参与人在前一个阶段的选择将决 定随后的子博弈的结构。
•子博弈精练纳什均衡:若A开发,B
不开发;若A不开发,B开发;若A 先开发,B的子博弈已就被排除了, B只能选择不开发。
思考:为什么序列博弈中,厂商 成功的关键是先行者优势? •在房地产开发的案例中纳什均衡是: 若A开发,B不开发;若A不开发,B 开发;
博弈的分类1 ——合作博弈与非合作博弈
如果各博弈方能达成某种有约束力的契约或默契, 以选择共同的策略,此种博弈就是合作博弈。 反之,就属于非合作博弈。 企业之间的联合定价就属于合作博弈,而经常挑起 价格战的企业采用的便主要是非合作博弈。 在合作博弈中往往包含着非合作博弈,如石油输出 国组织是合作博弈的产物,但其中为了各自利益的 超产和争吵又属于非合作博弈。
在智猪博弈中,先剔除小猪的严格 劣战略“按按纽”,在这一选择后的新 博弈中,小猪只有“等待”一个战略, 而大猪有两个战略可供选择。再剔除新 博弈中大猪的严格劣战略“等待”,从 而达到重复剔除的占优战略均衡: 小猪等待,大猪按按纽。
严格劣战略是指无论其他参与者采取什么 战略,该战略是对自己严格不利的战略。
实行承诺后的阻止市场进入博弈
垄断者
商战 默许 900,300
潜 在 进入 进 不进入 入 者
第四章 序贯决策博

9
进入障碍博弈
进入者 ●
容忍 垄断者
●
进入 抵抗
◆ (1,5) ◆ (-2,2)
不进
垄断者 容忍 ◆ (0,10)
●
抵抗 ◆ (0,4)
10
二、序贯博弈的纳什均衡
例如:性别战.
足球 男●
芭蕾
女 足球
●
芭蕾
足球
●
芭蕾
◆ (2,1) ◆ (0,0) ◆ (-1,-1) ◆(1,2)
13
虚线排除确定法的缺陷
该方法可以找到纳什均衡,但找不到博弈 的最终结果。
均衡是策略的组合,而结果则是行动的组 合。
因此,我们一般用倒推法(Backwards Induction)来寻找序贯博弈的结果。
14
三、寻找序贯博弈的结果——倒推法
从动态博弈的最后一个阶段博弈方的行为开始分析, 逐步倒推回前一个阶段相应博弈方的行为选择,一 直到第一个阶段的分析方法,称为“逆推归纳法”。
在序贯情侣博弈中,任何一方率先采取行动可能
得到的好处,都比他或她后行动可能得到的好处
大。这种局中人先动得益大于后行得益的情况,
叫做先动优势。
请比较:
女 足球
◆ (2,1)
足球 男●
●
芭蕾 × ◆ (0,0)
芭蕾 × 女 足球 × ◆ (-1,-1) ●
芭蕾
◆(1,2) 19
先动优势
当男方先动时,男方得2,女方得1,但当 女方先动时,男方得1,女方得2。
支付对应每条路径,而不是对应每步选择、行为。 支付向量中,数字的排列按局中人的出场顺序出现。
5
构造博弈战略式表述
在进入障碍博弈中 潜在进入者只有一个信息集,两个可选择
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
{忍,忍}{斗,斗} {斗,忍} {忍,斗}
进 进驻者
不进
1, 5 0,10
-2,2 0, 4
-2,2 0,10
1, 5 0, 4
第一节 表现形式的相互转换
二、矩阵(正规型)→树型(展开型) (一)案例:公用地悲剧——同时决策 牧民乙 过度放牧 适度放牧 过度放牧 10,10 30,0 甲 0,30 20,20 适度放牧
第一节 表现形式的相互转换
二、矩阵(正规型)→树型(展开型) (二)转换过程 1.任意选定某参与人“先行” 2.另一参与人“后行”:同时决策,不 完美信息
用椭圆形虚线圈“罩住”两个决策节点
3.给出相应支付向量
公用地悲剧的展开型
要致富,多养羊
多 多 甲 少 乙 少 乙 少 多 (0,30) (20,20) (30,0) (10,10)
3,4 1,2 4,3 2,1
第二节
混和博弈
三、案例:研发投入与定价博弈 (三)第二阶段:根据对方研发投入 定价 4.(低投入,低投入)
高价 低投入 低投入 低价 高价 低价
6,6 3,7 7,3 5,5
第二节
混和博弈
三、案例:研发投入与定价博弈 (四)简化形式与纳什均衡 戴尔 1.简化表述
第二节
混和博弈
三、案例:研发投入与定价博弈 (三)第二阶段:根据对方研发投入 定价 2.(高投入,低投入)
高价 低投入 高投入 低价 高价 低价
4,3 3,4 2,1 1,2
第二节
混和博弈
三、案例:研发投入与定价博弈 (三)第二阶段:根据对方研发投入 定价 3.(低投入,高投入)
高价 高投入 低投入 低价 高价 低价
同时博弈与序贯博弈的转换
给碗饭吃吧
城管 突击清查 不清查 出摊 -2,2 4,0 小贩 0,-1 0,0 不出摊
特征:(1)同 时决策;(2) 矩阵形式
核心企业与外包企业
合作?不合作?
特征:(1)一 前一后决策; (2)博弈树形 式
思考
Q:两种表现形式是否分别专属于某 一种博弈? A:No. A:同时决策博弈——矩阵型、展开型 A:序贯博弈——矩阵型、展开型
第一节 表现形式的相互转换
一、树型(展开型)→矩阵(正规型) (一)案例 市场进入阻挠——序贯博弈
容忍 进驻 进驻者 不进驻 在位者 斗 在位者 斗争 忍 (1,5) (-2,2)
(0,10)
(0,4)
第一节 表现形式的相互转换
一、树型(展开型)→矩阵(正规型) (二)转换过程 1.确定参与人的纯策略数目 (1)进驻者(行参与人) 策略:2个——进驻、不进驻 表格:2行
停顿
结论:某些博弈可以在两种表现形式 之间相互转换 延伸:某些博弈本身既包含同时决策, 又包括序贯决策
第二节 混和博弈
一、定义 既包含同时决策行动又包含序贯决 策行动的博弈 二、存在条件 相当长一段时期的策略互动过程
第二节 混和博弈
三、案例:研发投入与定价博弈 (一)第一阶段:同时决策(不完全 信息)——新产品的研发投入 戴尔 高投入 低投入 高投入 华硕 低投入
高投入 低投入
高投入
低价
华硕Biblioteka 低投入低价低价 4, 4 高价 4, 3
高价 低价
低价 3, 4 低价 5, 5
第二节
混和博弈
三、案例:研发投入与定价博弈 (四)简化形式与纳什均衡 2.纳什均衡 第一阶段:(低投入,低投入) 第二阶段:(低价,低价)
第一节 表现形式的相互转换
一、树型(展开型)→矩阵(正规型) (二)转换过程 1.确定参与人的纯策略数目 表格:4列 (2)在位者:针对进驻者策略,制定 完整的行动计划(充分的准备) 我行我素策略:{忍,忍}{斗, 斗} 对抗策略:{斗,忍} 追随策略:{忍,斗}
第一节 表现形式的相互转换
第二节
混和博弈
三、案例:研发投入与定价博弈 (二)插曲 产业年度交易展→ 互相观察对方产品性能→ 推测对方研发投入
第二节
混和博弈
三、案例:研发投入与定价博弈 (三)第二阶段:根据对方研发投入 定价 1.(高投入,高投入)
高价 高投入 高投入 低价 高价 低价
5,5 2,6 6,2 4,4