博弈论完全且完美信息动态博弈.ppt

合集下载

博弈论 完全信息动态博弈.ppt

博弈论 完全信息动态博弈.ppt

4、工会、雇主与中央银行的经济博弈
考虑工资、物价、就业的宏观经济模型:
• 中央银行:选择货币供应量,在其效用函 数中关注通货膨胀率与就业水平;
• 企业:选择就业数量,使企业利润最大化 (受工人的工资影响);
• 就业者:要求工资水平,使自身福利最大 化(受通货膨胀率影响)。
• 由于劳动合同和工资刚性,博弈顺序为:
• 企业1首先选择产量q1,企业2观察到企业1的产量 后选择自己的产量q2,令: P(Q)=a-q1-q2代表逆需求函数 Ci(qi)=cqi代表成本函数 则第i企业的利润函数为:
i(q1,q2)=qiP(q1+q2)-Ci(qi)
企业1 q1
企业2 q2
市场
i=1,2
P(Q)
企业利润:
i(q1,q2)
• 若T=1,在T=1时,参与人1出价,如果他提出 x1=1,参与人2只能接受。
两阶段博弈(T=2)
• 若T=2,在T=2时,参与人2出价,如果他提 出x2=0,参与人1只能接受;
• 由于参与人2在T=2时的1单位支付相当于在 t=1时δ2单位,如果参与人在t=1时出价1-x1≥δ2, 则参与人2会接受。
承诺价值
• 在该博弈中,拥有信息优势反而使参与人处 于劣势,企业1称为领导者,企业2称为随从。
• 现在考察完全信息静态情形下:如果企业1 承 信诺呢?(威协)生产q1*=(a-c)/2,企业2是否会相
• 若 优 信企选企业择业将21选的是择威qq1胁*2=*,=3((唯aa--一cc))//的48, ,纳则 因什此 此均时企衡企业是业2不1会的相最 q1*=q2*=(a-c)/3。
企业1 q1
企业2 q2
市场
P(Q)

第三章 完全信息动态博弈 ppt课件

第三章 完全信息动态博弈  ppt课件

条路径。但每条路径可由不同的策略组合决定。
例如, (开发,(不开发,开发))决定了
A -> 开发 -> B -> 不开发 -> (1,0)
该路径还可由(开发,(不开发,不开发))决定。
事实上,该问题共有4条路径,8种策略组合。
ppt课件
12
§2 子博弈精炼纳什均衡
对于动态博弈,Nash均衡可能并不是一个合理的预测。 如房地产博弈:
又如,上例中,如果进入者先行动,而在位者在 行动前能准确知道前者的行动,那么在位者的信息 集为 {进入}或{不进入}。 反之,若在位者先行动, 则在位者的信息集为{进入,不进入}。
ppt课件
7
三、 动态博弈的相关概念
(3) • 完美信息(Perfect information):一个局中人在行动
时,对之前博弈进程有准确了解,即每一个信息集只包含 一个值,则称该局中人具有完美信息。 • 如果动态博弈的所有局中人都有完美信息,则称为完美信 息的动态博弈。 • 如果动态博弈中,存在部分局中人具有不完美信息,称为 不完美信息的动态博弈。
思考:若进入者真的进入,在位者的最优行动是“默许”。 所以“斗争”是一种不可置信的威胁(即使在位企业摆出 一副“你进入我就斗争”的架势,进入企业不应被吓到)。 而静态博弈承认这种不可置信的威胁,使(不进入,斗争) 成为一个Nash均衡。
动态博弈解决方案:剔除不可置信的威胁策略
ppt课件
3
扩展阅读:不可置信的威胁策略 引出信息经济学重要的概念—— 承诺行动(Commitment)。
ppt课件
18
三、 逆向归纳法求解子博弈精炼Nash均衡
• 从动态博弈的最后一个阶段局中人的行为开始分析

博弈论第三章.ppt

博弈论第三章.ppt
混合策略的子博弈完美Nash均衡可类似定义。 简单地说: 子博弈完美Nash均衡要求均衡策 略 的行为规则在每一个信息集上都是最优的 (包括均衡路径和非均衡路径)。
定 义 展开型博弈的一个策略组合称为子博弈 完美Nash均衡,如果对于该博弈的每一个子 博弈,该策略组合都是Nash均衡。
如果B在决策时并不知道自然的选择,则有博
弈树:
开发
A
hA
不开发
N
N
大(1/2)
hB B
小(1/2)
B
大(1/2)
B
小(1/2)
B h′B
开发
不开发 开发 不开发 开发 不开发 开发 不开发
另一种情况就则B知道自然的选择,但不知道A的
选择,这时博弈树如下:
A
开发
不开发
N
N




B
B
B
B
开发
不开发 开发
开 -3,-3
-3,-3
1,0
1,0
参 与 人A
不 0,1
0,0
0,1
0,0
由 画 线 法 可 得 三 个 纯 策 略Nash 均 衡:
①( 不 开 发,( 开 发, 开 发))
②( 开 发,( 不 开 发, 不 开 发))
③( 开 发,( 不 开 发, 开 发))
但①中B的策略是不合理的,这个威胁是不可置 信的; ②中B的策略(不开发,不开发)也不合理, 因为若A不 开发,B显然应该开发; 只有③是一 个合理的均衡。
的全体记汉A(hi),如果令Hi表示参与人i的信息 集
的集合,则Ai= ∪ A(hi)就是参与人i的所有行

hi∈Hi

博弈论以及应用之3完全且完美信息动态博弈[1].pptx

博弈论以及应用之3完全且完美信息动态博弈[1].pptx

3.8 空头承诺II
回顾
在前述产品开发博弈中,均衡结果(不开发,(开发,开发)) 就是企业A的空头承诺,是不可置信的。
生活中的空头承诺
学生对老师的承诺
老师,这回让我过吧,以后我会好好学习的 老师,先发表一篇达到毕业要求,以后一定会写核心期刊的
山盟海誓
爱你一万年 海枯石烂
1,0 0,0
纳什均衡
企业A开发B不开发
➢ (开发,(不开发,开发)) ➢ (开发,(不开发,不开发))
企业A 不开发B开发
➢ (不开发,(开发,开发))
2020/3/4
9
3.3 动态博弈中的行为与战略VII
总结:动态博弈的矩阵描述存在的问题
战略空间复杂
后行动者的战略空间随局中人的数量和每一阶段局中人的行 动选择数量而急剧增大
25
3.9 承诺行动IV
绑架与劫持中的承诺行动
对峙中的谈判
拒绝谈判
➢ 历史上拒绝谈判曾是一种高效方法,汉武帝和曹操都用过 ➢ 实际生活中拒绝谈判也是一种重要策略 ➢ 交出控制权是拒绝谈判的一种具体形式
谈判中的承诺
➢ 歹徒的承诺可信吗?
职业歹徒的承诺是可信的,因为他们在树立和维护自己的声誉 非职业歹徒的承诺可能也是可信的,因为他们可能不想罪加一等
先行者:美国 后行者:中国
2020/3/4
4
3.3 动态博弈中的行为与战略II
模型描述
战略空间
美国——先行者
➢ 战略就是行动
中国——后行者
➢ 战略是针对先行者各种可能行动而制定的行动方案,包括 美国犯我,我犯人;美国不犯我,我犯人 美国犯我,我不犯人;美国不犯我,我不犯人 美国犯我,我犯人;美国不犯我,我不犯人 美国犯我,我不犯人;美国不犯我,我犯人

(完整版)完全信息动态博弈.ppt

(完整版)完全信息动态博弈.ppt

(四)参与人在博弈树中的顺序
1、排序的基本原则
一个参与人在决策之前知道的事情必须出现在该 参与人的决策结之前。
2、自然人的排序
– 如果参与人不能观测到虚拟人——自然的行动, 自然的决策结置于该参与人的前后都一样;
– 自然的信息集总是假定为单结。
N
大 1/2 A
小 1/2 A


发开

B
B
开发
不开发 开发 不开发
– 博弈的战略式表述只包括三个要 素
– 扩展式表述包括以下六个方面的 要素
扩展式表述包括以下六个方面的要素:
– 参与人集合:i=1、2、…,n;并且用大写N代表 虚拟的参与人——“自然”;
– 参与人的行动顺序(The order of moves):谁在什么 时候行动;
– 参与人的行动空间(Action set):在每次行动时, 参与人有些什么选择;
A
坦白 抵赖
B
B
坦白
抵赖
抵赖
坦白
(-8, -8) (0,-10) (-10, 0) (-1,-1)
B
坦白 A
抵赖 A
坦白
抵赖
抵赖
坦白
(-8, -8) (0,-10) (-10, 0) (-1,-1)
(五)完美回忆
完美回忆(Perfect recall)是指没有参与人会 忘记自己以前知道的事情,所有参与人都 知道自己以前的选择。
第三章 完全信息动态博弈
Dynamic Games of Complete Information
@ 2009 Zheng Daowen, All Rights Reserved
动态博弈:参与人的行动有先后顺序,且后 行动者在自己行动之前能观测到先行动者 的行动。

博弈论与信息经济学--完全信息动态博弈 ppt课件

博弈论与信息经济学--完全信息动态博弈  ppt课件

©&® by H. Q. Feng, CUFE
5/58
一、动态博弈的表述——扩展式
(2)博弈的扩展式表述包括以下要素: 参与人集合:i=1,…,n,此外,N代表虚拟参与人“自然” 参与人的行动顺序:谁在什么时候行动; 参与人的行动空间:在每次行动时,参与人有些什么选择; 参与人的信息集:每次行动时,参与人知道什么; 参与人的支付函数:在行动结束之后,每个参与人得到些什 么(支付是所有行动的函数); 外生条件(即自然的选择)的概率分布。 假定房地产开发博弈的行动顺序如下:开发商A首先行动, 选择开发或不开发;在A决策后,自然选择市场需求的大小; 开发商B在观测到A的决策和市场需求后,决定开发或不开 发。
该博弈的扩展式表述为:
©&® by H. Q. Feng, CUFE
15/58
一、动态博弈的表述——扩展式
进入者
进入
不进入
在位者
斗争 默许
(0,300)
(-10,0)
(40,50)
©&® by H. Q. Feng, CUFE
16/58
二、子博弈精炼纳什均衡
纳什均衡有几个问题:
第一,一个博弈不止一个均衡,事实上,有些 博弈可能有无数个纳什均衡,究竟哪一个更合 理? 纳什均衡假定每一个参与人在选择自己的最优 战略时假定所有其他参与人的战略是给定的, 但是如果参与人的行动有先有后,后行动者的 选择空间依赖于前行动者的选择,先行动者在 选择时不可能不考虑自己的行动对后行动者的 影响。
©&® by H. Q. Feng, CUFE 20/58
二、子博弈精炼纳什均衡
“子博弈”的概念:从每一个行动选择开始至 博弈结束又构成一个博弈,称为“子博弈”。 如在进入者选择进入之后,在位者选择行动 开始就是一个子博弈。 子博弈需满足的条件:

完全信息动态博弈-PPT


(1) 开发商A先行动, 选择开发或不开发;(2) 开发商B在
观测到A得决策后, 再决定开发或不开发。博弈树如下
图。
A


B
B




(-3,-3)
(1,0) (0,1)
(0,0)
注:所有n个局中人得一个纯策略组合决定了博弈树上得一条 路径。但每条路径可由不同得策略组合决定。
例如, (开发,(不开发,开发))决定了 A -> 开发 -> B -> 不开发 -> (1,0)
进 入 进入 者 不进入
在位者
默许
斗争
5,5 1,10
-2,3 1,10
承诺行动使 不可ቤተ መጻሕፍቲ ባይዱ信威胁可信威胁,否则,当事人将为自 己得“失信”付出成本。
例如,该例中,在位者与某第三者打赌,如果进入者进入后她 不斗争,她就付给后者3,这时,斗争成为可置信得威胁。因为 如果进入后,选择默许,收益更小。注意:有了这个赌,进入者 就不敢进入了,实际上,在位者无需支付赌注。
开 (-3,-3)
A

BI


B

(1,0) (0,1)

不 (0,0)
房地产开发中,子博弈I与Ⅱ属于单人博弈,子博弈I中,B得最优 选择就是不开发,子博弈Ⅱ中,B得最优选择就是开发,因此: (1)(不开发, (开发,开发))在子博弈I上不构成Nash均衡; (2)(开发,(不开发,不开发))在子博弈Ⅱ上不构成Nash均衡; (3)(开发,(不开发,开发))在所有子博弈上都构成Nash均衡, 就是子博弈精炼Nash均衡。
Max π1(q1,s2(q1))=q1(a-q1-s2(q1)-c)

lec4_完全信息动态博弈——博弈论课件

❖ A开发我不开发,A不开
B
B
开发 不开发 开发
不开发

发我开发;
博 弈
❖ 不论A开发与否,我不开 (-3,-3) (1,0) (0,1) (0,0)
发。
图2-8 房地产开发博弈
动态博弈的策略式表述



❖若把B的信息集从左

到右排列,上述四个

纯战略可以简单记为
——
A
➢ {开发,开发}

开发
不开发
法,即可处理动态博弈问题。
息 动
近来研究表明,存在策略式表述相同,但却

有本质差别的,不同扩展式表述的动态博弈。

说明上述观点具有一定的局限性。因此,策

略式表述并不能取代扩展式表述。
行为战略


论 混合战略纳什均衡:在扩展式表述博弈中,
讲 义
一个重要概念是“行为战略” (behavior
strategies),用以区别战略式表述博弈的混



讲 ❖(不开发,{开发,

开发})决定了博弈
的路径为A不开发
A
开发
不开发
B
B
开发
不开发 开发 不开发
——

B开发(0, 1)
(-3,-3) (1,0) (0,1) (0,0)
全 信
❖(开发,{不开发,
图2-8 房地产开发博弈

开发})决定了博弈
表2-1 房地产开发博弈:战略式表述
动 态 博 弈

弈树上的一个路径。

图2-8 房地产开发博弈
息 ❖比如(开发,{不开发, 表2-1 房地产开发博弈:策略式表述

北京大学博弈论课件第3章完全信息动态博弈.ppt

参与者 1
S1
S2
参与者 2 V1
V2 V1
参与者 2 V2
(a1, b1, c1) 参与者 3 U1
(a2, b2, c2) U2
(a3, b3, c3) (a4, b4, c4)
错误的博弈树构造方法
❖ 正确的博弈树构造方法
参与者 2 V1 (a1, b1, c1)
参与者 1
S1
S2
参与者 2
V2 参与者 3
斗争
(0, 20)
潜在进入者
不进入
默许
斗争 进入
在位者 默许
(0, 15) (-10, -10)
(5, 5)
横向博弈树
❖ 博弈树中包含若干“节点”,节点用小圆圈表示。 ❖ 位于博弈树最上端的节点称为“初始节点”。 ❖ 初始节点用空心小圆圈表示,其他节点均用实心小圆圈表示。 ❖ 在每个节点处均对应某个博弈参与者,将节点对应的博弈参与者标识在
POWERPOINT TEMPLATE
完全信息动态博弈 POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERP金OI融NT TEMPLATE
归纳法(Backward Induction)”。 ❖ 只有首先确保从博弈树任何最终节点向上回溯时路径唯一,
才能确保逆向归纳法的可操作性。
❖ 正确的博弈树构造方法
参与者 1
S1
S2
(a1, b1, c1) T1
参与者 2 T2
(a2, b2, c2) S1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
能否找到子博弈?
好1差
1 不卖
1


不卖
2
(0,0) (0,0)
买 不买
买 不买
(2,1)
(0,0)
(1,-1)
(-1,0)
二手车交易扩展形
结论:
(1)子博弈不能包括原博弈的第一阶段, 即动态博弈本身不会是它自己的子博弈;
(2)子博弈必须有一个明确的初始信息集, 以及必须包含初始阶段之后的所有博弈 阶段,即子博弈不能分割任何信息集或在 有多节点信息集的不完美信息博弈中可 能不存在子博弈。
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义:由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和 进行博弈所需要的全部 信息,能够自成一个博 弈的原博弈的一部分, 称为原动态博弈的一个 “子博弈”。
乙 借
第三种开金矿博弈中, (不借-不打,不分)和 (借-打,分)都是纳什均衡。但后者不可信,不 可能实现或稳定。
结论:纳什均衡在动态博弈可能缺乏稳定性,也就 是说,在完全信息静态博弈中稳定的纳什均衡,在 动态博弈中可能是不稳定的,不能作为预测的基础。
根源:纳什均衡本身不能排除博弈方策略中包含的 不可信的行为设定,不能解决动态博弈的相机选择 引起的可信性问题
《博弈论与信息经济学》
第三章
完全且完美信息动态博弈
本章讨论动态博弈,所有博弈方都对博弈 过程和得益完全了解的完全且完美信息动态博 弈。这类博弈也是现实中常见的基本博弈类型。 由于动态博弈中博弈方的选择、行为有先后次 序,因此在表示方法、利益关系、分析方法和 均衡概念等方面,都与静态博弈有很大区别。 本章对动态博弈分析的概念和方法,特别是子 博弈完美均衡和逆推归纳法作系统介绍,并介 绍各种经典的动态博弈模型。
3.2.3 逆推归纳法
定义:从动态博弈的最后
一个阶段博弈方的行为
开始分析,逐步倒推回 前一个阶段相应博弈方 的行为选择,一直到第


不借
一个阶段的分析方法,

称为“逆推归纳法”。 分
不分 (1,0)
逆推归纳法是动态博弈 (2,2) 分析最重要、基本的方
法。
(0,4)
逆推归纳法练习一:
1
L
R
2
本章分六节
3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5动态博弈分析的问题和扩展讨论
3.1 动态博弈的表示法和特点
3.1.1 阶段和扩展性表示 3.1.2 动态博弈的基本特点
3.1.1 阶段和扩展性表示
阶段:动态博弈中一个博弈方的一次选择行为 例子:仿冒和反仿冒博弈
仿冒
A 不仿冒
制止 B 不制止(0,10)
(-2,5) 制止
仿冒 A 不仿冒 B 不制止 (5,5)
(2,2) (10,4)
3.1.2 动态博弈的基本特点
策略是在整个博弈中所有选择、行为的计划 结果是上述“计划型”策略的策略组合,构成一
条路径 得益对应每条路径,而不是对应每步选择、行为
动态博弈的非对称性——先后次序决定动态博弈 必然是非对称的。
先选择、行为的博弈方常常更有利,有“先行优 势”。
3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
3.2.1 相机选择和策略中的可信性问题
不同版本的开金矿博弈——分钱和打官司的可信性

借不借乙来自借不借借
乙 不借

甲 不分 (1,0) 分

(2,2) (0,4) (2,2) 打
(1,0)

不分


(2,2)
不打

(1,0) 不分
乙 不打
开金矿博弈
(1,0)
(0,4)
有法律保障的开金矿博弈
(-1,0) (0,4) 法律保障不足的开金矿博弈
——分钱打官司都可信
——分钱打官司都不可信
3.2.2 纳什均衡的问题
(3)子博弈包含所有在初始节点之后的选 择节点和终点,但不包含不跟在此初始 节点之后的节点。
3.3.2 子博弈完美纳什均衡
定义:如果一个完美信息的动态博弈中,各博弈方的 策略构成的一个策略组合满足,在整个动态博弈及 它的所有子博弈中都构成纳什均衡,那么这个策略 组合称为该动态博弈的一个“子博弈完美纳什均 衡”。
子博弈完美纳什均衡能够排除均衡策略中不可信的 威胁和承诺,因此是真正稳定的。
(2, 1) M
N
1
(1, 2)
S
T
2
(1, 1) U
V
(0, 0)
(2, 3)
逆推归纳法练习二:
5个海盗抢到了100颗宝石,每颗都有一样的大小和一 样贵重的价值,经过商议,他们决定将宝石这样分配:(1) 抽签决定自己的号码1,2,3,4,5;(2)先由1号提出分 配方案,然后5人进行表决,当大等于半数的人同意时,就 按照1号的提案进行分配,否则他将被仍入大海喂鲨鱼。然 后由2来分,如果2的方案不能被接受,则同1一样,依次类 推。假设每个海盗都是很聪明的人,都能很理智地判断得失, 从而做出选择。问题是1号海盗应该提出怎样的分配方案才 能够使自己的收益最大化?
具体分析如下:如果只剩下4,5两人,5只要反对,4就得下海 喂鱼,则4一无所获还要下海喂鱼。于是,分配的方式是(0, 100),所以,为了保住性命,无论3的分配方案是什么,4都 必须支持,于是,只剩下3,4,5时,3的方案必然是(100, 0,0)。这样,如果由3来分配的话,4,5将一无所获,所以 对4,5而言,让3来分配不符合自己的利益,必须让3以外的人 来分配,当2分配时,对3而言,无论怎么分配,反对2的方案 对自己最有利,所以2只能求得4,5中的支持,对2而言,只需 满足4,5的利益(98,0,1,1),就可以得到超过一半的票 数,也就是说,如果2来分配,3必将一无所获,所以对3而言, 只要1的分配方案使3有收获就可以得到3的支持,得到3的支持 后,4或5中有一个人支持1就可以了,于是1的方案就出来了, 即(98,0,1,1,0),或者(98,0,1,0,1)。对4、 5中拿到宝石者而言,无论是1还是2来分配,自己手中的宝石 数量都不会变,所以他会支持1,这样,1自己拿98个,3拿1 个,4或5拿1个。
相关文档
最新文档