博弈论与信息经济学 第二章 完全信息动态博弈
信息经济学部分习题解答

解:设金钱总数为M。
对赌徒i,战略空间Si=[0,M],si∈Si,支付
函数ui为
ui
si 0
if if
si M
i
si M
i
所有满足∑isi≤M的选择都是纳什均衡。纳什均 衡有无穷多个。
5.(库诺特博弈)假定有n个库诺特寡头企业,每 个企业具有相同的不变单位成本c,市场逆需求 函数是p = a - Q,其中p是市场价格,Q = ∑jqj是 总供给量,a是大于零的常数。企业i的战略是 选择产量qi最大化利润 πi=qi(a-Q-c),给定其他 企业的产量q-i,求库诺特-纳什均衡。
2
q2
14q12q220
求解可得 q 14q24 116
假设企业1第一阶段投资引进新技术。此时
两个企业的边际成本下降到1,利润函数为:
1 1 q 1 4 q 2 q 1 q 1 f
2 1 q 4 1 q 2 q 2 2 q 2
一阶最优条件为
1
q1
142q1q210
求 故解当可1得9q 6 1 fq 22 1 1 31644 q2 q11 f3 2 q1 25122 时10,99 引6 f进新技术
解:根据问题的假设可知各企业的利润函数为
i piq ciqaqijn iqjqiciq
其中i=1,…,n。
将利润函数对qi求导并令其为0得:
i
qi
n
a
ji
qj
c2qi 0
解得各企业对其他企业产量的反应函数为:
n
qi aji qj c/2
根据n个企业之间的对称性,可知 q1 *q2 *qn * 必然成立。代入上述反应函数可解得:
q
2
再代入企业1的反应函数,得
非合作博弈经济管理学及财务知识分析理论

(7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
市场进入博弈-2阶段不完全信息动态博弈
基本思路-不完全信息动态博弈
在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡 概念没有规定参与人如何修正自己的信念。但是,如果进 入者可以任意修订自己有关在位者成本函数的信念,上述 不完全信息动态博弈可以有任意均衡。
假定参与人的类型是独立分布的,参与人i有K个类型, 有h个可能的行动,өk和ah分别代表一个特定的类型和 一个特定的行动。
如果我们观察到i选择了ah,i属于өk的后验概率是多少?
p(ahk)p(k) p(ahk)p(k)
Por{b kah}
(7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
市场进入博弈-2阶段不完全信息动态博弈
基本思路-不完全信息动态博弈
精练贝叶斯均衡是贝叶斯均衡、子博弈精练均 衡和贝叶斯推断的结合。它要求:
✓ 1、在每个信息集上,决策者必须有一个定义 在属于该信息集的所有决策结上的一个概率分 布(信念);
第二个弟子……
第三个弟子……
贝叶斯法则
在日常生活中,当面临不确定时,我们对某事 件发生的可能性有一个判断,然后,会根据新 的信息来修正这个判断。
✓ 统计学上,修正之前的判断称为“先验概率”
✓ 修正后的判断称为“后验概率”
贝叶斯法则就是人们根据新的信息从先验概率 得到后验概率的基本方法。
贝叶斯法则
基本思路-不完全信息动态博弈
成语故事:黔之驴-驴虎博弈
老虎通过不断试探来修正对毛驴的看法, 每一步行动都是给定它的信念下最优的, 毛驴也是如此。最终老虎将毛驴吃掉。
完全信息动态博弈和演化博弈的关系

完全信息动态博弈和演化博弈的关系在博弈论的研究领域中,完全信息动态博弈和演化博弈是两个重要的分支。
它们分别从不同的角度研究博弈现象,但二者之间也存在一定的联系和关系。
本文将探讨完全信息动态博弈和演化博弈的关系,并对它们的特点和应用进行分析。
1. 完全信息动态博弈的定义和特点完全信息动态博弈是指博弈参与者在博弈过程中具备完全信息的情况下,根据先后顺序依次做出决策,随着时间的推移,博弈过程也在不断变化。
在完全信息动态博弈中,博弈参与者对于其他参与者的行动和策略都有准确的了解,能够全面考虑对手的决策,以此来优化自己的策略选择。
完全信息动态博弈的特点包括:首先,信息对称,每个博弈者都能了解其他博弈者的策略和收益函数;其次,决策按照时间顺序依次进行,每个博弈者的行动会对其他人的决策产生影响;最后,完全信息动态博弈具有策略的时序性,参与者需要根据他们观察到的其他人的决策来选择自己的策略。
2. 演化博弈的定义和特点演化博弈是指博弈参与者根据其在群体中的优势来选择策略,并通过遗传和选择机制在演化过程中逐步改变策略的过程。
演化博弈考虑的不是个体之间的完全信息,而是从整体出发,通过个体之间的相互作用和进化选择来探讨不同策略之间的稳定性和最终结果。
演化博弈的特点包括:首先,演化博弈关注的是群体中不同策略的相对频率和进化趋势,而不是个体行动的绝对收益;其次,演化博弈中存在着演化稳定策略,即一旦某种策略在群体中形成,就会对其他策略形成一种稳定的威胁;最后,演化博弈的结果依赖于演化的时间尺度和环境的改变。
3. 完全信息动态博弈与演化博弈的关系完全信息动态博弈和演化博弈虽然从不同的角度出发,但也存在一定的联系和关系。
首先,完全信息动态博弈可以看作演化博弈的一种特殊情况,即当演化博弈的时间尺度趋于无穷时,完全信息动态博弈的结果可以看作是演化博弈的极限情况。
因此,完全信息动态博弈可以为演化博弈提供一种基础理论框架。
其次,演化博弈可以用来解释完全信息动态博弈中出现的某些稳定策略。
完全完美信息动态博弈

• 子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因 此是真正稳定的。
• 子博弈是倒着看的,从最小的子博弈开始我们就找稳定策略组合, 直至最开始的节点,那么当然是稳定的了。大家会发展这正是逆推 归纳法。
• 逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。
• 战略空间是连续函数:产量。
(-2,5) 制止
仿冒
A 不仿冒
B 不制止 (5,5)
(2,2)
(10,4)
4.1.2 动态博弈的基本特点
• 策略是在整个博弈中所有选择、行为的计划,不能分割。 • 结果是上述“计划型”策略的策略组合,构成一条路径. • 得益对应每条路径,而不是对应每步选择、行为.
• 动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。先 选择、行为的博弈方常常更有利,有“先行优势”。
动)开始。这里参与者1面临的选择是L’’。那么在第二阶段,参与者2预测 到一旦博弈进入到第三阶段,则参与者1会选择L’’ ,这会使2的收益为0, 从而参与者2在第二阶段的选择为:L‘可得收益1, R“可得收益0,于是 L‘是最优的。
• 这样在第一阶段,参与者1预测到如果博弈进入到第二阶段,2将选择L’, 使参与者1的收益为1,从而参与者1在第一阶段的选择是:L收益为2, R收益 为1,于是L是最优的。
乙
借
不借
甲
分
(2,2) 打
(1,0) 不分
乙
不打
(-1,0)
(0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
• 第一个图中,通过法律手段使乙的利益得到保障,这样乙的完整策略: “第一阶段借,如果第二阶段甲不分,第三阶段打官司。”甲的完整策 略是:“第二阶段分。”这是这个3阶段动态博弈的解。
博弈论基础读书笔记三完全信息动态博弈和逆向归纳法

博弈论基础读书笔记三完全信息动态博弈和逆向归纳法第⼆章完全信息动态博弈先来说明两个概念:1、是指在博弈中,参与⼈同时选择或虽⾮同时选择但后⾏动者并不知道先⾏动者采取了什么具体⾏动。
2、是指在博弈中,参与⼈的⾏动有先后顺序,且后⾏动者能够观察到先⾏动者所选择的⾏动。
这⼀章,我们来讨论关于完全信息(即参与者的收益函数是共同知识的博弈)动态博弈的问题。
在这⾥我们还将博弈分为两种:完美信息博弈:即要选择⾏动的参与者完全知道这⼀步之前所有的博弈过程。
完全但不完美信息博弈:即要选择⾏动的参与者不知道这⼀步之前的博弈过程。
进⾏这章之前先简要的解释⼀些东西:所有的动态博弈的中⼼问题都是可信任性。
下⾯给⼀个经典的⼿雷博弈的例⼦:第⼀,参与者1可以选择⽀付1000美元给参与者2或者是⼀分不给。
第⼆,参与者2观察参与者1的选择,然后决定是否引爆⼀颗⼿雷将两个⼈同炸死。
如果参与者2威胁参与者1如果他不付1000美元就引爆⼿雷,如果参与者1相信这个威胁,则最优选择是⽀付1000美元。
但参与者1却不会对这⼀威胁信以为真,因为它不可置信(参与者2不会蠢到因为1000美元⽽同归于尽,⾄于参与者1考虑参与者2是不是疯⼦的情况在第三章讨论)。
这个例⼦就是典型的完全且完美信息博弈。
在2.1节我们将在后⾯使⽤逆向归纳解,来求解这个问题。
在2.2节我们会丰富前⼀节的博弈模型使之成为完全但不完美博弈,我们会定义这种博弈的⼦博弈精炼解,它是逆向归纳法的延申。
在2.3节研究重复博弈,即多次重复⼀个给定博弈。
这⾥分析问题的中⼼使(可信的)威胁和对以后做出的承诺对当前⾏为的影响。
在2.4节中我们介绍分析⼀般的完全信息动态博弈所需要的⼯具。
不再区别信息是否是完美的。
本节和本章的重点都在语⾔,⼀个完全信息动态博弈可能会有多个纳什均衡,但其中⼀些均衡或许包含了不可置信的威胁和承诺,⼦博弈精炼纳什均衡则是通过了可信检验的均衡。
看到这⾥你可能还是⼀头雾⽔,但是⽆所谓,让我们⼀节⼀节的来讲,看到最后你在回头看前⾯的总结可能会更有利于你对本章的理解。
完全信息动态博弈模型

完全信息动态博弈模型完全信息动态博弈模型是博弈论中一种重要的博弈模型,它描述了一组参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。
下面将详细介绍完全信息动态博弈模型的相关内容。
一、博弈的参与者:完全信息动态博弈模型中,通常包括两个或多个参与者,每个参与者都可以做出自己的决策和行动。
参与者可以是个人、组织、公司等,他们之间存在着相互竞争和合作的关系。
二、博弈的信息:完全信息动态博弈模型中的参与者拥有完全信息,即每个参与者都能够获得关于其他参与者的决策和行动的完整信息。
通过完全信息,参与者能够准确地评估自己的决策和行动对其他参与者的影响,并作出最优化的决策。
三、博弈的行动和策略:在完全信息动态博弈中,参与者可以选择不同的行动和策略来达到自己的目标。
每个参与者根据自己对其他参与者行动和策略的评估,以及自己的目标和利益,选择最优化的行动和策略。
四、博弈的时间顺序:完全信息动态博弈是一个时间序列上的博弈模型,参与者的决策和行动是有序进行的。
参与者按照一定的时间顺序依次进行决策和行动,每个参与者都会考虑前面参与者的行动和决策对自己的影响,进而作出自己的决策。
五、博弈的结果和收益:完全信息动态博弈模型的结果是参与者的收益和利益。
通过多轮反复的博弈过程,参与者根据自己的决策和行动可以获得不同的结果和收益。
每个参与者的最终目标是通过优化自己的决策和行动,获得最大的收益和利益。
完全信息动态博弈模型是博弈论中一种重要的模型,它能够帮助我们分析和理解多方参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。
通过对博弈的参与者、信息、行动和策略、时间顺序以及结果和收益的分析,可以更好地理解和应用完全信息动态博弈模型。
博弈论——完全信息动态博弈

2 完全信息的动态博弈2.1完全和完美信息的动态博弈动态博弈(dynamic game):参与人在不同的时间选择行动。
完全信息动态博弈指的是各博弈方先后行动,后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合下所有参与人相应的得益都完全了解的博弈静态博弈习惯用战略式(Strategic form representation)表述,动态博弈习惯用扩展式(Extensive form representation)表述。
战略式表述的三要素:参与人集合、每个参与人的战略集合、由战略组合决定的每个参与人的支付。
扩展式表述的要素包括:参与人集合、参与人的行动顺序、参与人的行动空间、参与人的信息集、参与人的支付函数、外生事件(自然的选择)的概率分布。
n人有限战略博弈的扩展式表述用博弈树来表示1(1,2) (0,3)①结:包括决策结和终点结。
决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。
第一个行动选择对应的决策结为“初始结”,用空心圆表示,其它决策结用实心圆表示。
X表示结的集合,x X表示某个特定的结。
z表示终点结,Z表示终点结集合。
表示结之间的顺序关系,x x´表示x在x´之前。
x之前所有结的集合称为x的前列集,x之后所有结的集合称为x的后续集。
以下两种情况不允许:前者违背了传递性和反对称性;后者违背了前列节必须是全排序的。
在以上两个假设之下,每个终点结都完全决定了博弈树的某个路径。
②枝:博弈树上,枝是从一个决策结到其直接后续结的连线,每一个枝代表参与人的一个行动选择。
在每一个枝旁标注该具体行动的代号。
一般地,每个决策结下有多个枝,给出每次行动时参与人的行动空间,即此时有哪些行动可供选择。
③信息集(information sets):博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结集合称为一个信息集。
博弈树上的所有决策结分割成不同的信息集。
每一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合),该子集包括所有满足下列条件的决策结:(1)每一个决策结都是同一个参与人的决策结。
博弈论与信息经济学-非合作博弈理论

例2.2 石头、剪刀、布的支付矩阵
乙 甲
石头 剪刀
石头
0,0 -1,1
剪刀
1,-1 0,0
布
-1,1 1,-1
布 1,-1 -1,1 0,0
利用重复剔除严格劣策略无法求解
例2.6 利用重复剔除严格劣策略无法求解
乙 甲 上 中 下
左
0,4 4,0 3,5
策 略:政 济
府:救济,不救
不找工作
下岗工人:找工作,
工人 政府
救济
找工作 不找 3,2 -1,3
不救济 -1,1 0,0
求出性别大战博弈的混合策略纳什均衡
女
足球
男
足球 3,2
芭蕾 1,1
芭蕾 -1,-1 2,3
第五节 纳什均衡的存在性
定理1:(Nash, 1950)每个有限策略型博弈至 少存在一个纳什均衡(纯策略的或混合策略的)。
上下中 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1
中上下 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1
中下上 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1
下上中 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1
下中上 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
例2.4 性别大战(battle of the sexes)
局中人:男,女 策 略:男:看足球,看芭蕾 女:看足球,看芭蕾 支付矩阵:见下一页
性别大战的支付矩阵
女 男
足球
足球 3,2
芭蕾 1,1
芭蕾
-1,-1
2,3
第二节 重复剔除严格劣策略均衡
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(0,0)
21 22 23 24
S1 {开发,开发}—威胁战略 S 2 {开发,不开发}—跟随战略 S 3 {不开发,开发}—差异化战略 S 4 {不开发,不开发}—放弃战略
扩展式表达博弈的纳什均衡
则:
21 22 23 24 21 23 22 24
(即如果A开发,B不开发;如果A不 开发,B开发),因此(开发,{不开
x’
开发 不开发
发,开发})是这个博弈的唯一的子博
弈精炼纳什均衡。
(0,1)
(0,0)
子博弈(c)
子博弈精炼纳什均衡
用逆向归纳法求解子博弈精炼纳什均衡: 假定博弈有两个阶段,第一阶段参与人1行动,第二阶段 参与人2行动,并且2在行动前观测到1的选择。 令A1是参与人1的行动空间,A2是参与人2的行动空间。
(0,0)
子博弈精炼纳什均衡
例:
U (2,0) L 1 D 2 R 1 D’ (0,2)
Step1:参与人1(第二次行动)——U’ Step2:参与人2——L Step3:参与人1——U 所以,精炼均衡({U,U’},L)
(1,1) U’ (3,0)
用逆向归纳法求解子博弈精炼纳什均衡的过程,实质是重复剔除劣 战略过程在扩展式表述博弈上的扩展:从最后一个决策结开始依次剔除 掉每一个子博弈的劣战略,最后生存下来的战略构成精炼纳什均衡。
在扩展式表述博弈中,所有n个参与人的一个纯战略组合s= (si,…,sn)决定了博弈树上的一个路径。每一个战略组合 (即博弈树的路径)决定了一个支付向量u=(u1,…,un)。 战略组合si*是扩展式博弈的一个纳什均衡,如果对于所有 的i,si*最大化 u ( s s ) ,即 i i i
ui ( si s i ) ui ( si s i ).si si
子博弈精炼纳什均衡
现在以上例进行说明:
A
开发
不开发
这个博弈有三个子博弈,除原博弈外,子 博弈(b)和(c)实际上是两个单人博弈(即在 每个博弈中,只有开发商B在决策)。
x’ x
开发 (-3,-3) 不开发 (1,0) 开发 (0,1)
B
开发
B x
开发 不开发
x’
不开发 (0,0)
不开发
(0,1) ( -3 , -3 ) (1,0)
纳什均衡(不开发,{开发,开发})中B的均衡 战略{开发,开发}在子博弈(c)上构成纳什均衡, 但在子博弈(b)上不构成纳什均衡,因此,(不开 发,{开发,开发})不是一个子博弈精炼纳什均 衡; 同理,纳什均衡(开发,{不开发,不开发})中 B的均衡战略{不开发,不开发}在子博弈(b)上构 成纳什均衡,但在子博弈(c)上不构成纳什均衡, 因此, (开发,{不开发,不开发})也不是一个 子博弈精炼纳什均衡。
不开发 开发
(0,1) ( -3 , -3 ) (1,0)
(0,0)
子博弈精炼纳什均衡应用举例
1.斯坦科尔伯格寡头竞争模型 例: 市场上有两家企业,企业 1 首先选择产量
博弈树
博弈的扩展形(即博弈树)构造,包括结、枝和信息集。
(1) 结:包括决策结和终点结两类。决策结是参与人
采取行动的时点,终点结是博弈行动路径的终点。
用 X 所有结的结合, x X 表示某个特定的结。 用 " " x x' '意味着 x在 x ' ' 之前。 表示定义在X上的顺序关系: 假定 " " 满足传递性和反对称性,从而意味着顺序关系 " " 是半序的,即有些结之间是不可比较的。
注意:因为一个参与人的纳什均衡战略是假定其他参与人的战略为给 定时在最优战略,所有参与人似乎时在同时选择战略。但这并意味着 在纳什均衡中,参与人一定是在同时选择行动。
扩展式表达博弈的纳什均衡
在扩展式表述博弈中,混合战略被称为“行为战略”以 区别于战略式表述博弈的混合战略概念。行为战略是指 参与人在每一个信息集上随机地选择行动。一个行为战 略规定了对应每一个信息集的行动集合上的概率分布, 且不同信息集上的概率分布是独立的。每一个行为战略 组合b=(b1,…,bn)给出一个支付空间上的概率分布。 b*=(b1*,…,bn*)是一个行为战略纳什均衡,如果没 有任何参与人可以通过选择其他行为战略增加自己的期 望效用。
博弈树
(3)信息集:博弈树上的所有决策结分割成不同的信息集。 每一个信息集是决策结集合的一个子集,该子集包括所有 满足下列条件的决策结:
①每一个决策结都是同一参与人的决策结。
②该参与人知道博弈进入该集合的某个决策结,但不知道自 己究竟处于哪一个决策结。
引入信息集的目的是描述下列情况:当一个参与人要作出
完美回忆:指没有参与人会忘记自己以前知道的事情,所 有参与人都知道自己以前的选择。
扩展式表达博弈的纳什均衡
为了说明如何从扩展式表达构造战略式表达,让我们考虑 房地产开发博弈的例子。假定在博弈开始之前自然就选择 了“低需求”,并且已成为参与人的共同信息;再假定开 发商A先决策,开发商B在观测到A的选择后决策。那么, 博弈的扩展式表述如图所示。
承诺行动与子博弈精炼纳什均衡
有些纳什均衡之所以不是精炼均衡,是因为他们包含了不可置信的威 胁战略。这一点意味着,如果参与人能在博弈之前采取某种措施改变 自己的行动空间或支付函数,原来不可置信的威胁就可能变得可置信, 博弈的精炼均衡就会相应改变。我们将这些为改变博弈结果而采取的 措施称为“承诺行动”。 有些情况下,一个参与人可以通过减少自己的选择机会使自己受益, 原因在于保证自己不选择某些行动可以改变对手的最优选择。这样的 承诺是完全承诺。
博弈树
( 2 )枝:在博弈树上,枝是从一个决策结到它的直接后续 结的连线(有时用箭头表述),每一个枝代表参与人的一 个行动选择。并且,当且仅当参与人选择不同的行动时, 从一个给定的结出发博弈才会到达不同的直接后续结。博 弈树的枝不仅完整地描述了每个决策结参与人的行动空间, 而且给出了从一个决策结到下一个决策结的路径。正因为 如此,每一个终点结才完全决定了博弈树的路径。
1 2 1 2 1 2 1 2
上例说明:一个行为战略可能对应多个混合战略;但逆定理不成立,即一 个混合战略只对应一个行为战略。
库恩(Kuhn,1953)证明,在完美回忆博弈中,混合战 略和行为战略是等价的。
子博弈精炼纳什均衡
例:
A
开发
从上一节讨论中,可得三个纳什均衡:
不开发
B
开发 不开发 开发
这个博弈的子博弈精炼 纳什均衡为( a1 , a2 (a1 ))。
子博弈精炼纳什均衡
例:
A
开发 不开发
Step1:B的最优行动规则—— 差异化战略S3={不开发,开发}
Step2:A——开发
不开发
B
开发 不开发 开发
B
所以,精炼均衡是(开发,{不 开发,开发})
(0,1) ( -3 , -3 ) (1,0)
博弈论
任课教师: 南京航空航天大学 经管学院
李帮义 教授
博弈论与信息经济学
第二章 完全信息动态博弈
博弈的扩展式表述
博弈的扩展式表述包括以下要素: 1.参与人的集合:i=1,…,n. N—虚拟参与人“自然”。 2.参与人的行动顺序:谁在什么时候行动。 3.参与人的行动空间:在每次行动时,参与人有些什么选择。 4.参与人的信息集:每次行动时,参与人知道些什么。 5.参与人的支付函数:在行动结束之后,每个参与人得到些 什么(支付是所有行动的函数)。 6.外生事件(即自然的选择)的概率分布。
(0,0)
(b)子博弈Ⅰ
(c)子博弈Ⅱ
如前所述,这个博弈有三个纳什均衡:(不开发,{开发,开发}); (开 发,{不开发,开发}); (开发,{不开发,不开发})
子博弈精炼纳什均衡
检验这三个纳什均衡是否满足子博弈精炼纳什均衡的要求。
x
开发 不开发
在子博弈(b),B的最优选择是不开发;在子博 弈(c),B的最优选择是开发。
A
开发 不开发
B
开发 (-3,-3) 不开发 开发
B
不开发 (0,0)
(1,0) (0,1)
这是一个完美信息博弈(每个人的信息集都是单结的)。
扩展式表达博弈的纳什均衡
为了构造出这个博弈的战略式表述,首先注意到,A只有一个 信息集,两个可选择的行动,因而A的行动空间也即战略空 间:SA=(开发,不开发)。但B有两个信息集,每个信息集上 有两个可选择的行动,因而B有四个纯战略,分别为: 1.不论A开发还是不开发,我开发—威胁战略S1=(开发,不开发). 2.A开发我开发,A不开发我不开发—跟随战略S2=(开发,不开发). 3.A开发我不开发,A不开发我开发—差异化战略S3=(不开发,开 发). 4.不论A开发还是不开发,我不开发—放弃战略S4=(不开发,不 开发).
参与人1: 参与人2: Step1:a1 A1源自支付函数 u1 (a1 , a2 )
a2 A2 支付函数 u2 (a1 , a2 )
max u 2 ( a1 , a 2 ) a 2 ( a1 ) a 2 A2
Step2:
maxu1 (a1 , a2 (a1 )) a1
博弈树
定义 P( x) 为在 x 之前的所有结的集合,简称为 x 的前列集。 如果 P( x) ,x 称为初始结。
定义 T ( x) 为在 x 之后的所有结的集合,简称为 x 的后续集。
如果 T ( x) , x 称为终点结。
除了终点结之外的所有结都是决策结。 在图示中,用空心圆“○”代表初始结,实心圆“●” 代表其他决策结。
扩展式表达博弈的纳什均衡
例: