5 同时博弈与序贯博弈

合集下载

连续博弈的概念

连续博弈的概念全文共四篇示例，供读者参考第一篇示例：连续博弈是博弈论中一个重要的概念，它描述了博弈的一种特定形式，即游戏在一系列连续的回合中进行，每一回合的决策都受前一回合的结果影响。

这种博弈形式不同于一次性的单次博弈，而是存在连续的互动和反复博弈。

在连续博弈中，参与者可以根据前一回合的结果来调整自己的策略，以获得更好的回报。

这种互动性和动态性使得连续博弈更具挑战性和复杂性，同时也更贴近现实生活中的许多实际情况。

在连续博弈中，参与者的决策往往受到对手的策略选择和游戏规则的限制。

他们需要不断地分析对手可能的行为，同时也要考虑自己的利益和目标，以在长期的博弈过程中取得最优的结果。

连续博弈的一个重要特点是信誉的建立和维持。

在多次互动中，参与者的决策会反映他们之前的行为和信誉，这会影响其他玩家对他们的看法和态度。

在连续博弈中，建立良好的信誉是非常重要的，它可以帮助玩家取得更好的结果和更大的收益。

另一个重要的概念是策略的演化和博弈的稳定性。

在连续博弈中，参与者的策略选择往往会随着时间的推移而发生变化，他们可能会根据对手的行为和游戏的胜率来调整自己的策略。

这种策略的变化和演化会导致博弈的稳定性出现变化，有些策略可能会变得稳定，而有些策略可能会被淘汰。

在现实生活中，连续博弈的概念可以应用于许多领域，如商业竞争、政治博弈、社会互动等。

人们可以通过分析对手的行为和不断优化自己的策略，来取得更好的效果和获得更大的利益。

连续博弈也提醒我们，与他人的互动是一个长期的过程，需要不断地学习和适应，才能在竞争中取得优势。

连续博弈是博弈论中一个重要的概念，它描述了一种具有动态性和互动性的博弈形式。

在连续博弈中，参与者需要不断地分析对手的行为和调整自己的策略，以获得最优的结果。

这种博弈形式不仅具有理论意义，也可以应用于现实生活中的各种情况，为人们提供有益的参考和启示。

第二篇示例：连续博弈是博弈论中一个重要的分支，它描述了博弈在一个连续时间内进行的情况。

博弈论第五章同时博弈与序贯博弈

乙借
甲分（2，2）
不分乙
不借（1，0）
（-1，0）（0，4）
注意
1、子博弈不能从第一个阶段开始，因为原来的博弈（母博弈）本身不能称为子博弈，即子博弈集合是一个真子集合。
2、子博弈不能分割原来博弈（母博弈）的信息集。
D
●
B
●
A
●
C
●
E
●
F●
●
G
◆
H
●
◆
D、E、F、 G点以后
◆
◆ 都不能构
大投入
联想小投入
3，
大投入
4，4
方正
小投入
4，3
5，
该博弈的结果为：两个公司都在第一个阶段采取小投入（帕累优势原则），在第二个阶段采取低价格。但纳什均衡有16个（过程略），因为很多策略导致同一个结果。
该博弈的展开型表述见P173页注意： 1、非单点信息集代表什么？ 2、为什么两个决策点会用虚线联系起来？
信息集
案例：情侣博弈
丈夫
足球
芭蕾
妻
足球
子芭蕾
2， 1 0， 0
0， 0 1， 2
夫妻之争
信息集
根据同时博弈的定义，每个局中人决策时不知道别人的策略，即每个局中人在做自己的行动选择时，并不知道自己处在哪个决策节点上。例如妻子在选芭蕾时，并不知道丈夫选的是芭蕾还是足球。
局中人不能是别人对方“已经”做出的行动或决策，就等于同时行动或决策。
●
◆ 该虚线罩住的不是信
息集。
◆ ◆
其必须满足：同集同
注，即从各个决策点
◆ 出发的策略选择数目
相同，名称也相同。
◆

10章博弈论

解题思路:由Q=QS+Qb, QS=49p, p=300-Q得出支配型厂商的需求曲线,再对总收益求导得出MRb; 令MRb=MCb,得出利润最大化产量、价格；行业产量=Qb+49p
寡头厂商之间的博弈：博弈论初步 •博弈论的基本概念及其分类； •完全信息静态博弈 •完全信息的动态博弈；
•不完全信息的静态博弈
思考：子博弈精练纳什均衡的特点是什么？
•参与人在前一个阶段的选择将决定随后的子博弈的结构。
•子博弈精练纳什均衡：若A开发，B
不开发；若A不开发，B开发；若A 先开发，B的子博弈已就被排除了， B只能选择不开发。
思考：为什么序列博弈中，厂商成功的关键是先行者优势？ •在房地产开发的案例中纳什均衡是：若A开发，B不开发；若A不开发，B 开发；

博弈的分类1 ——合作博弈与非合作博弈
如果各博弈方能达成某种有约束力的契约或默契，以选择共同的策略，此种博弈就是合作博弈。反之，就属于非合作博弈。企业之间的联合定价就属于合作博弈，而经常挑起价格战的企业采用的便主要是非合作博弈。在合作博弈中往往包含着非合作博弈，如石油输出国组织是合作博弈的产物，但其中为了各自利益的超产和争吵又属于非合作博弈。
在智猪博弈中，先剔除小猪的严格劣战略“按按纽”，在这一选择后的新博弈中，小猪只有“等待”一个战略，而大猪有两个战略可供选择。再剔除新博弈中大猪的严格劣战略“等待”，从而达到重复剔除的占优战略均衡：小猪等待，大猪按按纽。
严格劣战略是指无论其他参与者采取什么战略，该战略是对自己严格不利的战略。
实行承诺后的阻止市场进入博弈
垄断者
商战默许 900，300
潜在进入进不进入入者

博弈树例题

博弈树例题（原创实用版）目录1.博弈树的概念和基本结构2.博弈树的分类和应用场景3.博弈树的例题解析4.博弈树的解题技巧和策略5.博弈树在人工智能和决策制定中的作用正文一、博弈树的概念和基本结构博弈树（Game Tree）是一种用于表示博弈过程的树形结构，主要用于分析和解决两人或多人之间的互动决策问题。

博弈树由节点、边和叶子组成，每个节点表示一个决策，边表示决策之间的概率转移，叶子表示最终的结果。

在博弈树中，每个参与者的决策对应着一棵子树，通过对比子树之间的胜率，可以找到最优的决策策略。

二、博弈树的分类和应用场景1.分类：博弈树根据参与者决策的顺序可以分为序贯博弈树和同时博弈树。

序贯博弈树表示参与者按照一定顺序依次做出决策，而同时博弈树则表示参与者在同一时间做出决策。

2.应用场景：博弈树广泛应用于经济学、社会学、政治学、军事战略等领域。

典型的应用场景包括价格博弈、拍卖、选举、战争策略等。

三、博弈树的例题解析例题：两人零和博弈假设甲乙两人进行零和博弈，甲方有策略 A 和策略 B，乙方有策略 X和策略 Y。

甲方选择策略 A 时，乙方选择策略 X 的概率为 0.6，选择策略 Y 的概率为 0.4；甲方选择策略 B 时，乙方选择策略 X 的概率为0.3，选择策略 Y 的概率为 0.7。

求甲方在两种策略下的最优选择。

解析：通过构建博弈树，可以发现甲方选择策略 A 时，期望收益为0.6*(-1)+0.4*0=-0.2；选择策略 B 时，期望收益为0.3*(-1)+0.7*0=-0.3。

因此，甲方应选择策略 A，乙方应选择策略 Y，才能达到最大收益。

四、博弈树的解题技巧和策略1.剪枝：在博弈过程中，可以对胜率较低的子树进行剪枝，以降低搜索空间，提高计算效率。

2.引入随机因素：在博弈树中，可以通过引入随机因素来模拟不确定性，从而提高模型的泛化能力。

3.采用启发式算法：对于复杂的博弈问题，可以采用启发式算法如Alpha-Beta 剪枝、Min-Max 算法等，来加速搜索过程。

5 同时博弈与序贯博弈

第五章同时博弈与序贯博弈目录•5-1 正规型表示与展开型表示–树型表示转化为矩阵表示–矩阵表示转化为树型表示：信息集•5-2 同时决策与序贯决策的混合博弈•5-3 树型博弈的子博弈•5-4 子博弈精炼纳什均衡•5-6 连续支付情形的序贯博弈5-1 正规型表示与展开型表示•1.树型表示转化为矩阵表示•“进入者”只有一个决策节点，他有两个纯策略可以选择：进入和不进入。

•“垄断者”有四个可能的纯策略：–{容忍，容忍}、{对抗，对抗}、{对抗，容忍}、{容忍，对抗}。

•把首先行动的局中人放在行局中人的位置，后行动的局中人放在列局中人的位置。

•垄断者有不止一个纯策略可以导致相同的博弈结果。

•步骤：首先确定好可供每个局中人选择的纯策略的总数目，从而把表格的大小确定下来，然后在每个策略组合所对应的格子中，按照约定的规格填入相应的支付向量。

•2.矩阵表示转化为树型表示•问题：树型如何能够表达出局中人同时进行博弈的情况。

信息集•处理方法：用一个扁椭圆形的虚线的圈，把所论局中人的若干决策节点罩起来，成为他的一个信息集，并约定如下的理解：所论局中人只知道博弈是否进行到了他的这个信息集，但是在他知道博弈已经进行到他的这个信息集的情况下。

他不知道博弈究竟进行到这个信息集中的哪个决策节点。

注意•一个信息集罩住的必须首先是同一个局中人的决策节点。

•一个信息集罩住的必须是同一个局中人在同一个时点的决策节点。

•给予不被扁椭圆虚线罩住的每个决策节点以信息集的地位，是单点集的信息集。

•每一个决策位置都是一个信息集。

•在同一个信息集上，大自然、老天爷或者虚拟局中人必须给位于该信息集内的每个决策节点规定相同的行动选择集合。

（数量，内容均相同）•当博弈走到一个单点集的信息集时，面临决策的局中人对于博弈迄今的历史是清楚的，他清楚博弈具体走到了他的这个决策节点而不是别的决策节点。

但是当博弈走到一个非单点集的信息集时，面临决策的局中人对于博弈迄今的历史是不清楚的，他不清楚博弃具体走到了他的这个信息集里面的哪个决策节点。

西方经济学微观部分第十章博弈论初步

策略1 策略2
b p 1 ( b 1 1 b 1 ) 2 ( 1 p 1 )b 2 ( 1 b 2 )2
b11
策
参 p1 略
A的p1 条件010,1混合aaa策 000略为与人A p：2 策略12
a11 b21
a21
b12 a12
b22 a22
[习题] 博弈论初步
[习题] 博弈论初步
p1
单击添加副标题
第十章博弈论初步
西方经济学 (微观部分)
*自嘲* 一介学究，惶惶似狗。东拼西凑，闲来插柳。或存疏漏，等着挨揍。钱财无有，知识半斗。交流携手，相逢美酒。余望何求？潮起云收。
第十章博弈论初步目录
目录 /CONTENTS
1
第一节 ○
博弈论和
○
策略行为
2
第二节
3
0 q10.7 1 p10.5 7
1
9– 8–
2
第三节混合策略均衡二、混合策略的纳什均衡
第三节混合策略均衡
二混合策略的纳什均衡
❖ 即使纯策略的纳什均衡不存在，相应的混合策
略纳什均衡总会存在。
❖ 纯策略纳什均衡作为 ·q1 1 特例被包括在混合策略纳什均衡之中。 0.7·
❖ 混合策略博弈的均衡
[案例] “华容道”里的纳什
均衡(1)
小道
孔明
大路
[案例]“华容道”里的纳什均衡(1)
[案例] “华容道”里的纳什均衡(1)
曹操小道大路
被擒
逃脱
擒住逃脱
空等被擒
空等
擒住
❖ 孔明曰：“亮夜观乾象，操贼未合身亡。留这人情，教云长做了，亦是美事。” 玄德曰：“先生神算，世所罕及！”

Chapter06序贯博弈和同时博弈的结合

Chapter06序贯博弈和同时博弈的结合序贯博弈和同时博弈的结合Combining Sequential and Simultaneous Moves第6章Chapter 6序贯博弈和同时博弈的结合Combining Sequential and Simultaneous Moves博弈类型Game Type概念Concepts分析技术Techniques of Analysis博弈树(扩展形式) Game Trees (Extensive form)收益表(策略形式) Payoff tables (Strategic form) 纯粹序贯博弈反转均衡Purely Sequential- Rollback move games equilibrium纯粹同时博弈Purely Simultaneousmove games纳什均衡Nash equilibriumSlide 2序贯博弈和同时博弈的结合Combining Sequential and Simultaneous Moves在现实中，许多策略环境包含了这两种相互作用的成分。

In reality, many strategic situations contain elements of both types of interaction.而且，我们还可以使用扩展形式或策略形式分析任何一种博弈(可以交叉使用)。

Also, we can use either extensive form or strategic form for any type of game.Slide 3内容提要Outline兼具同时和序贯行动的博弈Games with both simultaneous and sequential moves改变博弈中的行动顺序Changing the order of moves in a game !改变分析方法Change in the method of analysis *三人博弈Three-player gamesSlide 4 兼具同时和序贯行动的博弈Games with Both Simultaneous and Sequential Moves典型的例子一般都是博弈者在一段比较长的时间内相互作用。

3(2)同时博弈与序贯博弈

也即πi(ti, tj, hi,ei, hj, ej)=
[a-(hi+ej)]hi -chi +

企业i在市场的最优化问题就可拆为一对问题，在每个市场分别求解

企业的收益为其利润πi： [a-(hj+ei)]ei-cei-tjei
πi(ti, tj, hi,ei, hj, ej)=
[a-(hi+ej)]hi -chi +

企业的收益为其利润πi：
+ [a-(hj+ei)]ei-c(hi+ei)-tjei
πi(ti, tj, hi,ei, hj, ej)= [a-(hi+ej)]hi
ei*必须满足：maxei[a-(ei+hj*)-c]-tjei ei≧0

企业的收益为其利润πi：
+ [a-(hj+ei)]ei-c(hi+ei)-tjei
企业i在市场的最优
化问题就可拆为一对问题，在每个市场分别求解

企业的收益为其利润πi：
πi(ti, tj, hi,ei, hj, ej)= [a-(hi+ej)]hi -chi + [a-(hj+ei)]ei-cei-tjei

hi*须满足： max hi[a-(hi+ej*)-c], hi ≧ 0
银行挤兑(1)
王则柯“银行挤兑的成因和预防”
对客户来说，抽回存款的日期也有两种：一是在银行投资两客户在同一银行各存有100元，银行将项目到期之前，称日期 1；一是在到期之后，称日期2。这200元投资于一个长期项目。如果在项
假定如果两客户在日期 1要求抽回资金则各得70元；如果只目到期前银行要抽回资金，则只能收回有一个客户在日期1要抽回资金则该客户得100元，另一客 140元；但如果到期后再收回投资，则可户只能得到剩余的 40元。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第五章同时博弈与序贯博弈
目录
•5-1 正规型表示与展开型表示–树型表示转化为矩阵表示
–矩阵表示转化为树型表示：信息集•5-2 同时决策与序贯决策的混合博弈•5-3 树型博弈的子博弈
•5-4 子博弈精炼纳什均衡
•5-6 连续支付情形的序贯博弈
5-1 正规型表示与展开型表示•1.树型表示转化为矩阵表示
•“进入者”只有一个决策节点，他有两个纯策略可以选择：进入和不进入。

•“垄断者”有四个可能的纯策略：
–{容忍，容忍}、{对抗，对抗}、{对抗，容忍}、{容忍，对抗}。

•把首先行动的局中人放在行局中人的位置，后行动的局中人放在列局中人的位置。

•垄断者有不止一个纯策略可以导致相同的博弈结果。

•2.矩阵表示转化为树型表示
•问题：树型如何能够表达出局中人同时进行博弈的情况。

信息集
•处理方法：用一个扁椭圆形的虚线的圈，把所论局中人的若干决策节点罩起来，成为他的一个信息集，并约定如下的理解：所论局中人只知道博弈是否进行到了他的这个信息集，但是在他知道博弈已经进行到他的这个信息集的情况下。

他不知道博弈究竟进行到这个信息集中的哪个决策节点。

注意
•一个信息集罩住的必须首先是同一个局中人的决策节点。

•一个信息集罩住的必须是同一个局中人在同一个时点的决策节点。

•给予不被扁椭圆虚线罩住的每个决策节点以信息集的地位，是单点集的信息集。

•每一个决策位置都是一个信息集。

•在同一个信息集上，大自然、老天爷或者虚拟局中人必须给位于该信息集内的每个决策节点规定相同的行动选择集合。

（数量，内容均相同）
•当博弈走到一个单点集的信息集时，面临决策的局中人对于博弈迄今的历史是清楚的，他清楚博弈具体走到了他的这个决策节点而不是别的决策节点。

完美和不完美
•历史，也是一种信息。

历史清楚的博弈，叫做完美信息的博弈，历史不清楚的博弈，叫做不完美信息的博弈。

•非单点集的信息集的作用，在于说明所论局中人在决策时面对不完美信息的局面，即他不能根据自己现有的信息对位于信息集内的决策节点进行区分，他不知道自己现在究竟位于这个信息集的哪个决策节点上。

定义
•定义：如果一个序贯博弈的每个信息集都是一个单点集，那么么该序贯博弈就是完美信息博弈。

否则，它就是不完美信息博弈。

•同集同注
例子
•女方不清楚男方“先前做出”
的策略选择。

女方必须要么
在两个决策节点上都选择足
球，要么在两个决策节点上
都选择芭蕾，她不能在一个
决策节点上选择足球，而在
另一个决策节点上选择芭蕾。

•女方的选择也可以放在博弈树的初始决策节点上，这时候男方的两个决策节点就位于同一个信息集内。

此时，男方受到的限制是，他必须在位于信息集内的两个决策节点上作出相同的策略选择。

5-2 同时决策与序贯决策的混合博弈•混合博弈：包含同时决策行动和序贯决策行动的博弈。

例子
•假定有两家计算机公司，彼此就新产品的研发展开博弈竞争。

博弈持续的时间为一年。

•在这一年里，这两家公司为能在市场上推出新产品而需要各自私下确定对研发的投入。

•假设两家公司致力推出的新产品类型相同，并且双方都知道对方要这样做，但他们都没有向公众公布他们的研发预算。

•了解对手研发投入决策的唯一方法，是通过在产业年度交易展上观察其产品的性能来推断最终产品的情况。

•在交易展上观察到对手的新产品后。

双方必须分别对各自的新产品定价。

•假定公司的研发投入只有低预算和高预算两种选择。

低预算的结果是新产品只是旧产品的部分改良，而高预算的结果则是推出一个完全不同于旧产品而且质量高很多的全新产品。

低预算策略用“小”或者“小投人”表示，高预算策略用“大”或者“大投入”表示。

•假定方正和联想在看到对手的新产品后的唯一决策问题就是对自己的新产品进行定价，定价只有“高”和“低”两种选择。

•两阶段同时博弈的序贯结构
研发预算和定价博弈的矩阵型表述
•研发预算和定价博
弈的展开表述•每家公司各有32个
纯策略；共有64个纯策略。

•结果只有16个。

5-3 树型博弈的子博弈
支和棱
•一个支可以包含许多条棱。

支必须包含从它的每个决策节点往后直到末端节点的所有棱。

子博弈
•定义：在一个n人展开型博弈T中，满足如下3个条的一个博弈S称为博弈T的一个子博弈：
1.S的博弈树是T的博弈树的一支；
2.博弈S不能分割博弈T的信息集．具体来说，只要博
弈T的某个情息集的任何一个决策节点是博弈S的一
个决策节点，那么T的这个信息集的每一个决策节点
都必须是博弈S决策节点；
3.博弈S的末端节点处的支付向量，与博弈T在这些末
端节点的支付向量的有关部分重合。

z母博弈
•子博弈的根前断开标示法
注意
•任何博弈树必须从一个初始决策节点（根）开始，那么，子博弈的根必须组成母博弈的单点信息集。

•子博弈的信息集和不包含在它这个支内的母博弈的信息集不相交。

一共有几个子博弈？
5-4 子博弈精炼纳什均衡•策略组合的粗线表示法和纳什均衡的虚线排除确定法可知，8个策略组合，有3个是纳什均衡。

•哪个均衡是最有可能发生的并且具有最好稳定性的结果？
子博弈精炼纳什均衡
•定义(泽尔滕)：在一个博弈的所有作为纳什均衡的策略组合当中，那些局限在每个子博弈上都仍然是那个子博弈的纳什均衡的策略组合，叫做子博弈精炼纳什均衡。

•子博弈精练纳什均衡本身也是纳什均衡，但却是比纳什均衡更强的均衡概念。

•利用博弈树考察一个纳什均衡的时，只要局限于某一个子博弈上它不再是纳什均衡，所考察的纳什均衡就不是子博弈精炼纳什均衡。

•(足球，{足球，足球})对局虽然是博弈的纳什均衡，但不是博弈的子博弈精炼纳什均衡，因为局限在根前断开的那支子树所标示的子博弈上，指向(-1，-1)的策略选择有单独偏离的激励，用弯曲箭头表示箭尾的策略成分有向箭头的方向偏离的激励（偏离方向的箭头标示法）。

•如果一个策略组合的某个策略成分有偏离的激励，可以说这个策略组合缺乏局部稳定性。

•子博弈精炼纳什均衡，应该是经得起每个子博弈均衡检验的纳什均衡
•包含不可信威胁的纳什均衡，不是子博弈精炼的纳什均衡。

•这个策略组合，无论从全局看还是从每个局部看，都符合稳定性的要求，符合最优性的要求。

所以，序贯情侣博弈的(足球，{足球，芭蕾})对局，是博弈的子博弈精炼的纳什均衡。

5-5 完美博弈的库恩定理•是否每个树型表示的动态博弈都有纳什均衡呢?
•库恩定理完美信息的有限序贯博弈(sequential game of perfect information)都有纳什均衡。

课堂练习
•用策略组合的粗线表示法和纳什均衡的虚线排除法画出并讨论全部可能的对局或者策略组合，以虚线标示不是纳什均衡的那些对局。

•用虚线圈住的子博弈和相应的标示具有偏离激励策略的箭头，排除那些不是子博弈精炼均衡的纳什均衡，得到子博弈精炼的纳什均衡。

5-6 连续支付情形的序贯博弈•斯坦克尔伯格模型
–与古诺竞争模型一样，斯坦克尔伯格寡头竞争模型也是同质产品的产量竞争模型。

–与古诺模型所不同的是，斯坦克尔伯格模型是一个序贯决策模型，博弈的其中一方具有较强的实力，称之为企业1；而另一方的实力相对
较弱，称之为企业2。

–博弈首先由实力比较强的企业1选择自己的产
量，实力比较弱的企业2在观察到企业1所作出的产量决策后，再确定自己的产量水平。

是一个两阶段的序贯决策博弈。

•用（）表示企业1的产量选择；•用（
）表示企业2在观测到后所选择的产量；•用表示当市场总产量为时的市场出清价格，其中•企业的利润是
•每个企业的利润可写为：
1q 01≥q 2q 02≥q 1q q A q p −=)(q 21q q q +=i 2,1)],)([),(21=−=i c q p q q q i i i π)(),(2121i i i c q q A q q q −−−=π。