博弈论第四章 完全且完美信息动态博弈

合集下载

经济博弈论3——完全且完美信息动态博弈

经济博弈论3——完全且完美信息动态博弈
第三章 完全且完美信息动态博弈
本章讨论动态博弈(Dynamic Games),所 有博弈方都对博弈过程和得益完全了解的完全 且完美信息动态博弈。这类博弈也是现实中常 见的基本博弈类型。由于动态博弈中博弈方的 选择、行为有先后次序,因此在表示方法、利 益关系、分析方法和均衡概念等方面,都与静 态博弈有很大区别。本章对动态博弈的概念和 分析方法,特别是子博弈完美均衡和逆推归纳 法作系统介绍,并介绍各种经典的动态博弈模 型。


逆推归纳法事实上就是把多阶段动态博弈化为一系列的 单人博弈,通过对一系列单人博弈的分析,确定各博弈 方在各自选择阶段的选择,最终对动态博弈结果,包括 博弈的路径和各博弈方的得益作出判断,归纳各个博弈 方各阶段的选择则可得到各个博弈方在整个动态博弈中 的策略。 由于逆推归纳法确定的各个博弈方在各阶段的选择,都 是建立在后续阶段各个博弈方理性选择基础上的,因此 自然排除了包含不可信的威胁或承诺的可能性,因此它 得出的结论是比较可靠的,确定的各个博弈方的策略组 合是有稳定性的。




最上方的圆圈表示乙的选择信息集 或称选择节点(node)。 如果乙选择“不借”则博弈结束, 他能保住1万元本钱而甲得不到开矿 的利润;如乙选择“借”则到达甲 的选择信息集,轮到甲进行选择。 三个终端黑点处的数组,表示由各 博弈方各阶段行为依次构成的,到 达这些终端的“路径”所实现的各 博弈方得益。 乙决策的关键是要判断甲的许诺是 否可信。


结论:在一个由都有私心、都更重视自身利益的成员 组成的社会中,完善公正的法律制度不但能保障社会 的公平,而且还能提高社会经济活动的效率,是实现 最有效率的社会分工合作的重要保障。

但是要充分保障社会公平和经济活动的效率,法律制 度必须要满足两方面的要求:一是对人们正当权益的 保护力度足够大;二是对侵害他人利益者有足够的威 慑作用。否则,法律制度的作用就是很有限的甚至完 全无效。

动态博弈

动态博弈

“战术勾结”
寡头之间的“不回避竞争法则”,是指至 少有几个寡头厂商保证(通常以做广告的 方式)自己的索价不高于其他任何竞争者。 这样的许诺对于消费者来说似乎是件很好 的事,但事实上这样的做法会提高价格。
寡占的斯塔克博格(stackberg)模型—— 动态的寡头市场产量博弈模型
u1=q1P(Q)-c1q1 =q1[8-(q1+q2)]-2q1 =6q1- q1q2-q12
最后,实施上述策略组合的最终结果,即 路径终端处得益数组中的数字。
可信性和纳什均衡问题
相机选择和策略中的可信性问题 动态博弈中博弈方的策略并没有强制力,
而且实施起来有一个过程,只要符合博弈 方自己的利益,他们完全可以在博弈过程 中改变计划。我们称这种问题为动态博弈 中的“相机选择”(Contingent Play)。
逆推归纳法(backwards induction)
逻辑基础:动态博弈中先行动的理性的博弈方, 在前面阶段选择行为时必然会考虑后行为博弈 方在后面阶段中将会怎样选择行动,只有在博 弈的最后一个阶段不再有后续阶段牵制的博弈 方,才能做出明确的选择。而当后面阶段博弈 方的选择确定以后,前一阶段博弈方的行为也 就容易确定了。
q2应满足: 6-q1-2 q2 = 0 q2 =3-q1/2
厂商1 知道厂商2的这种决策思路,因此在选择产量水平 q直1时接就将知上道式厂代商入2自的己产的量得q2益*会函根数据,上这式样确厂定商,1的所得以益他函可数以 实际上转化成了他自己产量的一元函数:
u1(q1,q2*) = 6q1-q1q2*-q12 = 6q1-q1(3-q1/2)-q12 = 3q1-0.5q12
乙讨价还价的筹码就是可以跟甲托时间
(当然拖延对乙的收益也有影响),拖延

博弈论原理 第4讲 完全但不完美信息动态博弈

博弈论原理  第4讲 完全但不完美信息动态博弈

要求2
给定各博弈方的“判断”,他们的策略必须是“序列理性”的。即在 各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续策略 ”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的得益 或期望得益最大。此处“后续策略”即相应的博弈方在所讨论信息集 以后的阶段中,针对所有可能情况如何行为的完整计划。
好 1
卖 2 买 不买 买 卖
1
差 1
不卖 0 ,0 不卖 0 ,0
不买
2,1 0,0 1,-1 -1,0
4.1.2 不完美信息动态博弈的表示
二手车问题的多节点信息集:
好 1 差
工商管理学院
School .Busi Admin
1
卖 2 买 2 ,1 不买 买 不买
1 卖
不卖 0 ,0 不卖 0 ,0
好 1
卖 2 不买 买 卖
1
差 1
不卖 0 ,0 不卖 0 ,0

不买
2,1 0,0 1,-1 -1,0
工商管理学院
School .Busi Admin
有了这些信息或判断,买方或卖 方就能对自己获利的机会、损失 风险的大小程度心中有数,从而 作出正确的判断和选择。 在这个博弈中双方决策需要的信 息或判断与双方的选择有关,两 个博弈方的选择、信息和判断之 间形成了一种复杂的交互决定关 系。
工商管理学院
School .Busi Admin
子博弈完美 纳什均衡
在完全且完美信息动态博弈中,满足子博弈完美纳什均衡。其 中引入子博弈、可信性概念,由此才可保证在一定的条件下解 的存在性。对动态而言这种均衡策略组合必须有一定的可信性 加以保证(确保其为均衡,某种最优性)。理想的均衡必须能
够排除任何不可信的威胁和诺言。

完全且完美信息动态博弈共94页

完全且完美信息动态博弈共94页
心灵的最软弱无力。——斯宾诺莎 7、自知之明是最难得的知识。——西班牙 8、勇气通往天堂,怯懦通往地狱。——塞内加 9、有时候读书是一种巧妙地避开思考的方法。——赫尔普斯 10、阅读一切好书如同和过去最杰出的人谈话。——笛卡儿
Thank you
完全且完美信息动态博弈
16、自己选择的路、跪着也要把它走 完。 17、一般情况下)不想三年以后的事, 只想现 在的事 。现在 有成就 ,以后 才能更 辉煌。
18、敢于向黑暗宣战的人,心里必须 充满光 明。 19、学习的关键--重复。
20、懦弱的人只会裹足不前,莽撞的 人只能 引为烧 身,只 有真正 勇敢的 人才能 所向披 靡。

完全且完美信息动态博弈下ppt课件

完全且完美信息动态博弈下ppt课件
different nodes in the game tree that he
knows might be the actual node,but
between which he cannot distinguish by direct observation.每一个信息集是决策结集 合的一个子集,该子集包括所有满足下列条 件的决策结。(1)每一个决策结都是同一参 与人的决策结。(2)该参与人知道博弈进入 该集合的某个决策结,但不知道自己究竟处 于哪一个决策结。
博弈参与方?
博弈的战略:
开发商A的战略就是:开发与不开发
关键是开发商B的战略:是指参与人的相机行动规则 (该自己行动的时候,应该如何选择,行事的原则、策 略、方案等),以及知道些什么。
在战略式表述博弈,参与人似乎是在博弈开始之前就制 定了一个完全的相机行动计划,即 “如果……发生,我 将选择…………”
根据分析, (不开发,开发)是不可信的。 显然用战略式描述和分析动态博弈过于复杂. 使用纳什均衡的概念分析动态博弈是不恰当的,它无法排除
不可信的威胁。 纳什均衡在动态博弈中不是一个非常合理的预测。泽尔腾
(Selten)的“子博弈精练纳什均衡”是纳什均衡概念的一 个最重要的改进,它的目的是把动态博弈中的“合理纳什均 衡”与“不合理纳什均衡”分开。
第三章
完全且完美信息动态博弈
1
本次课程的任务
上次课程我们已经深入理解了“Credible threats or promises about future behavior can influence current behavior” 的经济内涵.
本次课程我们要进一步思考,为什么对于动态 博弈而言承诺是否可信非常重要?

完全且完美信息动态博弈a

完全且完美信息动态博弈a

第三章 完全且完美信息动态博弈
完全-得益 完美-过程 动态-先后 请考虑以下问题:
第三章 完全且完美信息动态博弈
Catalogue
可信性问题
O1
有同时选择的两阶段动态博弈
子博弈逆推归纳法
单击添加文本
O2
O3
O4
3.1 可信性问题(信息经济学_道德风险问题)
在动态博弈中,由于过程十分重要,类似于对未来过程的了解,它本身依赖于其它博弈方的行为。那么就存在一个对其博弈方所可能采取策略的可信性问题。 可信性:动态博弈中先行为的博弈方是否应该相信后行为博弈方会采取某种策略或行为。 后行为博弈方将来采取对先行为博弈方有利的行为为“许诺”,采取对先行方不利的行为为“威胁”。
(1,0)

不借

不分
(2,2)
(1,0)
开金矿(信守)-逆推第一步


不借
(2,2)
(1,0)
开金矿(信守)-逆推第二步
3.2.2 逆推归纳法
3.2.2 逆推归纳法-分金币
案例:5个海盗抢到了100颗宝石,每一颗都一样的大小和价值连城。他们决定这么分:1.抽签决定自己的号码(1,2,3,4,5)2.首先,由1号提出分配方案,然后大家5人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔进大海喂鲨鱼。3.如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。4.以次类推…… 条件:每个海盗都是很聪明的人,都能很理智的判断得失,从而做出选择 问题:第一个海盗提出怎样的分配方案才能够使自己的收益最大化
1
2

不进

博弈论的几个经典模型

博弈论的几个经典模型
博弈论的几博弈论及其应用, 科学出版社,2008年2月
• 潘天群著,博弈生存(第二版),中央编 译出版社,2004年10月
• 王春永编著,博弈论的诡计,中国发展出 版社,2007年1月
博弈论的几个经典模型
基本术语
• 博弈论研究的对象:是理性的行动者或参与 者如何选择策略或如何作出行动的决定。理 性的人是对现实的人的基本假定,即假定参 与者努力用自己的推理能力使自己的目标最 大化。“理性的”与“道德的”不是一回事, 理性的与道德的有时会发生冲突,但是理性 的人不一定是不道德的。
合作互动是指既存在协调又存在冲突的博弈协调是因为两个参与同时改变行动可以变得更好冲突是因为尽管其他参与人承诺行动也不一定有利于该参与人支付的增加前者可能引起无效率后者则意意味着无效率状态会成为均衡博弈论的几个经典模型猎鹿类型协调博弈由策略不确定性所引起的均衡结果依赖于参与人之间的行为预期博弈支付与策略风险
小猪
大猪

不按(等待)

(5,1)
(5,3)
不按(等待)
(9,-1)
(0,0)
大猪和小猪分别该如何选择。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
选择等待是小猪的占优策略。
大猪的最佳选择取决于小猪的行动,如果小猪 去按,大猪最好选择等待;如果小猪不去按, 则最佳选择是大猪亲自去按。
也就是说,在智猪博弈中,大猪没有占优策略, 而小猪有占优策略,它的最佳选择就是耐心 等待大猪去按钮,才能获得最佳结果。
• 不完全信息博弈:参与者所做的是努力使自 己的期望支付或期望效用最大化。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
例:猪圈里有两只猪,一只比较大,一只比较 小。猪圈狭长,猪食槽在一头,猪食按钮在 另一头,按一下会有10个单位的猪食落进槽 里。由于按钮和食槽距离较远,按按钮的体 力耗费相当于2个单位的食物。

完全信息动态博弈 经典例子

完全信息动态博弈 经典例子

完全信息动态博弈经典例子完全信息动态博弈是博弈论中的一个重要概念,指的是博弈参与者在做决策时拥有完全的信息。

下面是符合要求的10个完全信息动态博弈的经典例子:1. 拍卖场景:假设有两个竞拍者参与一场拍卖,他们都知道对方的出价和拍卖物品的价值,他们需要根据对方的出价和自己对拍卖物品价值的估计来决定自己的出价。

2. 囚徒困境:两名囚犯被关押在不同的牢房中,检察官给他们一个选择,如果他们都保持沉默,那么都只会被判轻罪;如果其中一个人供出另一个人,供出者会被判轻罪,而另一个人则会被判重罪;如果两人都供出对方,那么都会被判重罪。

囚犯在做出决策时,都知道对方的选择和可能的后果。

3. 企业竞争:两家竞争对手企业同时决定是否要进入一个新市场。

如果只有一家企业进入市场,它将获得垄断地位,赢得较高的利润;如果两家企业都进入市场,将会有激烈的竞争,利润都会下降。

两家企业在做出决策时,了解对方的行动和可能的后果。

4. 汽车悖论:假设有两辆车同时行驶在一条单行道上,它们需要决定是否要超车。

如果只有一辆车超车,它将获得更快的到达目的地的时间;如果两辆车同时超车,将会导致交通堵塞,两辆车的到达时间都会延长。

两辆车在做出决策时,了解对方的行动和可能的后果。

5. 资源分配:假设有两个人需要共同分配一笔资源,他们都知道对方对资源的需求和自己对资源的评估。

他们需要根据对方的需求和自己的评估来决定如何分配资源。

6. 股票交易:假设有两个投资者同时决定是否要买入或卖出某只股票。

他们都知道对方的交易意向和市场的情况,他们需要根据对方的交易意向和市场情况来决定自己的交易策略。

7. 网络安全攻防:假设有两个黑客分别掌握了对方的攻击技术和防御技术。

他们需要根据对方的技术和自己的技术来决定如何进行攻击或防御。

8. 购物决策:假设有两个消费者同时决定是否要购买某个商品。

他们都知道对方的购买意向和商品的价格,他们需要根据对方的购买意向和商品的价格来决定自己的购买策略。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一 博弈扩展式表述
(一)博弈的标准式(或战略式、正则式或 策略式)
女 足球 足球 男 芭蕾 0,0 1,2 2,1 芭蕾 0,0
博弈的标准式(战略式)
开发商B 开发 不开发
开发 不开发 需求小的情况 开发 不开发
4000,4000 0,8000 8000,0 0,0
需求大的情况 开发商A
开发商B

王 P175
什么是“支”?
找出房地产开发博弈的子博弈
A
开发
不开发
B
开发
x
不开发
B
开发
x’
不开发
(-3,-3)
(1,0) (0,1) 房地产开发博弈
(0,0)
A
开发
不开发
x
不开发
开发 开发
x’
B
开发
x
不开发
B
开发
x’
(-3,-3)
(1,0)
(0,1)
(0,0) (-3,-3)
子博弈I
子博弈II
2. 无循环。重要的是在博弈运行中,我们不要 陷入僵局;树枝循原路折回并造成一个循环一定 是不可接受的。


3. 单方向前进。重要的是,对于博弈如何进行 下去不能模棱两可,因此,必定不存在二个或多 个枝导向同一个结。
为保证这三条性质,在前结点上强加下述限 制: 1.结点不能是自身的前结点。 2.前结点的前结点也是前结点:如果结点是 的前结点,依次结点是的前结点,那么也是 的前结点。 3 .前结点可以排序:如果 和 都是 的前结点, 必定是或者是的前结点,或者反过来。 4.必定存在一个共同的前结点:考虑任意两个 结,和,它们之间没有一个是另一个的前结 点。那么,必定存在一个结点 ,它是 和 双 方的前结点。
动态博弈的 战略
动态博弈的战略的表述

战略:参与人在给定信息集的情况下选择行动的规则,它规定参 与人在什么情况下选择什么行动,是参与人的“相机行动方案”。
si 表示第i个参与人的特定战略
Si si 代表第i个参与人所有可选择的 战略集合 如果n个参与人每人选择一个 战略, n维向量s (s1,s2, ,si, ,sn)称为一个战略组合 si 表示第i个人选择的战略
开发
-3000,-3000 0,1000
不开发
1000,0 0,0
开发商A
(二)博弈扩展式表述
博弈的扩展式表述包括四个要素: 参与人集合(Player) 每个参与人的战略集合(Strategy) 博弈的顺序(Order) 由战略组合决定的每个参与人的支付(Payoff)
扩展式表示的一个例子
在静态博弈中,战略和行动是相同的。
作为一种行动规则,战略必须是完备的。
Battle of Sexes if Boy moves first

足球 芭蕾

芭蕾
x
足球

芭蕾
x
足球
(0,0)
(2,1) (1,2)
(0,0)
Battle of Sexes if Boy moves first
男的策略:{足球,芭蕾}
的确,如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人, 他的告状威胁是不可置信的。

完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965)

考虑下列问题: 一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合 理? 纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其 他参与人的战略是给定的,但是如果参与人的行动有先有后,后 行动者的选择空间依赖于前行动者的选择,前行动者在选择时不 可能不考虑自己的行动对后行动者的影响。 子博弈完美纳什均衡的一个重要改进是将“合理纳什均衡”与 “不合理纳什均衡”分开。
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ) ( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
Of 8 strategy combination, 3 are Nash
B S
B S B S
B S
B S B S
B S
B S B S
Three Nash equilibria of Battle of Sexes are:


二、子博弈精炼纳什均衡(或子 博弈完美纳什均衡)

一个纳什均衡称为精炼纳什均衡,当只当参与人 的战略在每个子博弈中都构成纳什均衡,也就是 说,组成完美纳什均衡的战略必须在每一个子博 弈中都是最优的。 一个精炼纳什均衡首先必须是一个纳什均衡,但 纳什均衡不一定是精炼纳什均衡。 承诺行动-当事人使自己的威胁战略变得可置信的 行动。
完全且完美信息动态博弈的主要特点
(1)行动是顺序发生的, (2)下一步行动选择之前,所有以前的行动都
可以被观察到,
(3)每个可能的行动组合下局中人的收益是共
同知识。
第三章 完全且完美信息动态博弈

一 博弈扩展式表述 二 子博弈完美纳什均衡 三、用逆向归纳法求-子博弈完美 纳什均衡

四、完全且完美信息的动态博弈 的案例
N

A
开发
不开发
N

1/2


1/2
1/2
1/2
B
不开发 开发
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8)
(0,0)
(0,1)
(0,0)
房地产开发博弈
Battle of Sexes again if Boy moves first
Girl Ballet Ballet Boy Soccer Soccer Soccer Ballet ( 1, 2) ( -1, -1) ( 0, 0)
(1,0) (0,8)
(0,0)
(0,1)
(0,0)
房地产开发博弈
支付
横向扩展式举例:
进入
进入者
在位者
合作(40,50) 斗争(-10,0)
不进入(0,300)
市场进入阻挠博弈树
扩展型
为了让“树”描绘博弈,其结点和枝需要满足三 条性质:

1.单一的出发点。重要的是知道博弈从何处开 始,所以必须有一个,也只能有一个出发点。
( B, { B, B }),
???
在8个图里找纳什均衡
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ) ( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ) ( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ) ( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ) ( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
(1,0) (0,1)
(0,0)
子博弈Ⅲ
动态博弈中的子博弈

虚线框出的部分正是博 弈方 2 在 博弈方 1 选择 进时所面临的决策问题, 它本身构成博弈方 2 的 一个单人博弈,我们称 它为原先来后到博弈的 一个“子博弈”。
Game and subgames(子博弈未标完)
子博弈定义
由一个动态博弈第一阶段以外的某个阶段 开始的后续博弈阶段构成,它必须有初 始信息集,具备进行博弈所需要的各种 信息,能够自成一个博弈的原博弈的一 部分,称为原动态博弈的一个“子博 弈”。
第四章 完全且完美信息动态博弈
本章讨论动态博弈,所有博弈方都对博弈过程和 得益完全了解的完全且完美信息动态博弈。这类博弈 也是现实中常见的基本博弈类型。由于动态博弈中博 弈方的选择、行为有先后次序,因此在表示方法、利 益关系、分析方法和均衡概念等方面,都与静态博弈 有很大区别。本章对动态博弈分析的概念和方法,特 别是子博弈完美均衡和逆推归纳法作系统介绍,并介 绍各种经典的动态博弈模型。


子博弈完美纳什均衡

泽尔腾引入子博弈完美纳什均衡的概念的目的是将那 些不可置信威胁战略的纳什均衡从均衡中剔除,从而 给出动态博弈的一个合理的预测结果,简单说,子博 弈完美纳什均衡要求均衡战略的行为规则在每一个信 息集上是最优的。 什么是子博弈,什么是子博弈完美纳什均衡? 有没有更好的方法找到子博弈完美纳什均衡?

子博弈不好找!!! 学完后面的信息集请看P177
信息集
• 为了扩展式表述也可用来表述静态博弈,我们 使用虚线圈。如:
情爱博弈的扩展式表述

足球

芭蕾
足球 芭蕾

芭蕾
x
足球

芭蕾
x’

芭蕾
x
足球

芭蕾
x’
(1,2)
(-1,-1)(0,0)
(2,1)
(1,2)
(-1,-1)(0,0)
(2,1)
不同的纳什均衡可以对应相同的结果

一个动态博弈可能有多个(甚至无穷多个)纳 什均衡,究竟哪个更合理?
子博弈完美纳什均衡-不可置信威胁

美国普林斯顿大学古尔教授在1997年的《经济学透视》里发表文章,提出一个例子说明威胁的可信性问题:

两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具。 不耐烦的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我 告状,我都把你们两个关起来,关起来比没有玩具更可怕。 现在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说: 快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告诉爸 爸,我是要倒霉的,可是你不告状不过没有玩具玩,而告了状却 要被关禁闭,告状会使你的境遇变得更坏,所以你不会告状,因 此哥哥对弟弟的警告置之不理。
相关文档
最新文档