第五章 不完美信息博弈
合集下载
第5讲-不完全信息动态博弈

第5讲 不完全信息动态博弈
1.基本思路
• 在不完全信息动态博弈(dynamic game of incomplete information)中,“自然”首先选择 参与人的类型,参与人自己知道,其他参与人不 知道;在自然选择之后,参与人开始行动,参与 人的行动有先有后,后行动者能观测到先行动者 的行动,但不能观测到先行动者的类型。
第5讲 不完全信息动态博弈
不一样的。假定存在一个价格P*,只有低成本企业 才有利可图,而高成本企业司不敢模仿这个价格 的。 • 那么,精炼贝叶斯均衡是,低成本在位者选择P*, 高成本企业选择一个较高的垄断价格。如果进入 者观察到在位者选择了P*,这就推断其为低成本, 不进入;否则,就认为在位者是高成本,进入。 • 这就是由米尔格罗姆和罗伯茨于1982年提出的著 名的“垄断限价模型”。
马上认为这个人一定是好人,除非这件好事非常非常地好,因为否 则的话,坏人总是有积极性干件好事以使我们认为他是一个好人)。 当然,如果我们认为坏人干好事并不仅仅是为了假装好人,我们对 他的看法就不会改变,因为,根据贝叶斯法则:
第5讲 不完全信息动态博弈
ProbBP GT p*1 =1
q*0 P*1 这里,p>0是坏人干好事的概率,q>0好人干好事的概率。 从上面例子可以看到,我们如何改变对一个人的看法不仅依赖于我们 认为他是好人或坏人的先验概率,而且依赖于我们如何“认为”好人 干好事和坏人干好事的条件概率。
• 但是,因为参与人的行动是类型依存的,每个参 与人的行动都传递着有关自己类型的某种信息, 后行动者可以通过观察先行动者所选择的行动来
第5讲 不完全信息动态博弈
推断其类型或修正对其类型的先验信念(概率分 布),然后选择自己的最优行动。先行动者预测 到自己的行动将被后行动者所利用,就会设法选 择传递对自己最有利的信息,避免传递对自己不 利的信息。 • 因此,博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。
1.基本思路
• 在不完全信息动态博弈(dynamic game of incomplete information)中,“自然”首先选择 参与人的类型,参与人自己知道,其他参与人不 知道;在自然选择之后,参与人开始行动,参与 人的行动有先有后,后行动者能观测到先行动者 的行动,但不能观测到先行动者的类型。
第5讲 不完全信息动态博弈
不一样的。假定存在一个价格P*,只有低成本企业 才有利可图,而高成本企业司不敢模仿这个价格 的。 • 那么,精炼贝叶斯均衡是,低成本在位者选择P*, 高成本企业选择一个较高的垄断价格。如果进入 者观察到在位者选择了P*,这就推断其为低成本, 不进入;否则,就认为在位者是高成本,进入。 • 这就是由米尔格罗姆和罗伯茨于1982年提出的著 名的“垄断限价模型”。
马上认为这个人一定是好人,除非这件好事非常非常地好,因为否 则的话,坏人总是有积极性干件好事以使我们认为他是一个好人)。 当然,如果我们认为坏人干好事并不仅仅是为了假装好人,我们对 他的看法就不会改变,因为,根据贝叶斯法则:
第5讲 不完全信息动态博弈
ProbBP GT p*1 =1
q*0 P*1 这里,p>0是坏人干好事的概率,q>0好人干好事的概率。 从上面例子可以看到,我们如何改变对一个人的看法不仅依赖于我们 认为他是好人或坏人的先验概率,而且依赖于我们如何“认为”好人 干好事和坏人干好事的条件概率。
• 但是,因为参与人的行动是类型依存的,每个参 与人的行动都传递着有关自己类型的某种信息, 后行动者可以通过观察先行动者所选择的行动来
第5讲 不完全信息动态博弈
推断其类型或修正对其类型的先验信念(概率分 布),然后选择自己的最优行动。先行动者预测 到自己的行动将被后行动者所利用,就会设法选 择传递对自己最有利的信息,避免传递对自己不 利的信息。 • 因此,博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。
第五章 不完全信息静态博弈

不完全信息的古诺模型 5
不完全信息的古诺模型 6
三、静态贝叶斯博弈的战略式表述
参与人的类型
要准确地表示静态贝叶斯博弈,关键的问题是反映这种博弈中各参与 人虽然清楚自己的支付函数,却无法确定其他参与人支付函数这一特征。 解决这个问题的前提和基本思路:某些参与人虽然不能确定其他 参与人在一定策略组合下的支付,但至少知道其他参与人的支付有哪 几种可能的结果,而哪种可能的结果会出现则取决于其他参与人属于 哪种“类型”。 定义:一个参与人自己清楚而他人无法完全清楚的私人内部消息、有 关情况或数据等(所有个人信息),即所有不是共同知识的信息称为参 与人的类型。 上述方法实际上是将博弈中某些参与人对其他参与人支付的不了 解,转化成为对这些参与人“类型”的不了解,是一种“追根溯源 ”的思想方法。
与人不知道其他参与人的支付或支付函数。
暗标拍卖 注:不完全信息并不是完全没有信息,实际上不完全信息的博弈方至 少必须有关于其他博弈方支付分布的可能范围和分布概率的知识,否则 博弈方的决策选择就会完全失去依据,我们的博弈分析也就无意义了。
1. 不完全信息博弈例子:市场进入博弈
潜在进入企业(参与人1) 决定是否进入一个新的产业, 但不知道在位企业(参与人2) 的成本函数,不知道在位者 决定默许还是斗争。假设在 位者的成本有两种可能的成 本函数:高成本或低成本(称 为类型)。
四、海萨尼转换 2
海萨尼(Harsanyi,1967-1968)提出了一种在前述将对支付的不了解
转化为对类型的思路的基础上,进一步将不完全信息静态博弈转化为完全 但不完美信息动态博弈进行分析的思路,被称为海萨尼转换。
之后,
四、海萨尼转换 3
N
在位者 1 p 高成本 低成本
不完全信息博弈

(0.6)
不建厂
2,1
3 ,0
不完全信息静态下市场进入的博弈树
进入E 高建厂成本 [0.4] 建 (0,-1)
不进入D (2,0) E (2,1)
N○
[0.6]
1
低建厂成本
不建
建 不建
2
D
E
(3,0) (1,-1) (4,0) (1)
D E
D
(3,0)
不完全信息静态市场进入模型 --求解思路
不妨假设:
企业1的单位成本c1是共同信息,企业2的单位成本
c2 是其私人信息,它有高成本 c2H 和低成本 c2L两种情 形,设低成本的概率为p,它是双方的共同知识。
• 给定企业 2 知道企业 1 的成本时,企业 2 将最大化其利
润函数:
π2=q2(a-c2-q1-q2),
其中c2=c2H或c2L依赖于企业2的实际成本。 由此可得企业2的反应函数为: q2*(q1, c2)=(a-c2-q1)/2 它不但依赖于企业1的产量q1,而且依赖于自己的成本 c2。分别记q2L、q2H为企业2在低成本和高成本下的最 优反应产量,分别为:
不完全信息静态市场进入模型 --期望收益
• 在位者有两个信息集:高成本类型和低成本类型, 因而有4种纯策略;潜在进入者只有进入不进入两 种纯策略。 • 海萨尼转换后,支付矩阵变为: 潜在进入者 进入 不进入 0.6,-1 3.2,0 1.2,0.2 2.6,0 1.4,-0.2 3.6,0 2,1 3,0
图示——完全信息情形
q2
q1*(q2) 1/2 1/6 1/4 5/12
在完全信息情形下,满足以上条件时, 若企业2为低成本时,纳什均衡产量为 q1*=1/4,q2L*=1/2。 若企业2为高成本时,则企业1和2的纳 什均衡产量分别为5/12和1/6。 完全信息时的纳什均衡
博弈论 第 五 章 不 完 全 信 息

不捐款 1,1-c2
例 拍卖 考虑一次价格密封标价拍卖,两个标价者,记作 i=1,2,对于拍卖的货物,每个标价者i有自己的 估价vi,如果他以价格p获得货物,那么他将获益 vi-p ,现假设v1,v2均是来自[0,1]上均匀分布的独立随 机变量,则可建立博弈模型:
⑴行动空间——参与人i的行动是递送一个(非 负)标价bi,bi∈[0,+∞)。 ⑵类型空洵——参与人i的类型是他对货物的 估价vi,类型空间为Ti=[0,1]。 ⑶信念——估价是独立的, 参与人都相信vi均 匀地分布在[0,1]上 vi-bi 如果bi>bj ⑷ 得益函数ui(b1,b2,v1,v2)= (vi-bi)/2 如果bi=bj
cj cj 2 (vi bi )(bi a j ) bi (a j vi )bi vi a j 期望得益为: cj cj
这时 利用一阶条件,易知I的最佳反应为bi=(vi+ai)/2, 由于bi必须大于aj,因此若vi<aj的话,必须至少 取bi=aj,明确地用公式:
bi (vi ) vi a j 2 , vi a j ; a j , vi a j
第五章 不完全信ห้องสมุดไป่ตู้静态博弈
完全信息博弈的主要特点是“参与人的得益 (或支付)是 “共同知识”(理想模式)。 如果至少有一个参与人不知道(或不确定)其他 参与人的得益函数,信息便成为不完全的。这 类博弈又称为Bayes博弈。
5.1 静 态Bayes 博 弈 和Bayes Nash 均 衡 5.1.1 静态Bayes博弈的例子 例 假定某行业有一个在位者(参与人1)和-个 潜在的进入者(参与人2),1决定是否要建一个 新工厂,2决定是否进入该行业。假定2不知道 1建厂的成本是3还是1,但1自己知道。
@第5章 不完全信息静态博弈

(三)贝叶斯纳什均衡定义
在静态贝叶斯博弈G { A1 ,, An ; T1 ,, Tn ; p1 ,, pn ; u1 ,, un } 中, 博弈方i的一个策略,就是自己各种可能类型ti (ti Ti )的一个 函数Si (ti )。Si (ti )设定对于“自然”可能为博弈方i抽取的各种 类型ti,博弈方i将从自己的行为空间Ai中相应选择的行动a i 。
不完全信息博弈又叫贝叶斯博弈
一、贝叶斯博弈与纳什均衡 二、贝叶斯博弈与混合策略均衡 三、拍卖理论 四、机制设计理论及显示原理
一 、 贝 叶 斯 博 弈 与 纳 什 均 衡
146
(一)静态贝叶斯博弈及其表示
• 完全信息静态博弈的一般表达式:
G {S1 ,, S n ; u1 ,, un }
二 、 贝 叶 斯 博 弈 与 混 合 策 略 均 衡 154
海萨尼(1973):完全信息情况下 的混合策略均衡可以解释为不完全 信息情况下的纯策略均衡的极限。
抓 抓 不抓
不抓
-41,-41 0,100
100,0 0,0
三 、 拍 卖 理 论
157
拍 卖 的 类 型
英式拍卖
收益等价定理: 在一些合理的 荷式拍卖 约束条件保证 下,四种拍卖 第一价格拍卖 形式最终的收 第二价格拍卖 益是相等的!
七个和尚分粥的故事 方案五:无论谁分粥,先分的人后领
结果:每个和尚轮流值日分粥, 但是分粥的那个和尚要最后一个 领粥。令人惊奇的是,七只碗里 的粥每次都是一样多。 启示:一个好的制度不是不让人 自利,而是要形成一个内在的制 约机制,利用人的利己之心引导 他做利于社会之事。
四 、 机 制 设 计 理 论 及 显 示 原 理
5 不完全信息静态博弈

第5章
不完全信息静态博弈
[贝叶斯博弈]
1. 贝叶斯博弈简介
• 在第2章中,我们学习了关于完全信息静 态博弈,以及如何求解其纳什均衡。
• 在完全信息博弈中,局中人了解每个人 的特征(type).
• 然而,在很多情况下,博弈参加者并不 了解其对手的特征。
•
例如:
1. 谈判双方不了解彼此对于谈判目标的 评价。 2. 企业可能不知道竞争对手的成本函数。
• Jerry选择 (D,P)时, Michelle选择 D 的期望收益为2p。
如果 p>1/3, 那么, Michelle 选择 D, Jerry 选择 (D,P)是贝叶斯纳什均衡的。
• 所有博弈都可以被划分为完全信息或不 完全信息博弈。
• 不完全信息博弈: 至少一个局中人不知道 其他人的“类型”。
不完美信息 vs.不完全信息博弈
• 在不完美信息博弈中,局中人不知道其 他局中人所选择的行动。但是,知道他 们的类型。
• 也可以说, 在不完全信息博弈中,正在进 行的博弈状况不是“共同知识”。
但是, 局中人1不知道局中人2处于哪种状 态,他认为处于两种状态的概率各为1/2, 这是他的信念(belief)。
• 接下来,求解博弈均衡的核心理念是, 给定对方的选择,以及关于对方行动的 信念,自己做出的选择是最优的。
• 局中人1不知道局中人2的类型,所以, 要作出理性的选择,他需要形成关于对 方各个行动的信念。
• 给定这些信念,他就可以计算自己各种 行动的期望收益。
• 例如,局中人1了解到,当他选择B时, 如果局中人2愿意与自己在一起,会选择 B, 如果不愿意与自己在一起则选择S。
• 那么局中人选择B的期望收益为: ½ ·2 + ½ ·0 = 1
不完全信息静态博弈
[贝叶斯博弈]
1. 贝叶斯博弈简介
• 在第2章中,我们学习了关于完全信息静 态博弈,以及如何求解其纳什均衡。
• 在完全信息博弈中,局中人了解每个人 的特征(type).
• 然而,在很多情况下,博弈参加者并不 了解其对手的特征。
•
例如:
1. 谈判双方不了解彼此对于谈判目标的 评价。 2. 企业可能不知道竞争对手的成本函数。
• Jerry选择 (D,P)时, Michelle选择 D 的期望收益为2p。
如果 p>1/3, 那么, Michelle 选择 D, Jerry 选择 (D,P)是贝叶斯纳什均衡的。
• 所有博弈都可以被划分为完全信息或不 完全信息博弈。
• 不完全信息博弈: 至少一个局中人不知道 其他人的“类型”。
不完美信息 vs.不完全信息博弈
• 在不完美信息博弈中,局中人不知道其 他局中人所选择的行动。但是,知道他 们的类型。
• 也可以说, 在不完全信息博弈中,正在进 行的博弈状况不是“共同知识”。
但是, 局中人1不知道局中人2处于哪种状 态,他认为处于两种状态的概率各为1/2, 这是他的信念(belief)。
• 接下来,求解博弈均衡的核心理念是, 给定对方的选择,以及关于对方行动的 信念,自己做出的选择是最优的。
• 局中人1不知道局中人2的类型,所以, 要作出理性的选择,他需要形成关于对 方各个行动的信念。
• 给定这些信念,他就可以计算自己各种 行动的期望收益。
• 例如,局中人1了解到,当他选择B时, 如果局中人2愿意与自己在一起,会选择 B, 如果不愿意与自己在一起则选择S。
• 那么局中人选择B的期望收益为: ½ ·2 + ½ ·0 = 1
不完全信息博弈分析
静态博弈
指参与者在同一时间内做出选择的博弈。
静态博弈的策略分析
纯策略
01
指参与者在博弈中采取的单一策略,每个参与者都有若干个纯
策略可供选择。
混合策略
02
指参与者以一定的概率分布随机选择不同的策略,以最大化预
期收益。
优势策略
03
指不论其他参与者选择何种策略,该参与者选择的策略总是最
优的策略。
静态博弈的均衡分析
要点二
详细描述
在囚徒困境中,两个囚犯因为被隔离审讯而无法沟通,每 个囚犯都有坦白和不坦白两种选择。如果双方都不坦白, 则都无罪释放;如果一方坦白而另一方不坦白,则坦白的 一方会被释放而另一方会被判刑;如果双方都坦白,则都 会被判刑。因为无法信任对方,所以每个囚犯都选择了坦 白,最终导致双方都不利的结果。
纳什均衡
指在给定其他参与者策略的情况 下,每个参与者都选择最优策略, 此时所有参与者的策略组合构成 纳什均衡。
优势策略均衡
指在给定其他参与者策略的情况 下,每个参与者都有优势策略可 供选择,此时所有参与者的策略 组合构成优势策略均衡。
风险优势均衡
指在给定其他参与者策略的情况 下,每个参与者选择风险优势最 大的策略,此时所有参与者的策 略组合构成风险优势均衡。
序贯均衡
在给定自己类型和他人的类型概率分布的情况下,每个参 与人在每个决策节点上选择最优策略,使得期望效用最大 化。
PART 03
不完全信息静态博弈
静态博弈的基本概念
博弈
指参与者在给定信息的情况下,根据各自的策略 进行选择,并最终获得收益的过程。
不完全信息
指参与者在博弈中无法完全掌握其他参与者的信 息,如其他参与者的类型、偏好等。
指参与者在同一时间内做出选择的博弈。
静态博弈的策略分析
纯策略
01
指参与者在博弈中采取的单一策略,每个参与者都有若干个纯
策略可供选择。
混合策略
02
指参与者以一定的概率分布随机选择不同的策略,以最大化预
期收益。
优势策略
03
指不论其他参与者选择何种策略,该参与者选择的策略总是最
优的策略。
静态博弈的均衡分析
要点二
详细描述
在囚徒困境中,两个囚犯因为被隔离审讯而无法沟通,每 个囚犯都有坦白和不坦白两种选择。如果双方都不坦白, 则都无罪释放;如果一方坦白而另一方不坦白,则坦白的 一方会被释放而另一方会被判刑;如果双方都坦白,则都 会被判刑。因为无法信任对方,所以每个囚犯都选择了坦 白,最终导致双方都不利的结果。
纳什均衡
指在给定其他参与者策略的情况 下,每个参与者都选择最优策略, 此时所有参与者的策略组合构成 纳什均衡。
优势策略均衡
指在给定其他参与者策略的情况 下,每个参与者都有优势策略可 供选择,此时所有参与者的策略 组合构成优势策略均衡。
风险优势均衡
指在给定其他参与者策略的情况 下,每个参与者选择风险优势最 大的策略,此时所有参与者的策 略组合构成风险优势均衡。
序贯均衡
在给定自己类型和他人的类型概率分布的情况下,每个参 与人在每个决策节点上选择最优策略,使得期望效用最大 化。
PART 03
不完全信息静态博弈
静态博弈的基本概念
博弈
指参与者在给定信息的情况下,根据各自的策略 进行选择,并最终获得收益的过程。
不完全信息
指参与者在博弈中无法完全掌握其他参与者的信 息,如其他参与者的类型、偏好等。
第五章-不完全信息动态博弈2全篇
理论定价 现实定价
最优垄断价格 MR=MC p实<p垄
✓这一现象的一个老的解释是:若价格等于垄断价格,其他企 业看到有利可图,就会进入;相反,若价格低一些,其他企 业看到进入无利可图,就不会进入,垄断企业就可以继续保 持其垄断地位。 ✓结论:价格作为一种承诺是不可置信的,因为不论垄断者现 在索取什么价格,一旦其他企业进入,垄断者就会改变价格, 因此,靠低价格是不可能阻止进入的。 ✓米尔格罗姆和罗伯茨(1982)提出的解释是,垄断限价可能 反映了这样一个事实,即其他企业不知道垄断者的生产成本, 垄断者试图用低价格来告诉其他企业自己是低成本,进入是 无利可图的。
p( 1)
p( 1) 0 p( 2 )
1
p( 1 | m2 )
p(m2
p(m2 | 1) p( 1) | 1) p( 1) p(m2 | 2 ) p( 2 )
(1 ) p( 1) (1 ) p( 1) 1 p( 2)
(1 ) p(1) (1 ) p(1) (1 ) p( 2 )
7
1、分离均衡(separating equilibrium)
✓分离均衡(separating equilibrium):不同类型的发送者(参 与人1)以1的概率选择不同的信号,或者说,没有任何类型选择 与其他类型相同的信号。 ✓假定K(类型数)=J(信号数)=2,则分离均衡(SE)意味着: 若m1是类型θ1的最优选择,m1就不可能是θ2的最优选择,并且, m2一定是类型θ2的最优选择。即:
p( 1)
p( 2 | m2 )
1 p( 2 )
1 p( 2 ) p( 2 )
(1 ) p( 1) 1 p( 2 ) p( 1) p( 2 )
(见到m2信号, 2的后验概率将大于先验概率)
最优垄断价格 MR=MC p实<p垄
✓这一现象的一个老的解释是:若价格等于垄断价格,其他企 业看到有利可图,就会进入;相反,若价格低一些,其他企 业看到进入无利可图,就不会进入,垄断企业就可以继续保 持其垄断地位。 ✓结论:价格作为一种承诺是不可置信的,因为不论垄断者现 在索取什么价格,一旦其他企业进入,垄断者就会改变价格, 因此,靠低价格是不可能阻止进入的。 ✓米尔格罗姆和罗伯茨(1982)提出的解释是,垄断限价可能 反映了这样一个事实,即其他企业不知道垄断者的生产成本, 垄断者试图用低价格来告诉其他企业自己是低成本,进入是 无利可图的。
p( 1)
p( 1) 0 p( 2 )
1
p( 1 | m2 )
p(m2
p(m2 | 1) p( 1) | 1) p( 1) p(m2 | 2 ) p( 2 )
(1 ) p( 1) (1 ) p( 1) 1 p( 2)
(1 ) p(1) (1 ) p(1) (1 ) p( 2 )
7
1、分离均衡(separating equilibrium)
✓分离均衡(separating equilibrium):不同类型的发送者(参 与人1)以1的概率选择不同的信号,或者说,没有任何类型选择 与其他类型相同的信号。 ✓假定K(类型数)=J(信号数)=2,则分离均衡(SE)意味着: 若m1是类型θ1的最优选择,m1就不可能是θ2的最优选择,并且, m2一定是类型θ2的最优选择。即:
p( 1)
p( 2 | m2 )
1 p( 2 )
1 p( 2 ) p( 2 )
(1 ) p( 1) 1 p( 2 ) p( 1) p( 2 )
(见到m2信号, 2的后验概率将大于先验概率)
博弈论-不完全信息静态博弈
从而V(b)=2b,或b=v/2
竞价者的最优战略是以自己保留价格的一 半作为叫价。
2021/4/9
24
一级密封价格拍卖(四)
如果有n人参与竞标,则b=(n-1)v/n,即b 随n的增加而增加,特别地,当n时, bv,就是说,投标人越多,卖者能得到 的价格就越高;当投标人趋于无穷时,卖 者几乎得到买者价值的全部。因此,让更 多的人加入竞标是卖者的利益所在。
不完全信息博弈
在生活中我们也会碰到这样的问题,比 如一个乞丐向你乞讨,你愿意帮助别人, 但不知道他是真的乞丐还是骗子,该如 何决定呢?如果你喜欢与人为善,你可 能愿意冒一点上当的危险,这不等于你 愚蠢,而是你认为,帮助一个困境中的 人比回绝一个骗子更重要。
2021/4/9
36
不完全信息博弈
❖ 不完全信息:每一个参与人对所有其他参与人 的(对手)的特征、战略空间及支付函数有准 确的 知识,否则为不完全信息。
不求爱 0,0
0,0
2021/4/9
33
市场需求信 息是不完全的。
不完全信息博弈
需求大的情况
开发商B 开发 不开发
开发商A
开发 4000,4000 不开发 0,8000
8000,0 0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
2021/4/9
32
不完全信息博弈
被求爱者对于
求爱者的品德的 信息是不完全的。
你 接受 不接受
求爱博弈:
求爱 100,100 -50,0
品德优良者求爱 求爱者 不求爱 0,0
0,0
100x+(-100)(1-x)=0
讲义6-不完全信息动态博弈.讲义
管理博弈论
(Management Game Theory)
第六讲 不完全信息动态博弈 主讲人:张成科 博士 广东工业大学经济与贸易学院
zhangck@
第五章 不完全信息动态博弈精练贝叶斯纳什均衡
一 精练贝叶斯纳什均衡
基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡
基本思路图示
在不完全信息动态博弈中,由于信息不完全,故子博弈的概念不能精确细致 地描述动态博弈中的各个阶段,从而就不能剔除那些包含“不合理信念”的 Nash均衡。但是其推理逻辑可用,即“新均衡”不仅在整个博弈上构成Bayes 均衡,而且从每一个信息集开始的“后续博弈”上也构成Bayes均衡。但还不 能剔除“总是认为先验概率不变”这样的不合理行为。而实际上,参与人都 是依据他们的观测信息对自己的先验概率进行修正的-------这需要用精练Bayes 均衡。 给定别人的战略,自己的战略是最优的,即没人愿独自偏离 Nash均衡 在完全信息动态博弈中无法剔除不可置信威胁战略 子博弈精练Nash均衡 不仅是整个博弈的Nash均衡,而且是每个子博弈的 Nash均衡
修正之后的判断称为“后验概率”
贝叶斯法则就是人们根据新的信息从先验概率 得到后验概率的基本方法。
贝叶斯法则
以不完全信息博弈为例说明贝叶斯法则:假定 参与人的类型是独立分布的,参与人i有K个类 型,有H个可能的行动,θk和ah分别代表一个特 定的类型和一个特定的行动。 如果我们观察到i选择了ah,我们要问i属于θk的 后验概率是多少?
二 信号传递博弈及其应用举例
三 博弈论概念简要总结
不完全信息动态博弈引例
(Management Game Theory)
第六讲 不完全信息动态博弈 主讲人:张成科 博士 广东工业大学经济与贸易学院
zhangck@
第五章 不完全信息动态博弈精练贝叶斯纳什均衡
一 精练贝叶斯纳什均衡
基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡
基本思路图示
在不完全信息动态博弈中,由于信息不完全,故子博弈的概念不能精确细致 地描述动态博弈中的各个阶段,从而就不能剔除那些包含“不合理信念”的 Nash均衡。但是其推理逻辑可用,即“新均衡”不仅在整个博弈上构成Bayes 均衡,而且从每一个信息集开始的“后续博弈”上也构成Bayes均衡。但还不 能剔除“总是认为先验概率不变”这样的不合理行为。而实际上,参与人都 是依据他们的观测信息对自己的先验概率进行修正的-------这需要用精练Bayes 均衡。 给定别人的战略,自己的战略是最优的,即没人愿独自偏离 Nash均衡 在完全信息动态博弈中无法剔除不可置信威胁战略 子博弈精练Nash均衡 不仅是整个博弈的Nash均衡,而且是每个子博弈的 Nash均衡
修正之后的判断称为“后验概率”
贝叶斯法则就是人们根据新的信息从先验概率 得到后验概率的基本方法。
贝叶斯法则
以不完全信息博弈为例说明贝叶斯法则:假定 参与人的类型是独立分布的,参与人i有K个类 型,有H个可能的行动,θk和ah分别代表一个特 定的类型和一个特定的行动。 如果我们观察到i选择了ah,我们要问i属于θk的 后验概率是多少?
二 信号传递博弈及其应用举例
三 博弈论概念简要总结
不完全信息动态博弈引例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章 完全但不完美信息动态博弈
本章开始介绍信息不充分、不对称、的博弈分析, 本章介绍的是不完美的动态博弈。对信息不充分、 不对称情况下博弈问题的研究,也是研究信息价值 的有效方法,是信息经济学的核心内容。信息不充 分、不对称会使人们决策选择的难度增加,对博弈 的结果和效率产生影响,也使博弈分析的难度增加。 本章将主要以二手车交易模型为核心,介绍不完美 信息动态博弈的完美贝叶斯均衡分析方法。
• 卖方在车好时要高价,车差时要低价 • 买方买下卖方出售车 • 买方的判断是
p( g | h) 1, p(b | h) 0 p( g | l ) 0, p(b | l ) 1
其他均衡:
• 市场部分成功
C Ph
pg (v Ph ) pb (w Ph ) 0
• 市场完全失败
模
型
好
1
低价
差
1
高价
1
高价 低价
2
买 不买 买 不买
2
(P ,V P ) h h
P P Pl (0,0) (0,0) ( P , VP h h ) (0,0) (Pl ,V l) (0,0) ( l ,W )
6.4.2 模型的均衡
市场完全成功的完美贝叶斯均衡 条件: 均衡策略组合和判断:C Ph
三方三阶段不完全信息动态博弈
1
F B
2
L(p) R(1-p)
(2,0,0)
3
U
D
U
D
(1,2,1) (3,3,3,)
(0,1,2) (0,1,1)
6.3 单一价格二手车模型
6.3.1 单一价格二手车交易博弈模型 6.3.2 均衡的类型 6.3.3 模型的纯策完美贝叶斯均衡 6.3.4 模型的混合策略完美贝叶斯均衡
合并均衡 分开均衡
混成均衡
6.3.3 模型的纯策略完美贝叶斯均衡
1、市场部分成功的合并均衡
• 卖方选择卖,不管车子好差 • 买方选择买,只要卖方卖 • 买方的判断是
p( g | s) pg , p(b | s) pb
条件:差车概率很小 买到差车损失不大 P C 伪装费用较小
2、市场完成成功的分开均衡
什么是“均衡路径上的信息集”?
在均衡路径上的信息集:如果博弈按照均衡 策略进行,则该信息集会以正的概率达到。 不在均衡路径上的信息集:博弈按均衡策略 进行时绝对不可能达到,或者达到的概率为0。
1
L(p)
R 1) D (0,0,) U (0,0) D (0,1)
• 因为原博弈本身不会成为 原博弈的后续阶段,因此 子博弈不能从原博弈的第 一个节点开始,即原博弈 不是自己的子博弈 • 包含所有在初始节点和终 点,但不包含不跟在此初 始节点之后的节点 • 不分割任何的信息集。
Ll
1
R
L
R
2
L
2
R
3
L
R
L
R
6.2 完美贝叶斯均衡
6.2.1 完美贝叶斯均衡定义 6.2.2 均衡要求的初步解释 6.2.3 关于判断形成的进一步解释
1、均衡策略组合:“玩家1第一 阶段L,玩家2第二阶段U” 均衡路径上判断:p=1 2、均衡策略组合:“玩家1第一 阶段R,玩家2第二阶段D” 不存在与该策略组合一致的 不在均衡路径上判断,因此该 策略组合不可能构成完美贝叶 斯均衡。
6.2.3 关于判断形成的进一步解释
二手车交易为例
好
1
差
1 不卖
6.2.1 完美贝叶斯均衡定义
• 在不完美信息动态博弈中纳什均衡和子博弈完 美纳什均衡都不能解决问题,需要引进新的均 衡概念 • 纳什均衡和子博弈完美纳什均衡分析方法,反 应函数和逆推归纳法等同样也要改进、变化
一个策略组合和相应的判断满足下列4个要求,称 为一个“完美贝叶斯均衡”:
要求1:在各个信息集,轮到选择的玩家必须具有一个关于博 弈达到该信息集中每个节点可能性的“判断”。 对非单节点信息集,一个“判断”就是博弈达到该信 息集中各个节点可能性的概率分布,对单节点信息集,则可 理解为“判断达到该节点的概率为1” 要求2:给定各玩家的“判断”, 他们的策略必须是“序列 理性”的。 即在各个信息集,给定轮到选择玩家的判断和其他玩 家的“后续策略”,该玩家的行为及以后阶段的“后续策 略”,必须使自己的收益或期望收益最大。 此处所谓“后续策略”即相应的玩家在所讨论信息集 以后的阶段中,针对所有可能情况如何行为的完整计划
市场类型归纳
Pg (V P) P b (W P)
市场 部分 成功 市场 完全 成功
0
市场接 近失败 或 完全失败
P
市场 完全 成功
C
单一价格二手车交易的解
6.4 双价二手车交易
6.4.1 双价二手车交易博弈模型 6.4.1 模型的均衡
6.4.1 双价二手车交易博弈模型
• • • • • 价格不变——价格可变 两种价格、离散价格、连续价格 价格透露的信息 市场的分化、发育,高端、低端市场的形成 本模型可以揭示市场发展和演变的 一些过程和规律,以 及建立市场秩序的条件和方法等。
卖 卖
1
不卖
2
买 不买 买 不买
p( g ) p( s | g ) p( g | s) p( s) p( g ) p( s | g ) p( g ) p( s | g ) p(b) p( s | b)
二手车交易扩展形
具体例子:
车况好差:好车差车各占一半 双方策略:好车一定卖,差车有一半概率卖出时选择卖 p( s | g ) 1
p( s b) 0.5 p( g ) p(b) 0.5
0.5 1 2 p( g ) p( s | g ) p( g ) p( s | g ) p( g | s) p( s) p( g ) p( s | g ) p(b) p( s | b)0.5 1 0.5 0.5 3
市场完全成功的完美贝叶斯均衡
策略和判断: • 卖方在车好时要高价,车 差时要低价 • 买方在卖方要高价、要低 价时都买 • 买方的判断是
条件:
或
Ph W V 0
Ph W V Pl
p( g | h) 1, p(b | h) 0 p( g | l ) 0, p(b | l ) 1
C 0
pg (v Ph ) pb (w Ph ) 0
• 市场接近失败
柠檬原理和逆向选择
• 允许价格变化 • 消费者支付价格低于期望价值 • 平均(期望)价值以上商品退出,市场上商品质 量越来越差 • 消费者愿意支付的价格越来越低 柠檬原理和逆向选择是信息不完全导致的,对 市场效率都是不利的。
完美贝叶斯均衡
要求3:在均衡路径上的信息集处,“判断” 由贝叶斯法则和各玩家的均衡策略决定 要求4:在不处于均衡路径上的信息集处, “判断”由贝叶斯法则和各玩家在此处可 能有的均衡策略决定
6.2.2 均衡要求的初步解释
1、判断的必要性 2、序列理性要求——实质是利益最大化要求 3、判断与策略的一致性:符合策略和BAYES法则 (包括均衡路径和非均衡路径上)
6.3.1 单一价格二手车交易博弈模型
基本假设:
Pc V P W
卖 好
1
不卖
差
1
1
卖 不卖 (0,0) (0,0)
2
买
不买
买
不买 (-C, 0)
(P, V-P) (0, 0) (P-C, W-P)
单一价格二手车交易
6.3.2 均衡类型
• 市场完全失败:市场上所有的卖方,无论商 品好坏,都选择不卖 • 市场完全成功:质量好的商品的卖方将商品 投放市场,质量差的商品的卖方不敢将商品 投放市场 • 市场部分成功:所有的卖方,无论商品好坏, 都将商品投放市场,而买方也不管好坏商品 都买进 • 市场接近失败:所有好商品的卖方都将商品 投放市场,而只有部分“差”商品的卖方将 商品投放市场,同时买方以一定的概率随机 决定是否买进
本章分五节 6.1不完美信息动态博弈 6.2完美贝叶斯均衡 6.3单一价格二手车模型 6.4双价二手车交易 6.5有退款保证的双价二手车交易
6.1 不完美信息动态博弈
6.1.1 概念和例子 6.1.2 不完美信息动态博弈的表示 6.1.3 不完美信息动态博弈的子博弈
6.1.1 概念和例子
• 完美信息:博弈中后面阶段的玩家有关于前面阶段博弈进 程的充分信息 • 完美信息动态博弈:动态博弈中的所有玩家都有完美信息 的博弈 • 完全信息:各玩家对博弈结束时每个玩家的收益是完全清 楚的 • 不完美信息动态博弈的基本特征之一是玩家之间在信息方 面是不对称的,如二手车市场
一、条件:
PC
W P
二、市场接近失败的数字例子:
假设:V 3000 ,W 0, P 2000 , C 1000 pg pb 0.5 均衡: 卖方在车好时选卖,车差时以0.5概率随机选 择卖或不卖 买方以0.5概率随机选择买或不买 2 1 买方的判断为 p ( g | s ) , p (b | s ) 3 3
• 卖方在车好时卖,车差时不卖 • 买方选买,只要卖方卖 • 买方的判断为
p( g | s) 1, p(b | s) 0
条件:
PC
3、市场完全失败的合并均衡
• 卖方选择不卖 • 买方选择不买 • 买方的判断为:
p( g | s) 0, p(b | s) 1
条件:
W P
6.3.4 模型的混合策略完美贝叶斯均衡
6.5 有退款保证的双价二手车交易
原理:用退款 保证提高C ,或者说卖 方的收益。 设 C 0 赔偿 V W
买
好
1
低价
差
1
高价
1
高价
本章开始介绍信息不充分、不对称、的博弈分析, 本章介绍的是不完美的动态博弈。对信息不充分、 不对称情况下博弈问题的研究,也是研究信息价值 的有效方法,是信息经济学的核心内容。信息不充 分、不对称会使人们决策选择的难度增加,对博弈 的结果和效率产生影响,也使博弈分析的难度增加。 本章将主要以二手车交易模型为核心,介绍不完美 信息动态博弈的完美贝叶斯均衡分析方法。
• 卖方在车好时要高价,车差时要低价 • 买方买下卖方出售车 • 买方的判断是
p( g | h) 1, p(b | h) 0 p( g | l ) 0, p(b | l ) 1
其他均衡:
• 市场部分成功
C Ph
pg (v Ph ) pb (w Ph ) 0
• 市场完全失败
模
型
好
1
低价
差
1
高价
1
高价 低价
2
买 不买 买 不买
2
(P ,V P ) h h
P P Pl (0,0) (0,0) ( P , VP h h ) (0,0) (Pl ,V l) (0,0) ( l ,W )
6.4.2 模型的均衡
市场完全成功的完美贝叶斯均衡 条件: 均衡策略组合和判断:C Ph
三方三阶段不完全信息动态博弈
1
F B
2
L(p) R(1-p)
(2,0,0)
3
U
D
U
D
(1,2,1) (3,3,3,)
(0,1,2) (0,1,1)
6.3 单一价格二手车模型
6.3.1 单一价格二手车交易博弈模型 6.3.2 均衡的类型 6.3.3 模型的纯策完美贝叶斯均衡 6.3.4 模型的混合策略完美贝叶斯均衡
合并均衡 分开均衡
混成均衡
6.3.3 模型的纯策略完美贝叶斯均衡
1、市场部分成功的合并均衡
• 卖方选择卖,不管车子好差 • 买方选择买,只要卖方卖 • 买方的判断是
p( g | s) pg , p(b | s) pb
条件:差车概率很小 买到差车损失不大 P C 伪装费用较小
2、市场完成成功的分开均衡
什么是“均衡路径上的信息集”?
在均衡路径上的信息集:如果博弈按照均衡 策略进行,则该信息集会以正的概率达到。 不在均衡路径上的信息集:博弈按均衡策略 进行时绝对不可能达到,或者达到的概率为0。
1
L(p)
R 1) D (0,0,) U (0,0) D (0,1)
• 因为原博弈本身不会成为 原博弈的后续阶段,因此 子博弈不能从原博弈的第 一个节点开始,即原博弈 不是自己的子博弈 • 包含所有在初始节点和终 点,但不包含不跟在此初 始节点之后的节点 • 不分割任何的信息集。
Ll
1
R
L
R
2
L
2
R
3
L
R
L
R
6.2 完美贝叶斯均衡
6.2.1 完美贝叶斯均衡定义 6.2.2 均衡要求的初步解释 6.2.3 关于判断形成的进一步解释
1、均衡策略组合:“玩家1第一 阶段L,玩家2第二阶段U” 均衡路径上判断:p=1 2、均衡策略组合:“玩家1第一 阶段R,玩家2第二阶段D” 不存在与该策略组合一致的 不在均衡路径上判断,因此该 策略组合不可能构成完美贝叶 斯均衡。
6.2.3 关于判断形成的进一步解释
二手车交易为例
好
1
差
1 不卖
6.2.1 完美贝叶斯均衡定义
• 在不完美信息动态博弈中纳什均衡和子博弈完 美纳什均衡都不能解决问题,需要引进新的均 衡概念 • 纳什均衡和子博弈完美纳什均衡分析方法,反 应函数和逆推归纳法等同样也要改进、变化
一个策略组合和相应的判断满足下列4个要求,称 为一个“完美贝叶斯均衡”:
要求1:在各个信息集,轮到选择的玩家必须具有一个关于博 弈达到该信息集中每个节点可能性的“判断”。 对非单节点信息集,一个“判断”就是博弈达到该信 息集中各个节点可能性的概率分布,对单节点信息集,则可 理解为“判断达到该节点的概率为1” 要求2:给定各玩家的“判断”, 他们的策略必须是“序列 理性”的。 即在各个信息集,给定轮到选择玩家的判断和其他玩 家的“后续策略”,该玩家的行为及以后阶段的“后续策 略”,必须使自己的收益或期望收益最大。 此处所谓“后续策略”即相应的玩家在所讨论信息集 以后的阶段中,针对所有可能情况如何行为的完整计划
市场类型归纳
Pg (V P) P b (W P)
市场 部分 成功 市场 完全 成功
0
市场接 近失败 或 完全失败
P
市场 完全 成功
C
单一价格二手车交易的解
6.4 双价二手车交易
6.4.1 双价二手车交易博弈模型 6.4.1 模型的均衡
6.4.1 双价二手车交易博弈模型
• • • • • 价格不变——价格可变 两种价格、离散价格、连续价格 价格透露的信息 市场的分化、发育,高端、低端市场的形成 本模型可以揭示市场发展和演变的 一些过程和规律,以 及建立市场秩序的条件和方法等。
卖 卖
1
不卖
2
买 不买 买 不买
p( g ) p( s | g ) p( g | s) p( s) p( g ) p( s | g ) p( g ) p( s | g ) p(b) p( s | b)
二手车交易扩展形
具体例子:
车况好差:好车差车各占一半 双方策略:好车一定卖,差车有一半概率卖出时选择卖 p( s | g ) 1
p( s b) 0.5 p( g ) p(b) 0.5
0.5 1 2 p( g ) p( s | g ) p( g ) p( s | g ) p( g | s) p( s) p( g ) p( s | g ) p(b) p( s | b)0.5 1 0.5 0.5 3
市场完全成功的完美贝叶斯均衡
策略和判断: • 卖方在车好时要高价,车 差时要低价 • 买方在卖方要高价、要低 价时都买 • 买方的判断是
条件:
或
Ph W V 0
Ph W V Pl
p( g | h) 1, p(b | h) 0 p( g | l ) 0, p(b | l ) 1
C 0
pg (v Ph ) pb (w Ph ) 0
• 市场接近失败
柠檬原理和逆向选择
• 允许价格变化 • 消费者支付价格低于期望价值 • 平均(期望)价值以上商品退出,市场上商品质 量越来越差 • 消费者愿意支付的价格越来越低 柠檬原理和逆向选择是信息不完全导致的,对 市场效率都是不利的。
完美贝叶斯均衡
要求3:在均衡路径上的信息集处,“判断” 由贝叶斯法则和各玩家的均衡策略决定 要求4:在不处于均衡路径上的信息集处, “判断”由贝叶斯法则和各玩家在此处可 能有的均衡策略决定
6.2.2 均衡要求的初步解释
1、判断的必要性 2、序列理性要求——实质是利益最大化要求 3、判断与策略的一致性:符合策略和BAYES法则 (包括均衡路径和非均衡路径上)
6.3.1 单一价格二手车交易博弈模型
基本假设:
Pc V P W
卖 好
1
不卖
差
1
1
卖 不卖 (0,0) (0,0)
2
买
不买
买
不买 (-C, 0)
(P, V-P) (0, 0) (P-C, W-P)
单一价格二手车交易
6.3.2 均衡类型
• 市场完全失败:市场上所有的卖方,无论商 品好坏,都选择不卖 • 市场完全成功:质量好的商品的卖方将商品 投放市场,质量差的商品的卖方不敢将商品 投放市场 • 市场部分成功:所有的卖方,无论商品好坏, 都将商品投放市场,而买方也不管好坏商品 都买进 • 市场接近失败:所有好商品的卖方都将商品 投放市场,而只有部分“差”商品的卖方将 商品投放市场,同时买方以一定的概率随机 决定是否买进
本章分五节 6.1不完美信息动态博弈 6.2完美贝叶斯均衡 6.3单一价格二手车模型 6.4双价二手车交易 6.5有退款保证的双价二手车交易
6.1 不完美信息动态博弈
6.1.1 概念和例子 6.1.2 不完美信息动态博弈的表示 6.1.3 不完美信息动态博弈的子博弈
6.1.1 概念和例子
• 完美信息:博弈中后面阶段的玩家有关于前面阶段博弈进 程的充分信息 • 完美信息动态博弈:动态博弈中的所有玩家都有完美信息 的博弈 • 完全信息:各玩家对博弈结束时每个玩家的收益是完全清 楚的 • 不完美信息动态博弈的基本特征之一是玩家之间在信息方 面是不对称的,如二手车市场
一、条件:
PC
W P
二、市场接近失败的数字例子:
假设:V 3000 ,W 0, P 2000 , C 1000 pg pb 0.5 均衡: 卖方在车好时选卖,车差时以0.5概率随机选 择卖或不卖 买方以0.5概率随机选择买或不买 2 1 买方的判断为 p ( g | s ) , p (b | s ) 3 3
• 卖方在车好时卖,车差时不卖 • 买方选买,只要卖方卖 • 买方的判断为
p( g | s) 1, p(b | s) 0
条件:
PC
3、市场完全失败的合并均衡
• 卖方选择不卖 • 买方选择不买 • 买方的判断为:
p( g | s) 0, p(b | s) 1
条件:
W P
6.3.4 模型的混合策略完美贝叶斯均衡
6.5 有退款保证的双价二手车交易
原理:用退款 保证提高C ,或者说卖 方的收益。 设 C 0 赔偿 V W
买
好
1
低价
差
1
高价
1
高价