第4讲不完全信息静态博弈

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
同知识的信息)称为他的类型。 不完全信息意味着:至少有一个参与人有多个类型。 离散类型和连续类型
• 例如,在市场进入阻挠博弈中,进入者打算进入一个新的产业,但不 知道在位者的成本函数,只知道在位者有两种可能的成本函数:高成 本或低成本。
高成本情况:
进入者 不进入 (0,300) 斗争 (-10,0) 进入 在位者 (40,50) 默许 (40,50)
如果100元为最小单位。理性的A、B能够接受的均衡结果为:A获9900
元,B得到100元。
但Ken Binmore的实验结果为:提方案者倾向于50:50;而接受者倾向
于:如果给他的少于30%,他将拒绝。

我们的感觉是:现实中的人除了理性外,在事情的处理上还受到情绪、 文化、道德等多种(可能是)非理性因素的影响。
荷兰式拍卖:从一个非常高的初始标价逐步降低到有一个买者接受报价。 一级密封价格拍卖:出价最高的投标者获得拍卖品,并支付自己的出价 给卖者; 二级密封价格拍卖:出价最高的投标者获得拍卖品,并支付次最高出价。
1)
2)
英式拍卖:投标者按照递增的顺序宣布他们的出价,直到没有人愿意出更
高的价格,出价最高的投标者获得拍卖品; 荷兰式拍卖:从一个非常高的初始标价逐步降低到有一个买者接受报价。

pi pi (i 描述给定自己属于 | i ) θi的情况下,其他参与人不同类型的
概率分布。我们采用G={A1,…,An;θ1,…,θn;p1,…,pn;u1,…,un}表示静态 贝叶斯博弈。 n人不完全信息静态博弈G={A1,…,An;θ1,…,θn;p1,…,pn;u1,…,un}的纯
二、恋爱博弈
女 男 足球 芭蕾 足球 2,1 0,0 芭蕾 0,0 1,2
这个博弈有两个非对称纯策略纳什均衡:(足球,足球),(芭蕾,芭 蕾);还有一个对称的混合策略纳什均衡:男的以2/3的概率选择足球,女 的以2/3的概率选择芭蕾。
考虑不完全信息下的恋爱博弈:
女 男 足球 芭蕾 足球 2+θm,1 0,0 芭蕾 0,0 1,2+θf
第四讲 不完全信息静态博弈
浙江工业大学 经贸管理学院 曹柬:jcao@zjut.edu.cn
一、贝叶斯纳什均衡
二、贝叶斯均衡的应用举例 三、贝叶斯博弈和混合策略均衡
一、贝叶斯纳什均衡
• 各参与人的策略空间、效用函数等都是“共同知识”的博
弈称为“完全信息博弈”。
我们将一个参与人所拥有的所有私人信息(即所有不是共
策略贝叶斯均衡是一个类型依存战略组合
{ai* (i )}in,满足: 1
* ai* (i ) arg max pi (i | i )ui (ai , a i ( i );i , i ) ai
1、不完全信息古诺模型(板书)
• 在这个模型中,参与人的类型是成本函数。逆需求函数为
的一个特定行动。同理,参与人i 的效用函数也是类型依存的,采用ui (ai,
由此,给出不完全信息静态博弈的定义,即静态贝叶斯博弈如下: n人静态贝叶斯博弈的战略式表述包括:参与人的类型空间Θ1,…,Θn,条 件概率p1,…,pn,类型依存策略空间A1(θ1),…, An(θn),类型依存支付函数
u1 (a1,a-1,θ1),…, un (an,a-n,θn)。参与人i 知道自己的类型θi Θi,条件概
P=a-q1-q2,每个企业都有不变的单位成本。假设企业1的 单位成本c1是公共知识,而企业2的单位成本c2是不完全信 息。企业1知道企业2为低成本的概率为,为高成本的概 率为1- 。
不完全信息的存在对于博弈参与方各自收益(?)、以及整
体收益都带来了负效益。
2、不完全信息下的公共产品提供
• 两个参与人,i =1, 2,同时决定是否提供公共产品,每个参
3)
4)
一级密封价格拍卖:出价最高的投标者获得拍卖品,并支付自己的出价给
卖者; 二级密封价格拍卖:出价最高的投标者获得拍卖品,并支付次最高出价。
•如果买者都是理性的,针对某个价值确定的物品,从理论上讲,卖者获得 期望收入的高低次序大致为: (2) (3) (4) (1) (可以讨论?) •但在现实中,物品拍卖往往采用方式 (1) ,这主要与物品价值的模糊性和 不确定性有关(也可以认为:与人的理性有限相关);而项目招标,往往采 用方式(3)。
现在考虑同样的博弈但具有不完全信息:每个参与人有相同的支付结
构,但如果他赢了的话,他的利润为(1+θi),这里θi是每个参与人的 类型,是私人信息。但θi在[-ε,+ε]上均匀分布,这是公共知识。
不完全信息抓钱博弈如下:
参与人 2 参与人 1 抓 不抓 抓 -1,-1 0,1+θ2 不抓 1+θ1,0 0,0
条件下,与他有关的其他参与人属于θ-i的概率。如果类型的分布是独
立的,则
pi (i | i ) pi (i )
在不完全信息静态博弈中,所有参与人同时行动,参与人i 的策略空间Si 等同于他的行动空间Ai 。行动空间是类型依存的,即Ai依赖于他的类型 θi,可以采用Ai(θi)表示参与人i的类型依存行动空间。ai(θi) a-i,θi)表示。 A i(θi)表示i
看,一开始应采取“不合作”的策略。究竟是直觉正确,还是逻辑正
确? 博弈论专家Ken Binmore实验发现,不会出现一开始选择“不合作”
策略而使双方收益为1的情况。双方会主动选择“合作”策略,从而 走向合作。但逆向归纳法在某一步肯定会起作用。只要逆向归纳法在 起作用,“合作”便不能进行下去。
这个悖论在现实中的对应情况是,参与人不会在开始时确定他的策略
不完全信息的存在使得公共产品的供应量减少。
3、一级密封价格拍卖(招标)
拍卖和招标的相关知识:
这类博弈涉及双方信息、判断不一致情况下的决策问题 拍卖和招标有两个基本功能:揭示信息和减少代理成本。根据拍卖交易
制度的不同,分为四类拍卖:
1)
2) 3) 4)
英式拍卖:投标者按照递增的顺序宣布他们的出价,直到没有人愿意出 更高的价格,出价最高的投标者获得拍卖品;
贝叶斯纳什均衡相关概念
一般地,我们采用θi 表示参与人i 的一个特定类型,Θi 表示参与人 i 所
有可能类型的集合(θi Θ i)。我们假定
数P(θ1,…,θn)是公共知识。
{i取自某个客观的分布函 }in1
我们称 pi (i | i )为参与人i 的条件概率,即给定参与人i 属于类型θi的
人的有限理性和阿罗不可能性定理
理性人:在给定的约束条件下最大化自己的效用。
1、人的理性不一定能带来合理的结果。
例1、蜈蚣博弈
1 A 2 A 1 A 2 A 1 A 2 A (100,100)
D
D
D
D
D
D
(1,1)
(0,3)
(98,98)
(97,100) (99,99)
(98,101)
直觉告诉人类:从一开始采取“合作”策略是好的。但从逻辑的角度
效用”问题上必须保持理性;而在“低效用”问题上可以采用非理性 的策略。如在购买彩票上,付出少量的金钱给购买者带来的损失不大, 可认为损失的效用在生活中可以忽略不计。
例4、投票悖论和阿罗不可能性定理
假如A、B、C三人晚上要一起活动,但对进行什么样的活动要投票表
决,有三个方案:T(聊天),M(看电影),D(跳舞)。对于这三 个活动,A的偏好顺序为T>M>D;B的为M>D>T;C的顺序为D>T>M。现在, 对这三个活动进行两两投票表决。 1、先是T和M表决,结果A、C投T,B选M,T>M,T获胜; 2、再对M和D表决,结果A、B选M,C选D,M>D,M获胜; 根据逻辑的传递性规则,我们由此得到T>M>D,即T>D; 3、如果再对T和D进行表决,发现D>T。
贝叶斯博弈和混合策略均衡
海萨尼证明:完全信息情况下的混合策略均衡可以解释为不 完全信息情况下纯策略均衡的极限。 举两个例子予以说明。
一、抓钱博弈
参与人 2 抓 不抓 -1,-1 1,0 0,1 0,0
参与人 1
抓 不抓
这个博弈有两个非对称纯策略纳什均衡:(抓,不抓),(不抓,抓); 还有一个对称的混合策略纳什均衡:每个参与人以1/2的概率选择抓。
为“不合作”,但他难以确定在何处采取“不合作”策略。
这个悖论,有待采用新的数学理论或方法予以解决。
2、一个正常的人,在很多情况下,他的理性是有限的。
例2、分钱博弈
如果A在马路上捡到10000元(共100张100元),正巧被B看到。B要求分
钱。分钱方案由A提出,B表决。如果B同意,那么就按A提出的方案来 分;如果B不同意的话,两人将一无所获。
由于θi在[-ε,+ε]上是均匀分布的,因而θi ≥ 0和θi < 0的概率各为1/2。可认 为每个参与人认为对方选择抓与不抓的概率各为1/2。 当ε 0时,该纯策略贝叶斯均衡就收敛为一个完全信息博弈的混合策 略纳什均衡。
因而,海萨尼说,完全信息博弈的混合策略均衡可以解释为不完全信息 情况下纯策略均衡的极限。
一级密封价格拍卖
每个投标人的策略是根据自己对该物品的评价和对其他投标人评价的判
断来选择自己的出价,赢者的支付是他对物品的评价减去他的出价,其
他投标人的支付为0。
在两个投标人的情况下,博弈的贝叶斯均衡为:每个投标人的出价是 其实际估计的一半。在不完全信息下,在均衡情况下,物品被估价最高 的投标人所得。但卖主只得到买者最高估价的一半。如果是完全信息, 卖主可以得到买者最高估价的全部。 当投标人有多个时,显然,b*(v)随着n 的增加而增加。也就是说,投 标人越多,卖主能得到的价格就越高;当投标人趋于无穷时,卖者几乎 得到买者价值的全部。因此,让更多的人加入竞标是卖者的利益所在。
θm和θf分别是男和女的私人信息,二者都在[0,x]上均匀分布,这是公 共知识。
* * 构造一个贝叶斯均衡:存在一个m ,如果, [0, x] 和 * [0, x ] f m m 男的将选择足球赛;如果 * ,女的将选择芭蕾。
f
f
当x0时,该纯策略贝叶斯均衡就收敛为一个完全信息博弈的混合策略 纳什均衡。
与人面临的是一个0-1决策问题,即提供 (ai=1) 和不提供
(ai=0)。参与人 1, 2 提供公共产品的成本分别为 c1,c2。博 弈的战略式表述如下:
参与人 2 参与人 1 提供 不提供 提供 1-c1,1-c2 1,1-c2 不提供 1-c1,1 0, 0
c2
1 2/3
0
2/3
1
c1
不完全信息下的公共产品提供区域 + 完全信息下的公共产品提供区域
低成本情况:
进入者 不进入 (0,400) 斗争 进入 在位者 (-10,100) 默许
(-10,100) (30,80)
• 请问:进入者应该如何决策?
• 如果在位者有 n 种可能的不同成本函数,进入者似乎在与 n 个不同的 在位者博弈。在 1967 年以前,博弈论专家认为这样的不完全信息博 弈是没法分析的,因为当一个参与人不知道他在与谁博弈时,博弈 的规则是没有定义的。 • 常规思路是:假设进入者认为在位者为高成本的概率为 p,低成本的 概率为1-p,则进入者选择进入的期望利润为:p(40)+(1-p)(-10); 而选择不进入的期望利润为0。 • 因而,如果 p 1/ 5 ,进入者将进入。 • 根据这一思路,海萨尼提出处理不完全信息博弈的方法:引入一个虚 拟参与人“自然”;自然首先行动决定参与人的类型(如成本函数的 高低),参与人知道自己的类型,其他参与人不知道。这一方法称为
“海萨尼转换”。
自然与内生/外生的关系
• 由此得到海萨尼转换后的市场进入阻挠博弈:
N 高 [ p] 不进入 (0,300) 斗争 (-10,0) 进入 在位者 默许 (40,50) 进入者 不进入 (0,400) 斗争 (-10,100) 低 [1-p] 进入 在位者 默许 (30,80)
海萨尼转换后得到的纳什均衡称为贝叶斯纳什均衡,简称贝叶斯均 衡,该均衡和参与人的类型概率分布有关。
wenku.baidu.com
例3、彩票购买问题
在现实中,有大量的人愿意掏少量的钱去买彩票。彩票的获奖率是很
低的,彩票发行者通过发行彩票来获得高额回报,他们肯定赢。因而,
对于理性的人而言,他是不会选择买彩票的。
但社会上仍有各种各样的彩票存在,也有大量的人来购买。可见,理
性人的假定是不符合实际情况的。
目前为止,对此提出的一种比较合理的解释为:一个正常人在“高
相关文档
最新文档