第三章 不完全信息静态博弈

合集下载

不完全信息静态博弈

不完全信息静态博弈

由于θi在[-ε,+ε]上是均匀分布的,因而θi ≥ 0和θi < 0的概率各为1/2。可认 为每个参与人认为对方选择抓与不抓的概率各为1/2。 当ε 0时,该纯策略贝叶斯均衡就收敛为一个完全信息博弈的混合策 略纳什均衡。
因而,海萨尼说,完全信息博弈的混合策略均衡可以解释为不完全信息 情况下纯策略均衡的极限。
策略贝叶斯均衡是一个类型依存战略组合
{ai* (i )}in,满足: 1
* ai* (i ) arg max pi (i | i )ui (ai , ai (i );i ,i ) ai
1、不完全信息古诺模型(板书)
• 在这个模型中,参与人的类型是成本函数。逆需求函数为
荷兰式拍卖:从一个非常高的初始标价逐步降低到有一个买者接受报价。 一级密封价格拍卖:出价最高的投标者获得拍卖品,并支付自己的出价 给卖者; 二级密封价格拍卖:出价最高的投标者获得拍卖品,并支付次最高出价。
1)
2)
英式拍卖:投标者按照递增的顺序宣布他们的出价,直到没有人愿意出更
高的价格,出价最高的投标者获得拍卖品; 荷兰式拍卖:从一个非常高的初始标价逐步降低到有一个买者接受报价。
看,一开始应采取“不合作”的策略。究竟是直觉正确,还是逻辑正
确? 博弈论专家Ken Binmore实验发现,不会出现一开始选择“不合作”
策略而使双方收益为1的情况。双方会主动选择“合作”策略,从而 走向合作。但逆向归纳法在某一步肯定会起作用。只要逆向归纳法在 起作用,“合作”便不能进行下去。
这个悖论在现实中的对应情况是,参与人不会在开始时确定他的策略
现在考虑同样的博弈但具有不完全信息:每个参与人有相同的支付结
构,但如果他赢了的话,他的利润为(1+θi),这里θi是每个参与人的 类型,是私人信息。但θi在[-ε,+ε]上均匀分布,这是公共知识。

不完全信息静态博弈

不完全信息静态博弈
不完全信息博弈
不完全信息静态博弈
海萨尼转换 现实中的贝叶斯博弈和均衡 机制设计
不完全信息静态博弈概述
在不完全信息静态博弈中,博弈参与者同时进行决策,但
博弈一方或多方并不了解博弈的全部信息。
只要在博弈中包含不完全信息,那么这样的博弈通常也被
称为贝叶斯博弈(Bayesian Game)。
不完全信息静态博弈的均衡通常被称为贝叶斯纳什均衡 (Bayesian Nash Equilibrium)
A cH q1 H q2 2 A cL q1 L q 2 2 H L A * q2 (1 ) * q2 c q1 2
不完全信息条件下的古诺寡头博弈均衡为:
A 2c ( * cH (1 ) * cL ) q1 3 H 2 A 2c (3 ) * cH (1 ) * cL q2 6 2 A 2c * cH (4 ) * cL L q2 6
贝叶斯对概率论和数理统计理论的早期发展做出了杰出的奠
基性贡献
贝叶斯对统计理论的主要贡献的“贝叶斯公式
(Bayesian Law)” 全概公式 设试验 E 的样本空间为
,事件
A1 , A2 ,..., An 构成样本空间的一
一、不完全信息与“市场争夺战”博弈
假设市场中有一个在位者和一个潜在进入者。 潜在进入者有两个策略可以选择:“进入”或者“不进入”。 在位者有两个策略可以选择:“斗争”或者“默许”。 在位者可能是“高效型”企业,也可能是“低效型”企业。 在位者不同类型对应不同博弈情况。
别。
厂商 2 将厂商 1 的产量看作给定。
当厂商 2 的成本函数为 C(q2) = cHq2 ,厂商 2 的产量为:

不完全信息静态博弈

不完全信息静态博弈

• (3)、信念不同出现的均衡的答案也会不同。 )、信念不同出现的均衡的答案也会不同 )、信念不同出现的均衡的答案也会不同。 • • • • (4)、由于参与者的收益函数具有不确定性,因而不可能通过 )、由于参与者的收益函数具有不确定性, )、由于参与者的收益函数具有不确定性 求解最大化的方式找到最优策略,换句话说, 求解最大化的方式找到最优策略,换句话说,就是什么策略都可 能成为最优策略,任何结果都有可能是博弈的均衡解。 能成为最优策略,任何结果都有可能是博弈的均衡解。这样得不 出结果。 出结果。
囚徒因境2 囚徒因境2的扩展式表达
2、囚徒因境2的扩展式的理解 、囚徒因境2
)、该博弈有两个开始点 行动的时候, • (1)、该博弈有两个开始点 )、该博弈有两个开始点(X1和X2),在囚徒 行动的时候, 和 ,在囚徒1行动的时候 囚 • 徒1分不清他到底位于哪一个节点,是X3、X4、X5,还是 。 分不清他到底位于哪一个节点, 分不清他到底位于哪一个节点 、 、 ,还是X6。 • (2)、博弈的扩展式有三个信息集,它们分别 )、博弈的扩展式有三个信息集 )、博弈的扩展式有三个信息集,它们分别{X1},{X2}和 , 和 • {X3,X4,X5,X6}。 , , , 。 • • • • )、由于该博弈有两个开始点 (3)、由于该博弈有两个开始点、可以理解为两个不同的博 )、由于该博弈有两个开始点、 但关键是,这两个博弈被一条虚线连接起来, 弈,但关键是,这两个博弈被一条虚线连接起来,因而它又是一 个博弈。它既是两个博弈又是一个博弈, 个博弈。它既是两个博弈又是一个博弈,从逻辑上来说这是矛盾 因而我们不可能直接分析它。 的,因而我们不可能直接分析它。
• 豪尔绍尼转换的主要思路 • 以类型概念构造对不完全信息的招述, 在此基础上构造统一的模型来描述局中人 在博弈中对不完全信息的处理,从而将不 完全信息博弈转化为不完美信息的完全信 息博弈。

博弈论——不完全信息静态博弈

博弈论——不完全信息静态博弈

3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。

不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。

如在拍卖商品或工程招投标中。

信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。

不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。

但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。

在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。

3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。

Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。

N 首先行动,决定每个局中人的特征。

每个局中人知道自己的特征,但不知道其他局中人特征。

这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。

这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。

局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。

用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。

不完全信息静态博弈

不完全信息静态博弈
U2=q2(aq1 q2 c2)
a8,c12
第一种情况,企业1 知道企业2是低成本
cL 2
3 2
第二种情况,企业1 知道企业2是高成本
cH 2
5 2
第三种情况,企 业1认为企业2是 高成本的概率为
u
1 2
U
q
2
2

8-
q1

2
q

2
c

2
0
q(2*
q1
,
c
)=
2
1( 2
8-
q

1
c
2);

q
L 2
提供
不提供
提供 1-c1,1-c2 不提供 1 , 1-c2
1-c1,1 0, 0
分析:
假设1 参 和 2提 与供 人的概 , r率 ,对 1和 分 2来别 讲为 ,提
不提供的期 为望收益分别
u c u E 提供1 ; E 不提供 r
1
1
1
因此
u c u E 提供1 ; E 不提供
2
2
2
当1c1r,即c11r时,参与1人 提供 ; 当1c1r,即c11r时,参与1人 不提;供
例1:不完全信息囚徒困境——有无江湖道义
贝叶斯纳什均衡:甲招认,乙正常类型则招认,有义气则不认 例2:——法官私恩与江湖道义(囚犯甲是法官亲戚)
贝叶斯纳什均衡为:
1、当 u 1 ,甲不招,乙正常则招,有义气不招
4
2、当 u 1 ,甲招不招几率相等,乙正常则招,有义气不招
4
3、当 u 1 ,甲招,乙正常则招,有义1 1,c2 1,为智猪博弈
对应均衡分别为 (提供,不提供),(不提供,提供)

第3章 不完全信息静态博弈

第3章  不完全信息静态博弈

贝叶斯纳什均衡


有了上述概念,贝叶斯纳什均衡可以定义为, n人不完全信息静态博弈G={A1,…,An;1,…,n; P;u1,…,un}的纯战略贝叶斯纳什均衡是一个类 型依存战略组合{ai*( i )},i=1,…,n,其中每 个参与人i在给定自己的类型i和其他参与人类 型依存战略{a-i*( -i )}的情况下,选择行动 ai*(i)最大化自己的期望效用函i。 贝叶斯纳什均衡是完全信息静态博弈纳什均衡 概念在不完全信息静态博弈上的扩展。
3.1-3不完全信息静态博弈的战略 式表述和贝叶斯纳什均衡


不完全信息静态博弈又称为静态贝叶斯博弈。 不完全信息静态博弈的参与人也称为贝叶斯参 与人。如同在完全信息静态博弈中一样,在不 完全信息静态博弈中,所有参与人同时行动, 参与人i的战略空间Si等同于他的行动空间Ai。 但是,与完全信息静态博弈不同的是,在不完 全信息静态博弈中,参与人i的行动空间Ai可能 依赖于他的类型i ,换句话说,行动空间是类 型依存的(type contingent)。
不完全信息与参与人的类型



不完全信息意味着,至少有一个参与人有多个 类型(否则,就成为完全信息博弈)。 我们用 i 表示参与人i的一个特定类型, i 表 示参与人i所有可能类型的集合,i i。 我们假定,={i},i=1,…,n,取自某个客观的 分布函数P(1,…,n)。 为了简单起见,我们假定只有参与人i观测到 自己的类型i,除i之外的其他参与人都不能观 测到i。
N
高成本 低成本
[p]
在位者 默许 进入者 进入 不进入 进入 不进入 进入 斗争
[1-p]
默许
斗争
不进入 进入
不进入
(50,40) (300,0) (0,-10) (300,0) (80,30) (400,0) (100,-10) (400,0)

博弈论_不完全信息静态博弈

博弈论_不完全信息静态博弈

贝叶斯纳什均衡的存在性
贝叶斯纳什均衡的存在性定理 定理3.1.2,见书上第62页,不讲定理的证明 它与第24页的定理2.2.3的比较。定理3.1.2所
要用到的前提条件更强,其原因在于: 在贝叶斯博弈中,局中人i的收益是纯策略下
的期望收益。或,局中人i的收益函数ui(s-i, si, ti)可以随着类型的变化而变化;当ui是si的凹函 数时,其凸组合“∑pi(t-i|ti)×ui(s-i(t-i), si, ti), t-i∈T-I”也是si的凹函数;若拟凹则不成立
义3.1.2做比较 此定义是对纯策略下贝叶斯纳什均衡定义的一
个直接扩展,其中E(ui)是局中人i在混合策略 组合下,对其收益函数ui的数学期望 定理3.1.3:混合策略组合是贝叶斯纳什均衡 的充分必要条件 定理3.1.4:贝叶斯纳什均衡的存在性定理
求解行业博弈的贝叶斯纳什均衡
条件概率 标记混合策略的符号 标记期望收益的符号 计算不同类型下的期望收益 书上的方法:由混合策略下贝叶斯纳什均衡的
对局中人2的计算
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 , -4/3 , 0 建厂 , -4/3 , 0
不建厂 , 1 , 0 不建厂 , 1 , 0
合成后的支付矩阵
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 0, -4/3 2, 0 建厂 1.5, -4/3 3.5, 0
混合策略
在贝叶斯博弈G=[N, {Ti}, P, {Si(ti)}, {ui}]中,局中人i 在类型ti∈Ti下,为每一个纯策略以概率进行选择,则 xi(ti) =(x1(i)(ti), x2(i)(ti), ···, xm_i(i)(ti))称为局中人i在类型 ti下的一个混合策略。有时简写为xi。

不完全信息静态博弈详解

不完全信息静态博弈详解
人类型依存战a略*i (i ) 的情况下最大化自己的期望效用v函i 数 。
换言之,战略组a*合 (a1* (1), an* (n )), 是一个贝叶斯纳什均衡, 如果对于所有的aii, Ai (i ),
ai*(i ) arg max pi (i | i )ui (ai , a*i (i );i ,i ) ai
进入者的最优选择是:如果p≥1/5,进入;如果p<1/5不进入
博弈论与信息经济学 江西财经大学 陶长琪
3.1.2 海萨尼(Harsanyi)转换
海萨尼提出的处理不完全信息博弈的方法是,引入一个虚拟的 —“自 然”(nature);这样,不完全信息博弈就转换为如图3.1所示的完全但不完 美信息博弈(games of complete but imperfect information)可以使用标 准的分析技术进行分析。
混合战略贝叶斯纳什均衡的概念可以类似地定义。均衡的存在性定理是纳什均 衡存在性定量的一个直接推广
博弈论与信息经济学 江西财经大学 陶长琪
3.2 贝叶斯均衡的应用举例
3.2.1 不完全信息库诺特模型
在不完全信息库诺特模型里,参与人的类型是成本函数。假定逆需求函
数是 P a q1 q2 ,每个企业都有不变的单位成本。令 ci 为企业i 的单位成本,那么,企业 i 的利润函数如下:
3. 不完全信息静态博弈
3.1 不完全信息博弈和贝叶斯 3.2.3 一级密封价格拍卖(招标)
纳什均衡
3.2.4 双方叫价拍卖
3.1.1 不完全信息博弈
3.3 贝叶斯博弈与混合战略均
3.1.2 海萨尼(Harsanyi)转换

3.1.3 不完全信息静态博弈的 3.4 机制设计理论与显示原理
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二、例子
1、抓钱博弈 这个博弈有两个非对 称纯战略均衡:一个 参与人抓,另一个参 与人不抓;一个对称 混合战略均衡:每个 参与人以0.5的概率 选择抓。 (1)完全信息
参与人2 抓 参与人1 不抓 抓 -1,-1 1,0
不抓 0,1
0,0
(2)不完全信息 每个参与人有相同 参与人2 的支付结构,但若 抓 不抓 他赢了,其利润是 抓 -1,-1 1+θ1,0 (1+θi)。 θi是参 参与人1 与人的类型,参与 不抓 0 , 1+θ 0,0 人i自己知道θi,但 另一参与人不知道。 假定θ 在[-ε,+ε]区间上均匀分 i 布。
博弈方的类型 原来的静态博弈,即各 中选择行动方案 a1 , , a n 个实际博弈方
u i u i ( a 1 , , a n , i ), i 1, , n
根据海萨尼公理,假定分布函数P(θ1,…,θn)是所有 参与人的共同知识,用θ-i =(θ1,…, θi-1 ,θi+1,…,θn)表示 除i之外的所有参与人的类型组合。这样, θ= (θ1,…, θn)= (θi,θ- i)。称pi(θ-i | θi)为参与人i的条 件概率,即给定参与人i属于类型θi的条件下,他有 关其他参与人属于θ- i的概率。根据条件概率规则, p i , i p i , i p i i | i p i p i , i 这里, p (θi)是边缘概率。如果类型的分布是独立的, pi(θ-i | θi)= p (θ-i)。
2

均衡意味着两个反应函数同时成立。解两个反应函数 得贝叶斯均衡为:
q1
*
1 3
; q2
L*

11 24
; q2
H*

5 24
比较不完全信息下的贝叶斯均衡与完全信息下的纳 什均衡:
如果企业2的成本是 c2L=0.75,企业1知道企业2的 成本,那么,反应函数为:
q1
*
1 2
1
q 2 ; q 2
*
注意:与纯战略纳什均衡不同的是,在贝叶斯均衡中, 参与人i只知道具有类型θ j参与人j将选择aj (θ j)但 并不知道θ j,因此,即使纯战略选择也必须取支付 函数的期望值。
贝叶斯均衡在本质上也是一个一致性预测,即每个参 与人i都能正确预测到具有类型θ j的参与人j将选择
aj *(θ j)。
3.2贝叶斯均衡的应用举例
p 1 ,..., p n ;
1 1
类型依存战略空间 A ,..., 类型依存支付函数 u a ,..., a
1 1
A n n
n
; 。
, 1 ,..., u n a1 ,..., a n , n
参与人i知道自己的类型 ,条件概率 pi(θ-i | θi)描 述给定自己属于θi的情况下,参与人i有关其他人类型 的不确定性。
*
1 5 q1 2 4
纳什均衡产量为q1* =0.25, q2* =0.5。同样地,若 企业2的成本是c2H=1.25,企业1知道企业2的成本, 纳什均衡产量为 q 5 1 。 , q
* * 1
12
2
6
即:
q1 L
NE

1 4 5 12
q1
* *
1 3
; q2L
NE
1 2 1 6
q2
L*

11 24 5 24
q1 H
NE
q1
1 3
; q2H
NE
q2
H *

就是说,与完全信息情况相比,在不完全信息情况 下,低成本企业的产量相对较低,高成本企业的产 量相对较高。
二、不完全信息情况下公共产品的提供
三、一级密封价格拍卖
四、双方叫价拍卖
* j

j
| i ) (1 i )

* j


)( 1) 1 p i (

j
) (1 i )

因为θj在[-ε,+ε]区间上均匀分布,有 上均匀分布。所以,上式整理得:
u i 抓 = 1 p i ( j j ) ( 1) p i ( j j ) (1 i )
一、不完全信息的古诺模型: 假定参与人的类型是成本函数,逆需求函数是P=aq1-q2。令ci是企业i的单位成本,企业i的利润函数为:
i q i a q1 q 2 c i , i 1, 2
假定企业1的单位成本c1是共同知识,企业2的单位 成本可能是c2L也可能是c2H, c2L< c2H;企业2知道 自己的成本是c2H还是c2L,但企业1只知道c2= c2L的 可能性为μ, c2= c2H的可能性为1- μ; μ为共同知 识。
i
i
三、不完全信息静态博弈的战略式表述 和贝叶斯纳什均衡
贝叶斯纳什均衡是完全信息静态博弈纳什均衡概 念在不完全信息静态博弈上的扩展。不完全信息静 态博弈又称为静态贝叶斯博弈。
1、贝叶斯博弈的战略式表述
n人静态贝叶斯博弈的战略式表述包括:
参与人的类型空间
条件概率
n
,..., 1 ;
2
考虑下列纯战略: 1)参与人1:如果θ1≥ θ1*,抓;如果θ1 < θ1*,不抓;
2)参与人2:如果θ2≥ θ2*,抓;如果θ2 < θ2*,不抓。
所以,给定参与人j的战略,参与人i选择抓的期望利 润为: 即
u i 抓 = p i (
u i 抓 = p i (
j
j
| i )( 1) 1 p i (
企业1不知道企业2的真实成本,从而不知道企业2 的最优反应是q2L 还是q2H,因此企业1将选择q1最大 化其期望利润函数:
E1 1 2 q1 1 q1 q 2
L


1 2
q1 1 q1 q 2

H

解最优化的一阶条件得企业1的反应函数为:
q1
*
1 1 L 1 H 1 1 Eq q2 q2 1 2 2 2 2

1 2
t
q1
企业2的最优产量不仅依赖于企业1的产量,而且依赖于 自己的成本。
令q2L为t= 1.25时企业2的最优产量, q2H 为t=0.75 时企业2的最优产量。有:
q2
L

1 5 H q1 ; q 2 2 4

1 3 q1 2 4
* * * j j 1 p i ( ) ( 1) 2 2

j
2
在[0,1]





* j j ) (1 i ) pi ( 2 2
* * 1 j ( 1) j (1 i ) 2 2
i i
i i
我们 G 博弈。
{ A1 , , A n ; 1 , , n ; p1 , , p n ; u 1 , , u n }
用代表该
2、静态贝叶斯博弈的时间顺序 (1)自然选择类型向量θ =(θ 1,…, θ n),参与人 i观测到θ i,但其他参与人j只知道pj (θ-j | θj),观测不 到θ i; (2)n个参与人同时选择行动a=(a1,…, an), 其中 A
3.3贝叶斯均衡与混合战略均衡
完全信息情况下的混合战略均衡可以解释为不 完全信息情况下纯战略均衡的极限。----海萨尼
3.3贝叶斯均衡与混合战略均衡
一、混合战略纳什均衡的本质特征
不在于参与人j随机地选择行动,而在于参与人i不能 确定参与人j将选择什么纯战略,这种不确定性可能 来自参与人i不知道参与人j的类型。 贝叶斯博弈中,因为参与人的战略是类型依存的, 每个参与人在选择自己的行动时他面对的似乎是选 择混合战略的对手。自然便是通过选择参与人的类 型制造了不确定性。
a
*
i
的情况下
*
a ,..., a 换言之,战略组合 是一个贝叶斯纳什均衡,如果对于所有的i, A a ,

* 1 1 n n
i
i
i
ai
*
i a rg m a x
ai

p ( i | i ) u i ( a i , a i i ; i , i )
i i i
a

u i a 1 ,..., a n , i
(3)参与人i得到

讨论: 1)若所有参与人的类型空间只包含一个元素,不 完全信息静态博弈就退化为完全信息静态博弈; 2)若参与人的类型是完全相关的,当参与人i观测 到自己的类型时也就知道了其他参与人的类型,博 弈是完全信息的。
3、贝叶斯纳什均衡
第三章 不完全信息静态博弈
第三章 不完全信Βιβλιοθήκη 静态博弈不完全信息博弈和贝叶斯纳什均衡 贝叶斯均衡的应用 贝叶斯均衡与混合战略均衡 *机制设计问题和显示原理
3.1不完全信息博弈和贝叶斯纳什均衡
一、不完全信息博弈
1、定义
不满足完全信息假设的博弈称为不完全信息博弈。
完全信息假设:支付函数是共同知识。
即是说,在不完全信息博弈中,至少有一个参与人 不知道其他参与人的支付函数。
参与人i不抓的利润是ui(0)=0。给定j的战略,i在抓 与不抓之间无差异,所以, θi*满足下列条件:
* * j 2j 1 ( 1) (1 i ) 0 2 2
二、海萨尼(Harsanyi)转换
引入虚拟参与人“自然”; 自然首先行动决定参与人的特征,参与人知道 自己的特征,其他参与人不知道; 特征的分布函数是共同知识; “不完全信息”转换为“完全但不完美信息”, 可使用标准的分析技术来分析。
相关文档
最新文档