第3章 非完全信息静态博弈(博弈论,吉本斯)知识分享
不完全信息静态博弈

不完全信息静态博弈
海萨尼转换 现实中的贝叶斯博弈和均衡 机制设计
不完全信息静态博弈概述
在不完全信息静态博弈中,博弈参与者同时进行决策,但
博弈一方或多方并不了解博弈的全部信息。
只要在博弈中包含不完全信息,那么这样的博弈通常也被
称为贝叶斯博弈(Bayesian Game)。
不完全信息静态博弈的均衡通常被称为贝叶斯纳什均衡 (Bayesian Nash Equilibrium)
A cH q1 H q2 2 A cL q1 L q 2 2 H L A * q2 (1 ) * q2 c q1 2
不完全信息条件下的古诺寡头博弈均衡为:
A 2c ( * cH (1 ) * cL ) q1 3 H 2 A 2c (3 ) * cH (1 ) * cL q2 6 2 A 2c * cH (4 ) * cL L q2 6
贝叶斯对概率论和数理统计理论的早期发展做出了杰出的奠
基性贡献
贝叶斯对统计理论的主要贡献的“贝叶斯公式
(Bayesian Law)” 全概公式 设试验 E 的样本空间为
,事件
A1 , A2 ,..., An 构成样本空间的一
一、不完全信息与“市场争夺战”博弈
假设市场中有一个在位者和一个潜在进入者。 潜在进入者有两个策略可以选择:“进入”或者“不进入”。 在位者有两个策略可以选择:“斗争”或者“默许”。 在位者可能是“高效型”企业,也可能是“低效型”企业。 在位者不同类型对应不同博弈情况。
别。
厂商 2 将厂商 1 的产量看作给定。
当厂商 2 的成本函数为 C(q2) = cHq2 ,厂商 2 的产量为:
经济博弈论 谢识予 3不完全信息静态博弈

进入者似乎在与两个在位者博弈:高成本和低成本的在位 者;如果在位者有T种不同的成本函数在位者就相当于与T个 不同的在位者博弈。
3 海萨尼转换
Harsanyi(1967)
高
N
低
不完全信息博弈转化 为不完美信息博弈; 而完全信息和完美信 息之间的区别显得不 再重要 [1-P]
进入
[ -50,0 0,0
不求爱 0,0
2 不完全信息
信息与收益
博弈中研究的信息是指能够影响局中人收益的信息 影响局中人收益的信息 完全或对称信息意味着局中人的收益(效用)函数是共同知 识 不完全信息则意味着不知道对方的效用函数 不完全信息博弈:至少有一个参与人不知道其他参与人的 支付函数。 不完全静态博弈=静态贝叶斯博弈:至少有一个参与人不 知道其他参与人支付的静态博弈
一个参与人拥有的所有的私有信息(即所有不是共同 知识的信息)称为他的类型。
2 不完全信息
不完全信息博弈与不完美信息博弈 私人信息:在博弈中(开始博弈前或博弈中),参与者i 知道,但不是所有参与者的共同知识。 不完全信息博弈:在参与人开始计划自己的策略行动前, 部分参与人具有其他人不知道的与博弈相关的私人信息 (初始私人信息) 完美(perfect)信息:在博弈中,每个参与人行动时, 都能够观察到在她(他)之前其他参与者的行动。 不完美信息博弈:在博弈中,至少有一个参与人行动时 不能观察到在她(他)之前某些参与人的行动。
孔明 冒险 司 马 懿 进攻 后退 守城 获胜,被擒 不胜不败,逃 脱 弃城 获胜,被擒 不胜不败,逃 脱 守城 被伏击,逃脱 不胜不败,逃 脱 谨慎 弃城 获胜,被擒 不胜不败,逃 脱
2 不完全信息
空城计
孔明可以选择的策略是“弃城”或“守城”,如果司 马懿判断孔明是“冒险”的,无论是“弃”还是“守”, 那么孔明均要被其所擒。 所以孔明就用空城计“于城上敌楼前凭栏而坐,焚香操 琴”,增大了司马懿判断自己是“谨慎”类型的主观概率。 正如孔明所料,司马懿认为孔明是“谨慎”的,在“理 性的”司马懿看来,进攻失败的可能性较大,而退兵的期 望效用大于进攻的期望效用。故最终司马懿选择了退兵, 孔明则得以逃脱。
第三章 不完全信息静态博弈

二、例子
1、抓钱博弈 这个博弈有两个非对 称纯战略均衡:一个 参与人抓,另一个参 与人不抓;一个对称 混合战略均衡:每个 参与人以0.5的概率 选择抓。 (1)完全信息
参与人2 抓 参与人1 不抓 抓 -1,-1 1,0
不抓 0,1
0,0
(2)不完全信息 每个参与人有相同 参与人2 的支付结构,但若 抓 不抓 他赢了,其利润是 抓 -1,-1 1+θ1,0 (1+θi)。 θi是参 参与人1 与人的类型,参与 不抓 0 , 1+θ 0,0 人i自己知道θi,但 另一参与人不知道。 假定θ 在[-ε,+ε]区间上均匀分 i 布。
博弈方的类型 原来的静态博弈,即各 中选择行动方案 a1 , , a n 个实际博弈方
u i u i ( a 1 , , a n , i ), i 1, , n
根据海萨尼公理,假定分布函数P(θ1,…,θn)是所有 参与人的共同知识,用θ-i =(θ1,…, θi-1 ,θi+1,…,θn)表示 除i之外的所有参与人的类型组合。这样, θ= (θ1,…, θn)= (θi,θ- i)。称pi(θ-i | θi)为参与人i的条 件概率,即给定参与人i属于类型θi的条件下,他有 关其他参与人属于θ- i的概率。根据条件概率规则, p i , i p i , i p i i | i p i p i , i 这里, p (θi)是边缘概率。如果类型的分布是独立的, pi(θ-i | θi)= p (θ-i)。
2
均衡意味着两个反应函数同时成立。解两个反应函数 得贝叶斯均衡为:
q1
*
1 3
; q2
L*
博弈论——不完全信息静态博弈.讲义

3 不完全信息静态博弈3。
1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。
不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。
如在拍卖商品或工程招投标中.信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。
不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。
但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息"(private information)。
在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。
3。
2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人--“自然N "。
N 首先行动,决定每个局中人的特征.每个局中人知道自己的特征,但不知道其他局中人特征.这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈.这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。
局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。
用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。
博弈论——不完全信息静态博弈

3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。
不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。
如在拍卖商品或工程招投标中。
信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。
不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。
但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。
在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。
3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。
N 首先行动,决定每个局中人的特征。
每个局中人知道自己的特征,但不知道其他局中人特征。
这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。
这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。
局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。
用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。
第3章不完全信息静态博弈详解

博弈论与信息经济学 江西财经大学 陶长琪
3.2.3 一级密封价格拍卖(招标)
拍卖或招标(auction)有两个基本功能,一是揭示信息,二是减少代理 成本。
一级密封价格拍卖(the first-price sealed auction)是许多 拍卖方式
中的一种。在这种拍卖中,投标人(bidders)同时将自己的出价写下来 装入一个信封,密封后交给拍卖人,拍卖人打开信封,出价最高者是 赢者,按他的出价支付价格,拿走被拍卖的物品。
定义:n人静态贝叶斯博弈的战略式表述包括:参与人的类型空 间 , 1 n 条件概率 p1 ,, pn ,类型依存战略空间 A 和类型依存支 1 (1 ), An ( n ), 付函数 u1 (a1 ,an ;1 ),, un (a1 ,an ;n ) 。 参与人i知道自己的类型i i 条件概率 pi pi (i | i ) 描述给定自己属于 i 的情况下,人i有关其他 参与人类型 i i 的不确定性。我们用 G {A1, An ;1,n ; p1,, pn ; u1,, un } 代表这个博弈。
k [0,1], Pr ob( k ) k
)
maxui (v b) P r ob(b j b) (v b)(b)
b
最优化的一阶条件是: 如果
(b) (v b)' (b) 0
b* (.) 是投标人i的最优战略, (b) v 。
(b) ((b) b)' (b)
给定参与人i只知道自己的类型 i 而不知道其他参与人的类型 i ,参与人 ai (i ) 最大化自己的期望效用。参与人i期望效用函数定义如下: i将选择
博弈论与信息经济学 江西财经大学 陶长琪
第3章 不完全信息静态博弈

贝叶斯纳什均衡
有了上述概念,贝叶斯纳什均衡可以定义为, n人不完全信息静态博弈G={A1,…,An;1,…,n; P;u1,…,un}的纯战略贝叶斯纳什均衡是一个类 型依存战略组合{ai*( i )},i=1,…,n,其中每 个参与人i在给定自己的类型i和其他参与人类 型依存战略{a-i*( -i )}的情况下,选择行动 ai*(i)最大化自己的期望效用函i。 贝叶斯纳什均衡是完全信息静态博弈纳什均衡 概念在不完全信息静态博弈上的扩展。
3.1-3不完全信息静态博弈的战略 式表述和贝叶斯纳什均衡
不完全信息静态博弈又称为静态贝叶斯博弈。 不完全信息静态博弈的参与人也称为贝叶斯参 与人。如同在完全信息静态博弈中一样,在不 完全信息静态博弈中,所有参与人同时行动, 参与人i的战略空间Si等同于他的行动空间Ai。 但是,与完全信息静态博弈不同的是,在不完 全信息静态博弈中,参与人i的行动空间Ai可能 依赖于他的类型i ,换句话说,行动空间是类 型依存的(type contingent)。
不完全信息与参与人的类型
不完全信息意味着,至少有一个参与人有多个 类型(否则,就成为完全信息博弈)。 我们用 i 表示参与人i的一个特定类型, i 表 示参与人i所有可能类型的集合,i i。 我们假定,={i},i=1,…,n,取自某个客观的 分布函数P(1,…,n)。 为了简单起见,我们假定只有参与人i观测到 自己的类型i,除i之外的其他参与人都不能观 测到i。
N
高成本 低成本
[p]
在位者 默许 进入者 进入 不进入 进入 不进入 进入 斗争
[1-p]
默许
斗争
不进入 进入
不进入
(50,40) (300,0) (0,-10) (300,0) (80,30) (400,0) (100,-10) (400,0)
博弈论_不完全信息静态博弈

贝叶斯纳什均衡的存在性
贝叶斯纳什均衡的存在性定理 定理3.1.2,见书上第62页,不讲定理的证明 它与第24页的定理2.2.3的比较。定理3.1.2所
要用到的前提条件更强,其原因在于: 在贝叶斯博弈中,局中人i的收益是纯策略下
的期望收益。或,局中人i的收益函数ui(s-i, si, ti)可以随着类型的变化而变化;当ui是si的凹函 数时,其凸组合“∑pi(t-i|ti)×ui(s-i(t-i), si, ti), t-i∈T-I”也是si的凹函数;若拟凹则不成立
义3.1.2做比较 此定义是对纯策略下贝叶斯纳什均衡定义的一
个直接扩展,其中E(ui)是局中人i在混合策略 组合下,对其收益函数ui的数学期望 定理3.1.3:混合策略组合是贝叶斯纳什均衡 的充分必要条件 定理3.1.4:贝叶斯纳什均衡的存在性定理
求解行业博弈的贝叶斯纳什均衡
条件概率 标记混合策略的符号 标记期望收益的符号 计算不同类型下的期望收益 书上的方法:由混合策略下贝叶斯纳什均衡的
对局中人2的计算
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 , -4/3 , 0 建厂 , -4/3 , 0
不建厂 , 1 , 0 不建厂 , 1 , 0
合成后的支付矩阵
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 0, -4/3 2, 0 建厂 1.5, -4/3 3.5, 0
混合策略
在贝叶斯博弈G=[N, {Ti}, P, {Si(ti)}, {ui}]中,局中人i 在类型ti∈Ti下,为每一个纯策略以概率进行选择,则 xi(ti) =(x1(i)(ti), x2(i)(ti), ···, xm_i(i)(ti))称为局中人i在类型 ti下的一个混合策略。有时简写为xi。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Confess 是 prisoner 1对prisoner 2的选择(Confess if rational, Mum if altruistic)的最优反应.
(Confess if rational, Mum if altruistic) 是 prisoner 2对 prisoner 1选择Confess的最优反应
两名犯罪嫌疑人被捕并受到指控,他们被关入不同的牢室。但是 警方并无充足证据.
两名犯罪嫌疑人被告知以下政策: ➢ 如果两人都不坦白,将均被判为轻度犯罪,入狱一个月. ➢ 如果双方都坦白,都将被判入狱六个月. ➢ 如果一人招认而另一人拒不坦白,招认的一方将马上获释, 而另一人将判入狱九个月.
Prisoner 2
什么是不完全信息静态博弈? 1. 不完全信息的囚徒困境 2. 不完全信息的Cournot双头垄断 3. 不完全信息的性别战 4. 首价密封拍卖(First-price, sealed-bid
auction)
Game Theory-Chapter 3
3
Static (or simultaneous-move) games of INCOMPLETE information
Normal-form (or strategic-form) representation of static Bayesian games
Bayesian Nash equilibrium Applications---Auction
Game Theory-Chapter 3
2
a static game of incomplete information
Prisoner Mum
1
Confess
Mum
-1 , -1 0 , -9
Confess
-9 , 0 -6 , -6
Game Theory-Chapter 3
6
Prisoners’ dilemma of
incomplete information
Prisoner 1总是理性的(自利的,selfish ). Prisoner 2可能是理性的(自利的) ,也可能是利他的
收益不再是共同知识
不完全信息意味着 ➢ 至少有一个参与人不能准确的知道其他某个 参与人的收益函数(类型,type )
不完全信息静态博弈也被称为静态贝叶斯博弈
(static Bayesian games )
Game Theorห้องสมุดไป่ตู้-Chapter 3
5
Prisoners’ dilemma of
complete information
一种同质的产品仅仅由两家企业进行生产: firm 1 和firm 2. 产量分别用q1 和q2表示.
它们同时选择它们的产量. 市场价格: P(Q)=a-Q, 这里 a 是常数并且
8
Prisoners’ dilemma of
incomplete information (continued)
解:
➢ Prisoner 1选择 confess, 给定他对prisoner 2 的推断 ➢ Prisoner 2如果是理性,选择 confess;如果是利他的,
则选择 mum
这可以写成
Static (or SimultaneousMove) Games of Incomplete Information-Chapter 3
Bayesian Nash Equilibrium
Outline of Static Games of Incomplete Information
Introduction to static games of incomplete information
(altruistic ), 这取决于他是否高兴(happy). 如果他是利他的,那么他更偏好于mum,他认为 “confess” 等于
额外“入狱四个月”. Prisoner 1不能确切的知道 prisoner 2是理性的还是利他的, 但是
他推断(believes ) prisoner 2理性的概率为 0.8, 利他的概率为 0.2.
Payoffs if prisoner 2 is altruistic
Prisoner 2
Mum
Confess
Mum Prisoner 1
Confess
-1 , -1 0 , -9
-9 , -4 -6 , -10
Game Theory-Chapter 3
7
Prisoners’ dilemma of incomplete information (continued)
Mum
Confess
-1 , -1
-9 , 0
0 , -9
-6 , -6
Payoffs if prisoner 2 is altruistic
Prisoner 2
Mum
Confess
Prisoner 1
Mum Confess
-1 , -1 0 , -9
-9 , -4 -6 , -10
Game Theory-Chapter 3
这里的一个纳什均衡被称为贝叶斯纳什均衡 (Bayesian Nash equilibrium )
Game Theory-Chapter 3
9
Cournot duopoly model of complete information
标准式表述:
➢ 参与人集:
{ Firm 1, Firm 2}
➢ 策略集: ➢ 收益函数:
给定prisoner 1关于prisoner 2的推断( belief ), prison 1 应该选择什么策略?
如果prisoner 2 是理性或利他的,他应该分别选择什么 策略?
Payoffs if prisoner 2 is rational
Prisoner 1
Mum Confess
Prisoner 2
S1=[0, +∞), S2=[0, +∞)
u1(q1, q2)=q1(a-(q1+q2)-c), u2(q1, q2)=q2(a-(q1+q2)-c)
所有这些信息是共同知识
Game Theory-Chapter 3
10
Cournot duopoly model of
incomplete information