不完全信息静态博弈
博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境”摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。
其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。
本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。
关键词:博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。
它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。
为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。
当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。
用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :囚徒2囚徒1(表1)假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。
容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。
二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。
而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。
下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。
首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。
博弈论与经济分析(不完全信息静态)

博弈论与经济分析(不完全信息静态)第四章 不完全信息静态博弈不完全信息意味着至少有一个参与者不能确定另一个参与者的收益函数,或者说类型。
我们用一个例子来引入要讨论的问题: 例:信息不对称条件下的古诺模型 市场:P(Q)=a-Q ,Q=q1+q2 企业1:C1(q1)=cq1企业2:以θ的概率为高成本,即222()H C q c q =;以1θ-的概率为低成本,即222()L C q c q =。
当然,H L c c >。
信息不对称:企业2知道自己的成本,也知道企业1的成本;企业1知道自己的成本,但是只知道企业2成本状况的概率分布。
以上都是公共信息,即企业1知道企业2享有信息优势,企业2知道企业1知道,企业1也知道企业2知道企业1知道……如此等等。
解题:企业1会预测企业2在不同情况下的最优选择:当企业2为高成本时2122max[()]H q a q q c q *---当企业2为低成本时2122max[()]L q a q q c q *---既然企业只知道企业2成本情况的概率分布,则企业1只能根据上述预测最大化自己的期望收益:1121121max [(())](1)[(())]H L q a q q c c q a q q c c q θθ**---+----以上三个优化问题的一阶条件为:12()2H H a q c q c **--=12()2LL a q c q c **--=221[()](1)[()]2H L a q c c a q c c q θθ***--+---=联立求解:221()()36H H H L a c c q c c c θ*-+-=+-22()()36L L H L a c c q c c c θ*-+=-- 12(1)3H L a c c c q θθ*-++-=比较该结果与“完全信息条件”条件下结果的不同。
作业:说明企业2在两种成本下是否因为“信息优势”得到了好处?是应该巩固该优势还是向企业1公开信息?一、 静态贝叶斯博弈的标准表述完全信息静态:G={S1,…Sn;u1,…,un}在静态博弈条件下,策略S 就是一个行动A (当然,动态博弈则不同),于是我们可以写作G={A1,…An;u1,…,un}。
不完全信息静态博弈-贝叶斯纳什均衡(博弈论与信息经济学-中科院张玲玲)

第四章 不完全信息静态博弈 -贝叶斯纳什均衡
一 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈 海萨尼转换 不完全信息静态博弈的战略式表述和贝叶斯纳什均衡
二 贝叶斯纳什均衡应用举例 三 贝叶斯纳什均衡与混合战略均衡 四 机制设计理论与显示原理
海萨尼转换
被求爱者对于
求爱者的品德的 信息是不完全的。
不完全信息博弈
你 接受 不接受
求爱博弈:
求爱 100,100 -50,0
品德优良者求爱 求爱者 不求爱 0,0
0,0
100x+(-100)(1-x)=0
当x大于1/2时,接受求爱
求爱博弈: 品德恶劣者求爱 求爱者
你 接受 不接受
求爱 100,-100 -50,0
不完全信息博弈
在生活中我们也会碰到这样的问题,比 如一个乞丐向你乞讨,你愿意帮助别人, 但不知道他是真的乞丐还是骗子,该如 何决定呢?如果你喜欢与人为善,你可 能愿意冒一点上当的危险,这不等于你 愚蠢,而是你认为,帮助一个困境中的 人比回绝一个骗子更重要。
不完全信息博弈
不完全信息:每一个参与人对所有其他参与人 的(对手)的特征、战略空间及支付函数有准 确的 知识,否则为不完全信息。
众官听得这个消息,尽皆失色。孔明登城 望之,果然尘土冲天,魏兵分两路杀来。
孔明令众将旌旗尽皆藏匿,打开城门,每 一门用20军士,扮作百姓,洒扫街道。而孔明 羽扇纶巾,引二小童携琴一张,于城上敌楼前 凭栏而望,焚香操琴。
不完全信息博弈
司马懿自马上远远望之,见诸葛亮神态自 若,顿时心生疑忌,犹豫再三,难下决断。又 接到远山中可能有埋伏的情报,于是叫后军做 前军,前军做后军,急速退去。司马懿之子司 马昭问:“莫非诸葛亮无军,故做此态,父何 故便退兵?”
不完全信息博弈

• 这个博弈的一个纯策略ai(ci) 是从﹝c’, c’’﹞到﹛0,1﹜的一个函数,其中0表示不 提供,1表示提供。参与人的支付函数为: • Ui(ai,a j, ci)=max(a1, a2)-aici • 如果j提供,i不提供, Ui(0,1, ci)=max(0, 1)-0ci=1;如果i提供, j不提供, Ui(1,0, ci)=max(1, 0)-1ci=1-ci • 贝叶斯均衡是一个策略组合,便得对于每 个i和每个可能的ci,策略ai﹡ (ci) 最大化参 与人i的期望效用。
因为z j≡Prob﹙ c’ ≤c j ≤c j ﹡﹚= P﹙ c j ﹡﹚ ,均衡分割点ci﹡必须满足ci﹡=1P﹙ c j ﹡﹚。因此ci﹡ 和c j ﹡都必须满足 方程c﹡=1- P(1-P﹙ c ﹡﹚)。假定存在 唯一的一个c﹡,解这个方程,那么下列条 件一定成立: ci﹡ = c﹡= 1- P﹙ c ﹡﹚。 比如说,如果P(· )是定义在﹝0,2﹞上 均匀分布( P(c)≡c/2 ),那么c﹡是唯 一的,等于2/3。为了检查c﹡=2/3确实是个 均衡点,如果参与人i不提供,他的期望支 付是P(c﹡)=1/3;如果成本为c﹡时提供, 他的期望支付为1- c﹡,提供是最优的。
• 那么q2L =1/2(5/4-q1); q2H =1/2(3/4-q1) • 企业1不知道企业2的真实成本从而不知道企 业2的最优反应是q2L还是q2H ,因此企业1选 择q1最大化下列期望利润函数: • E u1 =1/2 q1 (1- q1- q2L )+ 1/2 q1 (1- q1q2H ) 解一阶条件可得企业1的反应函数: • q1﹡= 1/2 (1- q1H- q2L )=1/2(1-Eq2) • 解反应函数可得贝叶斯均衡为: • q1﹡=1/3; q2L﹡=11/24; q2H﹡=5/24
第三章信息经济学的研究方法—博弈论

第一节 概述-人生处处皆博弈
人生是永不停歇的博弈过程,博弈意 略达到合意的结果。
作为博弈者,最佳策略是最大限度地 利用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社 会整体福利增加。
一、博弈论的定义
博弈论(game theory,又译为对策论,游戏论)
定义:研究决策主体的行为在直接相互作用时,人们如 何进行决策、以及这种决策如何达到均衡。
五、博弈论与信息经济学
博弈论是给定信息结构求均衡结果,它实际上是一种均衡理论, 我们最终要找的是一个均衡的结果,博弈论是方法论导向的, 它实际上是一种解决问题的方法。它是一个实证的方法。
信息经济学是给定信息结构求契约的安排。它实际上是一种契 约设计理论,它是问题导向的。它是一个规范的方法。
石匠的决策与拳击手的决策的区别
一、博弈论的定义
2、理性人假设 理性人是指一个很好定义的偏好,在面临给定的约束条件下
最大化自己的偏好。
博弈论说起来有些绕嘴,但理解起来很好理解,那就是 每个对弈者在决定采取哪种行动时,不但要根据自身的利益 和目的行事,而且要考虑到他的决策行为对其他人可能的影 响,通过选择最佳行动计划,来寻求收益或效用的最大化。
(一)囚徒困境
假定: (1)每个局中人都知道博弈规则和博弈结果的支付
矩阵; (2)每个局中人都是理性的(个人理性和个人最优
决策); (3)不能“串通”
(一)囚徒困境——纳什均衡
囚徒A
坦白
坦白 囚徒 B
-8,-8
抵赖 -10,0
抵赖 0,-10 -1,-1
-8大于-10 0大于-1
(坦白,坦白)是纳什均衡
第三章 信息经济学的研究方法 ——博弈论
不完全信息博弈

(0.6)
不建厂
2,1
3 ,0
不完全信息静态下市场进入的博弈树
进入E 高建厂成本 [0.4] 建 (0,-1)
不进入D (2,0) E (2,1)
N○
[0.6]
1
低建厂成本
不建
建 不建
2
D
E
(3,0) (1,-1) (4,0) (1)
D E
D
(3,0)
不完全信息静态市场进入模型 --求解思路
不妨假设:
企业1的单位成本c1是共同信息,企业2的单位成本
c2 是其私人信息,它有高成本 c2H 和低成本 c2L两种情 形,设低成本的概率为p,它是双方的共同知识。
• 给定企业 2 知道企业 1 的成本时,企业 2 将最大化其利
润函数:
π2=q2(a-c2-q1-q2),
其中c2=c2H或c2L依赖于企业2的实际成本。 由此可得企业2的反应函数为: q2*(q1, c2)=(a-c2-q1)/2 它不但依赖于企业1的产量q1,而且依赖于自己的成本 c2。分别记q2L、q2H为企业2在低成本和高成本下的最 优反应产量,分别为:
不完全信息静态市场进入模型 --期望收益
• 在位者有两个信息集:高成本类型和低成本类型, 因而有4种纯策略;潜在进入者只有进入不进入两 种纯策略。 • 海萨尼转换后,支付矩阵变为: 潜在进入者 进入 不进入 0.6,-1 3.2,0 1.2,0.2 2.6,0 1.4,-0.2 3.6,0 2,1 3,0
图示——完全信息情形
q2
q1*(q2) 1/2 1/6 1/4 5/12
在完全信息情形下,满足以上条件时, 若企业2为低成本时,纳什均衡产量为 q1*=1/4,q2L*=1/2。 若企业2为高成本时,则企业1和2的纳 什均衡产量分别为5/12和1/6。 完全信息时的纳什均衡
第九讲不完全信息静态博弈o
Example 2:
Players: The pair of people
States: The set of states is yy, yn, ny, nn Actions: The set of actions of each player is B, S
Signals: Player 1 receive one of two signals, y1 and n1; her
Conclusion: (B, (B, S)), where the component is the action of player 1 and the other component is the pair of actions of the two types of player 2, is a Nash equilibrium.
2. The action of each type of player 2 is optimal, given the action of player 1.
That is, we treat the two types of player 2 as sepatate players and analyze the situation as a three-player strategic game.
1/2
BS 2/3 B 2,1 0,0
S 0,0 1,2
State y y
2:y2
B
1/3
S
1/2
BS 0,1 2,0 1,0 0,2
1:y1
2/3 B S
1/2
BS 2,0 0,2 0,1 1,0
State y n
1:n1
2:n2
B
博弈论四种类型
信息和行动特点
均衡
均衡类型
特别均衡
求解方法
学过的例子
性质
完全信息静态博弈
每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。
纳什均衡
纯战略纳什均衡(PNE)
占优战略纳什均衡(DSE)
箭头法
划线法
Hotelling价格竞争
库诺特价格竞争
多重性和存在性
重复剔除的占有均衡(IFDE)
不断剔除劣战略(弱劣战略的剔除顺序会影响均衡结果
一般一个博弈中存在参与者有多个行动时可以先考虑能否剔除弱战略简化博弈
混合战略纳什均衡(MNE)
聚点均衡
支付最大化法
支付等值法
社会福利博弈
小偷-守卫博弈
完全信息动态博弈
精炼贝叶斯纳什均衡
信号传递博弈
分离均衡
根据所得信息修正判断概率,根据收益最大化决策
信号传递博弈
不完全信息重复博弈与声誉
Milgrom-Roberts垄断限价模型
不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶均衡
贝叶斯纳什均衡
混合战略(不完全信息情况下纯战略均衡的极限)
对原混合战略加入少许不确定性因素,求极限。
性别战
1、均衡存在性
2、不确定性体现为类型的不确定性
一般贝叶斯均衡
Harsanyi转换
机制设计
不完全信息动态博弈
在博弈开始前参与人之间的信息存在不确定性,同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。
完全信息和不完全信息-博弈论相关
3、完全信息和不完全信息:完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数.在不完全信息博弈里,至少有一个参与人不知道其他参与人的支付函数.温泉信息是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。
显然不完全信息意味着不完美信息,但逆命题不成立。
12、完美和不完美信息:不完美信息指的是自然做出了它的选择,但是其他选择人并不知道它的具体选择是什么,金知道各种选择的概率分布。
完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然")的行动选择有准确了解的情况,即每一个信息集只包含一个值。
2、贝叶斯均衡:是纳什均衡在不完全信息博弈中的自然扩展。
在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择.给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其他参与人实际上会选择什么策略,但是它能正确预测到其他参与人的选择如何以来与其各自的类型.这样,他决策的目标就是在给定自己的类型和别人的类型已从战略情况下最大化自己的期望效用14、PBNE贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性选择其他战略。
贝叶斯纳什均衡:P1474、有限次重复博弈:16、重复博弈是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。
定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T小于正无穷)。
那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。
7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。
激励相容约束也是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望他选择的行动。
博弈论与信息经济学 不完全信息静态博弈
不完全信息和贝叶斯纳什均衡
定义:在静态贝叶斯G {A1, , An ; 1, , n ; p1, , pn ;u1, , un}博弈中, 纯策略贝叶斯纳什均衡是一个类型依存策略组
合a (θ) (a1 (1 ),
,
a
n
(
n
)),其中,每个参与人
i
在给定自己的类
型
i
和其他参与人依存策略
a
i
(θ i
不完全信息和贝叶斯纳什均衡
n 人不完全信息静态博弈的时间顺序为:
⑴自然给定类型向量θ 察到 i ,但参与人
(1, ,
j( i
n ) ,其中,i )只知道 p j
(θ j
i
|
,参与人 i 观 j ),观察不
到 i;
⑵参与人同时选择行动,参与人 i 从可行集 Ai (i )中选择行
动 a i,n 人的行动组合为a (a1, , an );
p(i ,i ) p(i )
p(i ,i ) p(i ,i )
ii
这里,p(i ) 是边缘概率。如果类型的分布是独立的,pi (i i ) p(i )
不完全信息和贝叶斯纳什均衡
贝叶斯纳什均衡是完全信息静态博弈纳什均衡概念在不完 全信息静态博弈上的扩展。不完全信息静态博弈又称为静 态贝叶斯博弈。 ◆定义:n人静态贝叶斯博弈的战略式表述包括:参与人的类 型空间 1, , n,条件概率 p1 ,..., pn ,类型依存战略空间
A11,..., An n ,和类型依存支付函数u1(a1, , an ;1),..., un (a1, , an ;n )
参与人i知道自己的类型 i i ,条件概率 pi pi (i i ) 描述 给定自己属于 i 的情况下,参与人i有关其他参与人类型 i i的不确定性。我们用 G {A1, , An ;1, ,n ; p1, , pn ;u1, ,un} 代表这个博弈。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章 不完全信息静态博弈这一章里我们讨论不完全信息静态博弈,也称为贝叶斯博弈(Bayes)。
不完全信息博弈中,至少有一个参与者不能确定另一参与者的收益函数。
非完全信息静态博的一个常见例子是密封报价拍卖(sealed —bid auction):每一报价方知道自己对所售商品的估价,但不知道任何其他报价方对商品的估价;各方的报价放在密封的信封里上交,从而参与者的行动可以被看作是同时的。
静态贝叶斯博弈问题的主要来源也是现实经济活动,许多静态博弈关系都有不完全信息的特征,研究贝叶斯博弈不仅是完善博弈理论的需要,也是解决实际问题的需要。
8.1 静态贝叶斯博弈和贝叶斯纳什均衡为了更好的说明不完全信息与完全信息之间的差异,我们用一个典型静态贝叶斯博弈作为例子,自然的引进静态贝叶斯博弈概念。
考虑如下两寡头进行同时决策的产量竞争模型。
其中市场反需求函数由Q a Q P -=)(给出,这里21q q Q +=为市场中的总产量。
企业1的成本函数为1111)(q c q C =,不过企业2的成本函数以θ的概率为222)(q c q C H =,以θ-1的概率为222)(q c q C L =,这里H L c c <。
并且信息是不对称的:企业2知道自己的成本函数和企业1的成本函数,企业1知道自己的成本函数,但却只知道企业2边际成本为高的概率是θ,边际成本为低的概率是θ-1(企业2可能是新进入这一行业的企业,也可能刚刚发明一项新的生产技术)。
上述一切都是共同知识:企业1知道企业2享有信息优势,企业2知道企业1知道自己的信息优势,如此等等。
现在我们来分析这个静态贝叶斯博弈。
一般情况下,企业2的边际成本较高时选择较低的产量,边际成本较低时,选择较高的产量。
企业1从自己的角度,会预测到企业2根据其成本情况将选择不同的产量。
设企业1的最佳产量选择为*1q ,企业2 边际成本为H c 时的最佳产量选择为)(*2H c q ,企业2 边际成本为L c 时的最佳产量选择为)(*2L c q ,如果企业2的成本较高,它会选择)(*2H c q 满足:类似地,如果企业2的成本较低,)(*2L c q 应满足:从而,企业l 为了使利润最大化,选择*1q 应满足:三个最优化问题的一阶条件为:及 ]})()[(1(])([({211*21*2*1c c q a c c q a q L H ---+--=θθ 三个一阶条件构成的方程组的解为:及 3)1(2*1L H c c c a q θθ-++-=把这里的*1q 、)(*2H c q 和)(*2L c q 与成本分别为1c 和2c 的完全信息古诺均衡相比较,假定1c 和2c 的取值可使得两个企业的均衡产量都为正,在完全信息的条件下,企业的产出为3/)2(*j i i c c a q +-=。
与之不同的,在不完全信息条件下,H H c c q c q =>2*2*2,)(当, L L c c q c q =<2*2*2,)(当。
之所以会出现这种情况,是因为企业2不仅根据自己的成本调整其产出,同时还将考虑到企业l 的情况选择最优反应。
如果企业2的成本较高,它就会因成本较高而减少产量,但同时又会生产稍多一些,因为它知道企业1将根据期望利润最大化的原则决定产出,从而要低于企业1确知企业2成本较高时的产量。
现在,我们要建立非完全信息同时行动博弈的标准式表述,也称为静态贝叶斯博弈。
首先要表示出非完全信息的关键因素,即每一参与者知道他自己的收益函数,但也许不能确知其他参与者的收益函数。
令参与者i 可能的收益函数表示为);,,(1i n i t a a u Λ,其中i t 称为参与者i 的类型(type ),它属于一个可能的类型集(亦称为类型空间(type pace))i T ,每一类型i t 都对应着参与者i 不同的收益函数的可能情况。
作为具体的例子,考虑前面的的古诺博弈。
企业的行动是它们的产量选择1q 和2q 。
企业2有两种可能的成本函数,从而有两种可能的利润或收益函数:企业1只有一种可能的收益函数:我们说企业2的类型空间为了},{2H L c c T =,企业1的类型空间为了}{11c T =。
在这样定义参与者的类型之后,说参与者i 知道自己的收益函数也就等同于说参与者i 知道自己的类型,类似地,说参与者i 可能不确定其他参与者的收益函数,也就等同于说参与者i 不能确定其他参与者的类型,我们用},,,,,{111n i i i t t t t t ΛΛ+--=表示其他参与者的类型。
并用i T -表示i t -所有可能的值的集合,用概率)(i i i t t p -)表示参与者在知道自己的类型是i t 的前提下,对其他参与者类型i t -的推断,即在自己的类型是i t 的前提下,对其他参与者类型i t -出现的条件概率。
在完全信息静态博弈的标准式的基础上,增加类型和推断两个概念,得到静态贝叶斯博弈的标准式概念。
定义9.1 一个n 人静态贝叶斯博弈的标准式表述包括:参与者的行动空间n A A ,,1Λ和它们的类型空间n T T ,,1Λ,他们的推断n p p ,,1Λ,以及他们的收益函数n u u ,,1Λ。
参与者i 的类型作为参与者i 的私人信息,决定了参与者i 的收益函数);,,(1i n i t a a u Λ。
参与者i 的推断)(i i i t t p -描述了i 在给定自己的类型i t 时,对其他n —1个参与者可能的类型i t -的不确定性。
我们用},,;,;,;,,{1111n n n n u u p p T T A A G ΛΛΛΛ=表示这一博弈。
静态贝叶斯博弈的一般表示法,对于由现实问题抽象和建立静态贝叶斯博弈模型,提供了思路和帮助,我们根据静态贝叶斯博弈表达式中的几个方面,来确定模型的主要内容。
不过最重要的问题是如何来分析问题,那么用什么样的方法来分析这类博弈呢?信息的不完全使得博弈分析变的复杂,1967年以前,博弈论专家认为这样的不完全信息博弈是无法分析的,因为当一个参与人不知道在与谁博弈时,博弈的规则是无效的。
海萨尼(Harsanyi ,1967-1968)提出了处理不完全信息博弈的方法,巧妙地引入一个“第三者”----自然,将复杂问题的不完全信息博弈转换为完全但不完美信息博弈,称之为“海萨尼转换”。
海萨尼转换的具体方法是:(1) 一个虚拟的参与人“自然”,自然首先决定参与人的类型,赋予各参与人的类型向量),,(1n t t t Λ=, 其中,n i T t i i ,,1,Λ=∈;(2) 自然告知参与者i 自己的类型,却不告诉其他参与者的类型;(3) 参与者同时选择行动,每一参与者i 从可行集i A 中选择行动方案i a ;(4) 各方得到收益);,,(1i n i t a a u Λ。
借助于第一步和第二步中虚构的参与者“自然”的行动,我们可以把一个不完全信息的博弈表述为一个不完美信息的博弈。
海萨尼转换是处理不完全信息博弈的标准方法。
静态贝叶斯博弈转化的都是两阶段有同时选择的、特殊类型的不完美信息动态博弈,对于这类博弈有专门的分析方法和均衡概念。
为了定义贝叶斯纳什均衡概念,首先定义此类博弈中参与者的战略空间。
动态博弈中参与者的一个战略是关于行动的一个完整计划,包括了参与者在可能会遇到的每一种情况下将选择的可行行动。
在给定的静态贝叶斯博弈的时间顺序中,自然首先行动,赋予每一参与者各自的类型,参与者i 的一个(纯)战略必须包括参与者i 在每一可行的类型下选择的一个可行行动。
定义如下:定义9.2 在静态贝叶斯博弈},,;,;,;,,{1111n n n n u u p p T T A A G ΛΛΛΛ=中,参与者i 的一个战略是一个函数)(i i t s ,其中对i T 中的每一类型i t ,)(i i t s 包含了自然赋予i 的类型为i t 时,i 将从可行集中i A 中选择的行动i a 。
我们用不完全信息古诺模型来阐述战略定义,从前面分析知道博弈的解由三个产量选择组成:*1q 、)(*2H c q 和)(*2L c q 。
用刚刚给出的关于战略的定义,()(*2H c q ,)(*2L c q )就是企业2的战略,*1q 是企业1的战略,很容易想到企业2根据自己的成本情况会选择不同的产量,但是还应注意到的同样重要的一点,是企业l 在选择产量时也应同样考虑企业2将根据不同的成本选择不同的产量。
从而,如果我们的均衡概念要求企业l 的战略是企业2战略的最优反应,则2的战略必须是一对产量,分别对应于两种可能的成本类型,否则企业1就无法计算它的战略是否确实是企业2战略的最优反应,无法进行博弈分析。
给出贝叶斯博弈中关于战略的定义之后,我们就可以定义贝叶斯纳什均衡了。
尽管定义中的符号十分复杂,但中心思路却既简单又熟悉:每一参与者的战略必须是其他参与者战略的最优反应,亦即贝叶斯纳什均衡实际上就是在贝叶斯博弈中的纳什均衡。
定义9.3 在静态贝叶斯博弈},,;,;,;,,{1111n n n n u u p p T T A A G ΛΛΛΛ=中,战略组合),,(**1*n s s s Λ=是一个纯战略贝叶斯纳什均衡,如果对每一参与者i 及对i 的类型集i T 中的每一i t ,)(*i i t s 满足 定义中求最大值的和是对i t -求和,即对其他参与人的各种可能的类型组合求和,“纯策略”的意义与完全信息博弈相同。
当静态贝叶斯博弈中参与人的一个战略组合是贝叶斯纳什均衡时,没有参与者愿意改变自己的战略,即使这种改变只涉及一种类型下的一个行动。
贝叶斯纳什均衡是分析静态贝叶斯博弈的核心概念,一个有限的静态贝叶斯博弈(即博弈中n 是有限的,并且),,(1n A A Λ和),,(1n T T Λ都是有限集)理论上存在贝叶斯纳什均衡,包括采用混合战略的情况。
8.2 应用举例海萨尼(1973)提出这样的一个结论:完全信息静态博弈的混合战略纳什均衡,几乎总是可以解释为与之密切相关、存在少量不完全信息的博弈中的纯战略贝叶斯纳什均衡。
混合战略纳什均衡的重要特征,不是参与者以随机地方法选择一个战略,而是参与者不能确定其他参与人的选择,这种不确定性既可产生于随机因素,又可能(更为合理地)因为少量不完全信息,如下面的例子。
前面所讲的性别战博弈,存在两个纯战略纳什均衡(歌剧,歌剧)和(拳击,拳击)及一个混合战略纳什均衡,其中妻子以2/3的概率选择歌剧,丈夫以2/3的概率选择拳击。
图9-1 性别战现在假设尽管两人已经认识了相当一段时间,但不能完全肯定地把握对方的想法。
假定如果双方都选择歌剧妻子的收益为w t +2,其中w t 的值是妻子的私人信息,双方都去观看拳击时丈夫的收益为h t +2,其中h t 的值为丈夫的私人信息;w t 和h t 相互独立,并服从[0,x ]区间上的均匀分布,(w t 和h t 的值是指原博弈收益的随机扰动项,我们可以认为x 是一个很小的正数)。