不对称信息动态博弈

合集下载

不对称信息中的博弈理论研究

不对称信息中的博弈理论研究博弈理论是一门数学分支，研究的是决策者之间的互动，包括他们的利益、行动和结果。

而不对称信息博弈则是博弈理论中的一个重要分支，它考虑的是决策者之间信息不对称的情况。

在不对称信息博弈中，每个决策者拥有的信息不同，即他们对其他决策者的利益、行动和结果的了解程度不同。

这种不对称的信息会导致博弈的结果出现偏差，因为某些决策者会刻意隐瞒信息或者利用信息不对称来获取更大的利益。

为了更好地理解不对称信息博弈，下面将介绍几个典型的例子。

例一：拍卖拍卖是一种常见的不对称信息博弈。

在一次拍卖中，卖方往往拥有比买方更多的信息。

卖方知道物品的真实价值，而买方则不知道，他们只能通过竞标来猜测真实价值。

这种信息不对称会导致买方在评估价格时出现偏差，从而影响拍卖结果。

为了解决这个问题，拍卖的设计者通常会规定一些规则，如加价规则、起拍价等，来减少信息不对称对拍卖结果的影响。

例二：信用评级信用评级是银行和投资者为了评估借款人信用风险而采用的一种手段。

借款人往往拥有比银行和投资者更多的信息，比如他们自己的收入和支出情况、家庭背景等。

这种不对称的信息可能会导致银行和投资者对借款人的信用风险评估不准确，从而影响他们的决策。

为了解决这个问题，银行和投资者采用了一些方法来纠正借款人信用风险评估的偏差，如通过对借款人的资产和收入进行调查、审核借款人的信用记录等。

例三：医疗保险在医疗保险中，保险公司拥有比被保险人更多的医疗信息，这也是一种典型的不对称信息博弈。

被保险人需要购买医疗保险来应对未来的疾病和治疗费用，而保险公司则需要评估被保险人的健康状况来确定保险费用。

如果被保险人有隐瞒病史或病情的倾向，那么保险公司就很难准确评估被保险人的健康状况。

为了解决这个问题，保险公司通常会进行调查和审核，以确定被保险人的真实健康状况，并制定相应的保险费用。

在不对称信息博弈中，信息的缺失和不确定性是博弈结果偏差的主要原因。

因此，在研究不对称信息博弈时，需要考虑如何减少信息不确定性和缺失，以减少博弈结果的偏差。

不完全信息动态博弈模型

不完全信息动态博弈模型随着信息技术的迅猛发展和普及，人们在日常生活和工作中收集、传递和利用信息的能力越来越强。

然而，在现实生活中，我们常常会面临不完全信息的情况，尤其是在决策和博弈的过程中。

不完全信息动态博弈模型便应运而生，用于研究这种情况下的决策和行为。

不完全信息动态博弈模型指的是在博弈过程中，参与者并不完全了解其他参与者的信息，即参与者们面临着不确定性的决策环境。

在这种情况下，每个参与者的决策都会受到其他参与者决策的影响，而其他参与者的决策又受到他们所接收到的信息的影响。

因此，不完全信息动态博弈模型考虑了参与者的行动、信息和反应的交互作用，揭示了决策者在不完全信息环境下的最优策略。

在不完全信息动态博弈模型中，每个参与者有两个基本要素：策略和信息。

策略是指参与者为了达到自己的目标而采取的行动规则，而信息则是指参与者关于其他参与者决策或环境的知识。

在不完全信息动态博弈模型中，参与者的信息通常分为两种：私有信息和公共信息。

私有信息指的是只有某个参与者能够获得的信息，而公共信息是所有参与者都能够获得的信息。

不完全信息动态博弈模型通常采用博弈树来描述参与者们的行动和决策过程。

博弈树是一种图形化的表示方法，用来展示参与者之间的相互关系和决策的顺序。

在博弈树中，每个节点代表一个状态或者一个决策点，而边则表示参与者们的选择。

通过不完全信息动态博弈模型，我们可以研究和分析参与者们在不完全信息环境下的最优策略。

在这种模型中，参与者们会根据自己拥有的信息和对其他参与者可能行动的推测，选择最优的策略。

同时，他们也会考虑到其他参与者可能的反应和对自己行动的影响，以及在不完全信息环境下可能的不确定性。

不完全信息动态博弈模型在实际应用中有着广泛的应用。

例如，在商业领域中，企业面临着市场竞争和不确定性因素，通过不完全信息动态博弈模型可以帮助企业制定最优的决策策略。

在政治和军事领域中，各方面临着战略竞争和信息不对称的情况，通过不完全信息动态博弈模型可以揭示参与者之间的决策和行为规则。

第5讲-不完全信息动态博弈

第5讲不完全信息动态博弈
1.基本思路
• 在不完全信息动态博弈（dynamic game of incomplete information)中，“自然”首先选择参与人的类型，参与人自己知道，其他参与人不知道；在自然选择之后，参与人开始行动，参与人的行动有先有后，后行动者能观测到先行动者的行动，但不能观测到先行动者的类型。
第5讲不完全信息动态博弈
不一样的。假定存在一个价格P*,只有低成本企业才有利可图，而高成本企业司不敢模仿这个价格的。 • 那么，精炼贝叶斯均衡是，低成本在位者选择P*, 高成本企业选择一个较高的垄断价格。如果进入者观察到在位者选择了P*,这就推断其为低成本，不进入；否则，就认为在位者是高成本，进入。 • 这就是由米尔格罗姆和罗伯茨于1982年提出的著名的“垄断限价模型”。
马上认为这个人一定是好人，除非这件好事非常非常地好，因为否则的话，坏人总是有积极性干件好事以使我们认为他是一个好人）。当然，如果我们认为坏人干好事并不仅仅是为了假装好人，我们对他的看法就不会改变，因为，根据贝叶斯法则：
第5讲不完全信息动态博弈
ProbBP GT p*1 =1
q*0 P*1 这里，p>0是坏人干好事的概率，q>0好人干好事的概率。从上面例子可以看到，我们如何改变对一个人的看法不仅依赖于我们认为他是好人或坏人的先验概率，而且依赖于我们如何“认为”好人干好事和坏人干好事的条件概率。
• 但是，因为参与人的行动是类型依存的，每个参与人的行动都传递着有关自己类型的某种信息，后行动者可以通过观察先行动者所选择的行动来
第5讲不完全信息动态博弈
推断其类型或修正对其类型的先验信念（概率分布），然后选择自己的最优行动。先行动者预测到自己的行动将被后行动者所利用，就会设法选择传递对自己最有利的信息，避免传递对自己不利的信息。 • 因此，博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。

第4讲：不完全信息动态博弈

18
作业
1、下图是一个信号传递博弈：自然首先选择参与人1的类型，参与人1知道自然的选择，参与人2不知道，只知道参与人1属于t1和t2的可能性相等；参与人1然后选择信号L或R；参与人2最后选择行动U或D，博弈结束，效用向量如终点结所示。给出找个博弈的所有纯策略分离均衡和混同均衡。
N
t1
1
L
R
t2 L
在所有这些均衡中，低成本在位者限制自己的价格低于垄断价格以阻止进
入者进入。
15
不完全信息重复博弈与声誉
声誉模型涉及不完全信息重复博弈中的合作行为。
•我们已经知道，在完全信息情况下，不论阶段博弈重复多少次，只有重复的次数是有限的，唯一的均衡是每个参与人在每次博弈中选择单次静态的均衡策略，从而，有限次重复不可能导致参与人的合作行为。
6
则精炼贝叶斯均衡定义为：
精炼贝叶斯均衡是一个策略组合s*()(s1*(1), ,sn*(n)) 和一个后验概率组合p(p1, ,pn) ，满足： 1、精炼条件：对于所有的参与人i，在每一个信息集h，
si*(si,i)argmax pi(i |ahi)ui(si,si,i) si
2、贝叶斯法则：pi(i |ahi)是使用贝叶斯法则从先验概率 pi(i |i)观测到的ahi 和最优策略 s*i 得到的。
1
R
2
2
2
2
U
DU
DU
D
U
D
(1,1) (2,0) (2,2) (0,0) (0,0) (0,1) (1,0) (1,1)
19
2、一对夫妇离婚是要分财产。根据法律规定，婚姻期间形成的财产的所有权各占一半。但因为家庭财产由不同的部分组成，要对财产的价值作一个客观的估计是很困难的；特别地，由于个人的兴趣和出于对未来生活的考虑，夫妻双方对不同财产的评价是不同的。因此，二人免不了要对什么物品归谁所有而发生争执。经过几个回合的谈判，两人同意按以下规则办事：女方对物品作价（如电视机为3000元，电冰箱为2000元，等等）；如果男方愿意支付女方1/2的价格，该物品归男方所有；否则，女方必须支付男方1/2的价格，该物品归女方所有。考虑单件物品（如电视机），我们用vM和vF分别代表该物品对男方和女方的真实价值。假定vM 和vF都是私人信息，但双方都知道vM和vF在区间[2000，3000]上独立、均匀分布（即分布函数是共同知识），求出精炼贝叶斯纳什均衡。

制假售假大量存在的非对称信息动态博弈解释

制假售假大量存在的非对称信息动态博弈解释随着我国市场经济建设的不断深化，以市场为基础的经济活动不断繁荣。

在市场繁荣的同时，市场秩序的整顿也成了人们的关注焦点。

其中之一便是制假售假行为的大量存。

可以说人们的日常生活用品，比如，烟、酒、衣服等，几乎没有一样不存在假冒的。

近年来假冒伪劣商品日益猖獗，尤其以引起民众普遍关注的假奶粉为甚。

假冒伪劣商品的为害性，无论对专利所有者还的对消费者，不说自明。

但制假售假现象何以大量存在？学者们已从不同的角度给予了解释。

本文试图从监管的角度给出一个非对称信息的动态博弈解释，并以此提出治理建议。

一、制假售假的非对称信息动态博弈分析：示范效应与学习机制在市场上，商品生产者无时无刻不面对利益的竞争和诱惑。

为了获得利润，其采用的手段无非有两条：一是合法的手段，如提高要素质量，从而提高产品质量等；二是非法的手段，如采用低劣生产要素，冒用别人商标等。

但市场参与者在很多情况下不是采用合法手段，而是通过非法的手段谋取暴利。

此时，监管者是否有效监管便在很大程度上决定着市场参与者的制假售假程度。

于是，市场参与者便与市场监管者构成了博弈的双方。

市场参与者的制假售假行动和市场监管者的监管查处行动是相互制约和相互影响的。

由于信息是不完全和非对称的，监管者的未来行动对市场参与者来说也是不确定的。

因此，在博弈中每个市场参与者都在不断地收集和利用自己所能掌握的最新信息来修正自己的决策和行动，即不断地进行学习。

虽然制假售假可能获利，也可能受到严厉的惩处；但是，在现实中，由于主客观因素的制约，制假售假者被查处的概率和被惩罚的力度是不确定的。

基于此，潜在的制假售假者在决定要制假售假前不仅考虑市场已有的名义规则，而且更要考虑监管者过去对制假售假者的实际惩处情况。

根据过去制假售假者实际被查处的情况推测自己制假售假后被查处的概率和被惩处的力度，在权衡其利弊得失的基础上再确定是否制假售假。

因此，在这种重复博弈中，市场参与者对监管者的态度自始自终存在一种学习机制；同时监管者对制假售假的实际惩处情况具有一种示范效应。

讲义6不完全信息动态博弈

模型假设的限制
不完全信息动态博弈的模型假设可能受到现实世界的限制。例如，玩家可能不完全了解其他玩家的类型或策略，而这些类型和策略可能随着时间的推移而改变。这需要进一步研究和改进模型假设。
应用挑战
01 02 03
实际应用中的信息不对称
在不完全信息动态博弈中，信息不对称是一个常见的问题。例如，在金融市场中，投资者可能不完全了解公司的财务状况或未来的市场趋势。这使得应用不完全信息动态博弈更加困难，需要更多的数据和信息来建立准确的模型。
不完全信息博弈的未来研究方向
目前，不完全信息博弈的研究已经涉及许多复杂的问题和挑战，未来的研究需要进一步拓展和完善该领域的基础理论和方法，以更好地解释和解决现实世界中的问题。
02
不完全信息动态博弈模型
静态博弈与动态博弈的区别
静态博弈
参与人在同时进行决策，且决策前都不知道其他参与人的类型和策略。
政策制定
公共资源分配
政策制定者可以利用不完全信息动态博弈来分析公共资源的分配问题，如教育、医疗、环保等领域的资源分配。
税收政策
反垄断政策
不完全信息动态博弈可以用于分析企业的垄断行为，为政策制定者提供制定反垄断政策的依据。
政策制定者可以通过分析企业和个人的博弈行为，来制定合理的税收政策，以达到社会福利最大化的目的。
讲义6不完全信息动态博弈
汇报人： 2023-12-15
目录
• 不完全信息博弈概述 • 不完全信息动态博弈模型 • 不完全信息动态博弈的求解方
法 • 不完全信息动态博弈的应用 • 不完全信息动态博弈的挑战与
未来发展 • 不完全信息动态博弈案例研究
01
不完全信息博弈概述
定义与特点

不对称和博弈问题概述PPT课件

独立作出决策选择
2024/1/
博弈论概述
常和博弈与变和博弈
常和博弈（constant-sum game）是指局中人的利益根本对立，各自收益之和是一个常数。
排球等体育比赛的每个回合，双方得分之和恒为1。特点地区特定产品竞争的各企业市场份额其和为一。特例是零和博弈。比如赌博。但股票则未必属于零和博弈。
但是，在位者采取“不抵制”策略，则在位者可以赚取９００，高于“抵制”策略。即使“进入者”赚取了１２００。
什么样的威胁是“可信”的呢？只有当在位者采取“不抵制策略”
导202致4/1收/ 益低于“抵制”策略的时候，才是可信的。
博弈论概述
合作博弈与非合作博弈
合作博弈（cooperative games）：参与人之间达成有约束力的协议条件下的博弈。非合作博弈（non- cooperative games）：参与人之间没有形成有约束力的协议条件下的博弈。也即
寡头厂商的共谋及不稳定
参与者
乙
策略
合作
不合作
（不降价）（降价）
合作
甲（不降价） 10 10 6 12
不合作
（降价） 12 6 8
8
这甚至形成对亚当·斯密的“看不见的手”的理论的质疑。
重复博弈就是解决这个难题的。
“合作-合作”优于“不合作-不合作”，“串谋”是共赢。
这也是卡特尔组织的理论依据。
博弈均衡：博弈中的所有参与者都不想改变自己的策略的这样一种相对静止的状态。
占优策略均衡：由博弈中的所有参与者（自己的）占优策略组合所构成的均衡就是占优策略均衡。
纳什均衡：在这里，任何一个参与者都不会改变自己的最优策略，如果其他参与者均不改变各自的最优策略。

动态不完全信息博弈理论

动态不完全信息博弈理论动态不完全信息博弈理论是博弈论中的重要分支，它研究的是在博弈过程中，玩家面对不完全信息的情况下，如何做出最优策略的决策问题。

这个理论源于经济学领域中的研究，但很快扩展到其他领域，如政治学、管理学等。

在动态不完全信息博弈中，玩家的决策是基于他们对其他玩家信息的预期。

这意味着玩家并不能准确地了解其他玩家的利益、策略或者能力水平。

相反，他们只能根据其他玩家的决策来推测其信息，并以此为依据进行自己的决策。

这种不完全信息的情况给博弈带来了更大的不确定性和复杂性。

在这样的情况下，玩家需要制定一种策略来应对可能出现的各种情况。

这就引出了一个重要的概念，即“可观察策略”。

可观察策略是指玩家在做出决策时，只考虑其他玩家的可观察行为，并忽略其他不可观察的信息。

通过设计合适的可观察策略，玩家可以最大限度地利用信息，提高自己的利益。

动态不完全信息博弈理论的一个重要概念是“博弈树”。

博弈树是一个图形化的工具，用于展示博弈过程中的决策序列和可能的结果。

它有助于玩家更好地理解博弈的动态性，并帮助他们制定出更具策略性的决策。

博弈树的构建基于玩家的信息集。

信息集是指玩家面临同一决策节点时所拥有的信息。

通过将信息集上的决策节点连接起来，就可以形成博弈树。

博弈树上的每一个叶节点表示一个终止状态，即博弈的最终结果。

在动态不完全信息博弈中，一个重要的问题是如何确定最优策略。

最优策略是指可以使玩家获得最大利润的决策序列。

求解最优策略的方法主要有两种：一种是“回溯法”，通过从博弈树的末端开始逆向推导，找到最优解决策；另一种是“正向归纳法”，通过从博弈树的根节点开始向前推演，逐步得到最优解决策。

除了最优策略的求解，动态不完全信息博弈理论还涉及到其他一些重要的概念和模型。

例如，“均衡策略”是指在博弈中，各方参与者的策略相互匹配，不存在任何玩家改变自己策略的动机。

均衡策略是博弈理论中的一个核心概念，它对于博弈的稳定性和结局有着重要的影响。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

不对称信息动态博弈第一节不对称信息动态博弈的描述5.1.1 精炼贝叶斯纳什均衡在不对称信息博弈中，如果考虑博弈的动态性质，就会带来一些新的考量。

下面看看一个例子：例子5.1恋爱博弈在人生中，也许婚姻是最具代表性的不对称信息博弈，并且还是动态的博弈。

结婚的男女双方都不知道对方是否在未来的婚姻生活中是适合自己的。

为了简化分析，我们假定恋爱的一方（譬如男方）知道自己是否适合自对方的，但是对方（女方）并不知道男方是否适合她。

在图5.1中给出的一个不对称信息动态博弈中，“自然”N 首先选择参与人1(男方)的两种类型{}1112=,=θθ适合女方的男方不适合女方的男方中的某一种(当然，对于女方来说，是不是适合自己有多种含义，可以是是不是真心爱自己，也可以是不是能够挣钱，或者两者都有要求)，参与人2（女方）对N 的选择具有不对称信息，她只知道男方适合或者不适合自己的可能性各占一半，我们称参与人2的先验概率为211212()()0.5P P θθ==，参与人2的类型是对称的。

（在现实中，可能男方自己也不知道自己是不是适合对方，譬如自己是否真心爱女方，或者是否能够挣钱；也就是说，男方自己对于自己的类型也是不清楚的；在这里，我们作简化的假定，即男方自己是知道自己的类型的）男方有两个行动可以选择，一个是主动追求女孩L （L 在这里可以表示“爱”（Love ），也表示图中的左边（Left ），一个是不主动追求女孩R （表示“拒绝（refuse ）”或者右边（right ））；女孩也有两个行动可以选择，一个是向男孩示好l ，一个是不向男孩示好r （在这里的大小写没有男权主义的意思）；N图5.1 恋爱博弈我们来分析这样的博弈是如何达到均衡的。

当女方看见男孩追求自己的时候，她不知道男孩子是否是适合自己的，连接两个L 点的虚线就表示女孩子不知道她位于哪一个点上，这两个点都是可能的，它们构成一个“信息集”h ；类似地，连接两个R 点的虚线表示女孩子看见男孩子没有主动追求自己的时候，她不知道她位于哪一个点上，这两个点都是可能的，它们构成一个“信息集”f 。

我们假定策略的选择是“类型依存”的。

当女方选择某个策略时，就规定了她在任意决策结上面的行动选择。

而这样的行动选择可以带来什么样的支付，是取决于男孩子的类型，将这样的依存于男孩子类型的女方支付对男孩子类型进行加权平均，权重就是先验概率，就可以获得女孩子在特定行动选择下的“期望支付”。

譬如，我们假定男孩子的类型依存策略)(1*1θS 为 R S =)(11*1θL S =)(12*1θ（男孩子能够挣钱的时候，很高傲，拒绝女孩子；而他不能够挣钱的时候，就主动追求她）女孩子在信息集h 选择l 的期望支付是0.540.502⨯+⨯=她在信息集f 选择l 的期望支付是0.520.501⨯+⨯=类似地，女孩子在信息集h 选择r 的期望支付是0.530.52 2.5⨯+⨯=她在信息集f 选择r 的期望支付是0.510.52 1.5⨯+⨯=是不是女孩子在信息集f 上面应该选择r 吗？看起来好像应该是这样的，但是，给定男孩子的类型依存策略，女孩子事实上知道她在信息集f 上的时候，她的位置是在左端而不是右端的决策结上，而此时她应该选择的行动是l 而不是r 。

问题出在哪里呢？问题出在我们没有考虑当博弈进行到信息集f 的时候，女孩子观察到男孩子没有向自己示爱（譬如，情人节没有收到男孩子的鲜花），这样的观察是有信息价值的，而不使用这个信息就是不合理的。

当博弈进行到信息集f 的时候，女孩子观察到男孩子没有向自己示爱的时候，女孩子知道自己的位置在左端的决策结。

这意味着，在这里我们没有考虑博弈的“动态”性质。

“动态”性质意味着我们在博弈每进行到下一个信息集的时候，参与人会根据观察到的其他参与人的行动而修正自己关于其他参与人类型的先验概率，从而获得所谓的“后验概率”。

也就是说，在信息集f ，女孩子的后验概率是211212()1,()0P f P f θθ==。

一般地，参与人从先验概率出发，会根据观察到的新的信息获得“后验概率”的方法来自基本的概率论中著名的“贝叶斯公式”.如果参与人i 在其信息集h 上观察到了其他局中人的行动组合h i a -（hi a -的下标i -表示除了第i 位参与人外的其他所有参与人），则根据概率论中的贝叶斯公式：)()|()()|(),(h i h i i i i h i i h i a prob a prob prob a prob a prob --------==θθθθ得到∑-----------==ii i h i i h i h i i h i hi i prob a prob a prob a prob a prob a prob θθθθθθ)()|(),()(),()|( 式中的prob 表示概率。

这个公式就是“贝叶斯公式”或“贝叶斯法则”（Bayes Law ），它将条件概率)|(h i i a prob --θ与先验概率)(i prob -θ联系起来。

这里，在均衡路径上，条件概率)|(h i i a prob --θ就是前述信念)(~i ih P -θ。

这是因为，在均衡路径上，0)(>-h i a prob ，但是，在非均衡路径上，0)(=-h i a prob ，贝叶斯公式的分母为零，贝叶斯公式的分子也为零，因而贝叶斯公式在非均衡路径上给出的条件概率是00型的数，是不确定的。

所以，在非均衡路径，信念形成不受贝叶斯法则的制约，但也不是任意的，因为对于精炼贝叶斯均衡来说，非均衡路径上的信念与均衡路径上按贝叶斯法则决定的信念一起共同决定局中人在每一个信息集上的行动选择所构成的战略组合是精炼贝叶斯均衡。

正是在均衡路径上我们按贝叶斯法则决定信念，所以称这种精炼均衡概念为贝叶斯纳什均衡。

NL R L R图5.1 恋爱博弈同样，在信息集h ，女孩子知道自己在右端的决策结，而她此时选择行动r 。

也就是说，在信息集h ，女孩子的后验概率是211212()0,()1P h P h θθ==；这样，男孩子在右端的决策结就不会选择行动L ，而是选择R 。

所以，原来给出的男孩子策略就不会是均衡。

如果我们改变男孩子的策略，假定是*111()S L θ=*112()S R θ=显然，在信息集h ，女孩子选择行动l ，在信息集f ，她选择行动r 。

给定女孩子的策略，显然男孩子在右端的决策结会选择行动L 而不是R 。

因此这个男孩子策略也不是均衡。

下面我们假定男孩子的策略是L S S ==)()(12*111*1θθ；N图5.1 恋爱博弈那么，女孩子在信息集h 上面没有任何新的信息，后验信息就与先验信息一样；211212()()0.5P h P h θθ==；她选择行动l 和r 的期望支付分别是0.540.5020.530.52 2.5⨯+⨯=⨯+⨯=所以她会选择行动r ；给定男孩子的策略，信息集f 是达不到的，但是，尽管如此，也需要规定女孩子在这个信息集上面的后验概率即“信念”。

这些达不到的信息集被称为“非均衡路径”上面的信息集，非均衡路径上面的信念会影响均衡，非均衡路径上面不同的信念将导致不同的均衡。

假定女孩子在非均衡路径上面的信息集f 上的信念是211212(),()1P f x P f x θθ==-；则她在这个信息集上面选择行动l 和行动r 的期望支付分别是20(1)22(1)2x x x x x x+⨯-=+-=- 如果有2223x xx ≥-≥即则女孩子选择行动l ，否则选择行动r 如果23x ≥，则女孩子选择行动l ，而此时男孩子在任何类型下都选择行动R 。

所以不是均衡。

如果23x <，则女孩子选择行动r ，显然是均衡。

这样一种“均衡”，被称为“精炼贝叶斯纳什均衡”。

显然，这样的“精炼贝叶斯纳什均衡”存在无限多个，因为满足条件23x <的x 存在无限多个。

所以，不仅仅是策略，不同的信念也对应于不同的均衡。

最后我们假定男孩子的策略是**111112()()S S R θθ==；N图5.1 恋爱博弈此时信息集f是均衡路径上的，而信息集h是非均衡路径上的。

在信息集f上，女孩子选择行动r；在信息集h上，假定女孩子的信念是y女孩子选择行动l的期望支付是40(1)4y y y+⨯-=她选择行动r的期望支付是32(1)2y y y+-=+当4223 y y y≥+≥即女孩子选择行动l，否则选择行动r。

如果23y≥，显然右端决策结的男孩子会选择行动L，而不是R，所以，这种情形没有均衡.如果23y<，女孩子选择行动r。

显然是均衡。

这个恋爱博弈的结果都是女孩子拒绝男孩子。

如果我们修改这个博弈中的支付，就可以获得男方求婚成功的均衡。

N在上图中，我们将支付作的修改是：如果男孩子并不喜欢女孩子，即男孩子的类型是12θ，而且在这里，男孩子的类型的含义就是是否爱女孩子。

那么，当男孩子选择的行动是L ，并且女孩子的行动是l 时，男孩子的支付比较小，为1，小于当男孩子选择行动R 并且女孩子选择行动r 时的支付2.这意味着不喜欢这个女孩子的男孩子在与女孩子谈恋爱中获得的效用小于他不与这个女孩子恋爱的效用。

假定男孩子的策略是*111()S L θ=*112()S R θ=显然，这时候博弈的分离均衡是：男孩子按照上述类型依存策略选择行动，而女孩子在信息集h 上选择行动l ，而在信息集f 上选择行动r 。

这个精炼贝叶斯纳什均衡意味着爱女孩子的男孩子获得了女孩子的爱情，可谓“有情人终成眷属”，而不爱女孩子的男孩子与女孩子什么都没有发生。

下面，我们考虑一个类似的博弈，见下图：例5.2 在图5.2中给出的一个不对称信息动态博弈中，“自然”N 首先选择参与人1的两种类型{}1211,θθ中的某一种，但参与人2对N 的选择具有不对称信息，他只知道先验概率为5.0)|()|(21222112==θθθθP P ，参与人2的类型是对称的。

2 2图5.2 一个不对称信息动态博弈如果参与人1的类型依存策略)(1*1θS 为 R S =)(11*1θL S =)(12*1θ试找出与此策略相对应的参与人2的一个类型依存策略)(2*2θS ，使))(),((2*21*1*θθs s S =成为一个精炼贝叶斯均衡。

1，解：参与人2的类型是对称的。

给定)(1*1θS ，参与人2的2个信息集h 和f 都是均衡路径上的。

根据贝叶斯法则，在信息集h 上，参与人的后验概率为211(|)0P h θ= ，212(|)1P h θ= ；同样，在信息集f 上，有211(|)1P f θ= ，212(|)0P f θ= 。

给定这种信念，参与人2在h 上的最优行动是a ，在f 上的最优行动是a 。