决策及博弈论
第17章 决策与博弈论

第17章决策与博弈论17.1 复习笔记1.博弈论的基本概念(1)博弈及其三个要素博弈论是在一个简化的体系里描述复杂的决策问题,这些决策问题往往涉及多个行为者,他们之间的决策相互依存,相互作用。
博弈包含三个要素:①参与者;②决策;③报酬。
(2)合作与非合作博弈如果在博弈参与者之间可形成共同计划的决策这类具有约束性的合同,那么这类博弈被称为合作性的博弈。
如果在参与者之间不能达成或实施有约束性的合同,这类博弈则被称作非合作性的博弈。
(3)主导策略(占优策略均衡)主导策略是指对某参与者而言,不管其竞争对手的反应如何,这一决策总是最优的策略。
2. 纳什均衡(1)纳什均衡纳什均衡是指在给定对方行动的前提下可以给每个参与者都带来最佳结果的某种决策(或行动)。
达到纳什均衡时,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。
也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而这个均衡没有人有积极性去打破。
占优策略均衡即是一种纳什均衡。
占优策略均衡若存在,只存在惟一均衡,而纳什均衡可能存在多重解。
(2)最大极小决策(囚徒困境)最大极小决策反映的是,从个人角度出发所选择的占优策略,从整体来看,却是最差的结局,即个人理性与团体理性的冲突。
这一决策可以发生在不少的博弈场合,也可以解释卡特尔联盟的不稳定性。
(3)混合策略在有些博弈中,仅采取一种决策或一种行动的“纯决策”不是最好的决策,即可能不存在纳什均衡。
而以某特定的概率P选择一种行为,以1-P的概率选择另一种行为,则有可能是纳什均衡的解。
这时的选择被称为混合策略。
但反过来需要注意,存在混合策略均衡的博弈也有可能存在非混合策略的均衡。
3. 重复博弈重复博弈即同一个博弈被重复多次的动态博弈,它是反复不断进行的。
在无限期重复博弈中,对于任何一个参与者的欺骗和违约行为,其他参与者总会有机会给予报复。
所以,每一个参与者都不会采取违约或欺骗的行为,囚犯困境合作的均衡解是存在的。
博弈与决策

一.名词解释
1.博弈论:根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论。
2.完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。
3.静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动
4.动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。
5.非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合作博弈。
6.纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。
7.纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。
8.纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。
二、请用剔除劣势策略的方法寻找以下博弈的最优策略。
要求: (1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。
答:(1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行;(2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列;(3)余下的策略组合是(坦白,坦白),这就是该博弈的最优结果。
[注:步骤(1)(2)颠倒亦可]。
博弈论与策略决策

博弈论与策略决策博弈论是研究决策者在相互影响下做出决策的一门数学分析工具。
它旨在研究决策双方的策略选择及其对结果的影响。
在现代社会中,博弈论被广泛应用于战略规划、经济学、政治科学等领域。
本文将探讨博弈论在策略决策中的应用及其意义。
一、博弈论基础博弈论的基础概念包括参与者、策略和支付。
参与者是指参与博弈的个体或组织,他们根据自身的利益选择策略。
策略是指参与者可选择的行动方案,而支付则是博弈结果所给予的回报或惩罚。
二、非合作博弈非合作博弈是指参与者在博弈过程中采取相对独立的决策,不进行合作或沟通。
在非合作博弈中,参与者的选择受到其他参与者选择的影响。
在这种情况下,参与者需要通过分析其他参与者的策略来优化自己的决策。
三、纳什均衡纳什均衡是现代博弈论的核心概念。
它指的是在非合作博弈中,参与者选择最优策略,并且没有动机改变自己的策略,因为任何单方行动的改变都不能使其获益。
纳什均衡的存在和稳定性对于理解策略决策的合理性和可能性至关重要。
四、博弈论在经济学中的应用博弈论在经济学中有重要的应用。
例如,在市场竞争中,厂商们面临着相互竞争的博弈环境。
他们需要根据其他竞争者的策略来制定最佳的定价和营销策略,以获得最大的市场份额和利润。
此外,博弈论也可以用于研究拍卖市场、合作与共享资源等经济现象。
五、博弈论在政治科学中的应用博弈论在政治科学中的应用主要是研究政治参与者之间的策略决策。
例如,在选举中,候选人需要根据选民的反应制定竞选策略。
博弈论可以帮助他们预测选民对不同政策的反应,并找到最佳的竞选策略。
此外,博弈论还可以用于研究国际间的冲突与合作等政治问题。
六、博弈论的意义与局限性博弈论为我们提供了思考和分析策略决策的有力工具。
通过研究博弈论,我们可以更好地理解其他参与者的策略和动机,从而优化自己的决策并预测可能的结果。
然而,博弈论也有其局限性,它往往假设参与者具有理性和完全信息。
然而,在现实生活中,参与者的决策常常受到情感、不确定性和信息不对称的影响。
决策与博弈理论分析

3
公共资源分配
在公共资源分配问题中,博弈论可以帮助分析各 方利益诉求和冲突,寻求合理的资源分配方案。
04 基于博弈论决策方法论述
完全信息静态博弈下决策方法
最小最大定理
在完全信息静态博弈中,参与人可以通过选择策略使得自己的最小收益最大化, 即采用最小最大定理进行决策。
纳什均衡
纳什均衡是完全信息静态博弈中的一种稳定状态,参与人在该状态下无法通过单 方面改变策略来增加收益。因此,在决策时应考虑纳什均衡的存在。
通过本课程的学习,我掌握了决 策与博弈论的基本理论和方法, 能够运用所学知识分析和解决实 际问题。
不足之处
在学习过程中,我发现自己在理 论深度和广度方面还有待加强, 需要更加深入地学习和理解相关 知识。
未来计划
我计划在未来的学习中,继续深 入探究决策与博弈论的理论体系, 并尝试将所学知识应用于实际研 究和项目中。
决策与博弈理论分析
目录
• 决策理论基本概念 • 博弈论基础知识 • 决策与博弈关系探讨 • 基于博弈论决策方法论述 • 决策与博弈在现实生活应用举例 • 总结与展望
01 决策理论基本概念
决策定义及分类
决策定义
决策是指在不确定条件下,为实 现特定目标,从多个可行方案中 选择一个最优方案的过程。
决策分类
决策过程与影响因素
决策过程
包括问题识别、信息收集、方案制定、方案评估和选择等步骤。
影响因素
决策者的个人特征(如价值观、经验、能力等)、组织环境(如组织结构、文 化、资源等)以及外部环境(如市场状况、政策法规等)都会对决策过程产生 影响。
02 博弈论基础知识
博弈论定义及发展历程
博弈论定义
博弈论是研究决策过程中理性人之间相互作用及决策均衡的 理论。它分析在竞争或合作环境中,参与者如何根据各自掌 握的信息和对未来结果的预期,选择最优策略以最大化自身 利益。
博弈论和决策理论如何应用于现实生活中?

博弈论和决策理论如何应用于现实生活中?博弈论和决策理论是两门非常重要的学科,它们在现实生活中起到了非常大的作用。
下面将从不同角度探讨博弈论和决策理论的应用。
一、经济角度1.市场分析博弈论可以应用于市场分析。
市场中的个体之间存在着相互关联和相互影响的关系,通过博弈论可以分析市场中各个主体的行为和策略对于市场的影响。
2.拍卖拍卖是一个很好的博弈论应用场景。
在拍卖中,每个人会根据策略来决定自己的出价。
理解拍卖中各个策略的优劣、招标定价的影响等都可以帮助人们更好的参与到拍卖活动中。
二、社会政治角度1.政治决策政治决策中博弈论的应用又很多,从选举到决定政策,都需要考虑博弈论的相关内容。
选民的选择和参与投票本身就是一个博弈,而政策制定过程中扮演不同角色的政府和利益相关者之间的博弈同样是政治决策的内容。
2.危机处理在危机处理中也需要考虑博弈论的相关知识。
比如,在国家之间的沟通谈判中,博弈论是一种非常重要的分析工具。
通过分析对手的策略和行动来确定合适的反应。
三、个人方面1.谈判技巧在谈判中,了解博弈论的知识可以让你更好的制定和调整策略。
明白自己和对手之间所处的情境和策略,可以让你更好的了解谈判中的博弈过程,从而更有机会通过谈判达成自己想要的目的。
2.风险管理决策理论可以帮助你更好的管理风险。
风险本身就是一种博弈,通过决策理论我们可以更好的分析风险和制定应对策略。
结语博弈论和决策理论在现实生活中有广泛的应用。
理解博弈论和决策理论可以帮助我们更好的应对自己的问题和解决现实生活中的复杂情境,不仅可以提升自己的分析能力,也可以帮助我们更加准确的理解现实生活。
经济学中的博弈论与决策理论

经济学中的博弈论与决策理论博弈论和决策理论是经济学中两个重要的分支,它们研究了当涉及到决策和行为选择时,个体之间如何相互作用和相互影响。
这些理论为了解人们在经济环境中作出的决策提供了一种强大的框架。
本文将探讨博弈论和决策理论的基本概念、应用以及对经济学的重要性。
一、博弈论博弈论是研究决策制定者之间相互作用和决策制定的一种数学模型。
它的核心理念是通过分析决策制定者之间的策略选择和可能的结果,来确定最优的决策。
博弈论的一个关键概念是博弈的参与者,他们在特定情境下做出决策,并受到其他参与者决策的影响。
1.1 纳什均衡纳什均衡是博弈论中的一个重要概念。
它描述了一个状态,在该状态下,参与者之间的策略选择是相互协调的,没有人会单方面改变自己的策略来获得更好的结果。
简而言之,纳什均衡是一种稳定的策略选择状态。
1.2 进化博弈论进化博弈论是博弈论的一个分支,它结合了生物学与博弈论的原理。
在进化博弈论中,参与者的策略会随着时间的推移而演化。
那些能够在长期的演进中存活和繁衍的策略将成为主导策略。
这种理论有助于解释为什么在自然环境中存在着一些稳定的行为模式。
二、决策理论决策理论是研究决策制定者如何在面临不确定性的情况下做出决策的一门学科。
它关注的是决策者在不确定信息和风险中作出决策的过程和规律。
决策理论在经济学领域具有广泛的应用,用于解释经济主体(如消费者、生产者)在面对不确定的市场条件下做出的决策。
2.1 风险决策理论风险决策理论是决策理论中的一个重要分支,它研究如何在面临风险和不确定性的情况下做出决策。
在风险决策中,决策制定者权衡可能的结果和概率,以确定最佳的决策方案。
不同的风险态度和风险偏好将对决策结果产生重要影响。
2.2 启发式和认知偏差启发式和认知偏差是指人们在决策过程中所依赖的简化方法和决策中所存在的常见误差。
例如,人们通常倾向于根据可获得的信息做出决策,而不是综合所有可能的信息。
认知偏差也可能导致人们对风险的评估有所偏差,从而影响决策结果。
博弈论策略与决策分析

博弈论策略与决策分析博弈论(Game Theory)是一门数学工具,用于研究决策者之间相互作用的决策问题。
它通过建立模型和分析不同策略的效果,帮助我们做出更明智的决策。
在本文中,我将介绍博弈论的基本概念,并探讨其在决策分析中的应用。
一、博弈论基本概念1.1 纳什均衡纳什均衡(Nash Equilibrium)是博弈论中的一个重要概念,指的是在一个博弈中,每个参与者根据其他参与者的策略选择,无法通过单方面改变自己策略来获得更好的结果。
换句话说,每个参与者都在做出最优策略选择,考虑其他人的行为。
1.2 帕累托最优解帕累托最优解(Pareto Optimality)是指在一个博弈中,无法通过任何改变的手段,改善一个人的情况而不损害其他人的情况。
换句话说,帕累托最优解是一种达到最优利益分配的状态。
二、博弈论策略2.1 常见博弈策略(这里可以详细介绍不同的博弈策略,如:纳什均衡、完全理性、混合策略等)2.2 博弈策略的分析方法(这里可以介绍博弈论中常用的分析方法,如:博弈树分析、博弈矩阵分析等)三、决策分析中的博弈论应用3.1 商业竞争中的决策分析(这里可以举例说明如何利用博弈论进行商业竞争决策分析,如:定价策略、市场份额竞争等)3.2 政治决策中的博弈论应用(这里可以举例说明如何利用博弈论进行政治决策分析,如:选举策略、政策制定等)3.3 环境资源分配中的博弈论应用(这里可以举例说明如何利用博弈论进行环境资源分配决策分析,如:国际气候谈判、水资源分配等)四、博弈论策略与决策分析的局限性4.1 信息不完全性(这里可以介绍博弈论中信息不完全性对决策分析的影响)4.2 策略限制性(这里可以介绍博弈论中策略限制性对决策分析的影响)五、结论博弈论是一种强大的决策分析工具,可以帮助我们理解参与者之间的相互作用,并优化决策结果。
然而,我们也需要认识到博弈论的局限性,将其与其他决策分析方法结合使用,以获得更全面准确的决策结果。
管理决策博弈论

管理决策博弈论博弈论是一个研究决策制定的数学模型和工具,它用数学方法分析参与者之间的竞争、合作以及冲突。
在管理领域,博弈论被广泛应用于分析决策者之间的互动关系,揭示他们之间的策略选择和最终结果。
管理决策博弈论是指在管理实践中应用博弈论原理和方法进行决策的研究,通过博弈模型分析管理决策过程中的不确定性和风险,帮助管理者做出更加明智的决策。
博弈论基础概念在博弈论中,参与者之间的关系可以通过博弈模型来描述。
博弈模型包括博弈参与者、可供选择的策略、策略的影响以及最终结果等要素。
在管理决策博弈论中,管理者通常被视为博弈的参与者,他们在面对不同的选择时需要制定最佳的策略。
博弈论中的基本概念包括博弈参与者、策略、纳什均衡、最优策略等。
博弈参与者是指参与博弈过程的个体或组织,他们的利益可能存在冲突或一致。
策略是指每个参与者可供选择的行动方案,参与者通过选择不同的策略来影响最终的结果。
纳什均衡是指博弈参与者在相互博弈中达到的一种策略组合,使得没有参与者有动机单方面改变自己的策略。
最优策略则是指在给定的情况下,让每个参与者达到最佳的决策结果。
管理决策中的博弈理论应用在管理决策中,博弈论可以应用于多个方面,例如市场竞争、战略合作、资源分配等。
以下是一些管理决策中博弈论的应用案例:市场竞争在市场经济中,企业之间存在激烈的竞争,各方为了争夺市场份额会制定不同的营销策略。
通过博弈模型分析竞争对手的策略选择,可以帮助企业制定更具竞争力的营销策略,实现市场份额的增长。
战略合作在产业链中,不同企业之间可能存在合作关系,通过战略合作可以实现互利共赢。
博弈论可以帮助企业分析合作伙伴可能的策略选择,制定合适的合作方案,提高合作效益。
资源分配在企业管理中,资源分配是一个重要决策,不同部门之间可能存在资源争夺。
通过博弈模型分析资源分配的博弈过程,可以帮助企业管理者做出公平合理的决策,避免资源的浪费和冲突。
博弈论的局限性与挑战尽管博弈论在管理决策中具有重要的应用意义,但也存在一些局限性和挑战。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
L
R
(2.5,3)
(2.5,3)
2
A
B
A
B
(1,1)
(1,2)
(2,1)
(3,3)
图4.1.1 海萨尼转换后的情形
2020/7/3
4
1
L
M
R
(2.5,3)
2
A
B
A
B
(1,1)
(1,2)
(2,1)
(3,3)
图4.1.2
2020/7/3
5
博弈有两个纯策略纳什均衡,(L, A)和(R, B)。 给定参与人1选择L,参与人2的信息集没有达到;给 定参与人2选择A,参与人1的最优选择是L,因此,
在正常需求的情况下,如果进入者选择不进入,则进入者的支付 为0,在位者选择低价时的支付为40,选择高价时的支付为200;如果 进入者选择进入,则当在位者选择低价时,进入者的支付为-80,在位 者支付为-40,当在位者选择高价时,进入者和在位者各得支付80。在 萎缩需求时,在每种情况下,在位者的支付比正常情况少了40;而进 入者选择进入时,其支付比正常情况下也少了40。
类型,即后验概率 ( | m) 要么为0要么为1。
u1(i , mi , a(mi )) u1(i , mj , a(mj ))
2020/7/3
13
信号博弈的完美贝叶斯均衡
定义
混同均衡(pooling equilibrium)在这种均衡中,不同类型 的发送者选择了相同的信号,换句话说,没有任何类型选择与其 他类型不同的信号。这时,接收者无法从信号中得到新的信息, 也就无法对先验信念进行修正。因此,后验概率( | m) 等于自
因此,这个博弈的唯一完美贝叶斯均衡是
{R, B; q 0}
2020/7/3
7
4.1.2 不完全信息下的博弈与决策 服务行业的市场进入模型,博弈顺序为:
(i) 进入者决定进入(E)或不进入(O); (ii) 在位者选择高价(H)或低价(L); (iii)自然选择需求,正常需求(N)的概率为0.6,萎缩需求(R) 的概率为0.4;
同均衡和准分离均衡。更加具体地,它们分别定义如下:
分离均衡(separating equilibrium) 这种均衡中,不同类型 的发送者以概率1选择不同的信号,也就是说,没有两种类型选 择同一信号。在分离均衡中,信号准确地表现类型,特定的类型 发送特定的信号。接收者完全可以通过信号准确判断出发送者的
者的类型 ,n p( ) 1 ;
p( ),而告知发送者
,接收者不知道发送
1
(ii)发送者从信号集M [0, )中选择一信号m发送;
(iii)接收者观察到m后,从可行行动集A [0, )中选择行动a ;
(iv)发送者的效用函数为 或给出接收者的最优反应函数
u1
( , m, a,) 接收者的效用函数为 a( , m,) 两者为共同知识。
(ii)发送者从信号集 M {B,Q}中选择一信号发送; (iii)接收者观察到信号后,从可行行动集A {D, N}中选择行动; (iv)发送者和接收者的效用见图4.2.1,两者为共同知识。
在博弈顺序中,类型1 代表软弱型(wimpy), 2 代表粗暴型 (surly);B代表啤酒,Q代表热狗;D代表与发送者冲突(duel), N代表不与发送者冲突。 [p]表示当接收者接收到信号 Q后,认为发 送者的类型为 1的概率,即 p (1 | Q) 。
先行动者 的类型
行动 推断
后行 动者
2020/7/3
1
先行 动者
预测 信息
后行动者 的行动
后续博弈(continuation game): 从每一个信息集开始 的博弈的剩余部分。
与子博弈的区别:子博弈必须开始于单结信息集,并 且不能切割信息集,而后续博弈可以始于任何完全信息集 (不论是否为单结)。
例:在图4.1.1表示的博弈中,自然赋予参与人1两种类 型,L或H,将类型告诉参与人1,但只将参与人1的类型
分布告诉参与人2. 参与人1有两个行动L和R,参与人2有 行动A和B,参与人2能够观察到参与人1的行动,但是不知
道参与人1的类型(或自然的行动)。
2020/7/3
3
N
L[ P ]
1
L
R
H[1 P ]
(L, A)的剔除:假设参与人2认为参与人1选择 M和R的概率分别为q和1-q。给定这个信念,参与人2
选择A的预期效用是 q1 (1 q)11,选择B的预期效用
是2q 3(1 q) 3 q 1 , 这样,参与人2一定会选择B.
2020/7/3
6
给定参与人1知道参与人2将选择B,参与人1的最
优选择是R。但给定R是参与人1的最优策略,当参与人 2观察到参与人1没有选择L时,他推断参与人1一定选择 了R,即q 0 。
第四章 不完全信息动态博弈
4.1.1 基本概念
不完全信息意味着至少有一个参与人拥有私人信息, 通常用类型表示拥有不同私人信息的参与人,类型由 “自然”或“上帝”给定。
博弈顺序: (1)“自然”选择参与人的类型,并 将类型告诉参与人自己,不告诉其他参与人,只将类型 分布告诉其他参与人;(2)参与人开始行动,参与人 的行动有先有后,后行动者能观察到先行动者的行动, 而不能观察到先行动者的类型。
(L, A)是一个纳什均衡。因为这个博弈只有一个子 博弈(从广义的角度看),即原博弈,所以(L, A) 和(R, B)都是子博弈完美均衡。完美纳什均衡(L, A) 依赖于一个不可置信的威胁:当参与人1偏离L而选择 其他行动时,参与人2的最优行动是选择B,所以, 参 与人1不应该相信参与人2会选择A。
u2 ( , m, a)
后验概率 ( | m)表示观察到信号m,接收者相信是 类型发送的概率。
2020/7/3
11
信号博弈的完美贝叶斯均衡
定义
定义4.2.1 信号博弈的完美贝叶斯均衡(perfect Bayesian
equilibrium)是策略组合(m( ),a(m)) 和后验概率 ( | m) 的结合,
2020/7/3
8
不完全信息下的博弈与决策
根据上面的的行动顺序,可以画出进入者的决策树 (decision tree),见图4.1.3。
进入者
O
E
0 自然
在位者
L
H
[0.5] [0.5]
自然
R
N
[0.4] [0.6]
-120
-80
R
N
[0.4] [0.6]
40
80
图4.1.3 市场进入决策树
2020/7/3
“啤酒和热狗”信号博弈
支付的定性特征是,软弱型宁愿热狗,粗暴型 宁愿啤酒,两种类型都不愿意与接收者冲突,而接 收者宁愿与软弱型冲突,但不愿与粗暴型冲突。具 体地,对两种类型的发送者来说,偏好的早餐价 值 b0 ,不偏好的早餐价值为0,而避免冲突价 值 d 0 。对接收者来说,与软弱型(粗暴型)冲突 的支付为1(-1),所有其他支付为0。
完美贝叶斯均衡要求:(1)在每一个信息集上,决策者 必须有一个定义在属于该信息集的所有决策结上的一个概率 分布(信念);(2)给定有关其他参与人类型的信念,参与 人的策略在每一个信息集开始的后续博弈上构成贝叶斯均衡; (3)在所有可能的情况下(贝叶斯法则能适用),参与人使 用贝叶斯法则修正有关其他参与人类型的信念。
2020/7/3
15
信号博弈的完美贝叶斯均衡
“啤酒和热狗”信号博弈
Cho和Kreps(1987)的“啤酒和热狗(beer and quiche”信号博弈中, 博弈顺序为 :
(i)自然从可行的类型集 {1,2} 中赋予发送者类型 的概率
为 p( ) 0 ,并将 p( )告知接收者,而将 告知发送者,接收者不 知道发送者的类型 ,p(1) 0.1且 p(2 ) 0.9 ;
2020/7/3
14
信号博弈的完美贝叶斯均衡
信号博弈的完美贝叶斯均衡中一般存在不可置信( (incredible)的 均衡,为了剔除之,可以采用Kreps(1984)或Cho和Kreps(1987)
的直观标准(intuitive criterion)。接收者对类型 发出的信号 m所采取的行动记为 a( , m),以替代效用函数中的a,下同。
2020/7/3
2
完美贝叶斯均衡吸取了子博弈完美纳什均衡和贝叶 斯均衡的精华,是贝叶斯均衡、子博弈完美均衡和贝叶 斯推断的结合。
子博弈完美纳什均衡:策略不仅必须是整个博弈的 纳什均衡,还必须是其中每一个子博弈的纳什均衡。
完美贝叶斯均衡:策略不仅必须是整个博弈的贝叶 斯纳什均衡,而且还必须构成每一个后续博弈的贝叶斯 纳什均衡。
直观标准 如果m之后的信息集处于均衡路径之外,且m为类
型 的均衡劣信号,即均衡效用u( ) max u( , m, a( , m)) ,
则(在可能的情况下)接收者的推断 a( ,m) 。
( | m) 0
直观标准的含义是,在非均衡路径中,接收者认为发送者不 会选择无论接收者怎样采取行动发送者的效用总小于均衡时发送 者效用的信号。
2020/7/3
16
信号博弈的完美贝叶斯均衡
“啤酒和热狗”信号博弈
b,1
b+d,0 0,-1
d,0
D [p] Q
N
R D
[1-p] Q N
1
0.1
N
0.9
2
0,1 D B [q]
N d,0 R
D b,-1
B [1-q] N
b+d,0
图4.2.1 “啤酒和热狗”信号博弈
2020/7/3
17
信号博弈的完美贝叶斯均衡
然赋给信号发送者类型 的概率 p( )。
在混同均衡中,对于任何类型的信号发送者,选择均衡信号