完整版)博弈论知识点总结
《博弈论》知识点总结

《博弈论》知识点总结博弈论作为一门交叉学科,涵盖了数学、经济学、政治学、心理学等多个学科领域。
其研究对象包括零和博弈、非零和博弈、合作博弈、序贯博弈等。
博弈论的应用领域也非常广泛,包括经济学、政治学、社会学、管理学等。
博弈论在求解决策问题、预测市场行为、推导策略和解释社会现象等方面有着广泛的应用。
博弈论的主要内容包括:1.博弈的定义博弈是指互相影响的参与者所进行的一种决策活动。
在博弈中,每个参与者都要做出一个选择,其结果受到其他参与者的选择的影响。
博弈的结果取决于所有参与者的选择。
2.博弈的基本元素博弈的基本元素包括参与者、策略和结果。
参与者是进行决策的主体,策略是参与者可以选择的行为方式,结果是参与者选择策略后所得到的收益或损失。
3.博弈的分类根据参与者的利益关系和决策方式,博弈可以分为零和博弈和非零和博弈。
零和博弈指参与者的利益完全相反,一方获利即意味着另一方损失,而非零和博弈则指参与者的利益可能存在重叠或者是共同合作的情况。
4.博弈的解博弈的解是指在博弈参与者做出决策选择之后,通过某种机制确定最终的结果。
常见的博弈解包括纳什均衡、霍夫达均衡、帕累托最优等。
5.博弈论的应用博弈论在经济学、政治学、社会学等领域有着广泛的应用。
在经济学中,博弈论可以用来解释市场行为、预测价格变动等。
在政治学中,博弈论可以用来分析政治决策、议事程序等。
在社会学中,博弈论可以用来解释群体行为、合作问题等。
博弈论是一门具有重要理论意义和广泛应用价值的学科,它不仅可以帮助人们更好地理解决策制定的规律和机制,还可以为人们提供更科学的决策指导。
在日常生活中,我们可以通过学习和应用博弈论的知识,更加理性地做出决策,并更好地理解他人的选择和行为。
希望未来博弈论能够继续在各个领域发挥作用,为人类社会的进步和发展做出更大的贡献。
博弈论知识考点

博弈是人们的行为之间的交互作用博弈论的含义博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。
策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。
在所有社会,人们经常互动。
有时,互动是合作,其他的时候,互动是竞争。
在这两种情况下,都可以用一个术语,即相互依赖性来表示一个人的行为对另外一个人的福利造成的影响。
相互依赖的情形可称为策略环境。
因为人们为了确定所采取的最优行动,必须考虑他周围的其他人会怎样选择行动。
策略对于社会的运行来说,是非常基本的。
我们要学会了解在策略环境下,人们实际上是如何采取行动的,以及他们应该怎样采取行动。
这种系统的研究形成了策略互动的理论。
博弈论三要素:博弈的三个基本要素三个基本要素,即参与人、参与人的策略和参与人的支付。
所谓参与人(或称局中人),就是在博弈中进行决策的个体;所谓参与人的策略,指的是一项规则,根据该规则,参与人在博弈的每一时点上选择如何行动;所谓参与人的支付是指,在所有参与人都选择了各自的策略且博弈已经完成之后,参与人获得的效用(或期望效用)。
3.博弈的简单分类根据参与人的数量,可以分为二人博弈和多人博弈;根据参与人的支付情况,可分为零和博弈和非零和博弈;根据参与人拥有的策略的数量多少,可分为有限博弈和无限博弈;根据参与人在实施策略上是否有时间的先后,可分为同时博弈和序贯博弈。
一些概念:局中人或参与者(Players)规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。
策略(Strategy):一整套的行动方案,规定了各种情况下的行动。
比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。
相机策略(contingent strategy):仅在不确定事件发生时才会采取的策略。
如:人不犯我,我不犯人;人若犯我,我必犯人。
行动:局中人在特定条件下的行为支付( Pay-off ):博弈结束时,各方得到的收益。
博弈论知识简要

寻找混合策略纳什均衡的思路
• 令各博弈方随机选择纯策略的概率分布,满足使其 他博弈方采用不同策略的期望得益相同,从而计算 出各个博弈方随机选择各纯策略的概率。
• 在猜硬币博弈中,设盖硬币方出正面的概率为p, 出反面的概率为1-p。则猜硬币方猜正面的期望得 益为p·1+(1-p)·(-1)=2p-1,猜反面的期望得益 是p·(-1)+(1-p) ·1=1-2p,令二者相等,得p=1/2。 盖硬币方的混合策略是以(1/2,1/2)的概率随机 选择正面和反面。类似的,可以计算出猜硬币方的 混合策略。
S
i
1,2,...
表示 Si 中的某个特定策略。在静态博弈中,Si 中包含
的所有
S
i
就是第
i 个参与人的所有可选择的行动;ui
是第 i 个参与人的得益函数,它是所有参与人选择的
某个特定策略组合的函数,即
ui
ui
S1
,...,
S
i
,...,
S
n
。
•例 两寡头的产量博弈中,参与人就分别是编号为1和2的两个 企业;其各自的策略选择就是选择各自的产量;其各自的 策略空间就是其各自所能够生产的各种产量的集合。如果 假设两个企业,都能够生产大于0的任何数量的产量,那
下选择什么行动的预先安排; • 行动:参与人在博弈过程中轮到自己选择时所作的某个具体决策; • 得益:参与人从博弈中获得的效用,一般是所有参与人的策略
或行动的函数,这是每个参与人最关心的东西;
• 信息:参与人在博弈中所知道的关于自己以及其他参与人的行 动、策略及其得益函数等知识;
• 均衡:所有参与人的最优策略或行动的组合;
精炼贝叶斯均衡 泽尔腾等
博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。
它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。
下面是博弈论中的一些重要知识点的总结。
1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。
-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。
-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。
2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。
-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。
3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。
-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。
-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。
4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。
-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。
-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。
5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。
-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。
-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。
6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。
-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。
-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。
7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。
-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。
博弈论复习总结

追 B:女方
不接受
A:追求者 不追 均衡路径
B:女方
接受
不接受
(10,-10) (-50,-40)
(0,0)
(0,0)
第三个NE的均衡结果:(追,(接受,不接受))均衡路径上符合纳什
均衡,非均衡路径上女方不接受得益是0不小于接受的得益0,非均衡路
径是NE,则该均衡是SPNE。
接受
追 B:女方
不接受
囚徒的话: 1、集体理性和个人理性常常是冲突的:民主常常
不能代表“民意”;公司好不见得你就好;如果 我们都强大了,国家不见得就强大了…… 2、承认人是自私的,一切都好办了。
10
2.纳什均衡是唯一的吗?
美国会打朝鲜吗
同时有两个纳什 均衡
美国打了越南,打了阿富汗,打了 伊拉克,也已经打过朝鲜,它还会 再打朝鲜吗?如果美国智库计算出 如下简化的支付矩阵,那么结果会 怎样呢?
博弈论总复习总结
• 博弈类型
类型
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
其他博弈
• 博弈的类型关系
非合作博弈 博弈
合作博弈
是否同时 决策
对他人的 了解程度
静态博弈
动态博弈
完全信息 博弈
不完全信 息博弈
• 博弈的分类
博弈 分类
是否有协议 决策的顺序
是否连续 持续时间 得益情况 得益信息 过程信息
在案例博弈之中,如果局中人甲T、S、N三个策略,那么博
《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。
本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。
关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。
博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。
本文将对博弈论的相关知识进行详细的总结和归纳。
一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。
博弈的基本要素包括:参与者、策略、收益和信息。
1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。
参与者的目标是实现自身利益的最大化。
1.3 策略策略是指参与者在博弈中所能采取的行动或选择。
通常分为纯策略和混合策略。
1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。
收益可以用来衡量参与者的利益大小。
1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。
信息可以分为对称信息和非对称信息。
二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。
常见的均衡概念有纳什均衡、帕累托最优和博弈解。
2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。
2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。
帕累托最优是一种资源分配的有效方式。
2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。
博弈解往往是均衡的特殊情况。
三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。
博弈论总结(精选13篇)

博弈论总结第1篇最大化自己最坏情况下的收益。
着眼于自己的收益,保证自己收益,防止风险使得自己的收益变小。
以性别之战为例子:首先你得先得到一个关于妻子和丈夫的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育 xxx子期望收益(着眼于自己的期望收益): Uw(q,p)=2PQ + 0×P(1-Q) + 0×Q(1-P) +1×(1-P)(1-Q) = 3PQ - P -Q +1 前面的系数参考收益表(妻子收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,妻子的收益可能为0;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看体育,收益同样最小)这里只是在讨论妻子收益最小的可能性4.妻子的最坏收益为:minUw(p,q) = min(1-P,2P)5.最大化最坏收益: max(min(1-P,2P))解的:P=1/3则妻子的maxmin策略为:1/3概率选择韩剧,2/3概率选择体育。
同理得丈夫的maxmin策略为:1/3概率选择体育,2/3概率选择韩剧。
minmax策略 1.最小化对手最好情况下的收益。
是着眼于对手的收益。
还是这样的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育2.丈夫期望收益(着眼于对方的期望收益):(与maxmin不同要注意!!)Uw(q,p)=PQ + 0×P(1-Q) + 0×Q(1-P) +2×(1-P)(1-Q) = 3PQ - 2P -2Q +2前面的系数参考收益表(丈夫收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,如果这时妻子也想看体育,丈夫收益到2;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看韩剧,收益同最大1)这里只是在讨论妻子收益最小的可能性xxx夫的最大收益为:maxUw(p,q) = max(2-2P,P) 5.最小化最好收益: min(max(1-P,2P))妻子的minmax策略:2/3概率选择韩剧,1/3概率选择体育同里丈夫为的minmax为…在零和博弈中,maxmin策略和minmax策略是等价的。
《博弈论》知识点总结归纳

《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时,通过考虑对方的行动和可能的结果来进行决策的一门学科。
它主要关注对策略的选择与分析,以及对方可能的反应。
下面我们来对博弈论的知识点进行总结归纳。
1.普通博弈和扩展博弈:博弈论分为两类,即普通博弈和扩展博弈。
普通博弈是指参与者在同一时间同时做出决策的博弈,扩展博弈是指参与者在不同的时间节点上做出决策的博弈。
2.博弈的组成要素:博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。
博弈论的目标是通过合理的策略选择来实现最优的支付和效用。
3.纳什均衡:纳什均衡是博弈论中一个重要的概念,指的是当每个参与者都选择了最优的策略后,没有人会改变自己的策略来获得更好的支付。
纳什均衡是博弈的稳定状态。
4.博弈的分类:根据参与者的合作与否,博弈可以分为合作博弈和非合作博弈。
合作博弈中,参与者可以通过合作与其他参与者达成协议,而非合作博弈中,参与者彼此之间没有合作关系。
5.零和博弈和非零和博弈:零和博弈是指所有参与者的支付之和为零的博弈,即一方获利就意味着其他方会损失相应的支付。
非零和博弈是指所有参与者的支付之和不为零的博弈,即所有参与者都有可能获得一定的支付。
6.博弈的解析方法:解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。
解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。
7.博弈的策略选择:博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。
策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。
8.博弈的应用领域:博弈论的应用十分广泛,包括经济学、政治学、生物学、社会学等多个领域。
在经济学中,博弈论被用来研究市场竞争、价格形成等问题,在政治学中,博弈论被用来分析政治决策与合作等问题。
9.孤立型博弈和重复博弈:孤立型博弈是指只进行一轮博弈的情况,参与者只能根据当下的情况来做出决策。
重复博弈是指进行多轮博弈的情况,参与者可以根据之前的决策和结果来进行策略的调整。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。
该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。
博弈中涉及到的变量包括:参与人、行动、战略和信息。
完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。
不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。
博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。
博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。
与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。
扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。
战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。
博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。
根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。
根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。
根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。
不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。
Hotelling价格竞争模型是一种重要的扩展式博弈,用于描述两个企业在同一市场上的价格竞争。
相对应。
占有均衡是指在博弈中存在一组参与人的战略选择,使得每个参与人都无法通过改变自己的战略来提高自己的支付。
换句话说,每个参与人都采取了自己的最优战略,而这些最优战略相互协调,没有参与人有动机去改变自己的战略。
这样的战略组合称为占优均衡。
2、重复剔除劣战略均衡重复剔除劣战略均衡是指在博弈中,参与人反复进行决策,并且在每一轮决策中,都能够剔除掉自己的劣战略,最终达到一种均衡状态。
这种均衡状态称为重复剔除劣战略均衡。
3、一般纯战略纳什均衡一般纯战略纳什均衡是指在博弈中,每个参与人都采取了自己的最优战略,而且这些最优战略相互协调,没有参与人有动机去改变自己的战略。
这种均衡状态称为一般纯战略纳什均衡。
以上是新产品开发博弈中的一些基本概念和均衡概念。
在实际应用中,可以根据不同的情况选择不同的博弈模型和均衡概念,以便更好地分析和解决问题。
在博弈论中,占优战略是指在任何情况下都能使参与者获得最大利益的战略。
如果每个参与者都有占优战略,那么这些战略的组合就是占优战略均衡。
这样的博弈结果是所有理性参与者都可以预测到的唯一结果。
如果一个参与者没有占优战略,但是有两个战略中一个比另一个的效用更高,那么这个参与者就不会选择后者。
这种劣战略被称为严格劣战略或弱劣战略。
通过重复剔除劣战略,可以得到占优均衡。
在这个过程中,如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱劣战略,均衡结果可能与剔除顺序有关。
Nash均衡是完全信息静态博弈的解的概念,它指的是不存在任何一个战略严格优于Nash均衡战略的情况。
求解Nash 均衡的方法有划线法和箭头法。
混合战略是参与者在博弈中选择一定概率的各种纯策略的组合。
如果每个参与者都选择混合战略,那么这些战略的组合就是混合战略纳什均衡。
在混合战略纳什均衡中,每个参与者都不能通过改变自己的策略来获得更大的收益。
子博弈是一个独立的博弈,具有与原博弈相同的信息结构。
同时,原博弈也可以作为自身的一个子博弈。
为了解决Nash均衡多重性问题,可以采用精炼的方法,即在Nash均衡的基础上,定义更加合理的博弈解并剔除不合理的均衡。
子博弈精炼纳什均衡是指将那些包含不可置胁战略的纳什均衡从均衡中剔除,从而给出动态博弈结果的一个合理预测。
它要求均衡战略的行为规则在每个信息集上都是最优的。
一个战略组合是子博弈精炼Nash均衡当且仅当它对所有的子博弈(包括原博弈)构成Nash均衡。
逆推归纳法是求解子博弈精炼Nash均衡最常用的方法。
其步骤为:找出博弈的所有子博弈,按照博弈进程的“反方向”逐一求解各个子博弈,直至原博弈。
逆推归纳法所得到的解在各子博弈上构成Nash均衡,即为子博弈精炼纳什均衡。
在完全信息动态博弈中,承诺行动是指在博弈开始之前参与人采取某种改变自己支付或战略空间的行动,使原本不可胁变得可信。
但是参与人的承诺行动是有成本的,否则这种承诺就不可信。
例如,要挟诉讼就是一种博弈,原告几乎不可能胜诉,但其目的是通过私了获得赔偿。
博弈的结果为原告选择不指控,博弈结束。
要使威胁变得可信,就必须采取承诺行动(沉没成本)。
这样参与人的威胁就会变得可信,从而使其他博弈参与人改变策略。
2.6 重复博弈议题重复博弈中,可胁或承诺会如何影响当前的行动,以及在一次无法实现的均衡中,是否可以在重复博弈中实现,是重要的议题。
有限次重复博弈指对于给定的阶段博弈G,重复进行T 次,并且在下一次博弈开始前,所有以前博弈的进程都可被观测到。
有限次重复博弈均衡结论是,如果阶段博弈G有唯一的Nash均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,即G的Nash均衡结果在每一个阶段重复进行。
同时,如果在单阶段博弈中均衡解不只有一个,则将来行动所作的可胁或承诺可以影响当前的行动。
无限次重复博弈指对于一阶段博弈G,重复进行无限次,并且每个参与人在G(∞,δ)中的收益都是该参与人在无限次的阶段博弈中所得收益的现值。
无限次重复博弈的解是无名氏定理,即如果存在可行收益向量(x1,x2,…,xn)满足xi>ei,对于任意xi∈X,则存在贴现率δ,使得无限重复博弈G(∞,δ)存在一个子博弈精炼Nash均衡,其平均收益可达到(x1,x2,…,xn)。
这意味着在无限次重复博弈中,只要参与人具有足够的耐心,任何满足个人理性的可行收益向量都可以通过一个特定的子博弈精炼Nash均衡得到。
影响重复博弈结果的因素是重复的次数和信息的完备性。
2.7 子博弈精炼Nash均衡与Nash均衡的区别子博弈精炼Nash均衡不仅在均衡路径上给出参与人的最优选择,而且在非均衡路径上也能给出参与人的最优选择。
这是因为子博弈精炼Nash均衡在任一决策结上都能给出最优决策,并且不会含有参与人在博弈进程中不合理的、不可置信的行动。
3.不完全信息静态博弈不完全信息静态博弈的特点是在博弈开始之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
在不完全信息静态博弈中,参与人的类型存在不确定性,这会影响博弈的结果。
例如,在市场进入博弈中,位者的成本类型(高成本、低成本)是不完全信息,而在斗鸡博弈中,参与人的性格类型(强硬、软弱)也是不完全信息。
为了解决这种不确定性,___提出了海萨尼转换,即引入虚拟参与人——自然,由自然先决定参与人的不同类型,将不完全信息博弈转换为不完美信息博弈。
这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法称为Harsanyi转换。
海萨尼转换的规定包括:参与人关于“自然”选择的推断为共同知识;“自然”的选择可以是参与人的类型、行动空间或信息掌握程度;参与人关于“自然”选择的推断是基于自己类型判断的条件概率。
通过这种转换,原博弈中参与人的事前不确定性被转变为博弈开始后的不确定性。
在不完全信息静态博弈中,贝叶斯纳什均衡是一种重要的均衡概念。
___博弈包含参与人集合、参与人的类型集合、参与人关于其他参与人类型的推断、参与人类型相依的行动集和参与人类型相依的支付函数这五个要素。
在贝叶斯博弈中,参与人的战略是从参与人的类型集到其行动集的一个函数,它包含了当自然赋予参与人某一类型时,参与人将从可行的行动集中选择的行动。
___博弈的时间顺序为自然选择参与人的类型组合,然后参与人同时选择行动。
___纳什均衡是指在___博弈中,当一个理性的参与人i只知道自己的类型ti而不知道其他参与人的类型时,给定其他参与人的战略-si,他将选择使自己期望效用(支付)最大化的行动ai(ti)。
___博弈纳什均衡的存在性是指一个有限的贝叶斯博弈一定存在___Nash均衡。
混合策略均衡是指在完全信息情况下的混合策略均衡可以解释为不完全信息情况下纯策略均衡的极限。
混合策略的本质不在于参与人随机的选择行动,而在于他不能确定其他参与人将选择什么纯策略,这种不确定性可能来自于参与人不知道其他参与人的类型。
___的基本思想是只要在原来的博弈中加入少许不完全信息因素,使得参与人的支付函数中的收益不再是确定的,而是和一个有范围的不确定参数有关,从而通过将混合战略均衡求解转换为贝叶斯均衡的极限解,但是得到的纯战略贝叶斯均衡就与完全信息下的混合战略均衡相似。
因此,完全信息博弈的混合战略Nash均衡可以解释为与之密切相关、存在一点点非完全信息的纯战略贝叶斯Nash均衡。
同时,___给出了描述混合策略和纯策略之间关系的一个正式的定理:混合策略均衡的纯化定理。
机制设计问题实际上就是探讨设计者如何向参与人提供激励,以促使参与人向设计者透露其掌握的信息(说真话),从而确定对设计者有利的结果的问题。
这一机制对应于一个博弈形式,设计者需要设计出一个博弈形式,让参与人在这个博弈形式下进行博弈从而实现他的目标。
机制设计是典型的3阶段不完全信息博弈,期阶段如下:阶段1,机制设计者(委托人)设计一种“机制”,或者“契约”,或者“激励方案”;阶段2,代理人选择接受或拒绝该机制,拒绝的代理人得到某个外生的“保留效用”;阶段3,接受机制的代理人选择自己的行动(或者战略),实现一个博弈结果。
在这个过程中,设计者必须选择对他来说最有利的博弈形式,即最有利的机制。
机制设计模型中有几个重要的概念需要考虑。
首先是参与约束,这意味着代理人必须接受机制,获得的效用不能小于拒绝机制时获得的效用。
其次是激励相容约束,代理人真实报告自己的类型时获得的效用不能小于谎报时获得的效用。
同时,要设计出可行的可实施机制,既满足参与约束,又满足激励相容约束,以追求最大化收益。
不完全信息动态博弈具有不确定性和先后顺序的特点,参与人需要不断修正信念。
参与人的类型是首先要考虑的,而动态博弈则是行动有先有后,后行动者可以观察到先行动者的行动信息,从而修正自己对于参与人类型的信息的判断。
在这个过程中,参与者的行动传递着有关自己类型的信息,对方可以通过参与人的行动来推断自己的最优行动。