博弈论知识考点

合集下载

《博弈论》知识点总结

《博弈论》知识点总结

《博弈论》知识点总结博弈论作为一门交叉学科,涵盖了数学、经济学、政治学、心理学等多个学科领域。

其研究对象包括零和博弈、非零和博弈、合作博弈、序贯博弈等。

博弈论的应用领域也非常广泛,包括经济学、政治学、社会学、管理学等。

博弈论在求解决策问题、预测市场行为、推导策略和解释社会现象等方面有着广泛的应用。

博弈论的主要内容包括:1.博弈的定义博弈是指互相影响的参与者所进行的一种决策活动。

在博弈中,每个参与者都要做出一个选择,其结果受到其他参与者的选择的影响。

博弈的结果取决于所有参与者的选择。

2.博弈的基本元素博弈的基本元素包括参与者、策略和结果。

参与者是进行决策的主体,策略是参与者可以选择的行为方式,结果是参与者选择策略后所得到的收益或损失。

3.博弈的分类根据参与者的利益关系和决策方式,博弈可以分为零和博弈和非零和博弈。

零和博弈指参与者的利益完全相反,一方获利即意味着另一方损失,而非零和博弈则指参与者的利益可能存在重叠或者是共同合作的情况。

4.博弈的解博弈的解是指在博弈参与者做出决策选择之后,通过某种机制确定最终的结果。

常见的博弈解包括纳什均衡、霍夫达均衡、帕累托最优等。

5.博弈论的应用博弈论在经济学、政治学、社会学等领域有着广泛的应用。

在经济学中,博弈论可以用来解释市场行为、预测价格变动等。

在政治学中,博弈论可以用来分析政治决策、议事程序等。

在社会学中,博弈论可以用来解释群体行为、合作问题等。

博弈论是一门具有重要理论意义和广泛应用价值的学科,它不仅可以帮助人们更好地理解决策制定的规律和机制,还可以为人们提供更科学的决策指导。

在日常生活中,我们可以通过学习和应用博弈论的知识,更加理性地做出决策,并更好地理解他人的选择和行为。

希望未来博弈论能够继续在各个领域发挥作用,为人类社会的进步和发展做出更大的贡献。

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。

它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。

下面是博弈论中的一些重要知识点的总结。

1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。

-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。

-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。

2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。

-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。

3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。

-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。

-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。

4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。

-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。

-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。

5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。

-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。

-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。

6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。

-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。

-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。

7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。

-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。

本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。

关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。

博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。

本文将对博弈论的相关知识进行详细的总结和归纳。

一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。

博弈的基本要素包括:参与者、策略、收益和信息。

1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。

参与者的目标是实现自身利益的最大化。

1.3 策略策略是指参与者在博弈中所能采取的行动或选择。

通常分为纯策略和混合策略。

1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。

收益可以用来衡量参与者的利益大小。

1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。

信息可以分为对称信息和非对称信息。

二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。

常见的均衡概念有纳什均衡、帕累托最优和博弈解。

2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。

2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。

帕累托最优是一种资源分配的有效方式。

2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。

博弈解往往是均衡的特殊情况。

三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。

博弈论考试重点

博弈论考试重点

一、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。

博弈论 研究决策主体的行为及其相互决策和均衡问题的学科。

在经济学中 博弈论是研究经济主体的二、博弈论基本要素博弈参与者、各博弈方各自可选择的全部策略或行为的集合、进行博弈的次序、博弈方的利益、博弈行为、博弈信息、结果、均衡三、名词解释静态博弈:同时决策或者同时行动的博弈属于静态博弈—田忌赛马、猜硬币、古诺模型动态博弈:先后或序贯决策或者行动的博弈属于动态博弈—弈棋、市场进入、领导完全信息博弈:所有博弈方都清楚其他博弈方的得益状况不完全信息博弈(贝叶斯博弈):至少有一个博弈方不完全清楚其他博弈方的得益或得益函数囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。

非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈纳什均衡:在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的冷酷战略:重复博弈中,任何博弈方的一次性不合作将引起其他博弈方的永远不合作,从而导致的所有博弈方的收益减少。

针锋相对战略:参与人在博弈开始时选择合作;在时期t选择对方在时期t-1期所采用的战略,即如果对方在t-1期背叛(不合作),则自己在t期也选择背叛重复博弈:静态或动态博弈的重复进行,即重复进行的博弈过程聚点均衡:在理论上一个博弈中可能有多个纳什均衡点,这时在现实生活中,行为人往往利用在理论上省略掉的那些信息,找到一个大家都感兴趣的点,这个点往往成为现实世界中博弈的最终解。

当参与人之间没有正式的信息交流时,他们存在于其中的“环境”往往可以提供某种暗示,使得参与人不约而同地选择与各自条件相称的策略(聚点),从而达到均衡卡尔多-希克斯标准:一种变革使得受益者的所得足以弥补受损者的所失,这种变革就是卡尔多-希克斯改进。

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时,通过考虑对方的行动和可能的结果来进行决策的一门学科。

它主要关注对策略的选择与分析,以及对方可能的反应。

下面我们来对博弈论的知识点进行总结归纳。

1.普通博弈和扩展博弈:博弈论分为两类,即普通博弈和扩展博弈。

普通博弈是指参与者在同一时间同时做出决策的博弈,扩展博弈是指参与者在不同的时间节点上做出决策的博弈。

2.博弈的组成要素:博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。

博弈论的目标是通过合理的策略选择来实现最优的支付和效用。

3.纳什均衡:纳什均衡是博弈论中一个重要的概念,指的是当每个参与者都选择了最优的策略后,没有人会改变自己的策略来获得更好的支付。

纳什均衡是博弈的稳定状态。

4.博弈的分类:根据参与者的合作与否,博弈可以分为合作博弈和非合作博弈。

合作博弈中,参与者可以通过合作与其他参与者达成协议,而非合作博弈中,参与者彼此之间没有合作关系。

5.零和博弈和非零和博弈:零和博弈是指所有参与者的支付之和为零的博弈,即一方获利就意味着其他方会损失相应的支付。

非零和博弈是指所有参与者的支付之和不为零的博弈,即所有参与者都有可能获得一定的支付。

6.博弈的解析方法:解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。

解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。

7.博弈的策略选择:博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。

策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。

8.博弈的应用领域:博弈论的应用十分广泛,包括经济学、政治学、生物学、社会学等多个领域。

在经济学中,博弈论被用来研究市场竞争、价格形成等问题,在政治学中,博弈论被用来分析政治决策与合作等问题。

9.孤立型博弈和重复博弈:孤立型博弈是指只进行一轮博弈的情况,参与者只能根据当下的情况来做出决策。

重复博弈是指进行多轮博弈的情况,参与者可以根据之前的决策和结果来进行策略的调整。

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。

即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。

1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。

1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。

倘若不能,则称非合作博弈(Non-cooperative game)。

合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。

把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。

完整版)博弈论知识点总结

完整版)博弈论知识点总结

完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。

该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。

博弈中涉及到的变量包括:参与人、行动、战略和信息。

完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。

不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。

博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。

博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。

与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。

扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。

战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。

博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。

根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。

根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。

根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。

不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。

Hotelling价格竞争模型是一种重要的扩展式博弈,用于描述两个企业在同一市场上的价格竞争。

相对应。

占有均衡是指在博弈中存在一组参与人的战略选择,使得每个参与人都无法通过改变自己的战略来提高自己的支付。

博弈论前四章笔记整理

博弈论前四章笔记整理

博弈论前四章笔记整理第一章:博弈论基础概念。

- 博弈的定义与要素。

- 博弈是指在一定的规则下,多个参与者(至少两个)进行策略选择并得到相应结果(收益)的过程。

- 要素包括参与者(局中人)、策略(每个参与者可选择的行动方案)、收益(每个参与者在不同策略组合下的所得)。

例如在“囚徒困境”中,两个囚犯是参与者,坦白或不坦白是他们的策略,不同策略组合下的刑期长短就是收益。

- 博弈的分类。

- 按参与者数量可分为两人博弈和多人博弈。

- 按策略空间是否有限分为有限博弈和无限博弈。

如猜硬币是有限博弈(正面或反面两种策略),企业的产量竞争(产量可在一定范围内连续取值)可能是无限博弈。

- 按收益情况分为零和博弈(一方的收益就是另一方的损失,总和为零,如赌博)、常和博弈(收益总和为常数)和非零和博弈(收益总和不为零,如企业合作共同开拓市场,双方都可能获利)。

第二章:完全信息静态博弈。

- 策略式表述(标准式表述)- 通常用一个矩阵来表示,行代表一个参与者的策略,列代表另一个参与者的策略,矩阵中的元素是对应的收益组合。

以“性别战”为例,丈夫和妻子选择看电影或看球赛,就可以构建一个2×2的收益矩阵。

- 占优策略均衡。

- 占优策略是指无论其他参与者选择什么策略,该策略都是某个参与者的最优策略。

如果每个参与者都有占优策略,那么由这些占优策略组成的策略组合就是占优策略均衡。

例如在“囚徒困境”中,每个囚徒的占优策略都是坦白,所以(坦白,坦白)是占优策略均衡。

- 纳什均衡。

- 纳什均衡是指在一个策略组合中,每个参与者的策略都是对其他参与者策略的最优反应。

即给定其他参与者的策略,没有参与者有动机单方面改变自己的策略。

与占优策略均衡不同,纳什均衡并不要求每个参与者都有占优策略。

例如在“性别战”中,(看电影,看电影)和(看球赛,看球赛)都是纳什均衡。

第三章:完全信息动态博弈。

- 扩展式表述。

- 包括博弈树的构建,节点表示参与者的决策点,树枝表示可选择的策略,终端节点表示博弈的结果并标有相应的收益。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈是人们的行为之间的交互作用博弈论的含义博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。

策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。

在所有社会,人们经常互动。

有时,互动是合作,其他的时候,互动是竞争。

在这两种情况下,都可以用一个术语,即相互依赖性来表示一个人的行为对另外一个人的福利造成的影响。

相互依赖的情形可称为策略环境。

因为人们为了确定所采取的最优行动,必须考虑他周围的其他人会怎样选择行动。

策略对于社会的运行来说,是非常基本的。

我们要学会了解在策略环境下,人们实际上是如何采取行动的,以及他们应该怎样采取行动。

这种系统的研究形成了策略互动的理论。

博弈论三要素:博弈的三个基本要素三个基本要素,即参与人、参与人的策略和参与人的支付。

所谓参与人(或称局中人),就是在博弈中进行决策的个体;所谓参与人的策略,指的是一项规则,根据该规则,参与人在博弈的每一时点上选择如何行动;所谓参与人的支付是指,在所有参与人都选择了各自的策略且博弈已经完成之后,参与人获得的效用(或期望效用)。

3.博弈的简单分类根据参与人的数量,可以分为二人博弈和多人博弈;根据参与人的支付情况,可分为零和博弈和非零和博弈;根据参与人拥有的策略的数量多少,可分为有限博弈和无限博弈;根据参与人在实施策略上是否有时间的先后,可分为同时博弈和序贯博弈。

一些概念:局中人或参与者(Players)规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。

策略(Strategy):一整套的行动方案,规定了各种情况下的行动。

比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。

相机策略(contingent strategy):仅在不确定事件发生时才会采取的策略。

如:人不犯我,我不犯人;人若犯我,我必犯人。

行动:局中人在特定条件下的行为支付( Pay-off ):博弈结束时,各方得到的收益。

策略均衡:参与者之间稳定的、可预测的互动行为模式,就是策略均衡。

上策均衡与纳什均衡上策均衡:我所做的是不管你做什么我所能做的最好的你所做的是不管我做什么你所能做的最好的所谓上策,是指这样一种策略,即不管对手采取什么策略,这种策略都是最优的。

而当对局者选择的都是上策的时候,这种均衡叫做上策均衡。

NASH均衡:我所做的是给定你所做的我所能做的最好的你所做的是给定我所做的你所能做的最好的纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。

在一个纳什均衡里,任何一个参与者都不会改变自己的策略,如果其他参与者不改变策略。

的判别式A 是))(1()(其中,)()()])(1()([)-1()-1()-1()-1(2212121111222221112222211221212111112211211112111111A A q A A q A A A A q A p A A A q A A q A A q p A q p A q p A q p A q p E A --+-=∆+-+∆=+-+--+-=+++=上策均衡与纳什均衡的区别:⑴ 上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。

⑵ 纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。

⑶ 上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。

求纯策略博弈的纳什均衡街解的方法混合策略均衡的情侣博弈,根据支付矩阵计算出博弈双方的期望得益 分析该博弈的纳什均衡的概率分布 寻找混合策略纳什均衡的思路令各博弈方随机选择纯策略的概率分布,满足使其他博弈方采用不同策略的期望得益相同,从而计算出各个博弈方随机选择各纯策略的概率。

在猜硬币博弈中,设盖硬币方出正面的概率为p ,出反面的概率为1-p 。

则猜硬币方猜正面的期望得益为p ·1+(1-p )·(-1)=2p-1,猜反面的期望得益是p ·(-1)+(1-p) ·1=1-2p,令二者相等,得p=1/2。

盖硬币方的混合策略是以(1/2,1/2)的概率随机选择正面和反面。

类似的,可以计算出猜硬币方的混合策略。

.期望支付运用两个参与人的混合策略组合,可以分别表示出两个参与人得到的支付。

博弈树1.博弈树的起点“起点”又叫做“初始决策点”,通常只有一个。

起点是博弈树的“根”,是序贯博弈开始的地方,是博弈的最先行动者进行决策的地方。

2.博弈树的线段从初始决策点出发,向右伸展两条线段,分别表示竞争者可以采取的两个行动或策略。

3.博弈树的中间点中间点又叫做“中间决策点”,通常至少应有两个。

通常在这些中间决策点的旁边标上另一参与人,表示中间点是另一参与人做决策的地方。

博弈树的终点第一,终点不是决策点 终点是博弈结束的地方。

与起点和中间点不同,终点不是决策点:既不是初始决策点,也不是中间决策点。

因此,终点不属于任何的参与人,终点的旁边没有标注任何的参与人。

第二,终点的两层含义一是代表博弈的一个策略组合——从起点开始导向某个终点的所有线段按先后秩序排列的一个组的判别式B 是))(1()(其中,)()()])(1()([)-1()-1()-1()-1(2212121111222221112222211221212111112211211112111111B B q B B q B B B B q B p B B B q B B q B B q p B q p B q p B q p B q p E B --+-=∆+-+∆=+-+--+-=+++=合。

二是代表与某一个策略组合相对应的一个支付组合——在每一个终点的旁边,有一对用圆括号围住的数字,其中的第一个数字是先行动者的支付,第二个数字是后行动者的支付。

逆向归纳法求解子博弈的精炼纳什均衡解逆向归纳法的两个步骤第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈;第二步,再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。

这个最简博弈,就是原博弈的解。

举例情侣博弈简化之后女方的选择完全由男方的选择所决定:男(足)-女(足);男(芭)-女(芭)男方的最优策略是选足球,女也选足球,即最优策略组合为(足球,足球)。

逆向归纳策略总是纳什均衡,纳什均衡不一定是逆向归纳均衡。

先动优势从情侣博弈的例子中可以看到所谓的“先动优势”——先行动者的得益大于后行动者的得益。

如男方先动,逆向归纳的结果就是对男方更有利的纳什均衡(足球,足球);如改为女方先动,则逆向归纳的结果就是对女方更有利的纳什均衡(芭蕾,芭蕾)。

该混合策略纳什均衡给丽娟带来的期望得益是:(1-p)•θ•1+p•θ•0+(1-p) •(1-θ)•(-1)+p•(1- θ) •2=0.5给大海带来的期望得益是:(1-p)•θ•2+p•θ•0+(1-p) •(1-θ)•(-1)+p•(1- θ) •1=0.5丽娟p为丽娟选择芭蕾的概率足芭蕾2,10,0-1,-11,2逆向递归法逻辑基础:动态博弈中先行动的博弈方,在前面阶段选择行为时必然会考虑后行为博弈方在后面阶段的选择,只有在博弈最后一个阶段选择的博弈方才能直接作出明确选择。

而当后面阶段博弈方的选择确定后,前一阶段博弈方的行为也就容易确定了。

一般方法:从动态博弈的最后一个阶段开始分析,每一次确定出所分析阶段博弈方的选择和路径,然后再确定前一个阶段博弈方的选择和路径,逐步向前逆推以求解出动态博弈均衡。

子博弈定义:由一个单结信息集开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。

子博弈精炼纳什均衡定义:如果在一个完全信息动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个子博弈精炼纳什均衡。

幻灯片26以法律保障不足的开金矿博弈为例●策略组合“乙在第一阶段选择‘借’,第三阶段选择‘打’;甲在第二阶段选择‘分’”,即{(借,打),(分)},虽然是整个博弈的一个纳什均衡,但这个策略组合中乙的策略要求乙在第三阶段的子博弈中选择的“打”,不是该子博弈的一个纳什均衡,因此这个策略组合不是子博弈精炼纳什均衡。

●而策略组合{(不借,不打),(不分)}则是该博弈的子博弈精炼纳什均衡。

因为该策略组合的双方策略不仅在整个博弈中构成纳什均衡,而且在两级子博弈中也都构成纳什均衡(从而不存在任何不可信的威胁或承诺)。

●注意:当博弈方按上述子博弈精炼纳什均衡策略组合行动时,实际上不会进行到博弈的第二、三阶段,两博弈方在第二、三阶段的行为实际上不会发生。

但作为完整策略的表达,在描述子博弈精炼纳什均衡的策略选择时,必须将其给出。

幻灯片28三、子博弈精炼纳什均衡求解方法●逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。

●完全信息动态博弈的每一个决策结都是一个单独的信息集,每一个决策结都开始一个子博弈。

这样,可以从最后一个子博弈开始(即从最后一个决策结开始)逆推上去,求解子博弈精炼纳什均衡。

幻灯片30四、承诺行动与子博弈精炼纳什均衡●前面已知,有些纳什均衡之所以不是精炼均衡,是因为它们包含了不可信威胁。

这也意味着,如果参与人能在博弈之前采取某种措施改变自己的行动空间或支付函数,原来不可信的威胁就可能变得可信,博弈的均衡就会相应改变。

将这些为改变博弈结果而采取的措施称为“承诺行动”。

●在许多情况下,承诺行动对当事人是很有价值的。

特别的,有时一个参与人通过减少自己的选择机会使自己受益,原因在于保证自己不选择某些行动可以改变对手的最优选择。

相关文档
最新文档