(完整版)博弈论知识点总结
《博弈论》知识点总结

《博弈论》知识点总结博弈论作为一门交叉学科,涵盖了数学、经济学、政治学、心理学等多个学科领域。
其研究对象包括零和博弈、非零和博弈、合作博弈、序贯博弈等。
博弈论的应用领域也非常广泛,包括经济学、政治学、社会学、管理学等。
博弈论在求解决策问题、预测市场行为、推导策略和解释社会现象等方面有着广泛的应用。
博弈论的主要内容包括:1.博弈的定义博弈是指互相影响的参与者所进行的一种决策活动。
在博弈中,每个参与者都要做出一个选择,其结果受到其他参与者的选择的影响。
博弈的结果取决于所有参与者的选择。
2.博弈的基本元素博弈的基本元素包括参与者、策略和结果。
参与者是进行决策的主体,策略是参与者可以选择的行为方式,结果是参与者选择策略后所得到的收益或损失。
3.博弈的分类根据参与者的利益关系和决策方式,博弈可以分为零和博弈和非零和博弈。
零和博弈指参与者的利益完全相反,一方获利即意味着另一方损失,而非零和博弈则指参与者的利益可能存在重叠或者是共同合作的情况。
4.博弈的解博弈的解是指在博弈参与者做出决策选择之后,通过某种机制确定最终的结果。
常见的博弈解包括纳什均衡、霍夫达均衡、帕累托最优等。
5.博弈论的应用博弈论在经济学、政治学、社会学等领域有着广泛的应用。
在经济学中,博弈论可以用来解释市场行为、预测价格变动等。
在政治学中,博弈论可以用来分析政治决策、议事程序等。
在社会学中,博弈论可以用来解释群体行为、合作问题等。
博弈论是一门具有重要理论意义和广泛应用价值的学科,它不仅可以帮助人们更好地理解决策制定的规律和机制,还可以为人们提供更科学的决策指导。
在日常生活中,我们可以通过学习和应用博弈论的知识,更加理性地做出决策,并更好地理解他人的选择和行为。
希望未来博弈论能够继续在各个领域发挥作用,为人类社会的进步和发展做出更大的贡献。
博弈论知识点总结

博弈论知识点总结博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。
2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
1、2、 既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
1、参与人集合 :2、每位参与人非空的战略集 S i3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。
与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程{1,2,...,}n Γ=11(,...,,...,)ni i n i s s s s ==∏中遇到决策问题时序列结构的分析。
包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与人在何时行动; 3、序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。
比较:1、战略式博弈从本质上来讲是一种静态模型。
2、扩展式博弈从本质上来讲是一种动态模型。
博弈论总结

博弈论总结博弈论是一门研究决策和策略在竞争环境下的科学,它不仅仅应用于经济学领域,还渗透到了生活的方方面面。
通过分析不同参与者的利益和行动,博弈论揭示了决策者之间的相互关系和可能的结果。
一、基本概念博弈论中的基本概念包括参与者、策略、收益和均衡。
参与者是决策的主体,可以是个人、组织或国家。
策略是参与者根据自身利益选择的行动方式。
收益是参与者在特定策略下获得的结果,可以是利润、权力或其他形式的回报。
博弈论研究的重点是均衡,即在参与者做出决策后,没有动力再次改变策略,这是一种稳定的状态。
二、博弈类型在博弈论中,存在多种不同的博弈类型,其中最经典的是零和博弈和非零和博弈。
零和博弈是指参与者的利益互为对立,一个人的收益必然导致另一个人的损失。
这种博弈策略是零和博弈中的核心,参与者通过优化自身利益来获取最大化的收益。
经典的例子是赌场中的赌博游戏,赌徒之间的输赢是相互抵消的,没有合作的可能。
非零和博弈则将参与者的利益看作是互补的,不同决策者之间可以通过合作或竞争来达到共同的目标。
例如,在商业竞争中,公司之间的合作可以达到双赢的局面,而过度竞争则可能导致市场的破坏。
三、重要理论博弈论涉及了许多重要的理论和策略,其中最著名的是纳什均衡和最优响应。
纳什均衡是博弈论中的重要概念,指的是在参与者做出最优决策的情况下,没有动力再次改变策略。
纳什均衡强调了个体的最佳策略选择,每个参与者都基于其他参与者的行动来做出自己的决策。
最优响应则指的是参与者在其他参与者的选择之后,做出的对自身利益最有利的策略。
这种策略可以是合作的也可以是竞争的,取决于参与者的利益和目标。
四、博弈论的应用博弈论不仅在经济学领域有广泛的应用,还渗透到了生活的各个方面。
在商业中,博弈论可以帮助企业制定市场定价和竞争策略。
通过分析竞争对手的行动,企业可以找到最优的策略以提高自身的竞争力。
在个人生活中,博弈论可以帮助我们理解和处理人际关系。
无论是在家庭、友谊还是爱情关系中,博弈论的概念都可以帮助我们更好地理解彼此行为的动机,并寻求互惠互利的解决方案。
博弈论知识简要

寻找混合策略纳什均衡的思路
• 令各博弈方随机选择纯策略的概率分布,满足使其 他博弈方采用不同策略的期望得益相同,从而计算 出各个博弈方随机选择各纯策略的概率。
• 在猜硬币博弈中,设盖硬币方出正面的概率为p, 出反面的概率为1-p。则猜硬币方猜正面的期望得 益为p·1+(1-p)·(-1)=2p-1,猜反面的期望得益 是p·(-1)+(1-p) ·1=1-2p,令二者相等,得p=1/2。 盖硬币方的混合策略是以(1/2,1/2)的概率随机 选择正面和反面。类似的,可以计算出猜硬币方的 混合策略。
S
i
1,2,...
表示 Si 中的某个特定策略。在静态博弈中,Si 中包含
的所有
S
i
就是第
i 个参与人的所有可选择的行动;ui
是第 i 个参与人的得益函数,它是所有参与人选择的
某个特定策略组合的函数,即
ui
ui
S1
,...,
S
i
,...,
S
n
。
•例 两寡头的产量博弈中,参与人就分别是编号为1和2的两个 企业;其各自的策略选择就是选择各自的产量;其各自的 策略空间就是其各自所能够生产的各种产量的集合。如果 假设两个企业,都能够生产大于0的任何数量的产量,那
下选择什么行动的预先安排; • 行动:参与人在博弈过程中轮到自己选择时所作的某个具体决策; • 得益:参与人从博弈中获得的效用,一般是所有参与人的策略
或行动的函数,这是每个参与人最关心的东西;
• 信息:参与人在博弈中所知道的关于自己以及其他参与人的行 动、策略及其得益函数等知识;
• 均衡:所有参与人的最优策略或行动的组合;
精炼贝叶斯均衡 泽尔腾等
博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。
它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。
下面是博弈论中的一些重要知识点的总结。
1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。
-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。
-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。
2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。
-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。
3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。
-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。
-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。
4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。
-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。
-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。
5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。
-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。
-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。
6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。
-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。
-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。
7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。
-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。
《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。
本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。
关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。
博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。
本文将对博弈论的相关知识进行详细的总结和归纳。
一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。
博弈的基本要素包括:参与者、策略、收益和信息。
1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。
参与者的目标是实现自身利益的最大化。
1.3 策略策略是指参与者在博弈中所能采取的行动或选择。
通常分为纯策略和混合策略。
1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。
收益可以用来衡量参与者的利益大小。
1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。
信息可以分为对称信息和非对称信息。
二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。
常见的均衡概念有纳什均衡、帕累托最优和博弈解。
2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。
2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。
帕累托最优是一种资源分配的有效方式。
2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。
博弈解往往是均衡的特殊情况。
三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。
《博弈论》知识点总结归纳

《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时,通过考虑对方的行动和可能的结果来进行决策的一门学科。
它主要关注对策略的选择与分析,以及对方可能的反应。
下面我们来对博弈论的知识点进行总结归纳。
1.普通博弈和扩展博弈:博弈论分为两类,即普通博弈和扩展博弈。
普通博弈是指参与者在同一时间同时做出决策的博弈,扩展博弈是指参与者在不同的时间节点上做出决策的博弈。
2.博弈的组成要素:博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。
博弈论的目标是通过合理的策略选择来实现最优的支付和效用。
3.纳什均衡:纳什均衡是博弈论中一个重要的概念,指的是当每个参与者都选择了最优的策略后,没有人会改变自己的策略来获得更好的支付。
纳什均衡是博弈的稳定状态。
4.博弈的分类:根据参与者的合作与否,博弈可以分为合作博弈和非合作博弈。
合作博弈中,参与者可以通过合作与其他参与者达成协议,而非合作博弈中,参与者彼此之间没有合作关系。
5.零和博弈和非零和博弈:零和博弈是指所有参与者的支付之和为零的博弈,即一方获利就意味着其他方会损失相应的支付。
非零和博弈是指所有参与者的支付之和不为零的博弈,即所有参与者都有可能获得一定的支付。
6.博弈的解析方法:解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。
解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。
7.博弈的策略选择:博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。
策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。
8.博弈的应用领域:博弈论的应用十分广泛,包括经济学、政治学、生物学、社会学等多个领域。
在经济学中,博弈论被用来研究市场竞争、价格形成等问题,在政治学中,博弈论被用来分析政治决策与合作等问题。
9.孤立型博弈和重复博弈:孤立型博弈是指只进行一轮博弈的情况,参与者只能根据当下的情况来做出决策。
重复博弈是指进行多轮博弈的情况,参与者可以根据之前的决策和结果来进行策略的调整。
博弈论复习..

1.1.7 博弈的主要方面〔要素〕
►博弈的挨次〔Orders〕:行为决策挨次,不同的博 弈挨次产生的博弈结果可能会不同。 ►博弈方的得益〔Payoffs〕:对应于各博弈方的每一 组的可能决策选择,都应当有一个结果表示该策略组 合下各博弈方的所得或所失。“这些”所得所失就是 博弈方的得益,也叫做“支付”。 通常来说,一个博弈,最困难的地方就是确定各博弈方 的得益。博弈的多样性也都是由得益的多样性产生的。
39
1.2.1 囚徒逆境
1.囚徒逆境的根本模型 〔1〕囚徒逆境的根本模型是 塔克 1950年提出的。 〔2〕主题:个人理性与集体理性冲突。 〔3〕囚徒逆境博弈的主要方面〔要素〕: ►局中人:两个共同作案的囚徒;囚徒1、囚徒2; ►策略集合:{坦白,不坦白}; ►博弈的挨次:双方同时选择策略; ►博弈方的得益:如下页得益〔支付〕矩阵中所示。
罗斯
沙普利 20
1.1.3 博弈论与诺贝尔经济学奖
2023年,来自法国图卢兹大学的法国教授让-梯假设尔 (Jean Tirole)因其对市场力气和管制的争论分析获得诺 贝尔经济学奖。
梯假设
21
1.1.4 纳什的故事
《 美 丽 心 灵 》
22
1.1.4 纳什的故事
1928年6月13日,约翰·福布斯·纳什〔John Forbes Nash〕诞生于美国西弗吉尼亚州〔美国较穷的州〕 的布鲁菲尔德市。20岁,1948年9月入普林斯顿 大学作争论生;22岁,1950年获数学博士学位, 并留校任讲师一年。23岁,1951年到麻省理工学 院任教,直到31岁,1959年因精神分裂症而离职。 66岁,1994年获诺贝尔经济学奖。
► 50年月,合作博弈论鼎盛时期,讨价还价模型 —纳什〔1950〕和夏普里〔1953〕,核的概念— 吉利斯和夏普里〔1953〕;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。
2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主题所选择的行动的函数。
从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别:3、博弈论与传统决策的区别:1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。
可表示为:maxU(P,I),其中P为市场价格,I为消费者可支配收入。
2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
1、参与人集合 :2、每位参与人非空的战略集 S i3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn).扩展式博弈:是博弈问题的一种规范性描述。
与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。
包含要素: 1、 参与人集合2、参与人的行动顺序,即每个参与人在何时行动; 3、序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。
比较:1、战略式博弈从本质上来讲是一种静态模型。
2、扩展式博弈从本质上来讲是一种动态模型。
{1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)nii n i ss s s ==∏5、博弈论分类:按决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议可分为:1、合作博弈(强调团体理性、团体最优决策、效率)2、非合作博弈(强调个人理性,个人最优决策)按参与人行动先后顺序可分为:1、静态博弈:博弈中参与人同时行动,或者虽然不是同时行动,但是在行动前不知道其他参与人所选择的行动。
2、动态博弈:参与人的行动有先后顺序,后行动者获得先行动者的行动信息。
按参与人对信息的掌握程度可分为:1、完全信息:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素。
2、不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
按决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。
6、根据所学这四种博弈的特点对这四种博弈做一个对比分析:二、四种博弈类型具体分述1、完全信息静态博弈完全信息静态博弈特点:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
战略和行动相同。
完全信静态博弈相关概念:以新产品开发博弈举例说明:参与人:参与人1和2。
参与人的集合卡表示为:Γ={1,2,…n}.表示所有参与人的集合,在新产品开发博弈中为:Γ={1,2}行动:开发、不开发。
Ai表示参与人行动的集合。
新产品开发博弈中参与人的行动集合为A1=A2={a,b},其中a为开发,b为不开发。
a={a1,a2…an}表示参与人的行动组合。
新产品开发博弈中为:A={(a,a),(a,b),(b,a),(b,b)}战略:参与人的行动规则。
在博弈中的战略可以定义为从观测集到行动集的映射关系,即: Si:Xi—Ai。
用Si={si}表示参与人所有战略的集合。
在n人博弈中,用S=(s1,s2,s3…,s n)表示 n个参与人的战略组合,它表示博弈中每个参与人采取战略si的一种博弈情形。
在完全信息静态博弈中,由于不存在决策时序上的差异,所有参与人在同一决策时点即博弈开始的那一时刻决策,因此,所有参与人面临的决策情形都只有一种,所以,参与人的战略集与行动集相同。
支付:是指参与人在博弈中的所得。
一般情况下也是用效用函数来表示参与人在博弈中的所得。
因此,参与人的支付就可表示为一种特定博弈情形下参与人得到的确定效用水平或期望效用水平。
支付一般用ui(1,2,…,n)表示参与人i的支付(效用水平),支付组合u=(u1,u2,…un)表示参与人在特定博弈情形下所得到的支付,其中为参与人i的支付。
因此,参与人 i=(i=1,2,…,n)的支付就可表示为:ui=ui(s i,s-i).信息:是参与人所具有的有关博弈的所有知识,如有关其它参与人行动或战略的知识、有关参与人支付的知识等等。
在“新产品开发博弈”中,如果两个企业都知道市场需求,那么这样的博弈情形就是我们前面所提到的完全信息假设;如果两个企业中至少有一个不知道市场需求,那么这样的博弈情形就是我们前面所提到的不完全信息假设。
纯战略纳什均衡纯战略:参与人在给定信息下只选择一种特定(或确定性)的战略混合战略:混合战略解释了一个参与人对其他参与人所采取的行动的不确定性,它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。
纯战略纳什均衡中包括:占有均衡、重复剔除劣战略均衡、一般纯战略纳什均衡等。
1、占优均衡占优战略:参与人的最优战略si *与其他参与人的选择 s -i 无关。
无论其他参与人选择什么战略,参与人的最优战略总是唯一的,这样的最优战略称之为“占优战略”。
在n 人博弈中,如果对于所有的其他参与人的选择s -i ,si *都是参与人 i 的最优选择则称si *为参与人的占优战略。
在n 人博弈中,如果对所有参与人都存在占优战略si *,则占优战略组合si*=(s1 * si2*,…, sn *)称为占优战略均衡。
如果所有参与人都有占优战略存在,那么占优战略均衡就是唯一的所有理性参与人可以预测到的博弈结果。
2、重复剔除劣战略如果在一个博弈中,参与人不存在占优战略,但是参与人i 存在两个战略,其中一个战略叫另一个战略的所得效用要大,则理性的参与人绝对不会选择战略。
严格劣战略: 弱劣战略:若重复剔除过程一直可持续到只剩下唯一的战略组合,则该战略组合即为重复剔除的占优均衡,此时该博弈是重复剔除战略可解。
要点:再重复剔除过程中,如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱劣战略,均衡结果可能与剔除顺序有关。
3、一般Nash 均衡Nash 均衡是完全信息静态博弈的解的概念,在完全信息静态博弈中,构成Nash 均衡的战略是不可剔除的,即不存在任何一个战略严格优于Nash 均衡战略。
求解纳什均衡的方法*(,)(,)i i i i i i u s s u s s -->(,)(,)i i i i i i u s s u s s --'''>(,)(,)i i i i i i u s s u s s --'''>(,)(,)i i i i i u s s u s s --'''≥划线法、箭头法。
划线法:1、考察参与人1的最优战略2、用上述方法找出参与人2的最优战略3、找出最优战略组合 箭头法:1、 对于每个战略组合,检查是否有参与人会偏离这个战略组合2、直至找出没有参与人会偏离的战略组合纯战略均衡反映函数:各博弈方选择的纯策略对其他博弈方纯策略的反应。
混合战略纳什均衡混合战略:在博弈 中,对任一参与人i ,设Si={S i 1,…,S i k},则参与人i 的一个混合战略为定义在战略集Si 上的一个概率分布δi={δi 1,…, δi k },其中δi j(j=1,…,k )表示参与人i 选择战略 表示参与人i 选择战略S i j的概率的概率,即δi j满足0≦δi j≦1,其中概率之和为1。
支付:混合战略的支付为各种概率下收益的加权平均。
混合战略纳什均衡:在博弈 中,混合战略组合δi={δ1*,…, δn*}为一个Nash 均衡。
当且仅当 。
混合战略Nash 均衡的求解: 1. 支付最大化法; 2. 支付等值法;混合战略均衡反映函数:在混合策略的范畴内,博弈方的决策是选择概率分布,因此,反应函数就是一方对另一方选择的概率分布的反应。
聚点均衡:在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点”均衡。
这些信息可能与社会文化习惯、参与人过去博弈的历史有关。
11{;,...,;,...,}n n G S S u u =Γ11{;,...,;,...,}n n G S S u u =Γ***,,(,)(,)i i i i i i i i i v v σσσσσ--∀∈Γ∀∈∑≥有不同均衡概念之间的关系:占优均衡<重复剔除劣战略均衡<纯战略纳什均衡<混合战略纳什均衡纳什均衡的多重性与存在性存在性:每个有限战略式博弈(参与人与相应的战略集均为有限)必存在纳什均衡,这个均衡可能是纯战略纳什均衡,也可能是混合战略纳什均衡。
多重性:一个博弈可能有多个均衡,博弈论并没有一个一般的理论证明,哪一个纳什均衡结果一定能出现。
2、完全信息动态博弈完全信息动态博弈特点:在博弈开始之前参与人之间的信息不存在不确定性,但是参与人行动存在先后顺序。
在完全信息动态博弈中,为了表示参与人之间的信息掌握关系,引入了信息及的概念。
完全信息动态博弈有关概念:信息集:信息集I i是参与人i决策结的一个集合,它满足以下两个条件:1、 I i中的每个决策结都是参与人i的决策结;2、当博弈到达I i时,参与人i知道自己处在该信息集中的某个决策结,但不知道是哪一个。