(完整word版)博弈论知识点总结,.docx
《博弈论》知识点总结

《博弈论》知识点总结博弈论作为一门交叉学科,涵盖了数学、经济学、政治学、心理学等多个学科领域。
其研究对象包括零和博弈、非零和博弈、合作博弈、序贯博弈等。
博弈论的应用领域也非常广泛,包括经济学、政治学、社会学、管理学等。
博弈论在求解决策问题、预测市场行为、推导策略和解释社会现象等方面有着广泛的应用。
博弈论的主要内容包括:1.博弈的定义博弈是指互相影响的参与者所进行的一种决策活动。
在博弈中,每个参与者都要做出一个选择,其结果受到其他参与者的选择的影响。
博弈的结果取决于所有参与者的选择。
2.博弈的基本元素博弈的基本元素包括参与者、策略和结果。
参与者是进行决策的主体,策略是参与者可以选择的行为方式,结果是参与者选择策略后所得到的收益或损失。
3.博弈的分类根据参与者的利益关系和决策方式,博弈可以分为零和博弈和非零和博弈。
零和博弈指参与者的利益完全相反,一方获利即意味着另一方损失,而非零和博弈则指参与者的利益可能存在重叠或者是共同合作的情况。
4.博弈的解博弈的解是指在博弈参与者做出决策选择之后,通过某种机制确定最终的结果。
常见的博弈解包括纳什均衡、霍夫达均衡、帕累托最优等。
5.博弈论的应用博弈论在经济学、政治学、社会学等领域有着广泛的应用。
在经济学中,博弈论可以用来解释市场行为、预测价格变动等。
在政治学中,博弈论可以用来分析政治决策、议事程序等。
在社会学中,博弈论可以用来解释群体行为、合作问题等。
博弈论是一门具有重要理论意义和广泛应用价值的学科,它不仅可以帮助人们更好地理解决策制定的规律和机制,还可以为人们提供更科学的决策指导。
在日常生活中,我们可以通过学习和应用博弈论的知识,更加理性地做出决策,并更好地理解他人的选择和行为。
希望未来博弈论能够继续在各个领域发挥作用,为人类社会的进步和发展做出更大的贡献。
博弈论知识点总结

博弈论知识点总结博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。
2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
1、2、 既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
1、参与人集合 :2、每位参与人非空的战略集 S i3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。
与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程{1,2,...,}n Γ=11(,...,,...,)ni i n i s s s s ==∏中遇到决策问题时序列结构的分析。
包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与人在何时行动; 3、序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。
比较:1、战略式博弈从本质上来讲是一种静态模型。
2、扩展式博弈从本质上来讲是一种动态模型。
博弈论总结

博弈论总结博弈论是一门研究决策和策略在竞争环境下的科学,它不仅仅应用于经济学领域,还渗透到了生活的方方面面。
通过分析不同参与者的利益和行动,博弈论揭示了决策者之间的相互关系和可能的结果。
一、基本概念博弈论中的基本概念包括参与者、策略、收益和均衡。
参与者是决策的主体,可以是个人、组织或国家。
策略是参与者根据自身利益选择的行动方式。
收益是参与者在特定策略下获得的结果,可以是利润、权力或其他形式的回报。
博弈论研究的重点是均衡,即在参与者做出决策后,没有动力再次改变策略,这是一种稳定的状态。
二、博弈类型在博弈论中,存在多种不同的博弈类型,其中最经典的是零和博弈和非零和博弈。
零和博弈是指参与者的利益互为对立,一个人的收益必然导致另一个人的损失。
这种博弈策略是零和博弈中的核心,参与者通过优化自身利益来获取最大化的收益。
经典的例子是赌场中的赌博游戏,赌徒之间的输赢是相互抵消的,没有合作的可能。
非零和博弈则将参与者的利益看作是互补的,不同决策者之间可以通过合作或竞争来达到共同的目标。
例如,在商业竞争中,公司之间的合作可以达到双赢的局面,而过度竞争则可能导致市场的破坏。
三、重要理论博弈论涉及了许多重要的理论和策略,其中最著名的是纳什均衡和最优响应。
纳什均衡是博弈论中的重要概念,指的是在参与者做出最优决策的情况下,没有动力再次改变策略。
纳什均衡强调了个体的最佳策略选择,每个参与者都基于其他参与者的行动来做出自己的决策。
最优响应则指的是参与者在其他参与者的选择之后,做出的对自身利益最有利的策略。
这种策略可以是合作的也可以是竞争的,取决于参与者的利益和目标。
四、博弈论的应用博弈论不仅在经济学领域有广泛的应用,还渗透到了生活的各个方面。
在商业中,博弈论可以帮助企业制定市场定价和竞争策略。
通过分析竞争对手的行动,企业可以找到最优的策略以提高自身的竞争力。
在个人生活中,博弈论可以帮助我们理解和处理人际关系。
无论是在家庭、友谊还是爱情关系中,博弈论的概念都可以帮助我们更好地理解彼此行为的动机,并寻求互惠互利的解决方案。
博弈论知识简要

寻找混合策略纳什均衡的思路
• 令各博弈方随机选择纯策略的概率分布,满足使其 他博弈方采用不同策略的期望得益相同,从而计算 出各个博弈方随机选择各纯策略的概率。
• 在猜硬币博弈中,设盖硬币方出正面的概率为p, 出反面的概率为1-p。则猜硬币方猜正面的期望得 益为p·1+(1-p)·(-1)=2p-1,猜反面的期望得益 是p·(-1)+(1-p) ·1=1-2p,令二者相等,得p=1/2。 盖硬币方的混合策略是以(1/2,1/2)的概率随机 选择正面和反面。类似的,可以计算出猜硬币方的 混合策略。
S
i
1,2,...
表示 Si 中的某个特定策略。在静态博弈中,Si 中包含
的所有
S
i
就是第
i 个参与人的所有可选择的行动;ui
是第 i 个参与人的得益函数,它是所有参与人选择的
某个特定策略组合的函数,即
ui
ui
S1
,...,
S
i
,...,
S
n
。
•例 两寡头的产量博弈中,参与人就分别是编号为1和2的两个 企业;其各自的策略选择就是选择各自的产量;其各自的 策略空间就是其各自所能够生产的各种产量的集合。如果 假设两个企业,都能够生产大于0的任何数量的产量,那
下选择什么行动的预先安排; • 行动:参与人在博弈过程中轮到自己选择时所作的某个具体决策; • 得益:参与人从博弈中获得的效用,一般是所有参与人的策略
或行动的函数,这是每个参与人最关心的东西;
• 信息:参与人在博弈中所知道的关于自己以及其他参与人的行 动、策略及其得益函数等知识;
• 均衡:所有参与人的最优策略或行动的组合;
精炼贝叶斯均衡 泽尔腾等
博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。
它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。
下面是博弈论中的一些重要知识点的总结。
1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。
-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。
-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。
2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。
-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。
3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。
-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。
-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。
4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。
-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。
-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。
5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。
-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。
-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。
6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。
-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。
-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。
7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。
-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。
《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。
本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。
关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。
博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。
本文将对博弈论的相关知识进行详细的总结和归纳。
一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。
博弈的基本要素包括:参与者、策略、收益和信息。
1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。
参与者的目标是实现自身利益的最大化。
1.3 策略策略是指参与者在博弈中所能采取的行动或选择。
通常分为纯策略和混合策略。
1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。
收益可以用来衡量参与者的利益大小。
1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。
信息可以分为对称信息和非对称信息。
二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。
常见的均衡概念有纳什均衡、帕累托最优和博弈解。
2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。
2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。
帕累托最优是一种资源分配的有效方式。
2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。
博弈解往往是均衡的特殊情况。
三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。
《博弈论》知识点总结归纳

《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时,通过考虑对方的行动和可能的结果来进行决策的一门学科。
它主要关注对策略的选择与分析,以及对方可能的反应。
下面我们来对博弈论的知识点进行总结归纳。
1.普通博弈和扩展博弈:博弈论分为两类,即普通博弈和扩展博弈。
普通博弈是指参与者在同一时间同时做出决策的博弈,扩展博弈是指参与者在不同的时间节点上做出决策的博弈。
2.博弈的组成要素:博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。
博弈论的目标是通过合理的策略选择来实现最优的支付和效用。
3.纳什均衡:纳什均衡是博弈论中一个重要的概念,指的是当每个参与者都选择了最优的策略后,没有人会改变自己的策略来获得更好的支付。
纳什均衡是博弈的稳定状态。
4.博弈的分类:根据参与者的合作与否,博弈可以分为合作博弈和非合作博弈。
合作博弈中,参与者可以通过合作与其他参与者达成协议,而非合作博弈中,参与者彼此之间没有合作关系。
5.零和博弈和非零和博弈:零和博弈是指所有参与者的支付之和为零的博弈,即一方获利就意味着其他方会损失相应的支付。
非零和博弈是指所有参与者的支付之和不为零的博弈,即所有参与者都有可能获得一定的支付。
6.博弈的解析方法:解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。
解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。
7.博弈的策略选择:博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。
策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。
8.博弈的应用领域:博弈论的应用十分广泛,包括经济学、政治学、生物学、社会学等多个领域。
在经济学中,博弈论被用来研究市场竞争、价格形成等问题,在政治学中,博弈论被用来分析政治决策与合作等问题。
9.孤立型博弈和重复博弈:孤立型博弈是指只进行一轮博弈的情况,参与者只能根据当下的情况来做出决策。
重复博弈是指进行多轮博弈的情况,参与者可以根据之前的决策和结果来进行策略的调整。
博弈论复习..

1.1.7 博弈的主要方面〔要素〕
►博弈的挨次〔Orders〕:行为决策挨次,不同的博 弈挨次产生的博弈结果可能会不同。 ►博弈方的得益〔Payoffs〕:对应于各博弈方的每一 组的可能决策选择,都应当有一个结果表示该策略组 合下各博弈方的所得或所失。“这些”所得所失就是 博弈方的得益,也叫做“支付”。 通常来说,一个博弈,最困难的地方就是确定各博弈方 的得益。博弈的多样性也都是由得益的多样性产生的。
39
1.2.1 囚徒逆境
1.囚徒逆境的根本模型 〔1〕囚徒逆境的根本模型是 塔克 1950年提出的。 〔2〕主题:个人理性与集体理性冲突。 〔3〕囚徒逆境博弈的主要方面〔要素〕: ►局中人:两个共同作案的囚徒;囚徒1、囚徒2; ►策略集合:{坦白,不坦白}; ►博弈的挨次:双方同时选择策略; ►博弈方的得益:如下页得益〔支付〕矩阵中所示。
罗斯
沙普利 20
1.1.3 博弈论与诺贝尔经济学奖
2023年,来自法国图卢兹大学的法国教授让-梯假设尔 (Jean Tirole)因其对市场力气和管制的争论分析获得诺 贝尔经济学奖。
梯假设
21
1.1.4 纳什的故事
《 美 丽 心 灵 》
22
1.1.4 纳什的故事
1928年6月13日,约翰·福布斯·纳什〔John Forbes Nash〕诞生于美国西弗吉尼亚州〔美国较穷的州〕 的布鲁菲尔德市。20岁,1948年9月入普林斯顿 大学作争论生;22岁,1950年获数学博士学位, 并留校任讲师一年。23岁,1951年到麻省理工学 院任教,直到31岁,1959年因精神分裂症而离职。 66岁,1994年获诺贝尔经济学奖。
► 50年月,合作博弈论鼎盛时期,讨价还价模型 —纳什〔1950〕和夏普里〔1953〕,核的概念— 吉利斯和夏普里〔1953〕;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论知识总结博弈概述:1、博弈概念:博弈:就是研究决策主体的行生直接相互作用的决策以及种决策的均衡。
博弈研究的假:1、决策主体是理性的,最大化自己的收益。
2、完全理性是共同知3、每个参与人被假定可以所境以及其他参与者的行形成正确的信念与期2、和博弈有关的量:博弈参与人:博弈中行以最大化自己受益的决策主体。
行:参与人的决策略:参与人的行,即事件与决策主体行之的映射,也是参与人行的。
信息:参与人在博弈中的知,尤其是其他决策主体的略、收益、型(不完全信息)等的信息。
完全信息:每个参与人其他参与人的支付函数有准确的了解;完美信息:在博弈程的任何点每个参与人都能察并之前各局中人所的行,否不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、略空及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主所的行的函数。
从学的角度,博弈是决策主体之的相互作用,因此和个人决策存在着区:3、博弈与决策的区:1、微学的个人决策就是在定市价格、消者收入条件下,最大化自己效用,研究工具是无差异曲。
可表示:maxU(P,I),其中 P 市价格, I 消者可支配收入。
2、其他消者个人的合影响表示一个参数——市价格,所以在市价格既定下,消者效用只依于自己的收入和偏好,不用考其他消者的影响。
但是在博弈理个人效用函数依于其他决策者的和效用函数。
4、博弈的表示形式:略式博弈和展式博弈略式博弈:是博弈的一种范性描述,有亦称准式博弈。
略式博弈是一种假每个参与人一次行或略,并且参与人同行的决策模型,因此,从本上来略式博弈是一种静模型,一般适用于描述不需要考博弈程的完全信息静博弈。
1、参与人集合{ 1 , 2,...,n }:2、每位参与人非空的略集Sins i(s1,...,si,..., sn)上的效用函数Ui(s1,s2,⋯,sn).3、每位参与人定在略合i1展式博弈:是博弈的一种范性描述。
与略式博弈重博弈果的描述相比,展式博弈更注重参与人在博弈程中遇到决策序列构的分析。
包含要素:1 、参与人集合{ 1 , 2,...,n }类型完全信息静态博弈2 、参与人的行动顺序,即每个参与人在何时行动;3 、序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息;4 、参与人的支付函数。
比较:1、战略式博弈从本质上来讲是一种静态模型。
2、扩展式博弈从本质上来讲是一种动态模型。
5、博弈论分类:按决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议可分为:1、合作博弈(强调团体理性、团体最优决策、效率)2、非合作博弈(强调个人理性,个人最优决策)按参与人行动先后顺序可分为:1、静态博弈:博弈中参与人同时行动,或者虽然不是同时行动,但是在行动前不知道其他参与人所选择的行动。
2、动态博弈:参与人的行动有先后顺序,后行动者获得先行动者的行动信息。
按参与人对信息的掌握程度可分为:1、完全信息:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素。
2、不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
按决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。
静态动态完全信息完全信息静态博弈完全信息动态博弈均衡:纳什均衡均衡:子博弈精炼纳什均衡不完全信息不完全信息静态博弈不完全信息动态博弈均衡:贝叶斯纳什均衡均衡:精炼贝叶斯纳什均衡6、根据所学这四种博弈的特点对这四种博弈做一个对比分析:信息和行动特点均衡均衡类型特别均衡求解方法学过的例子性质每个参与人对其纳什均纯战略纳占优战略纳箭头法Hotelling 价格竞多重性和存他所有参与人的衡什均衡什均衡划线法争在性特征、战略空间及(PNE)( DSE)库诺特价格竞争支付函数有精确重复剔除的不断剔除劣一般一个博弈中的了解,博弈开始占有均衡战略(弱劣存在参与者有多时不存在不确定(IFDE)战略的剔除个行动时可以先性因素,参与人同顺序会影响考虑能否剔除弱时行动或者不是均衡结果战略简化博弈同时行动但是后混合战略聚点均衡支付最大化社会福利博弈行动者不知道行纳什均衡法小偷-守卫博弈动者的行动信息。
(MNE)支付等值法战略和行动相同。
完全信在博弈开始之前子博弈息动态参与人之间的信精炼纳博弈息不存在不确定什均衡性,但是参与人行动存在先后顺序。
在完全信息动态博弈中,为了表示参与人之间的信息掌握关系,引入了信息及的概念。
不完全在博弈开始之前贝叶斯信息静参与人之间的信纳什均态博弈息存在不确定性,衡但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
不确定是参与人的了性的不确定性子博弈精有限次重复与纳什均衡连锁店悖论炼纳什均博弈均衡的唯一性有衡关无限次重复与贴现因子囚徒困境(冷酷博弈均衡有关战略)(无名氏定无限期轮流讨价理)还价模型一般博弈逆向归纳法斯坦科尔伯格寡求解头竞争雇主与公会之间的竞争贝叶斯纳混合战略对原混合战性别战什均衡(不完全信略加入少许息情况下纯不确定性因战略均衡的素,求极限。
极限)一般贝叶斯Harsanyi 转机制设计均衡换1、均衡结果是原博弈的Nash 均衡;2、同时在每一个子博弈上构成Nash 均衡1、均衡存在性2、不确定性体现为类型的不确定性不完全信息动态博弈在博弈开始前参精炼贝信号传递分离均衡与人之间的信息叶斯纳博弈存在不确定性,同什均衡混同均衡时参与人行动存在先后顺序。
不完准分离均衡全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。
根据所得信信号传递博弈不完全信息息修正判断不完全信息重复动态博弈子概率,根据博弈与声誉博弈精炼纳收益最大化Milgrom-Roberts什均衡与海决策垄断限价模型萨尼不完全信息静态博弈贝叶斯均衡的结合。
二、四种博弈类型具体分述1、完全信息静态博弈1.1 完全信息静态博弈特点:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
战略和行动相同。
1.2完全信静态博弈相关概念:以新产品开发博弈举例说明:参与人:参与人 1 和 2。
参与人的集合卡表示:Γ={1,2,⋯n}.表示所有参与人的集合,在新品开博弈中:Γ={1,2}行:开、不开。
Ai 表示参与人行的集合。
新品开博弈中参与人的行集合A1=A2={a,b},其中 a 开, b 不开。
a={a1,a2⋯an}表示参与人的行合。
新品开博弈中:A={( a,a),(a,b),(b,a),(b,b)}略:参与人的行。
在博弈中的略可以定从集到行集的映射关系,即:Si:Xi— Ai。
用Si={si}表示参与人所有略的集合。
在n 人博弈中,用 S=(s1,s2,s3⋯,s n )表示 n 个参与人的略合,它表示博弈中每个参与人采取略 si 的一种博弈情形。
在完全信息静博弈中,由于不存在决策序上的差异,所有参与人在同一决策点即博弈开始的那一刻决策,因此,所有参与人面的决策情形都只有一种,所以,参与人的略集与行集相同。
支付:是指参与人在博弈中的所得。
一般情况下也是用效用函数来表示参与人在博弈中的所得。
因此,参与人的支付就可表示一种特定博弈情形下参与人得到的确定效用水平或期望效用水平。
支付一般用ui(1,2,⋯,n)表示参与人i 的支付 (效用水平 ),支付合 u=(u1,u2, ⋯un)表示参与人在特定博弈情形下所得到的支付,其中参与人i 的支付。
因此,参与人i=(i=1,2,⋯,n)的支付就可表示:ui=ui(s i ,s-i).信息:是参与人所具有的有关博弈的所有知,如有关其它参与人行或略的知、有关参与人支付的知等等。
在“新品开博弈”中,如果两个企都知道市需求,那么的博弈情形就是我前面所提到的完全信息假;如果两个企中至少有一个不知道市需求,那么的博弈情形就是我前面所提到的不完全信息假。
1.3略什均衡略:参与人在定信息下只一种特定(或确定性)的略混合略:混合略解了一个参与人其他参与人所采取的行的不确定性,它描述了参与人在定信息下以某种概率分布随机地不同的行或略。
略什均衡中包括:占有均衡、重复剔除劣略均衡、一般略什均衡等。
1、占均衡占略:参与人的最略 si * 与其他参与人的s-i无关。
无其他参与人什么略,参与人的最略是唯一的,的最略称之“占略”。
在 n 人博弈中,如果于所有的其他参与人的s-i,si * 都是参与人i 的最u i (s i* , s i ) u i (s i , s i )称 si *参与人的占略。
在 n 人博弈中,如果所有参与人都存在占略si * ,占略合si*=(s1 * si2*, ⋯, sn *)称占略均衡。
如果所有参与人都有占略存在,那么占略均衡就是唯一的所有理性参与人可以到的博弈果。
2、重复剔除劣略如果在一个博弈中,参与人不存在占略,但是参与人i 存在两个略,其中一u i ( s i, s i ) u i (s i , s i )个略叫另一个略的所得效用要大,理性的参与人不会略。
格劣略:u i ( s i , s i ) u i ( s i , s i )u ( s i , s i )u i ( s i , s i )弱劣 略 :若重复剔除 程一直可持 到只剩下唯一的 略 合, 略 合即 重复剔除的占 均衡,此 博弈是重复剔除 略可解。
要点:再重复剔除 程中,如果每次剔除的是 格劣 略,均衡 果与剔除 序无关;如果剔除的是弱劣 略,均衡 果可能与剔除 序有关。
3、一般 Nash 均衡Nash 均衡是完全信息静 博弈的解的概念,略是不可剔除的,即不存在任何一个 略 格 于在完全信息静 博弈中,Nash 均衡 略。
构成Nash 均衡的求解 什均衡的方法划 法、箭 法。
划 法 :1、考察参与人1 的最 略2、用上述方法找出参与人 2 的最 略3、找出最 略 合箭 法:1、 于每个 略 合, 是否有参与人会偏离 个 略 合2、 直至找出没有参与人会偏离的 略 合略均衡反映函数:各博弈方 的 策略 其他博弈方 策略的反 。
1.4 混合 略 什均衡混合 略:在博弈G { ; S 1 ,..., S n ;u 1,..., u n } 中, 任一参与人i , Si={S i1, ⋯ ,S i k }, 参与人i 的一个混合 略 定 在 略集Si 上的一个概率分布δi={ δ i 1, ⋯, δ ik}, 其中δ i j(j=1, ⋯ ,k )表示参与人 i 略 表示参与人 i 略i j的概率的概率,即δi jS足 0≦δ i j ≦ 1,其中概率之和 1。