博弈论名词解释
博弈论是什么

博弈论是什么博弈论是一门研究决策和策略的数学理论,它研究决策者在互动中作出最佳选择的数学模型。
博弈论的研究对象是决策者之间的相互作用,无论是个体、组织还是国家之间的相互作用。
在博弈论中,个体决策者通常被称为“球员”(players),决策者们的决策被称为“策略”(strategies)。
博弈论分析的目标是找到在各种不同策略组合中,球员可以通过分析其他球员的行动,作出最佳决策的方法。
博弈论通过建模和分析不同策略的结果,以及不同决策者之间的冲突和合作,来解决决策问题。
博弈论的起源可以追溯至20世纪的数学家、经济学家和游戏理论家。
它被广泛应用于经济学、政治学、社会科学和计算机科学等领域,以解决各种决策和策略问题。
博弈论有两个重要的分支,一是非合作博弈论,二是合作博弈论。
非合作博弈论研究的是在决策者之间缺乏合作的情况下的决策问题。
非合作博弈论分析的是每个决策者如何在互动中作出最佳决策,而不考虑其他决策者的影响。
其中最著名的非合作博弈论模型是“囚徒困境”。
囚徒困境是一种经典的非合作博弈论问题,描述了两个同时被捕的囚犯面临的决策问题。
如果两个囚犯都保持沉默,则他们将因不够证据而被判轻刑;如果一个人选择坦白,而另一个保持沉默,则坦白的囚犯将获得从刑期的豁免,而另一个将被判重刑;如果两个人都选择坦白,则他们将受到较重的刑期。
在这个例子中,每个囚犯的最佳策略是选择坦白,然而,当两个囚犯都选择坦白时,他们都会陷入囚徒困境,因为他们的总体利益会受到损害。
合作博弈论研究的是在决策者之间存在合作的情况下的决策问题。
合作博弈论分析的是决策者通过协商和合作来达成一致,并在互动中作出最佳决策。
其中最著名的合作博弈论模型是“合作对策”(cooperative games)。
合作对策是一种多人博弈论问题,在这种情况下,参与者通过协调策略,共同提高整体收益。
合作对策的目标是通过合作和协商,找到一种合理的分配方式,使得每个参与者都能获得相对公平和最大化的收益。
博弈论名词解释

博弈论名词解释博弈论是一种研究冲突和合作决策的数学理论。
在博弈论中,玩家通过制定决策来实现自己的利益,同时也要考虑其他玩家的决策对自己利益的影响。
博弈论的研究对象是在有限的资源和信息条件下,决策制定者之间的相互作用。
以下是一些常见的博弈论名词解释:1. 纳什均衡(Nash equilibrium):是指在博弈过程中,每个玩家依据其他玩家的行为选择自己的最佳策略,而没有动机单方面改变策略。
纳什均衡是一种稳定状态,即每个玩家的策略都是最优的。
2. 零和博弈(zero-sum game):是指一个玩家的收益与另一个玩家的损失完全相等,总收益为零。
在零和博弈中,一个玩家的利益的增加必然导致另一个玩家的利益的减少,双方利益存在完全的对立关系。
3. 非零和博弈(non-zero-sum game):是指一个玩家的利益的增加不一定导致另一个玩家的利益减少。
在非零和博弈中,玩家之间的利益可以相互协调、互利互惠。
4. 博弈树(game tree):是博弈论中常用的一种图形表示方式,用于展示博弈过程中的决策步骤和可能的结果。
博弈树由顶点和边组成,顶点表示玩家的决策点,边表示不同的行动选择。
5. 最优策略(optimal strategy):在博弈论中,最优策略是指玩家的最佳选择,使得在对手的任何策略下,自身获得最大利益。
最优策略可能根据玩家的目标和信息不同而变化。
6. 合作与背叛(cooperation and defection):博弈论中常涉及到的两个关键概念。
合作指玩家之间通过协调行动来获得共同利益,背叛指玩家为了自身利益而选择对方不合作。
7. 博弈矩阵(game matrix):是一种表示博弈参与者和策略选择关系的表格。
博弈矩阵以参与者为行,以策略选择为列,用数字表示参与者在不同策略下的收益情况。
8. 支配策略(dominant strategy):在博弈论中,一种策略如果在所有可能的对手策略下都能带来最佳结果,则被称为支配策略。
博弈论名词解释

博弈论名词解释博弈论名词解释1、博弈:是指代表不同利益主体的决策者,在⼀定的环境条件和规则下,同时或先后、⼀次或多次从各⾃允许选择的⾏动⽅案中加以选择并实施。
从⽽取得各⾃相应结果的活动。
2、参与⼈:也称局中⼈或博弈⽅。
是指博弈中能独⽴决策、独⽴⾏动并承担决策结果的利益主体。
3、⾏动:是参与⼈在博弈的某个时点的决策变量。
4、博弈信息:是参与⼈在博弈中的知识,包括博弈的环境条件、博弈的规则、⾃然的“安排”、其他参与⼈的特征及⾏为、博弈的结果、进程等等。
5、策略:是指各博弈⽅可选择的⾏动⽅案,亦称战略。
6、纯策略:指⼀个策略规定参与⼈在每⼀个给定的信息情况下只选择⼀种特定的⾏动。
7、混合策略:指⼀个策略规定参与⼈在给定信息情况下以某种概率分布随机地选择不同的⾏动。
8、⽀付函数:也称得益。
是指博弈⽅(参与⼈)策略实施后所获得的效⽤⽔平。
9、结果:是指博弈分析者所探寻的各种要素的集合,⽐如策略组合、⽀付向量等。
10、纳什均衡:是指在对⽅策略确定的情况下,每个参与⼈的策略都是最好的。
此时没有⼈愿意单独改变⾃⼰的策略。
11、两⼈博弈:就是参与⼈是两⽅的博弈。
12、多⼈博弈:是参与⼈有三个或三个以上的博弈。
13、零和博弈:每个⽀付向量的“总和”始终等于零的博弈称为零和博弈。
14、常和博弈:我们把每个⽀付向量的“总和”始终等于某个常数的博弈称为常和博弈。
15、变和博弈:我们把每个⽀付向量的“总和”并不相同的博弈称为变和博弈。
16、静态博弈:我们把所有参与⼈同时或可看作同时选择策略的博弈称为静态博弈。
17、动态博弈:我们把各参与⼈不是同时,⽽是先后、依次进⾏选择、⾏动。
⽽且后选择⾏为的参与⼈通常能观察到先进⾏选择、⾏为的参与⼈的选择、⾏为的博弈称为动态博弈。
18、重复博弈:就是同样结构的博弈重复进⾏多次。
19、完全信息博弈:如果所有策略组合下的⽀付向量都是共同知识,我们就说这⼀博弈是“完全信息”的,称为完全信息博弈。
博弈论基本概念

博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
在博弈论中,通常包括以下基本概念:
局中人:在一场竞赛或博弈中,具有决策权的参与者被称为“局中人”。
在一个博弈中,每个局中人都要做出选择。
行动:局中人在博弈中的每一个决策或选择被称为“行动”。
信息:局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。
策略:局中人基于可获得的信息,制定的决策方案或规则称为“策略”。
收益:局中人在博弈中的得失或输赢称为“收益”。
均衡:当所有局中人都认为自己的策略选择最优,并且其他局中人也认为该策略选择是最优时,这种状态被称为“均衡”。
结果:在一场博弈结束后,所有局中人的收益总和被称为“结果”。
博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。
其中,局中人、策略和收益是最基本要素。
发展过程方面,博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
目前,博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论(名词解释和简答)

博弈论名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。
4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。
7、均衡:所有参与人的最优战略组合。
8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。
9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。
10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。
11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。
12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。
13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。
博弈论名词解释(修改)

博弈论名词解释(修改)1.有限博弈:一个博弈中每个博弈方的策略数都是有限的。
常见的是数种策略。
无限博弈:一个博弈中至少有某些博弈方的策略有无限多个。
零和博弈:一方的得益必定是另一方的损失,博弈方之间利益始终对立,偏好通常不同。
两人零和博弈也称为“严格竞争博弈”。
2.常和博弈:博弈方之间利益的总和为常数。
博弈方之间的利益是对立的且是竞争关系。
3.变和博弈:零和博弈和常和博弈以外的所有博弈。
合作利益存在,博弈效率问题的重要性。
可以站在社会利益的立场对其效率进行评价。
4.静态博弈:所有博弈方同时或可看作同时选择策略的博弈。
5.动态博弈:各博弈方的选择和行动有先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动。
6.重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能。
7.完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益8.不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称“不对称信息博弈”9.完美信息博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈10.不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈11.完全理性:有完美的分析判断能力和不会犯选择行为的错误12.有限理性:博弈方的判断选择能力有缺陷13.个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化14.上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果,上策均衡不是普遍存在的。
15.严格下策反复消去法:反复寻找策略之间两两比较意义上的“严格下策”,并将它们消去的方法。
16.反应函数:对于厂商2的每一个可能的产量,厂商1的最佳对策产量的计算公式,它是厂商2产量的一个连续函数,我们称这个连续函数为厂商1对厂商2产量的一个“反应函数”。
17.帕累托上策均衡:博弈中存在多个纳什均衡,如这些纳什均衡存在明显的优劣差异,所有博弈方都偏好其中同一个纳什均衡,该纳什均衡给所有博弈方带来的得益都大于其他纳什均衡。
博弈论的定义和主要思想

清华诚志
23
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意 义。个人理性与集体理性的冲突,各人 追求利己行为而导致的最终结局是一个 “纳什均衡”,也是对所有人都不利的 结局。他们两人都是在坦白与抵赖策略 上首先想到自己,这样他们必然要服长 的刑期。只有当他们都首先替对方着想 时,或者相互合谋(串供)时,才可以得到 最短时间的监禁的结果。
清华诚志
11
4、信息指的是参与人在博弈中所知道的 关于自己以及其他参与人的行动、策略 及其得益函数等知识;
5、得益是参与人在博弈结束后从博弈中 获得的效用,一般是所有参与人的策略 或行动的函数,这是每个参与人最关心 的东西;
6、均衡是所有参与人的最优策略或行动 的组合;均衡结果是指博弈结束后博弈 分析者感兴趣的一些要素的集合,如在 各参与人的均衡策略作用下,各参与人 最终的行动或效用集合。
清华诚志
5
Selten and Harsanyi
泽尔腾(1965)将纳 什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概 念;以及进一步刻画 不完全信息动态博弈 的“完备贝叶斯纳什 均衡”
而海萨尼则发展了刻 画不完全信息静态博
弈的“贝叶斯纳什均 衡”(1967-1968)。 总之,他俩进一步将
清华诚志
26
囚徒困境在经济学上的应用
1、两个寡头企业选择产量的博弈 如两企业联合起来形成卡特尔,选择垄断利润 最大化的产量,每个企业都可以得到更多的利 润,但卡特尔协定不是一个纳什均衡,因为给 定对方遵守协议的情况下,每个企业都想增加 产量,结果是,每个企业都只得到纳什均衡产 量的利润,它小于卡特尔产量下的利润。 有些 情况下,个人理性与集体理性的冲突对整个社 会来说也许是一件好事。
博弈论(整理过名词解释和简答)

一、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。
4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。
7、均衡:所有参与人的最优战略组合。
8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。
9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。
10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。
11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。
12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。
13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈名词解释
1.博弈论: 根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论。
2.参与人(局中人)(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
3.策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
4.信息(information):参与人有关博弈的知识,特别是有关自然的选择,其他参与人的特征和行动的知识。
5.支付(payoff)函数:,参与人从博弈中获得的效用水平,它是所有参与人取定的一组策略的函数。
6.结果(outcome):博弈者感兴趣的要素的集合。
7.静态博弈:在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动。
8.动态博弈:在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
9.零和游戏(零和博弈):属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。
双方不存在合作的可能。
零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分。
两个人下棋、或是打乒乓球。
10.常和博弈:又叫非零和博弈,是指各博弈方的得益之和是一个非零的常数。
自己的所得并不与他人的所失的大小相等,连自己的幸福也未必建立在他人的痛苦之上,即使伤害他人也可能“损人不利己”,所以博弈双方存在“双赢”的可能,进而合作。
在恋爱中一方受伤的时候,对方并不是一定得到满足。
也有可能双方一起能得精神的满足。
也有可能双方一起受伤。
通常,彼此精神的损益不是零和的。
11.变和博弈:也称非常和博弈,则是指随着博弈参与者选择的策略不同,各方的得益总和也不同。
如在同一个股票市场,面对同样的大盘走势,伴随着投资者的投资策略不同,有可能大部分人赚钱而小部分人亏钱,也有可能小部分人赚而大部分人亏,甚至还有可能所有人都赚或都亏。
12.占优策略:占优均衡(dominant equilibrium),指不论其他参与者做何种策略选择,每个参与者的最佳策略都是唯一的,其结果为占优均衡。
每一个博弈中的企业通常都拥有不止一个竞争策略,其所有策略的集合构成了该企业的策略集。
在企业各自的策略集中,如果存在一
个与其他竞争对手可能采取的策略无关的最优选择,则称其为占优策略,与之相对的其他策略则为劣势策略。
13.合作博弈:合作博弈亦称为正和博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。
14.帕累托最优状态:资源分配的一种理想状态,即假定固有的一群人和可分配的资源,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,也不可能再使某些人的处境变好。
换句话说,就是不可能再改善某些人的境况,而不使任何其他人受损。
15.聚点均衡:在理论上一个博弈中可能有多个纳什均衡点,这时在现实生活中,行为人往往利用在理论上省略掉的那些信息,找到一个大家都感兴趣的点,这个点往往成为现实世界中博弈的最终解。
当参与人之间没有正式的信息交流时,他们存在于其中的“环境”往往可以提供某种暗示,使得参与人不约而同地选择与各自条件相称的策略(聚点),从而达到均衡。
16.重复博弈:是指同样结构的博弈重复许多次,其中的每次博弈称为“阶段博弈”。
重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。
17.阶段博弈:每个阶段博弈中,参与人可能同时行动,也可能不同时行动。
因为其他参与人过去的行动的历史是可以观测的,因此在重复博弈中,每个参与人可以使自己在每个阶段选择的策略依赖于其他参与人过去的行为。
18.触发战略(Trigger Strategy):又称为“冷酷战略”,它是指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。
19.二级密封价格拍卖法:即维克里拍卖,在这种拍卖中,竞买者同样以密封的形式独立出价,商品也出售给出价最高的投标者。
但是,获胜者支付的是所有投标价格中的第二高价,所以它被称为第二价格密封拍卖。
纳什均衡:在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
占优策略均衡一定是纳什均衡,而纳什均衡不一定是占优策略均衡。