博弈论-纳什均衡(非合作博弈均衡)

合集下载

纳什均衡

纳什均衡

纳什均衡简介纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。

如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。

一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。

纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。

实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。

然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。

阿尔伯特·塔克(Alberttucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。

它发展了本身很有意义的n人有限非合作博弈的概念和性质。

并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。

在概念和方法两方面,该论文都是作者的独立创造。

”纳什均衡例子博弈论中一个著名的例子就是囚徒困境。

囚徒困境是一个非零和博弈,说的是两个嫌疑犯甲和乙私人民宅联手作案,被警方逮住但未获证据。

警方于是将两个嫌疑犯分开审讯。

警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。

纳什均衡点

纳什均衡点

纳什均衡点纳什均衡点纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。

如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。

[编辑本段]例子经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。

大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。

于是,两人同时陷入招供还是不招供的两难处境。

如果两人均不招供,将最有利,只被判刑三年。

但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。

这时,个体的理性利益选择是与整体的理性利益选择不一致的。

囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑五年甲判刑十年;乙判刑一年不招供甲判刑一年;乙判刑十年甲判刑三年基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。

事实上,这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。

[编辑本段]学术争议和批评第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。

这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下达不到并不能解决问题。

[来源请求]在数学意义上,纳什并没有超越角谷静夫不动点定理。

大学博弈论试题及答案

大学博弈论试题及答案

大学博弈论试题及答案一、选择题(每题2分,共20分)1. 在博弈论中,非合作博弈是指:A. 参与者之间可以达成协议B. 参与者之间不能达成协议C. 参与者之间必须达成协议D. 参与者之间只能通过合作达到目标答案:B2. 纳什均衡是博弈论中的一个概念,它描述了一种情况,即:A. 所有参与者都处于最优策略B. 至少有一个参与者处于非最优策略C. 所有参与者都处于非最优策略D. 至少有一个参与者可以单方面改变策略以获得更好的结果答案:A3. 囚徒困境中,如果两个参与者都选择合作,那么:A. 他们都将获得最大收益B. 他们都将获得最小收益C. 他们都将获得中等收益D. 他们中的一个将获得最大收益,另一个获得最小收益答案:C4. 零和博弈是指:A. 一个参与者的收益等于另一个参与者的损失B. 参与者的总收益为零C. 参与者的总损失为零D. 参与者的总收益和总损失相等答案:B5. 在博弈论中,策略是指:A. 参与者的行动计划B. 参与者的收益C. 参与者的损失D. 参与者的支付结构答案:A6. 博弈论中的“混合策略”是指:A. 参与者随机选择策略B. 参与者总是选择相同的策略C. 参与者的策略是固定的D. 参与者的策略是预先确定的答案:A7. 博弈论中的“支配策略”是指:A. 无论对手选择什么策略,都是最优的策略B. 只有在特定情况下才是最优的策略C. 只有在对手选择特定策略时才是最优的策略D. 参与者总是选择的策略答案:A8. 博弈论中的“重复博弈”是指:A. 博弈只进行一次B. 博弈进行多次,但每次都是独立的C. 博弈进行多次,且参与者的记忆会影响后续决策D. 博弈进行多次,但参与者不能记住之前的决策答案:C9. 在博弈论中,如果一个策略在任何情况下都不是最优的,那么这个策略被称为:A. 支配策略B. 支配策略的反面C. 支配策略的替代D. 非支配策略答案:B10. 博弈论中的“共同知识”是指:A. 所有参与者都知道的信息B. 只有部分参与者知道的信息C. 参与者之间的秘密D. 参与者之间共享的信念答案:A二、填空题(每题2分,共20分)1. 在博弈论中,如果一个策略在任何情况下都不是最优的,那么这个策略被称为________。

博弈论纳什均衡

博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。

两个囚徒互相揭发,就是一种纳什均衡。

对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。

也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。

这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。

博弈策略稳定,博弈结果也稳定。

之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。

之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。

2、纳什均衡意义重大。

纳什均衡提出,震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。

”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。

”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。

”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。

纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。

读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。

但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。

这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。

从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。

更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。

Q2:怎样运用纳什均衡?1、分析囚徒困境。

纳什均衡的概念

纳什均衡的概念

纳什均衡的概念纳什均衡是博弈论中的重要概念,指的是在一个博弈中,所有参与者都选择了自己的最佳策略,不存在更好的选择,即达到了一种均衡状态。

纳什均衡是在参与者之间相互博弈的情况下,每个参与者都选择了自己的最佳策略,并且其他参与者也同时选择了最佳策略,从而实现了一种平衡状态。

纳什均衡最早由约翰·纳什提出,他于1950年发表了研究博弈论的著名论文《非合作博弈》。

在该论文中,纳什定义了纳什均衡,并利用数学方法证明了简单博弈的纳什均衡存在性。

由于纳什均衡的提出和研究,他获得了1994年的诺贝尔经济学奖。

纳什均衡的理论适用范围非常广泛,涵盖了众多社会科学领域,如经济学、政治学、社会学等。

在经济学领域,纳什均衡被广泛运用于市场竞争、价格确定、产出决策等方面的分析。

在政治学领域,纳什均衡被应用于国际关系、选举竞争等问题的研究。

在社会学领域,纳什均衡被用于解析社会合作、集体行动的机制等等。

为了更好地理解纳什均衡的概念,我们可以通过一个具体的博弈案例来说明。

假设有两个企业A和B在某个市场上销售相同的产品,它们可以选择两种不同的定价策略:高价策略和低价策略。

企业A和B都知道,如果它们选择相同的策略,市场将会处于均衡状态;如果它们选择不同的策略,市场将会出现不稳定的情况。

在这个博弈中,我们可以使用一个博弈表来表示两个企业的策略和回报。

假设高价策略带来的利润分别为5和2,低价策略带来的利润分别为3和4。

根据这个博弈表,我们可以得到以下结论:如果企业A选择高价策略,那么企业B选择高价策略可以带来较高的利润,所以企业B将会选择高价策略。

如果企业A选择低价策略,那么企业B选择低价策略可以带来较高的利润,所以企业B同样会选择低价策略。

综上所述,无论企业A选择高价策略还是低价策略,企业B都会选择低价策略,从而形成了一个纳什均衡。

在这种均衡状态下,企业A的最佳策略是低价策略,而企业B的最佳策略也是低价策略,两个企业都无法通过改变自己的策略来获得更高的利润。

非合作博弈纳什均衡及其关系

非合作博弈纳什均衡及其关系

非合作博弈纳什均衡及其关系非合作博弈是博弈论的重要分支之一,它研究的是在缺乏沟通和协调的情况下,个体之间的决策和行为。

而纳什均衡则是非合作博弈中的一个重要概念,指的是一种策略组合,使得在这种组合下,任何一个个体都没有动力单独改变自己的策略。

本文将介绍非合作博弈的基本概念,并探讨纳什均衡与博弈者行为之间的关系。

我们来了解一下非合作博弈的基本概念。

非合作博弈是指每个博弈者在做出决策时,只考虑自己的利益,而不关心其他博弈者的利益。

在非合作博弈中,博弈者之间彼此独立,没有任何形式的合作和沟通。

博弈者通过选择不同的策略来追求自己的利益,并根据其他博弈者的选择来调整自己的策略。

在非合作博弈中,博弈者的目标是尽可能地使自己获得最大的利益。

而纳什均衡是非合作博弈中的一个重要概念,它指的是一种策略组合,使得在这种组合下,任何一个博弈者都没有动力单独改变自己的策略。

换句话说,纳什均衡是一种稳定的策略组合,使得每个博弈者都认为在其他博弈者的策略给定的情况下,自己没有更好的选择。

在纳什均衡下,所有博弈者都做出了最优策略的选择,不存在任何一个博弈者可以通过改变自己的策略来获得更大的利益。

非合作博弈的纳什均衡与博弈者的行为密切相关。

在非合作博弈中,每个博弈者根据其他博弈者的选择来做出自己的决策。

当博弈者选择的策略达到纳什均衡时,他们就没有动力再改变自己的策略。

这意味着博弈者的行为是一种理性行为,他们根据自己的利益来做出决策,而不会被其他博弈者的选择所左右。

然而,在非合作博弈中,并不是所有的博弈都存在纳什均衡。

有些博弈可能存在多个纳什均衡,而有些博弈则可能不存在纳什均衡。

对于存在多个纳什均衡的博弈,博弈者可以根据自己的目标和利益来选择不同的策略。

而对于不存在纳什均衡的博弈,博弈者的行为将变得复杂和不确定。

非合作博弈纳什均衡的研究对于理解人类行为和社会决策具有重要意义。

在现实生活中,人们常常面临着各种博弈情境,需要根据自己的利益和目标做出决策。

1 纳什均衡

1 纳什均衡
一、博弈论

何为博弈论 博弈论又称对策论、游戏论、竞赛论,是指决 策主体在既定信息结构下通过决策,实现自己效 用最大化的行为。奠定其理论基础的是1944 年冯·诺依曼和摩根斯坦恩合著的《博弈论和经 济行为》 。
12/20/2014
博弈论分类
合作 博弈
分类标准: 按照博弈各 方能否达成 有约束力的 契约或默契 博弈各方能达成 某种有约束力的 契约或默契,以 选择共同的策略
12/20/2014
纳什均衡的本质
纳什均衡作为变和、非合作、静态、信息不对称博弈 的本质是:博弈规则、协议的非强制性,使博弈各方在 表面自己利益最大化的行为决策中,结果是整体、个体 利益的不经济。即现代市场经济资源有限条件下,博弈 各方必须通过体现整体利益本位的强制性规则或法律制 度,以帕累托最优为标准决策,才能实现各自利益的最 大化(非合作中的合作)。
非合 作博 弈
博弈各方不能达成 某种有约束力的契 约或默契,从而不 可以选择共同的策略
12/20/2014
合作博弈与非合作博弈的区别
合作博弈强调的是时常注意社会化的整体利益、集体 主义、团体理性,优先考虑整体利益最大化的同时才 能保障个体利益的实现与最大化,是效率、公平、公 正的综合体现,适用于现代社会化的市场经济条件。


由“象棋博弈”提出的质疑 由“性别战”博弈提出的质疑 由“蜈蚣博弈”提出的质疑
12/20/2014

12/20/2014
纳什均衡的启示
进行法律制度构建时,注意纳什均衡对法律 制度实施效力的影响 。主要表现在以下方面: 法律主体经济人行为的社会性 信息支配法律行为的动态性 心理影响法律行为的非理性 规则导致法律行为的变异性 弈策略对法律行为后果的决定性

博弈论吉本斯

博弈论吉本斯

博弈论吉本斯
吉本斯(John Nash)是著名的美国数学家和经济学家,他对博弈论的贡献被广泛认可。

以下是关于吉本斯在博弈论方面的主要贡献:
1. 吉本斯均衡:吉本斯提出了著名的吉本斯均衡概念,也称为纳什均衡。

吉本斯均衡是指在博弈中,当每个参与者都选择了最优策略后,没有参与者有动机单独改变自己的策略。

这个概念对于理解博弈中的平衡点和策略选择具有重要意义。

2. 非合作博弈理论:吉本斯发展了非合作博弈理论,该理论研究了在博弈中参与者之间缺乏合作的情况。

他提出了一种数学模型,描述了参与者在决策中寻求自己最佳利益的过程,以及在这种情况下可能出现的均衡点。

3. 吉本斯博弈:吉本斯还提出了吉本斯博弈,这是一类特殊的博弈模型,其中每个参与者的最佳策略取决于其他参与者的选择。

吉本斯博弈的研究为博弈论提供了更深入的理解,揭示了博弈中可能存在的多个均衡点和策略选择的复杂性。

吉本斯的贡献对于博弈论的发展具有重要影响,他的研究为理解经济、社会和政治中的决策行为和策略选择提供了理论基础,对于经济学、管理学和其他社会科学领域的研究都具有重要意义。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

完全理性:
理性指一种行为方式,它适合实现指定目标,而且在给定条件和约束的限度之内。

在不同的学科领域,理性所涵盖的内容存在着差异
完全理性的内涵
具有完全理性的行为人是个无所不知的超人,他具有纵向和横向方面完备的知识。

在纵向方面,他可以预测未来;在横向方面,他通晓资源、交易伙伴和环境等情况。

具体而言,行为人的完全理性包括以下隐含内容。

(1)不存在不确定性,即使存在不确定性,也可以预知不确定性的概率分布。

也就是说,对于具有完全理性的行为人来说,一切信息都是确定的。

(2)行为人具有可以确定的效用函数(消费者的效用函数和厂商的利润函数可以统称为效用函数),同时行为人具有同质性以及一致性的偏好体系。

(3)选择结果具有描述不变性、程序不变性和前后关系独立性。

描述不变性要求行为人选择的先后顺序不应依赖于所描述或显示的选项,也就是说如果行为人经过再三思考,将两种描述视为同一问题的同义表达,那么它们必定导致相同的选择——即这种思考不存在异处;程序不变性要求不同方式的等价学说揭露相同的偏好次序;前后关系独立性指一项选择与其他替代方案互为独立的原则,它要求在给定Z而不提供有关X或Y 的新的信息的情况下,X 与Y的优先权顺序不应该依赖于Z是否有效。

(4)行为人具备完备的计算和推理能力,可以像计算机一样在数秒内从事无穷尽的计算步骤,同时也不存在感性因素对选择的干扰。

(5)选择意味着在各种方案或选择集中进行比较和挑选,因此完全理性的行为人可以设计出所有的被选方案,以及各项方案所产生的全部后果。

(6)一个确定的报酬函数,即行为人可以确定地赋予每项行动结果一个具体的量化价值或效用。

(7)确定性的结果,也就是行为人町以实现效用最大化或最优目标(消费者效用最大化和企业利润最大化)。

在上述条件下,建立在完全理性假设的基础上的主流经济学的方法论,即行为人的选择或决策意味着在资源约束的条件下实现效用最大化或利润最大化。

行为人在选择过程中,可以遵循确定性原则、极大极小法则、边际原理以及概率法则(也就是主观期望原则)。

主流经济学的选择理论建立得如此简洁和完美,使得诸多该领域的学者为之倾倒。

并且,这种理论可以使我们不用站起身来实际观察人类行为,便能坐在椅子里预测它们(正确或错误的预见)。

正如主流经济学的典型代表弗里德曼的著名论断所述“彻底的‘现实主义’显然无法实现;看一个理论是否‘足够’现实,只能看它就眼下意图而言,是否能做出充分好的预见,或做出比其他理论更好的预见”。

主流经济学的完全理性假设致使其形成令人称赞的完美体系和预测能力,但是这种完美只是抽象上的理想模式和方法,不仅经不起经济学内部的逻辑推敲,也经不起实践和现实的考验。

完全信息(Complete Information)
完全信息(Complete Information),是指市场参与者拥有的对于某种经济环境状态的全部知识。

在现实经济中,没有人能够拥有各个方面经济环境状态的全部知识,
完全信息博弈
完全信息博弈是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。

关于完全信息博弈的最早结果出现在1950年代,但确切出自何人之手却无从得知,这就是所谓的“佚名定理”(the Folk Theorem)。

该定理认为,重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致,这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。

或者可以说,只要行为人有足够的耐心,任何满足个体理性的可行支付都可以通过一个特定的子博弈精炼均衡达到。

然而,虽然所有可行的个体理性结局确实代表了合作博弈的解观点,但是它不能够提供相关信息,并且是相当模糊的。

奥曼认为该理论本身没有多少新东西,他指出,完全信息的重复博弈论与人们之间相互作用的基本形式的演化是相关的。

演化博弈理论(Evolutionary Game Theory)
演化博弈理论的概述:在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。

在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。

与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。

有限理性这一概念最早是由西蒙(Simon.H.A.)在研究决策问题时提出的,它是指人的行为只能是“意欲合理,但只能有限达到”。

完全理性的人根本就不可能存在。

演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种理论。

在方法论上,它不同于博弈论将重点放在静态均衡和比较静态均衡上,强调的是一种动态的均衡。

演化博弈理论源于生物进化论,它曾相当成功地解释了生物进化过程中的某些现象。

如今,经济学家们运用演化博弈论分析社会习惯、规范、制度或体制形成的影响因素以及解释其形成过程,也取得了令人瞩目的成绩。

演化博弈论目前成为演化经济学的一个重要分析手段,并逐渐发展成一个经济学的新领域。

演化博弈理论的特征: 一般的演化博弈理论具有如下特征:它的研究对象是随着时间变化的某一群体,理论探索的目的是为了理解群体演化的动态过程,并解释说明为何群体将达到目前的这一状态以及如何达到。

影响群体变化的因素既具有一定的随机性和扰动现象(突变),又有通过演化过程中的选择机制而呈现出来的规律性。

大部分演化博弈理论的预测或解释能力在于群体的选择过程,通常群体的选择过程具有一定的惯性,同时这个过程也潜伏着突变的动力,从而不断地产生新变种或新特征。

一般的演化博弈模型的建立主要基于两个方面:选择(Selection)和突变(Mutation)。

选择是指能够获得较高支付的策略在以后将被更多的参与者采用;突变是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的策略,也可能是获得较低支付的策略)。

突变其实也是一种选择,但只有好的策略才能生存下来。

突变是一种不断试错的过程,也是一种学习与模仿的过程,这个过程是适应性且是不断改进的。

不具备这两个方面的模型不能称为演化博弈模型。

比如,艾格则等(Agiza,Hegazi&Elsadany,2001)提出了一个动态演化的博弈模型,它在有限理性的企业都采取一定的行为规则(产量调整机制)下研究企业重复博弈是否可以达到纳什均衡。

这个模型虽然研究的是有限理性个体和动态演化过程,但不属于演化博弈模型,因为没有包含选择和突变的过程。

如果把这个模型作如下修改,便可以看作演化博弈模型:假设企业有许多不同的行为规则,而采用某些行为规则的企业比那些不采用这些行为规则的企业获益更大;随着时间的推移,采用这些行为规则的企业生存下来,而不采用这些行为规则的企业被淘汰。

这样修改后的模型既有选择过程又有突变过程,便成为一个演化博弈模型。

总之,演化博弈模型有如下几个特征:第一,以参与人群体为研究对象,分析动态的演化过程,解释群体为何达到以及如何达到目前的这一状态;第二,群体的演化既有选择过程也有突变过程;第三,经群体选择下来的行为具有一定的惯性。

博弈论、纳什均衡(Nash equilibrium)
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。

即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

博弈论或称为赛局理论,数学的一个分支, 目前在生物学,经济学,计算机科学和其他很多学科都有广泛的应用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论的创始人是冯·诺伊曼。

具有竞争或对抗性质的行为成为对策行为。

在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。

比如日常生活中的下棋,打牌等。

对策论就是研究对策行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。

纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。

如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。

一个著名的例子就是囚徒困境,囚徒困境是一个非零和博弈。

大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果两人均不招供,将被判刑1年;如果你招供,而对方不招供,则你将被判刑3个月,而对方将被判刑10年;如果两人均招供,将均被判刑5年。

于是,两人同时陷入招供还是不招供的两难处境。

两个囚犯合理的选择是招供,原本对双方都有利的策略不招供和结局被判刑1年就不会出现。

这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。

相关文档
最新文档