经典博弈论概述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

经典博弈论概述

1什么是博弈论

博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学,经济学和其他社会科学和行为科学。博弈论是由约翰·冯·诺依曼创立的,该领域第一本重要著作是诺依曼和另一个伟大的数理经济学家奥斯卡·摩根斯坦所著的。

博弈论是关于包含相互依存情况中理性行为的研究。所谓相互依存,通常是指博弈中的任何一个参与者受到其他参与者行为的影响,反过来,他的行为也影响到其他参与者。由于这种相互依存性,游戏或博弈的结果依赖于每一个参与者的决策,没有一个人能完全地控制所要发生的事情,也没有一个参与者处于孤独的状态。相互依存常使博弈中的参与者之间产生竞争。譬如两个人分蛋糕、每个参与者都希望自己的那块可以分得大一些。然而,竞争仅仅是博弈论中相互依存的一个方面。应该指出,通常地博弈并非纯粹是参与者之间的竞争,相互依存的另一个方面是参与者可以有某些共同的兴趣或利益所在。仍以分蛋糕为例,作为参与者策略行动的结果,蛋糕的大小可以增加或者减少。参与者的共同兴趣在于增加蛋糕的总量,他们互相“倾轧”之处在于如何分配。从博弈论研究的角度,增大蛋糕应是博弈的第一步,而分配蛋糕则是博弈的第二步。

在博弈论中还需要对一个词“理性行为”作一些说明。博弈论中的所谓理性,一般不是指道德标准。从参加博弈的参与者的眼光来看,他们试图去实施自己认为可能最好的行为,尽管这样的行为有可能损害了其他参与者。

由于参与者的相互依存性,博弈中一个理性的决策必定建立在预测其他参与者的反应之上。一个参与者将自己置身于其他参与者的位置并为他着想从而预测其他参与者将选择的行动,在这个基础上该参与者决定自己最理想的行动,这就是博弈论方法的本质与精髓。

博弈论中每一个参与者做出理性决策的重要依据之一是他的可能收益有多少,这就是一个参与者需要认真计算的收益函数(payoff function)。对于每一个参与者、如果他们在可供自己选择的策略空间中任取一个策略作为自己的行动,既不会给自己带来盈利,又不会使他们必须付出,这种失去了激励机制的游戏本身也就失去了“博”的意义,在社会经济领域中尤其不太可能出现这类现象。收益函数的结构与取值无疑将会影响到参与者的行为,因而也影响到博弈的最终结局。由此,收益函数的确定在博弈论研究中是件非常重要的事情。从对博弈的不同角度考虑。从参与者不同的观点出发可以有形形色色的收益函数。

博弈所涉及的内容:

(1)参与者。以i=1、2,…表示。

(2)每个参与者一般有若干个策略(strategies)可供选择,它们构成了该参与者的纯策略空间。参与者i的纯策略空间用si表示,倘若si由。i个纯策略构成,则有si =(si1,si2.…si)。纯策略空间有时也可以是连续的。

(3)每个参与者的盈利函数。我们记参与者i的盈利函数为ui(s),其中s=(s1…sr),而sj表示参与者J所取策略,s表示r个参与者的策略向量。显然,盈利函数ui(s)与s有密切关系。它是每个参与者真正关心的东西。

2 博弈的分类

策略空间、盈利函数以及参与者的与博弈有关的特征等知识构成博弈的信息,从信息的角度,博弈可以分为完全信息与不完全信息两类,信息是博弈论中的重要内容。

完全信息博弈是指参与者对所有参与者的策略空间及策略组合下的收益有完全的了解,否则是不完全信息博弈。对于不完全信息的博弈,至少有一个参与者不能确切知道其他参与者的收益函数,在这种情况下,参与者所做的是努力使自己的期望收益或期望效用最大化。

从博弈的均衡结果来看,博弈分为合作性博弈和非合作性博弈。所谓合作性博弈是指参与者从自己的利益出发选择行动,但所选择的行动其结果对双方均有利;而非合作性博弈是

指参与者的行动选择对双方均不利。人们分工与交换的经济活动就是合作性的博弈,而“囚徒困境”便是典型的非合作性博弈。博弈又分静态博弈和动态博弈。静态博弈是指参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。动态博弈指双方的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人所采取的行动。

3 纳什均衡

纳什均衡是博弈分析中的重要概念。1950 年,还是一名研究生的纳什撰写了一篇论文,题为《N人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。在这篇论文中,纳什给出了博弈均衡的定义,即纳什均衡。

纳什均衡一般可以这样定义:如果决策组合处于这样的状态,即给定别人的选择,没有任何人有积极性改变自己的决策,那么这个决策组合就是纳什均衡。纳什是普林斯顿大学的教授,因为在非合作博弈理论方面的开创性贡献而获得1994 年诺贝尔经济学奖。他是一个了不起的数学天才,早在1951 年,当他还只有20 多岁的时候就提出了日后奠定非合作博弈分析基础的均衡概念,也即今天在社会科学教科书中广泛传播的“纳什均衡”概念;另外,他在纯数学领域也有重要的贡献。这个问题可以换一个角度理解:假如当事人之间签订了一个合同或协议,在给定其他人遵守协议、没有外在强制力的情况下,每个人是不是有积极性遵守协议?如果所有的人都有积极性遵守协议,这个协议就是一个纳什均衡。例如10 个人签订一个协议,假定另外9 个人都遵守协议时,最后1 个人是不是有积极性遵守协议?从纳什均衡的概念可以得知,在某些给定条件下,如果治理结构或者一个公司合同不是一个纳什均衡的话,那么它将不会自动得到遵守,合同或协议签了也无用。因此纳什均衡简单说就是一个策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。

也就是说,此时如果他改变策略,他的收益将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

如下述“夫妻博弈”(或称性别之战)中有两个纳什均衡点。丈夫和妻子商量晚上的5活动,丈夫喜欢看拳击,而妻子喜欢欣赏歌剧。但两人都希望在一起度过夜晚。在这个"夫妻博弈"中有两个纳什均衡点:(歌剧,歌剧),(拳击,拳击)。在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。在“夫妻博弈”中,我们无法知道,最后结果是一同欣赏歌剧还是一起去看拳击。

纳什均衡是博弈论中的重要概念,同时也是经济学的重要概念。诺贝尔经济学奖获得者萨缪尔森有一句幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。由此可见纳什均衡在现代经济学中的重要性。纳什均衡不仅对经济学意义重大,对其他社会科学意义也同样重大。

4 囚徒困境及其解析

囚徒困境是纳什的导师图克(Tucker)构造的重要的博弈模型,它是典型的困境,可说明许多现象。在这个模型中有两个囚徒,这两个囚徒一起做坏事,结果被警察抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以独立做出自己的选择。他们被告知:(1)如果他们之中有一人坦白,而另一人不坦白,则坦白者可获得自由,而拒不坦白者要被判十年监禁。(2)如果两人都坦白,则两人都被判五年监禁。(3)如果两人都不坦白,则两人都被判一年监禁。囚徒困境有两个前提预设:一是甲乙二人都是自利理性的个人,即只要给出两种可选的策略,每一方将总是选择其中对他更有利的那种策略。二是两人无法互通信息,要在不知道对方选择结果的情况下,自己进行选择。在这种条件下,从甲立场来看,共有两种可能情况:第一种可能是乙采取坦白的策略,这时如

相关文档
最新文档