双层博弈理论内政与外交的互动模式

双层博弈理论内政与外交的互动模式
双层博弈理论内政与外交的互动模式

双层博弈理论:内政与外交的互动模式

钟龙彪

2013-02-17 09:16:19 来源:《外交评论(外交学院学报)》(京)2007年2期

作者简介:钟龙彪,男,外交学院外交学系博士生。外交学院外交学系,北京100037

内容提要:双层博弈模式是关于外交谈判的理论。它把政治家作为战略行为体,认为政治家同时处理国内和国际事务,政治家的外交决策是对国内和国际两个棋盘上面临的机遇和约束的双面算计。外交谈判可分为国际、国内两个层次,对这两个层次的谈判,决策者都要同等认真对待,否则协议就得不到外国的接受或国内的批准,从而不能实现国际合作。自罗伯特?普特南1988年提出双层博弈模式后,又有不少学者对它进行拓展和深化,从不同的方面发展了该模式,提高了它的理论化程度,增强了它的理论解释力。

关键词:双层博弈产生背景内容框架发展进程

外交是内政的延伸,一直被视为外交学的“公理”。其实,不仅内政制约外交,外交也会影响内政。那么,如何理解国内政治与国际政治之间的互动关系?在众多关于国际政治和国内政治互动的理论中,双层博弈是颇有特色的一种。自1988年罗伯特?普特南(Robert D.Putnam)提出双层博弈模式后,又有不少学者对它进行拓展深化,从不同的方面发展了该模式,提高了它的理论化程度,增强了它的理论解释力。本文拟分析双层博弈理论的提出背景,概述其基本内容,追踪其发展进程,最后做出简要评析。

一、理论背景

双层博弈理论的提出不是偶然的,有其深刻的国际政治现实背景和学理背景。现实背景是,随着国际经济贸易的发展,各国之间在经济上日益相互依赖,传统的国家主权受到挑战,外交和内政的界限变得逐渐模糊,国际政治和国内政治相互影响的特征越来越明显。这就需要将国际政治与国内政治两个层面结合起来进行研究。

1.现实背景:国家间相互依赖关系的不断加深

罗伯特?普特南是在撰写《同舟共济:七大国首脑会议中的冲突与合作》时萌生双层博弈模式设想的,而这本著作的思想又与他在卡特政府的国家安全委员会任职期间的工作经历紧密相关[1]。他在研究世界七个工业化国家——美国、日本、西德、法国、英国、意大利和加拿大首脑会议的起源、发展过程中发现,七大国首脑会议机制化与当代国际关系的三个结构特征密切相关:经济相互依赖导致国际政治与国内政治日益紧密的联系;促进战后长期繁荣的美国霸权的衰退;国际关系的机制化,促使一些政治领导人发现这种趋向使决策变得更加复杂[2](P1)。国际贸易、投资的增长使得各国经济相互依赖加深,产生了一系列国际、国内政治后果,导致国家主权与相互依赖的矛盾、困境。有些自由主义经济学家、政治学家认为,经济相互依赖使得各国共同利益增加,国家主权受到削弱,国家边界日益模糊,国际合作增加,国际冲突减少。但国际关系的现实表明,经济相互依赖一方面加深了各国的共同利害关系,促进了国际合作,但是,另一方面,国家主权观念依然存在,国家边界也未消失,贸易保护主义政策还在执行,这使得协调各国政策比过去更困难。从国际政治角度看,协调各国政策困难的原

因在于,不同国家目标、经济结构、信奉的经济理论、制度、政治气候不一致。但更深层次的原因在于,在国家经济受制于国际因素的情况下,各国政府及其领导人要为国家、次国家行为体负责。这就给民主选举出来的政治家造成了困境[2](P2-3)。例如,一个美国议员的政治命运可能取决于布鲁塞尔或东京的决策、这时,他到底应该采取维护本国、本地区、自身利益的民族主义立场还是推进合作的国际主义的立场呢?由此,普特南萌发出双层博弈模式的设想。他认为,从政治角度看,国际经济协调可设想为双层博弈。在国家层次,国内集团通过施加压力迫使政府采取有利于自己的政策,以实现利益最大化,政治家则通过在那些集团中建立联盟来谋求权力。在国际层次,各国政府谋求最大限度地满足国内压力的自由,同时使外部发展的不利结果最小化。政府也可能追求“国家”利益,如声望、安全,但它们与国内压力只是间接联系。这两层博弈是同时进行的。所以,在某种意义上可以说,国家政策是国内国际两股力量平行作用的结果。只要各国相互依赖,而且都是主权国家,那么政策制定者就不能忽视两个层次中的任何一层博弈[2](P4)。

2.学理背景:国际政治单一层次分析法的局限

为了科学研究的方便,国际政治学者把国际关系划分为不同的层次进行研究,这就是层次分析法。它假定某一个或某几个层次上的因素会导致某种国际事件或国际行为[3](P246)。不同的学者对层次如何划分,重点研究哪个层次观点不一。国际体系层次的研究把国际体系结构、国家在国际体系中的地位作为国家行为的解释原因,如新现实主义、新自由制度主义;国家层次的研究则是把民族国家的政治制度、社会、文化等作为国家行为的解释原因,如民主和平论;个体层次的研究是把国家领导人的个性、心理特征作为国家行为的解释原因,如外交政策分析。层次分析法有其合理性、必要性。但是,单一层次分析法的局限也是

很明显的。于是,不少学者主张把国际、国内两个层次结合起来分析。普特南认为,从现有关于国内与国际事务关系的大部分文献看,要么是讨论不计其数的国内因素对外交政策的影响,要么是探讨国内与国际事务的“连锁”影响[4](P430)。詹姆斯?罗西瑙(James Rosenau)是第一个呼吁研究连锁政治(Linkage Politics)的学者,但是没有产生多少有意义的研究成果。第二个与此问题有关的流派是卡尔?多伊奇(Karl Deutsh)和厄恩斯特?哈斯(Ernst Haas)研究的地区一体化理论。该理论强调利益集团对欧洲一体化进程的影响。哈斯提出的“外溢”(spillover)概念认识到了国内与国际发展的相互作用。但其核心变量是假定超国家机制的演进,而不是政策变革。受地区一体化理论影响,约瑟夫?奈(Joseph Nye)和罗伯特?基欧汉(Robert Keohane)提出的相互依赖理论,强调相互依赖与跨国主义,但忽视国内因素,而是只强调国际机制概念。外交政策分析中的官僚政治模式,着重分析不同政府部门之间由于利害的冲突对国家外交政策选择的影响,但忽视社会因素的作用。国际政治经济学中的“倒置的第二意象”学派重点研究国际经济对国内政治和国内经济政策的影响,把国内政治只是作为国际政治作用的“传送带”。因此,普特南强调,我们必须超越单一的国内因素对国际事件或国际因素对国内政治的研究,超越对这种影响的简单列举,创立一种能把国际、国内政治融合为一体,能够解释国际、国内政治相互联结的理论[4]。他创立的双层博弈模式,即决策者在国际、国内两个层次同时进行博弈,从研究方法角度看,就是对国际、国内二个层次分析法的综合。

二、理论框架

双层博弈理论要研究的问题是,在相互依赖条件下,国家领导人如何进行外交决策?如何实现国际合作?他首先假定,中央决策者要同时协调国际国内事务,在外交政策选择中既面临战略机遇也面临战略挑战[4]。其次,他把外交谈

判分为国际、国内两个层次,对这两个层次的谈判,决策者都要同等认真对待,综合考虑国际、国内因素,否则协议就得不到外国的接受和国内的批准,从而不能实现国际合作。比较而言,国内层次的博弈更为重要,因为决策者关于国际谈判的立场是由其对国内能否批准的考量决定的。外交谈判能否成功、国际合作能否实现,取决于各自的获胜集合是否存在交集。

具体地说,双层博弈理论的基本内容有以下三个方面:

1.双层博弈:国内政治与国际政治的互动模式

普特南认为,许多国际谈判的政治可以设想为双层博弈。在国家层次,国内集团通过向政府施加压力使其采取有利于己的政策,政治家通过在这些集团中建立联盟来谋求权力。在国际层次,政府谋求满足国内压力的自身能力的最大化,同时谋求国外发展负面结果的最小化。只要主权国家还存在,仍然相互依赖,中央决策者就不能忽视这两层博弈。每个国家领导人都出现在两个棋盘上。在国际谈判桌的对面,坐着外国谈判对手,在领导人的旁边坐着外交官和其他国际顾问。在国内谈判桌周围,领导人的后面坐着执政党党员、国会议员,国内代理人的发言人,主要利益集团的代表,领导人的政治顾问。双层博弈的异常复杂性在于一个棋手在这一个棋盘上的行动是合理的(如提高能源价格、退让领土、限制汽车进口),在另一个棋盘对同一个棋手来说也许就是不明智的。在国际谈判桌上对谈判结果不满意的首席代表可以导致谈判失败。反之,未能满足国内谈判桌上的人的利益诉求的任何领导人都有下台的危险。有时,聪明的谈判代表在一个谈判桌上的一着棋会在另一个谈判桌上建立联盟,从而实现谈判目标。总之,普特南认为,双层博弈能比其他建立在单一国家行为体假定上的模式更好地抓住国际谈判的本质特征。由此可见,双层博弈理论把政治家作为主要的战略行为体,政治

家的战略是其同时对国际国内两个棋盘面临的约束和机遇的双面算计。外交战略和战术同时受到其他国家接受程度和本国民众批准可能的制约。外交是一个战略互动的过程。在外交活动过程中,行为体需要同时考虑国内和国际的情况[1]。

2.双层博弈的关键:批准(Ratification)和获胜集合(Win-sets)的重要性

双层博弈理论假定,在国际谈判中,每方只由一个领导人或首席谈判手作为代表,他没有自己的政策偏好,只是谋求达成对他所代表的人有吸引力的协议。为方便分析,普特南把谈判过程分为两个阶段:层次Ⅰ,谈判代表之间讨价还价,达成暂时协议;层次Ⅱ,每个集团内部就是否批准协议分别进行讨论。把谈判过程按先后顺序分成两个阶段,虽然不完全准确,但对研究是有益的。在现实中,预期结果非常重要。可能层次Ⅱ的预先商谈和争论就已经决定了层次Ⅰ的谈判立场。反之,层次Ⅱ批准的需要必定会影响层次Ⅰ的谈判。实际上,由于预计到协议在层次Ⅱ会被否决,层次Ⅰ的实际谈判可能还未开始就流产了。由此可见,在理论上,层次I的协议最终需要在层次Ⅱ获得批准,这是两个层次的关键点。“批准”可能是层次Ⅱ正式的投票程序,例如,根据美国宪法规定,批准条约需要参议院三分之二的同意票。层次Ⅱ的行为体可以代表政府部门、利益集团、社会阶层甚至是公众舆论。批准过程的唯一正式的约束是同一个协议需要双方批准,不重开层次Ⅰ谈判,层次Ⅰ达成的协议就不能在层次Ⅱ修改。换句话说,最后的批准就是同意或拒绝,对层次Ⅰ协议的任何修改都被视为拒绝,除非协议的其他各方同意修改。由此,普特南把“获胜集合”定义为当对层次Ⅰ协议进行支持或否决的表决时,在表决者中得到必需数量的支持者的集合。普特南认为,因为两个完全不同的原因,层次Ⅱ获胜集合的大小对理解层次Ⅰ协议非常重要。一是在其他条件不变的情况下,获胜集合越大,层次Ⅰ协议越有可能达成。根据定义,任何成功的协议都应在协议各方获胜集合内。因此,只有各方获胜集合形成交集

(overlap),达成协议才是可能的。获胜集合越大,越有可能产生交集。反之,获胜集合越小,谈判失败的危险越大。应把自愿违约(voluntary defection)与非自愿违约(involuntary defection)区别开来。自愿违约指在缺乏强制执行力的情况下的理性自我的违约。非自愿违约指由于协议未得到国内批准,代理人的违约行为。二是各方层次Ⅱ获胜集合的相对大小会影响国际谈判的共同所得的分配。一个谈判方的预期获胜集合越大,他更容易被其他谈判方“推着走”(pushed around)。反之,获胜集合小可能是谈判优势。

3.获胜集合的决定因素:层次Ⅱ偏好和联盟、层次Ⅱ制度、层次Ⅰ谈判代表的战略

获胜集合的大小与层次Ⅱ投票者间的权力分配、偏好和可能的联盟。普特南认为,任何可验证的国际谈判双层博弈理论必须植根于关于层次Ⅱ主要行为体的权力和偏好的国内政治理论。对层次Ⅱ政治细节的抽象,可以总结出决定获胜集合大小的原则。一是投票者达不成协议(no-agreement)的成本越低,获胜集合越小。达不成协议的成本对不同的投票者程度不一。对有些投票者来说成本低,而对另一些投票者来说则成本高,前者比后者更怀疑层次Ⅰ的协议。因此,有些投票者是一般性地反对或支持层次Ⅰ的协议,不关注协议的特定内容,而另一些投票者的决定则取决于协议的特定内容。获胜集合的大小取决于“孤立主义”力量与“国际主义”力量的相对强弱。小国、经济更开放的国家、对外依赖性强的国家支持国际合作的力量比自足性强的国家大。因为,在自足性强的国家,对大多数投票者来说,达不成协议的成本低,获胜集合小,谈判立场强硬,达成的国际协议少。二是在利益偏好一致(homogeneous)冲突和利益偏好不一致(heterogenerous)冲突两种情势下,谈判代表面临的问题截然不同。在国内利益偏好一致(homogeneous)情势下,谈判代表在层次Ⅰ赢得越多,协议越容易在层

次Ⅱ获得批准。谈判代表在层次Ⅱ面临的主要问题是处理投票者的预期与谈判结果的落差。双方都不可能在己方投票者中找到对方投票者要求的同情者,或在对方投票者中找到己方投票者立场的支持者。在利益偏好不一致(heterogenerous)冲突情势下,谈判者面临的问题则复杂得多。例如,1919年,一些美国人反对凡尔赛条约,因为它对战败国太严厉,另一些人则认为它对战败国太仁慈。所以,“越多越好”的原则不再适用。在有些情况下,层次Ⅰ的谈判手可能在对手国内找到同情者和支持者。因此,可能出现跨国联盟,他们向各自政府施加压力,要求采取他们共同支持的政策。三是在不同集团和议题间的投票者参与率差异会影响获胜集合的大小。例如,国际金融问题比国际贸易问题的投票弃权率高。层次Ⅱ投票者的参与积极性会随着议题的政治化而发生变化。政治化、公开化程度越高,获胜集合越小。所以,职业外交官都强调保守秘密对于谈判成功至关重要。四是议题的单一或多重性会影响获胜集合的大小。在多重、复杂议题的谈判中,层次Ⅱ的各个利益集团在不同的议题上可能有不同的政策偏好。一般地说,在某个具体问题上具有最大利益的集团可能在这个问题上持最极端的立场。如果每个利益集团都坚持自己的立场,那么什么协议也不能达成。因此,首席谈判代表必须在不同的议题、不同的集团之间进行平衡、协调。此外,还可采取议题联系(Issue Linkage)的办法以达成协议。普特南称之为协同联系(Synergistic Linkage)。例如,层次Ⅱ的大多数投票者反对某个政策,但是如果有更多的工作机会作为回报,如果首席谈判代表能说服对手达成创造更多工作机会的国际协议,可能有些投票者就会改变原来的政策选择,批准协议。普特南预计,随着相互依赖程度的加深,协同联系将越来越多。

获胜集合的大小与层次Ⅱ的制度安排。批准程序会影响获胜集合的大小。例如,需要三分之二投票支持的制度的获胜集合比需要半数投票支持的简单多数制度的获胜集合小。普特南认为,民主国家如美国的获胜集合比专制国家小,谈判

优势更大,但是非自愿违约的可能性也更高,国际合作更为困难。此外,其他制度也会影响获胜集合的大小。如执政党的严格纪律,能扩大获胜集合。反之,在其他条件不变的前提下,在大部分西方国家,松弛的政党纪律会减少国际合作的机会。在层次Ⅱ投票者中,中央决策者的自主权越大,获胜集合越大,达成国际协议的可能性越大。不过,这也意味着,一个国家相对于国内压力的自主权越大,在国际谈判中的相对优势越小。例如,专制国家的谈判代表比民主国家的谈判代表让人相信达成不利协议的阻力和压力小。普特南指出,为了研究的简化,只限于两个层次。但是在现实中,许多制度安排规定需要数个层次的批准,这增加了获胜集合分析的复杂性和重要性。例如美国和欧共体农业贸易谈判。根据《罗马条约》规定,欧共体国家的共同农业政策的修改需要代表成员国的部长理事会一致通过。然后,决定还需要在各国内部获得批准。在多个政党组成的联合政府,还需要在各个政党内部得到批准。同样,在美方,协议需要得到大多数农业组织的支持。在各个组织内部,需要各个利益集团、地区的支持。

获胜集合的大小与层次Ⅰ谈判代表的战略。每个层次Ⅰ的谈判代表都有兴趣最大化对方的获胜集合,但是涉及到他自身的获胜集合,他的动机则是复杂的。获胜集合越大,他越容易达成协议,但是他的相对谈判地位也越弱。假定某个谈判代表为批准某个协议希望扩大其获胜集合,他可以采用传统的额外支付(Side-Payments)和良好愿望(Good Will)战略。在博弈论和现实政治中,利用额外支付来吸引边缘支持者(Marginal Supporters)是个熟悉的战略。例如,为了说服立场不坚定的参议院批准巴拿马运河条约,卡特政府提出了许多有利条件(如公共工程)。在双层博弈中,额外支付既可来自无关的国内,也可能是来自国际谈判。额外支付在双层博弈中的价值是在于促进协议批准的边际贡献,而不是对接受国的总体价值。它针对的是边缘投票者,而不是所有投票者。例如,在贸易谈判中,它针对的不是自由贸易主张者,也不是保护主义者,而是立场中间

者。此外,首席谈判代表在国内地位高、声望好更容易使协议得到批准。每个层次Ⅰ的谈判代表都高度关注双方的受欢迎程度。因为,A方受欢迎能扩大其获胜集合,提高成功的可能和B方的谈判地位。所以,在正常情况下,谈判代表应该想方设法提高在各自投票者中的地位和声望。因为,高级谈判代表能提供更多的额外支付和良好愿望,所以,外国人都更愿意与政府首脑而不是低级官员谈判。

此外,普特南还探讨了信息不确定(Uncertainty)、谈判战术(Bargaining Tactics)、重构(Restructuring)和回应(Reverberation)及首要谈判者的作用(the Role of Chief Negotiator)对获胜集合大小、变化的影响。限于篇幅,不再详述。

三、双层博弈理论的应用和发展

普特南提出双层博弈理论后,引起了国际政治学界的关注,认为该理论为分析国内政治与国际政治的联系、互动提供了一个新的模式、框架和视角。此后有不少学者对它进行拓展、深化,从而在不同方面补充、发展、完善了该理论①。比较突出的有这三个方面:

1.扩大研究范围,证明双层博弈理论的普适性。代表作是彼得?埃文斯(Peter

B.Evans)、哈罗德?雅各布森(Harold K.Jacobson)、罗伯特?普特南合编的《双面外交:国际谈判和国内政治》。该书研究两个基本问题:(1)普特南的洞见和概括是否适用于包括非西方国家的谈判;(2)是否适用于经济问题外的其他谈判。此外,还拟探讨普特南的比喻或模式发展、提高、扩展的程度[1]。读过普特南的那篇论双层博弈理论的文章的人可能有种偏见,认为文中的例子主要是二战后工业发达民主国家间的经济合作谈判,这只是国际谈判中的一个特例,是以经济

问题和正和博弈为优势的国内理论。为了证明双层博弈理论的普适性,该书作者在选择案例时注意了广泛性,包括专制国家和民主国家、发达国家和发展中国家的外交,战前、战后初、主要是近期外交,共11个案例,其中4个是关于安全和土地问题的,3个是关于南北关系的,4个是关于经济问题的。每个案例都利用双层博弈理论框架解释谈判结果的两个层面:(1)达成协议的成功或失败;(2)得失的分配。每一章都包括两个案例,一个成功,另一个失败。该书通过这11个案例的研究,对普特南提出的双层博弈模式的理论含义在这几个方面进行了更深入的探讨:政治家利用守门人的角色获得的自主权;在发出信任威胁中的国内支持的作用;在国际谈判中不对称的国内政治信息的作用;政治家作为鹰派、鸽派、代理人的区别的重要性[1]。

2.对双层博弈理论概念化,提出可验证的假设。代表作是海伦?米尔纳(Helen https://www.360docs.net/doc/c74882739.html,ner)的《利益、制度、信息、国内政治与国际关系》。作者认为,普特南的双层博弈是一个很好的理论分析框架,但是它缺乏可验证的假设,理论化程度不够。该书的目标是对双层博弈理论概念化,提出可验证的假设。该书的核心议题是国内政治与国际政治的互动。一个现实困惑是,为什么国家能互相合作?为什么国家不能互相合作?作者认为,国家间的合作受对他国的相对所得和欺骗行为的恐惧的影响要小于合作行为的国内分配的影响。合作协议在国内产生了赢利者和失利者,因此形成了支持者和反对者。这些集团间的内部斗争塑造了国际合作协议的可能性和性质。实现合作的国际谈判之所以失败是因为国内政治,这种谈判也常常因为国内政治发起。合作的各个方面都受到国内政治考虑的影响,因为合作是国内政治斗争另一种形式的延续。作者假定,国家不是单一行为体。国内政治不是严格的等级政治,而是在等级政治、中间状态、无政府状态间变动的连续体,其具体状态受三个因素决定:国内行为体(行政部门、立法机构、社会利益集团)的偏好,规定权力如何在行为体中分配的政治制度,行为体间的信息

分配。作者首先探讨了行为体的利益与政治制度间的关系。利益和制度的互动如何决定政策选择,社会和政治行为体在塑造政策中的相对重要性,总统制与议会制的相对优点。其次探讨了政治制度在决定政策选择中的作用。行政部门决定议程,议会批准议程,利益集团直接影响政治行为体的偏好,扮演信息提供者的角色,但不能直接参与决策过程。最后探讨了信息分配的重要性。信息在行为体间分配的不完整性、不对称性、不确定性会导致两个后果,一是降低效率,二是导致行政部门拥有信息的政治优势,立法部门没有这个优势[5]。

3.对合作后外交政策过程的长期性和国内政治因素对国际协议批准的影响进行研究。代表作是杰弗里?兰蒂施(Jeffrey https://www.360docs.net/doc/c74882739.html,ntis)的《国内约束与国际协议的违约》。该书研究的问题是:为什么即使国家领导人相信合作符合国家的最大利益时,仍然决定不遵守国际承诺?对国际组织承诺的违约有时让人吃惊,因为从结构条件预测应该合作(即有国际合作的巨大国际压力)。有时是非自愿的,因为领导人相信合作符合国家的最大利益。作者认为,普特南在他那篇1988年发表的文章中对这种违约原因提供了最流行的解释,认为这是领导人在进行双层博弈时国际国内因素同时作用的结果。但是,普特南及其理论支持者对合作后外交政策过程的长期性和国际协议批准所需时间的含义研究不够,对合作后过程和国内政治因素造成不坚持认可合作的国际承诺的计划的可能性研究不够。该书的目的是弥补普特南理论的不足,认为国际违约是承诺后政治阶段领导人将问题置于公众议程,外交决策受到国内约束的结果。承诺后阶段就是国内条件与行为体就国际协议联合起来的时期。它发生在国际组织环境中领导人承诺与他国合作之后,但是在最后作出分配政府资源认可诺言的外交决策之前。作者提出了以三个观点为基础的承诺后政治框架:(1)国际合作是连续过程的结果,不只是国内与国际条件同时作用的结果。领导人在国际组织框架内作出的与他国合作的初步承诺(不论问题领域)动员了国内政治行为体和条件,划定了承诺后阶段的开始。

(2)在承诺后阶段,领导人必须建立支持国际合作的共识。至少有五个国内政治条件可能影响领导人最初的国际合作的持久性:主要政党的一致,执政联盟的共识,外交决策效果的对称,选举表现和公众支持。(3)这些国内政治条件与执政精英的相近程度决定了对合作的外交决策的相当影响[6]。

四、结论

综上所述,双层博弈理论具有三个显著特点。首先,双层博弈是关于外交谈判的理论。学界对外交的定义可谓五花八门,但是,没有谁能否认,外交的狭义解释就是通过谈判处理国际关系。既然谈判是外交的主要方法,那么从谈判角度来研究外交问题应是适当的。其次,双层博弈理论政治家视为外交谈判中的战略行为体。谈判立场是由政治家确定的,但是外交谈判要取得成功,达成协议,就要求政治家确定的谈判立场既能为其他国家所接受,也能为国内所批准。第三,双层博弈理论着重从国际与国内政治互动的角度来研究外交谈判。传统的外交谈判研究把国家看成是内部完全一致的单一的理性行为体,它以国家利益为最高原则,以利益最大化为谈判目标。在双层博弈理论看来,在外交谈判中,谈判方不是内部完全一致的单一的理性行为体。所谓国家利益,实际上是国家领导人对国内各种集团的利益诉求的折中。

双层博弈理论是由美国学者创立的,是以西方国家主要是美国的政治、经济、社会制度为前提和基础的。所以,运用双层博弈理论研究非西方政治制度国家的外交决策时难免有局限性,需要对这个理论进行一定的修正和改进。正如有个美国学者指出的,“民主国家和极权国家制定对外政策的方式差别很大。绝大多数在美国发展起来的决策理论关注的都是美国的政治,如大众舆论的作用,行政机构和国会之间关系,华盛顿的官僚机构内部每年的预算之争的性质”。“这里就

存在一种危险:当美国人把决策、冒险、官僚机构的预算之争、长期军备竞赛或严重危机中的互动行为方面的一些基本概念当作理性来考虑的时候,通过观察美国决策者的行为而得到的教训和经验就有可能被不恰当地运用到各种不同的决策环节中去,如莫斯科、北京、东京、新德里及曼谷”[7](P645-646)。因此,不能简单化地生搬硬套这个理论来研究非西方国家如中国的外交。

注释:

①See Jeffrey W. Knopf, "Beyond Two-Level Games:Domestic-International Interaction in the Intermediate-Range Nuclear Forces Negotiations," International Organization 47(Autumn 1993),pp.599-628; Keisuke Iida, "When and How Do Domestic Constraints Matter?Two-Level Games with Uncertainty, "The Journal of Conflict Resolution, Vol. 37, No.

3.(Sep.,1993),pp.403-426;Peter F. Trumbore, "Public Opinion as a Domestic Constraint in International Negotiations: Two-Level Games in the Anglo-Irish Peace Process," International Studies Quarterly, Vol. 42, No. 3.(Sep.,1998), pp.545-565 ;Peter F. Trumbore ,Mark A. Boyer, "International Crisis Decisionmaking as a Two-Level Process," Journal of Peace Research, Vol.37, No. 6. (Nov., 2000), pp. 679-697;Simon Hug, Thomas Kig, "In View of Ratification: Governmental Preferences and Domestic Constraints at the Amsterdam Intergovernmental Conference," International Organization, Vol.56, No. 2. (Spring, 2002), pp.447-476.

参考文献:

[1]Peter B. Evans, Harold K. Jacobson, Robert D.Putnam. Double-Edged Diplomacy:International Bargaining and Domestic Politics[M]. Berkeley: University of

California Press,1993.

[2]Robert D.Putnam, Nicholas Bayne. Hanging Together. The Seven-Power Summits[M]. Cambridge: Harward University Press, 1984.

[3]秦亚青.权力?制度?文化[M].北京:北京大学出版社,2005.

[4]Robert D.Putnam. Diplomacy and Domestic Politics:The Logic of Two-level Games [J]. International Organization, Vol.42,No.3.1988.

[5]Helen V. Milner. Interests,Institutions,and Information: Domestic Polities and International Relations [M].Princeton: Princeton University Press,1997.

[6]Jeffrey https://www.360docs.net/doc/c74882739.html,ntis. Domestic Constraints and the breakdown of International Agreements [M].Westport: Praeger Publishers,1997.

[7][美]詹姆斯?多尔蒂和小罗伯特?普法尔茨格拉夫.争论中的国际关系理论[M].阎学通,等译.北京:世界知识出版社,2002

第17章 决策与博弈论

第17章决策与博弈论 17.1 复习笔记 1.博弈论的基本概念 (1)博弈及其三个要素 博弈论是在一个简化的体系里描述复杂的决策问题,这些决策问题往往涉及多个行为者,他们之间的决策相互依存,相互作用。 博弈包含三个要素:①参与者;②决策;③报酬。 (2)合作与非合作博弈 如果在博弈参与者之间可形成共同计划的决策这类具有约束性的合同,那么这类博弈被称为合作性的博弈。 如果在参与者之间不能达成或实施有约束性的合同,这类博弈则被称作非合作性的博弈。 (3)主导策略(占优策略均衡) 主导策略是指对某参与者而言,不管其竞争对手的反应如何,这一决策总是最优的策略。 2. 纳什均衡 (1)纳什均衡 纳什均衡是指在给定对方行动的前提下可以给每个参与者都带来最佳结果的某种决策(或行动)。达到纳什均衡时,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而这个均衡没有人有积极性去打破。 占优策略均衡即是一种纳什均衡。占优策略均衡若存在,只存在惟一均衡,而纳什均衡可能存在多重解。 (2)最大极小决策(囚徒困境) 最大极小决策反映的是,从个人角度出发所选择的占优策略,从整体来看,却是最差的结局,即个人理性与团体理性的冲突。这一决策可以发生在不少的博弈场合,也可以解释卡特尔联盟的不稳定性。 (3)混合策略 在有些博弈中,仅采取一种决策或一种行动的“纯决策”不是最好的决策,即可能不存在纳什均衡。而以某特定的概率P选择一种行为,以1-P的概率选择另一种行为,则有可能是纳什均衡的解。这时的选择被称为混合策略。但反过来需要注意,存在混合策略均衡的博弈也有可能存在非混合策略的均衡。 3. 重复博弈 重复博弈即同一个博弈被重复多次的动态博弈,它是反复不断进行的。 在无限期重复博弈中,对于任何一个参与者的欺骗和违约行为,其他参与者总会有机会给予报复。所以,每一个参与者都不会采取违约或欺骗的行为,囚犯困境合作的均衡解是存在的。但在有限期重复博弈中,在博弈一开始的第1期,每个参与者就会采取欺骗或违约的不合作策略。所以,在有限期重复博弈中,囚犯困境博弈的纳什均衡是参与者的不合作。 4. 顺序博弈 顺序博弈是参与者轮换行动的博弈。分析顺序博弈要比参与者同时决策的博弈简单得多,其关键在于考虑每个参与者可能的行动及其理性的对策。 5. 威胁与承诺 行业的主导企业或者在位企业为了维护自己的地位或阻止新企业进入,往往会采用威胁或承诺的手段。 威胁通常是不付诸实际行动的,即不会改变报酬矩阵,最终往往使得发出威胁一方无法

博弈论(整理过名词解释和简答)

名词解释: 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 4、常和博弈:是指博弈双方的得益总和为非零的常数 变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响 6、战略:参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡:所有参与人的最优战略组合。 8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。 13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件: (1)决策结x是单结信息集; (2)在一个信息集的决策结必须是同一个决策结的后续结。 14、子博弈精炼纳什均衡:如果一个纳什均衡中的各个子博弈的战略在每一个子博弈中都是最优的,即构成纳什均衡,则称该博弈为子博弈精炼纳什均衡。 15、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动; 动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 16、重复博弈:给定一个标准博弈G(动态/静态)重复进行T次,并且每次重复G之前,以前的博弈的结果各个博弈方都能观察到,这样的博弈过程成为“G的T次重复博弈”,记为G(T),G称为G(T)的博弈阶段。同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。 17、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。 18、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。 19、类型:一个参与人所拥有的私有信息,是其个人特征的完备描述,博弈人知道,其他人不知道。

博弈论和纳什均衡

博弈论和纳什均衡文件管理序列号:[K8UY-K9IO69-O6M243-OL889-F88688]

关于博弈论和纳什均衡你应该知道这些 腾讯财经[]2015-05-25 10:05 我要分享 [摘要]纳什在与命运的博弈中找到均衡,纪念大师最好的方式就是尝试了解博弈论。 腾讯财经综合报道(风生)奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸,两人均不幸遇难。事发当时,这辆出租车失控撞向栏杆,两人均被抛出车外。 约翰-纳什因发表两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即着名的纳什均衡。 不均衡人生中孕育出均衡论 纳什于1928年在美国西弗吉尼亚州出生,曾在麻省理工学院任教,晚年为普林斯顿大学担任数学系教授,死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名,1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。

纳什在数学领域上取得多项突破,但他同时深受精神分裂症困扰,其生平故事在2001年被改编成电影《美丽心灵》,赢得包括最佳电影在内的4项奥斯卡奖项。 尽管西维亚-纳萨斯(Sylvia Nasars)广为人知的小说《美丽心灵》(A Beautiful Mind)和改编自该书的、由拉塞尔-克罗(Russell Crowe)主演的同名奥斯卡电影探究了纳什错综复杂的生平,但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界,人们普遍认为,与牛顿和爱因斯坦的数学理论相比,纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题,而纳什的数学却可以应用在生物学和社会学领域。 如若不是精神疾病的困扰,纳什今天可能已与那些科学伟人齐名。尽管如此,他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就,他与约翰海萨尼(John Harsanyi)和莱茵哈德-泽尔腾(Reinhard Selten)一起获得了1994年诺贝尔经济学奖。 什么是博弈论与纳什均衡 博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争

博弈论的基础知识与应用

博弈论的基础知识与应用(转) 1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括:1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是“理性”的? 3)如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的,在什么样的情况下合作是理性的? 4)在特定情况下,正在持续的关系与单方退出这种关系是不同的吗? 5)在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现吗? 6)在这些情况下,真正的人类行为与“理性”行为是否相符? 7)如果不符,在那些方面不符?相对于“理性”,人们更倾向于合作?或者更倾向于侵略?抑或二者皆是? 因而,博弈论研究的“博弈”包括: 破产 门口的野蛮人(Barbarians at the Gate) 网络战(Battle of the Networks) 货物出门,概不退换(Caveat Emptor) 征召(Conscription) 协调(Coordination) 逃避(Escape and Evasion) 青蛙呼叫配偶(Frogs Call for Mates) 鹰鸽博弈(Hawk versus Dove) Mutually Assured Destruction 多数决定原则(Majority Rule) Market Niche 共同防卫(Mutual Defense) 囚徒困境(Prisoner’s Dilemma) 补贴小商业Subsidized Small Business 公共地悲剧Tragedy of the Commons 最后通牒Ultimatum

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

论外交决策中的理性决策模式

论外交决策模式中的理性决策模式 摘要:“理性决策模式”是外交决策研究的基本模式,具有决策者的单一人格化、决策目标的现实主义化、决策过程的完美理性化三个基本特征,但该模式忽视了显示国际政治中决策机构的多元化、国家利益的复杂性、决策过程的非理性操作性,存在着局限性。本文试就“理性决策模式”的定义、基本内容和基本特征作一定阐述,并对其得失提出自己的评价。 关键词:理性决策模式、定义、基本内容、基本特征、优势、缺陷 外交决策虽然是针对外交、应对国际环境做出的决策,但是决策的基础还是国内政治,而且外交决策可能涉及的领域非常广泛。作为一种危机处理方式,无论是金融、安全、环境、技术、文化、教育等等各个方面出现了问题,都可能涉及外交决策。因此,外交决策可谓“贯穿内外,包罗万象”。 此外,外交决策是如何做出的并没有一个统一的模板,各国各地的国体政体、政治传统、民主程度都可能影响一国的决策方式。但是为了规范研究,学者们还是将外交决策模式在理论上大体上分为了三种:即以博弈论为主要方法的理性选择模式、以系统论和控制论为方法的官僚组织模式和基于心理分析法的认知心理模式。 理性决策模式(rational model),是美国哈佛大学教授格拉汉姆·艾里森(Graham T. Allison)在其《决策的本质》一书中所论述的“外交决策三大模式”之一,也是众多学者、专家用来观察、理解各国政府外交决策的传统研究视角。 一、“理性决策模式”的定义及基本内容 “理性决策模式”,即是在历史学的外交决策研究框架内,将国家或国家外交决策者看作是一个高度统一的行为体,并认为决策者能从理性出发,能依据同样的国家利益,在一切可供选择的外交方案中进行决策,以谋求国家利益的最大化的一种外交决策模式。 从这个定义可以看出,“理性”是“理性决策模式”的核心要素。那么,何谓理性?理 性一词(rationality)来源于拉丁词根“ratio”,带有“明智、理智”的含义,通常用来描述信仰范畴中的“坚持信念的方式”[1]以及行为活动范畴中的手段与目的之间的关系。理性决策中的“理性”属于后者。帕森斯(Talcott Parsons) 教

新《博弈与决策》期末复习指导

第一章博弈论的基本理论 (一)博弈论的基本概念 博弈:现实生活中,不同的决策人为了争夺资源、争夺机会使得决策人处于相互依存的复杂关系中,这就不得不思考他人有针对性行为对自身所产生的影响。 博弈就是一种游戏,在这种状态下,参与者必须作出选择,并对对方的选择作出判断,这种判断和选择决定了博弈的结果。每个对弈者在决定采取何种行动时不但要根据自身的利益和目的行事,也要考虑自身的决策行为对其他人的可能影响,以及其他人的行为对自身的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。 博弈论:就是以参与人之间有针对性的行为产生的互动过程为研究对象的理论,探讨在互动过程中参与人的一般行为规律。博弈论的核心问题在于如何在“策略互动”的局势中找到局中人的最佳行为方式,使得采用最佳行为方式的局中人能获得最大的收益。所以博弈论可以简单理解尾研究策略互动局势中的局中人的理性行为的理论。 (二)博弈论的构成要素 1、博弈一般由以下几个要素组成,包括:参与人、行动、信息、策略、得益、结果、均衡等。 2、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体); 3、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策; 4、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排; 5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西; 6、均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博弈规则来决定均衡。 二、博弈论的发展简史 1、萌芽阶段:博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。 2、产生阶段:1944年科学家冯·诺伊曼和经济学家奥斯卡·摩根斯坦合著《博弈论与经济行为》将二人博弈推广到n 人博弈结构并将博弈论系统的应用于经济领域,标志着博弈论作为一门独立的的学科诞生。 3、发展阶段:1950年,约翰·纳什(John Nash)引入均衡(解)的概念,即纳什均衡,将博弈论从零和博弈推进到非零和博

博弈论与纳什均衡

《博弈论与纳什均衡理论》 姓名张贺祺 学号 2010010404 专业政治经济学 指导老师张秉云

摘要 博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 关键字:博弈论;纳什均衡;合作博弈;非合作博弈

目录 摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) (一)博弈论的主要思想 (4) (二)博弈论的分类 (5) 三、经典案例 (7) (一)博弈论的经典案例 (7) (二)纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) (一)博弈论的重要影响 (8) (二)纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论 一、引言 近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。 博弈论(Game Theory):亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 纳什均衡:(Nash equilibrium)又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。假设有n人局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 二、博弈论与纳什均衡的主要内容 (一)博弈论的主要思想 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P:为局中人,博弈的参与者,也称为博弈方,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。决策人:在博弈中率先做出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者:在博弈二人对局中行动滞后的那个人,与决策人要做出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,因此对

博弈论在公共决策中的应用(最新)

博弈论在公共决策中的应用 一.领导干部要学点博弈论 1.几个富有启发性的案例 案例1:商家作出最低价格承诺的真相是什么?所谓最低价格承诺是指商家承诺自己的价格比任何对手都低,一旦有对手的价格比自己低,作承诺的商家将退回差额,并且承诺支付一定金额的违约罚金。 思考:商家为什么要作出这种承诺呢?是为了促销或者恶性竞争吗? 案例2:假设有三个候选人或候选方案:x、y 和z;有三个参加投票的人:甲、乙、丙。三个人对候选对象的态度分别如下:甲:x y z;乙:y z x;丙:z x y。(注:候选对象排位越靠前,表示越喜欢) 现在分别有三个投票程序:程序1,x与y先pk,然后胜利者进入下一轮与z进行pk;程序2,x与z先pk,然后胜利者进入下一轮与y进行pk;程序3,z与y先pk,然后胜利者进入下一轮与x进行pk。 思考:(1)上面每个程序的最终获胜者是谁?(2)为了保证丙自己心目中最喜欢的z当选,如果丙能够操纵投票程序,他应该采用哪个投票程序?(3)如果您是甲,为了

避免自己最不喜欢的丙当选,应该怎么办? 案例3:夫妻博弈(又称协调博弈) 妻 夫足球 芭蕾 思考:夫妻博弈最有可能出现的结局是什么?丈夫如何保证获得自己理想的结果——夫妻一起去看足球?妻子有没有办法扭转这一被动局面? 体会:什么是纳什均衡?纳什均衡的特点就是:在均衡状态下没有人愿意单方面改变自己的策略,也就是说,博弈各方所选择的策略互相构成了最优反应。 案例4:开店博弈 假设顾客均匀分布在一条街上,他们总是选择到离自己家最近得的商店购物;现有两位投资者均准备在街上开店,他们都希望到自己商店购物的顾客越多越好。请问:投资者应该

博弈论与纳什平衡

博弈论与纳什平衡 博弈论(game theory)对人的基本假定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。 纳什(John Nash)编制的博弈论经典故事"囚徒的困境",说明了非合作博弈及其均衡解的成立,故称"纳什平衡"。 所有的博弈问题都会遇到三个要素。在囚徒的故事中,两个囚徒是当事人(players)又称参与者;当事人所做的选择策略(strategies)是承认了杀人事实,最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认杀人,另外一个抵赖,不承认杀人,那么承认者将会得到减刑处理,而抵赖者将会得到最严厉的死刑判决,在纳什故事中两个人都承认了犯罪事实,所以两个囚徒得到的是中间的结果。 类似的:我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。 在互联网这个原始丛林中:最优策略是如何产生的呢? 一、博弈中最优策略的产生 艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。 社会实践中有很多合作的问题。比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。 A和B各表示一个人,他们的选择是完全无差异的。选择C代表合作,选择D代表不合作。如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。 显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。如果一方选C,一方选D,总体得5分。如果两人都选D,总体得2分。 对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于A来说,当对方选C,他选D得5

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论的基本概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论与纳什均衡

第22卷哈尔滨师范大学自然科学学报 Vol .22,No .42006 第4期 NAT URAL SC I E NCES JOURNAL OF HARB I N NOR MAL UN I V ERSI TY 博弈论与纳什均衡 郭 鹏 (中国矿业大学) 杨晓琴 (鸡西大学) 【摘要】 纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础. 关键词:博弈论;纳什均衡;非合作博弈 收稿日期:2006-02-15 0 引言 博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论.两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽.作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期.然而,它过于抽象,实用性不强,其局限性日益暴露出来.50年代以来,纳什(Nash )、泽尔腾(Selten )、海萨尼(Harsanyi )等人使博弈论成熟并最终进入实用.最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究.1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情.博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具. 简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡.博弈论由3个基本要素组成:一是决策主体(Player ),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是 效用(U tility ),是可以定义或量化的参与人的利 益,也是所有参与人真正关心的东西,又称偏好或支付函数.参与人、策略集和效用构成了一个基本的博弈. 1 博弈论的主要思想 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失. 博弈论模型可以用五个方面来描述:G ={P,A,S,I,U ) P:为局中人,博弈的参与者,也称为“博弈 方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标. A:为各局中人的所有可能的策略或行动的集合.根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等.

(完整word版)博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

博弈论中的几个经典问题精编版

博弈论中的几个经典问 题 集团企业公司编码:(LL3698-KKI1269-TM2483-LUI12689-ITT289-

几个博弈论中的经典问题博弈论(GameTheory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的 完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博 弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一 局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作 不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关 量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(NashEquilibrium):在一策略组合中,所有的参与者面临 这样一种情况,当其他人不改变策略时,他此时的策略是最好的。 也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B 也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

相关文档
最新文档