听一听谢林讲博弈论的故事
博弈论定义与主要思想

Selten and Harsanyi
泽尔腾(1965)将纳 而海萨尼则发展了刻
什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概念; 以及进一步刻画不完 全信息动态博弈的 “完备贝叶斯纳什均
画不完全信息静态博 弈的“贝叶斯纳什均 衡”(1967-1968)。 总之,他俩进一步将 纳什均衡动态化,加 入了接近实际的不完 全信息条件。他们的
著名经济学家保罗.萨缪尔森说:“要想在现代 社会做一个有文化的人,您必须对博弈论有一 个大致了解。”
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的 思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式 。
2005年诺奖授予有以色列和美国双重国籍的罗 伯特·奥曼和美国人托马斯·谢林,以表彰他们 在博弈论领域作出的贡献。
主要思想
博弈论并不是经济学的一个分支,它只是一种 方法,这也是为什么许多人将其看成数学的一 个分支的缘故。
在对参与者行为研究这一点上,博弈论和经济 学家的研究模式是完全一样的。经济学越来越 转向人与人关系的研究,特别是人与人之间行 为的相互影响和相互作用,人与人之间利益和 冲突、竞争与合作,而这正是博弈论的研究对 象。
4、信息指的是参与人在博弈中所知道的 关于自己以及其他参与人的行动、策略 及其得益函数等知识;
5、得益是参与人在博弈结束后从博弈中 获得的效用,一般是所有参与人的策略 或行动的函数,这是每个参与人最关心 的东西;
第11章-博弈论教材全篇

田忌
齐王 b1 b2 b3 b4 b5 b6
a1
3 1 1 1 1 1
a2
1 3 1 1 1 1
a3
1 1 3 1 1 1
a4 1 1 1 3 1 1
a5
1 1 1 1 3 1
a6
1 1 1 1 1 3
2-2 具有鞍点的博弈
通过下面的例3说明,什么是局中人的最优纯策略, 如何求出这个纯策略以及博弈解和博弈值的概念。
博弈的三个要素的矩阵表示(局中人A的收益)
局中人B
局中人A
策
a1
a2
略
am
b1
c11 c21
cm1
策
b2
c12 c22
cm 2
略
bn
c1n c2 n
cmn
局中人A的收益函数可用如下的矩阵表示:
c11
A
c21
cm1
c12 c22
cm 2
c1n c2n
cmn
二人零和博弈也称为矩阵博弈。
博弈论的研究建立在下述假设前提下:即参与博弈 的各局中人都是理性的。
“博弈中一个理性的决策必定建立在预测其他局中人 的反应之上。一个局中人将自己置身于其他局中人的 位置,并为他着想从而预测其他局中人将选择的行为, 在这个基础上该局中人决定自己最理想的行动。”
博弈的三个要素,即局中人,策略集和收益函数 构成了博弈信息,根据不同信息可对博弈做如下 分类:
同样乙方应从收益表中每列找出最大正数(恰为乙 方输掉的数值),为了减少损失,应从这些数字中 求出最小数,它所对应的列策略为乙方的最优纯策 略。
计算过程如下:
对局中人甲,先从每一行中求出最小值
min6,1, 8 8,min3, 2,6 2, min3,0, 4 3,再求出其中的最大值 max8, 2, 3 2。数字2对应的行策略
《博弈论心得体会》

《博弈论心得体会》今年是我刚刚进入中央广播电视大学的第一年,刚进入大学的第一学期我就学到了一门新的课程,这门课程在我们的生活中无处不在,在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述,经过一个学期的学习后,我才知道我身边发生的很多事情都可以用这门课程概述,他就是《博弈论》。
那么什么是“博弈论”。
所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。
经过一段时间的学习,我对博弈论有了一些肤浅的理解,诚然,一门学问想在短时间内有所深入理解是不现实的。
生活之中到处充满着博弈,有人说没有,那是因为缺少发现博弈现象的眼睛。
人生就是在弈棋,学会博弈。
虽说博弈不是万能的,但没有博弈现象存在的生活是万万不能的。
社会生活中,共赢是一种优良的博弈方式。
双赢策略其实是一种很高的智慧,帮助别人的同时接受别人的帮助,双方最终将获得独自奋战所不能拥有的东西。
放弃内心的宁予外贼不予家奴的思想。
中国人对竞争的理解大多不是“你死”就是“我活”,胜利的含义似乎就是阻止别人成功,可是这“胜利”是那么虚假,经不起风吹雨打,经不起时间考验。
拥抱双赢,拥抱明天。
双赢强调的是博弈双方的利益都要兼顾,就是所谓的“赢者不全赢,输者不全输”。
但是双方都得到了满意的结果。
在社会中,人与人之间的对抗和较量是一个不容回避的话题,只有直面这些问题,个人才更有可能获得成功的机会。
在所有的对抗和1较量中,其胜负成败常常取决于3个基本的因素。
机会或者说运气、体能和智能。
通过抛硬币来赌输赢是纯粹依赖于个人运气的游戏;百米赛跑的胜负基本上取决于个人的全身技能;而篮球赛、战争等对抗,虽然也会受到运气的影响,体能也很重要,但决定胜负的更重要的因素是头脑技能的较量。
头脑技能是一种策略技巧,或者说是在谋略方面的造诣。
既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。
博弈论概要

博弈论概要1.研究背景及意义在现实生活中,人们的利益冲突与一致具有普遍性,因此,几乎所有的决策问题都可以认为是博弈。
博弈论在政治学、经济学等许多领域都有着广泛的应用。
在经济学中博弈论作为一种重要的分析方法已渗透到几乎所有的领域,每一领域的最新进展都应用了博弈论,博弈论已经成为主流经济学的一部分,对经济学理论与方法正产生越来越重要的影响。
虽然博弈论是数学的一个分支,但其应用范围十分广泛,在经济学、管理学、社会学、政治学、法律学、军事学等领域都有许多成功运用博弈论的案例。
早在1994年,提出博弈均衡理论的纳什博士与他的伙伴哈尔萨尼教授、泽尔滕教授就共同分享了当年的诺贝尔经济学奖和93万美元的奖金。
2005年,瑞典皇家科学院再次把诺贝尔经济学奖颁给了有着以色列、美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林,以表彰他们在博弈论领域作出的贡献。
纳什的贡献是在1944年与奥斯卡·摩根斯特恩合著了《博弈论与经济行为》一书,标志着现代系统博弈理论的的初步形成。
而谢林和奥曼两位博弈论先驱在政治理论、社会学甚至生物学等方面成功运用到了博弈学理论。
奥曼用数学分析为博弈论列出了精确的公式,谢林则是想通过实践来展示博弈论在社会各个领域的实际意义。
他们两位利用博弈论对商业谈判、种族隔离、武器控制等领域进行了实际分析,谢林教授认为博弈论运用的重要领域应该包括核威慑和武器控制,同时还可以研究种族关系、有组织犯罪、雇员关系乃至自我管理等方面。
2.博弈论相关概念与发展史综述2.1博弈论的概念2.1.1博弈论的定义博弈论(Game Theory,又称对策论)研究决策主体的行为在发生直接的相互作用时,人们如何进行决策以及这种决策的均衡问题。
博弈论是研究理性的决策者之间冲突与合作的理论。
在博弈论分析中,一定场合中的每个对弈者在决定采取何种行动时都策略地、有目的地行事,他考虑到他的决策行为对其他人的可能影响,以及其他人的行为对他的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。
博弈论(第一、二章)

游戏2:摘柿子
甲 跑
摇 跑
乙
摇 跑
甲
摇
乙 跑
摇 跑
甲
不跑 (2,2)
(0,0)
(0,1) (2,0)
(0,3) (4,0)
游戏3:免费彩票博弈
每个人可以免费购买任意数量彩票,随机 抽取1张彩票中奖,奖金总额为1000万元/n,n 为彩票数量。
博弈论:研究理性人行为选择的理论
博弈论作用:帮助个人、组织等决策主 体深刻理解策略并明智的选择行动。
第二章 完全信息静态博弈
� 基本分析思路和方法 � 纳什均衡 � 混合策略 � 纳什均衡的选择
第一节 基本分析思路和方法
行动或策略(acቤተ መጻሕፍቲ ባይዱion or strategy)
si:局中人i的一个特定策略 Si:局中人i的策略集(strategy set)或策略空间 (strategy space),可以是离散的或连续的。
纳什的基本贡献是证明了非合作博弈均衡解 及其存在性,建立了作为博弈论基础的“纳 什均衡”概念;海萨尼则把不完全信息纳入 到博弈论方法体系中;泽尔腾的贡献在于将 博弈论由静态向动态的扩展,建立了“子博 弈精练纳什均衡”的概念。
1996莫里斯(James A.Mirrlees)和维克瑞(William Vickrey)
游戏1:军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
C -1 +1 +1
游戏1:军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
《第九章:合作博弈理论》

(1) 谈判破裂d带来的双方效用都是最低的, (2) 至少有一个谈判结果s带来的效用,要大于谈判破裂d的效用, 至少有一个s∈S,u1(s)>u1(d), u2(s)>u2(d) 。
我们将上述二人讨价还价问题记为:B=(S,d;u1,u2) 讨价还价问题的效用配臵集(the set of utility allocation):对于每一个 s∈S ,参与者都获得一对效用值(u1(s),u2(s)),称为问题B的 9 一个效用配臵,其集合:U(B)={(u1(s),u2(s)): s∈S }
该无差异曲线与效用配臵集U(B)的切点N即为讨价还价问题的纳什解。 定义2(讨价还价问题的纳什解法):对于任何二人讨价还价问题 B=(S,d;u1,u2),确定解集:
σN(B)={ s ∈arg max [u1(s)- u1(d)]· 2(s)- u2(d )]} [u
(2)
注意: [u1(s)- u1(d)]· 2(s)- u2(d )]是考虑到效用配臵集不作规范 [u 化处理的一般情况。
不可转换效用的合作博弈其特征函数不是一个总的效用值而是分配给每个参与者的一个向量函数第八章讨价还价和合作博弈理论第四节联盟博弈40可转换效用的联盟式表述模型的两个例子投票规则假定投票人可以达成有约束力的协议投票规则可用一个可转换效用的合作博弈来模型化
博弈论前沿专题
(Advances in Game Theory)
Nash
13
第八章
讨价还价和合作博弈理论
u2(s) 10万
u(s)=u1(s)·2(s)=c u
N
第二节 讨价还价问题纳什解法
U(B)
010万 u1ຫໍສະໝຸດ s)P9例1的求解:
代数求解:即下列优化问题: max s1, s2 (100s1)· (100s2)
博弈论—基本知识
莫里斯
维克瑞
阿克洛夫
斯宾塞
斯蒂格利茨
以色列希伯莱大学的罗伯特· 奥曼(Robert J· Aumann) 和美国马里兰大学的托马斯· 谢林(Thomas C· Schelling)“通过博弈论分析,促进了人们对冲突 和合作的理解”,以此获得了2005年诺贝尔经济学奖。
奥曼
谢林
二、什么是博弈论
• 从“齐威王田忌赛马”说起 春秋战国时期,齐威王常与旗下大将田忌赛马。 规则是:每次赛三局,每一局齐威王与田忌各出一 匹马比赛奔跑速度。每一局中的胜者赢败者一千斤 铜。田忌有上、中、下三匹马,齐威王也有上、中、 下三匹马。每次比赛,第一局田忌出上马,齐威王 也出上马;第二局田忌出中马,齐威王也出中马; 第三局,田忌出下马,齐威王也出下马。齐威王的 上马比田忌的上马好,齐威王的中马也比田忌的中 马好,齐威王的下马还是比田忌的下马好。于是, 每次比赛的结果都是田忌连输三局。
• 1944年 冯· 诺伊曼、摩根斯坦 《博弈论和经济行为》
1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽 尔腾和海萨尼,这是对博弈论在经济学发展中的贡献和 作用的充分肯定,确立了博弈论在现代主流经济学中的 地位。
纳什
海萨尼
泽尔腾
1996年,两位将博弈论应用于不对称信息下机制设计的经济学 家莫里斯(Mirrlees)和维克瑞(Vickrey)、以及2001年三位经 济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞 (Spence)因运用博弈论研究信息经济学所取得的成就而成为这 两个年度的诺贝尔经济学奖得主。
田忌 上 中 下 上中下 上 下 中 中 上 下 中 下 上 下 上 中 下 中 上
3 1,-1
1,-1 1,-1 3,-3 1,-1
【2024版】经济博弈论概述
即便如此,人们并没有放弃对合作博弈理论研究的兴趣。因为,在现实社会中,确实存在有很多类似于“为共同目的而一起行动”的合作问题,如各种形式的联盟。联盟通常是那些有着共同利益的一群(两个或两个以上)人,为了试图增进他们的共同利益一起行动所组成的集团如个体厂商为了获得更高利润,期待通过集团形成卖方断;工人们为了得到更高的工资待遇,期待通过工会形成讨价还价的势力等等。
但如果学生拒绝一个医院,往往导致医院再去找第二个学生就太迟了,因为第二个人可能已经被另一个医院抢走了。市场在这种情况下是极为不稳定的,因为医院往往会设定一个最后申请期限,迫使学生在不晓得是否还有其他机会之前就做出选择。由于医院未能及时给所有学生提供机会,而学生也未能向所有医院提出及时申请,双方都未能极大化自己的利益。
NRMP全国住院医师配对项目
到了1950年代,为了解决这个问题,美国设立了一个集中的清算所(Clearinghouse),也就是全国住院医师配对项目(NRMP:National Resident Matching Program)的项目。在1984年的论文中,罗斯发现这个清算所采用的就是盖尔-夏普利算法,从而达到有效而稳定的配对。
经济学家要在这篇数学论文发表差不多20年后,才开始将其中的原理逐步应用到真实世界的市场里。而这个工作最主要的代表者就是罗斯。
博弈论历史故事
博弈论历史故事篇①:《小兔子的菜园保卫战》在一片美丽的森林里,住着可爱的小兔子一家。
小兔子名叫跳跳,它特别拥有一个属于自己的菜园,里面种满了它最爱的胡萝卜和青菜。
可是有一天,一群调皮捣蛋的小松鼠发现了跳跳的菜园,小松鼠们觉得那些胡萝卜看起来很好吃,就经常趁跳跳不在的时候来偷吃。
跳跳非常苦恼,它知道自己得想个办法来保护菜园。
跳跳一开始想在菜园周围围上高高的篱笆,但是它发现自己力气太小了,没办法砍到足够的树枝。
于是它开始向森林里的老牛伯伯请教,老牛伯伯告诉它可以运用智慧来保护菜园,比如在菜园周围设几个陷阱。
跳跳受到了启发,它开始自己动手。
它挖了一些小小的浅坑,在坑上面铺上树枝和树叶伪装起来。
同时,它还找了几个旧风铃挂在园子周围,如果有风吹草动风铃就会响。
过了几天,小松鼠们又来偷菜,其中一只小松鼠不小心掉进了陷阱,其他小伙伴们被风铃的声音吓得不轻,仓皇而逃。
被困住的小松鼠非常害怕,跳跳没有责怪它,而是告诉它偷东西是不对的,应该通过自己的努力去获取食物。
从那以后,小松鼠们再也没有来偷过菜,有时候还会帮跳跳看守菜园呢。
点评:这个故事告诉我们遇到问题的时候不要轻易放弃,要像小兔子跳跳一样自学自立,虽然力量小,但能向他人请教然后自己动手解决问题。
而且小兔子很善良,没有过度惩罚小松鼠,这也让我们知道,宽容对待犯错者有时候能获得更多的友谊。
小朋友们要学习小兔子的这些优秀品质哦,当遇到困难或者有人犯错时,积极去解决与包容。
篇②:《小蚂蚁的大搬家》在大树根下住着一群蚂蚁,小蚂蚁们过着平静的生活。
其中有一只特别小的蚂蚁叫小黑,小黑平常在家里最受照顾,因为它长得最小,所以很多事情都不做。
有一天,突然乌云密布,老蚂蚁们预测大暴雨即将来临,如果不赶紧搬家就会有危险。
于是蚁群开始忙碌地准备搬家到一个高地上去。
小黑刚开始想依赖其他的蚂蚁把它也搬走,就在原地干等着。
但是其他蚂蚁都非常忙碌,没有功夫管它。
小黑看到周围的伙伴们都在努力搬运着食物,有的强壮的蚂蚁还一次背着好几倍于自己体重的东西。
博弈论的哲学意蕴
博弈论的哲学意蕴摘要:博弈论是融合哲学社会科学与自然科学的有机理论,是连接方法论与世界观的直接通道。
它既是世界观,也是方法论。
本文从囚徒困境出发,探讨了博弈论在揭示个人理性何以能走向集体不合理性和合理性中的哲学意蕴。
关键字:博弈论,纳什均衡,囚徒困境,理性,哲学,1什么是博弈论博弈论又称对策论,它是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,可定义为:一些个人、一些团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后、一次或多次从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
博弈论要回答的是:决策主体的行为在发生直接的相互作用时双方所采取的决策以及这种决策之间的均衡问题。
其核心问题是:决策主体的一方行动后,参与博弈的其他人将会采取什么行动?参与者为取得最佳效果应采取怎样的对策?博弈主要可以分为合作博弈和非合作博弈。
它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
纳什对博弈论的发展起到了重要的推进作用,他不仅证明了非合作博弈及均衡解,也证明了均衡解的存在性,这就是著名的非合作博弈论的纳什均衡。
纳什均衡可以描述为:如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。
纳什均衡揭示了博弈均衡与经济均衡的内在联系。
博弈论是一个普遍的方法论,尽管它较多的应用在经济学领域,但远远不限于经济学。
到目前为止,博弈论在诸多领域已经取得辉煌成就而成为在数学、经济学、哲学[1]、生物进化[2]和社会分析等领域里极具影响力的理论。
各国对博弈论的研究,促进了人类社会的文明发展。
博弈论对人类的最大贡献则是博弈论的哲学思维方式推动了人类思维模式的向前发展[3]。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
听一听谢林讲博弈论的故事新京报博弈论趣话“囚徒的困境”在西方国家,一次严重的纵火案发生后,警察在现场抓到两个犯罪嫌疑人。
事实上正是他们为了报复而一起放火烧了这个仓库,但是警方没有掌握足够的证据。
于是,警方把他们隔离囚禁起来,要求坦白交代。
如果他们都承认纵火,每人将入狱三年;如果他们都不坦白,由于证据不充分,每人将只入狱一年;如果一个抵赖而另一个坦白并且愿意作证,那么抵赖者将入狱五年,而坦白者将得到宽大释放,免予刑事处罚。
这样,两个囚徒面临的博弈格局如下,每个格子中左下角的数字是甲的赢利或得益,右上角的数字是乙的赢利或得益,现在都不是正数(见上图)。
如果乙抵赖,甲坦白,则甲可以得到宽大释放;如果乙坦白,甲也坦白,则甲要坐三年牢,但是甲抵赖可要坐五年牢。
可见对于甲来说,不管乙采取什么策略,他坦白总是比较有利的。
所以两相比较,坦白是他的全面的严格的优势策略。
全面,指的是不论对方采取哪种策略,我的这个策略总显示优势:对方坦白,我坦白比抵赖好;对方抵赖,也是我坦白比较好。
严格,指的是这个优势策略的结局确实要好一些:对方坦白,我坦白得-3,确实比抵赖得-5好;对方抵赖,我坦白得0,也确实比抵赖得-1好。
这里,严格地说:-3不仅仅是不差于-5,而且是严格好于-5;0不仅仅是差于-1,而且是严格好于-1.“全面的严格的优势策略”简称严格优势策略(strittly dominant strategy)。
优势和劣势是比较而言。
在这个博弈中,既然坦白是严格优势策略,那么抵赖就是相应的严格劣势策略(strictly dominated strategy)。
同样,坦白也是乙的严格优势策略,抵赖也是乙的相应的严格劣势策略。
理性的主体人是不会采用对自己明显不利的严格劣势策略的,所以在分析博弈可能的结局的时候,我们应该把局中人的严格劣势策略删去。
这样,在上述博弈中把双方的严格劣势的策略都删去,我们就得到囚徒困境的结局为:双方坦白,各得-3.在“囚徒的困境”(Prisoner…s Dilemma)博弈矩阵格式中,下面一行是甲的严格劣势策略,右面一列是乙的严格劣势策略,把它们都删去,就得到“坦白,坦白”得“-3,- 3”这个严格优势策略均衡。
在“-3,-3”或者(-3,-3)这样的写法中,第一个数字是甲之所得,第二个数字是乙之所得。
或者说,面对上述形式的博弈表达,(-3,-3)这样的写法中,第一个数字是表格左方博弈参与人之所得,第二个数字是表格上方博弈参与人之所得。
这种用同一个矩阵表示两个参与者的得失的做法,就是托马斯·谢林对博弈论做出的贡献。
■解读谢林笔下的夜盗寓言□郑志刚面对危机,中国古代历史不乏“否极泰来”、“祸兮,福之所伏”等富有东方式智慧的预言。
《史记》的《管子列传》更是为我们描绘了管仲这样一位善于转化危机的英雄人物。
在中国这样一种崇尚英雄的文化里,人们一方面赞叹管子的聪明才智,另一方面则抱怨自己为什么不是“管子”。
而谢林用西方人所擅长的演绎推理,在《冲突的战略》等书中分析了应对和化解危机的战略选择过程,以寓言的方式揭示了“管子之所以为管子”的原因。
谢林用他生动的笔触告诉读者:“只要遵循一定的战略选择过程,每一个人都可以成为管子”。
我们以《冲突的战略》中所提到的夜盗的故事为出发点,按照谢林贯穿全书的逻辑,来解读故事背后的种种寓意。
一天,一个持枪的夜盗进入了一所房子。
房子的主人在听到楼下的响动之后,同样持枪一步步向楼下走来。
于是,危机和冲突发生了。
上述危机显然会导致多种结果。
最理想的结果当然是,夜盗平静地空手离开房子(一个见义勇为的读者甚至建议勇擒夜盗,对夜盗绳之以法)。
此外,一种可能的结果是,主人担心夜盗盗窃财物而首先向夜盗射击,致使夜盗身亡;另一种可能的结果是,夜盗担心主人会开枪射击,而首先射击主人,导致主人身亡。
第二种可能结果的出现,显然对房子的主人而言是最糟糕的,因为他不仅会失去财物,而且还丧失了生命。
对于各种可能的结果,其引发的原因却可能有无数。
例如,对于夜盗死亡这一结果,除了主人担心财物受损而首先开枪射击外,还可能出于对夜盗可能出于恐惧而射击的担心使主人先发制人等等。
更有意思的是,主人先发制人的动机可能是对夜盗先发制人的担心,诸如此类。
如何成功解决冲突和化解危机?按照谢林的观点,对信息的把握至关重要。
例如,如果持枪的主人经过在黑暗中静静的观察,发现夜盗的手中并没有枪;或者持枪的夜盗发现主人毫无准备地冲下楼,则事态的进展会有利于掌握更多信息的一方。
但如果双方都了解对方持枪的事实,则主人向夜盗传递“只是想把夜盗赶走”的信息(或者夜盗向主人及时传递只想图财,无意害命的信息)就变得十分重要。
对于在夜盗和房子主人的博弈中存在的多重均衡(结果所对应的最优策略选择的组合)中,谢林告诉我们,在一些特定情形下,只会有唯一的均衡出现。
他把在众多的均衡(纳什均衡)中实际更可能发生的均衡称为聚点(focal point),并指出,文化、宗教、社会规范和历史传统等有助于聚点的形成。
我们知道,博弈分析的目的是为了预测均衡,而均衡的多重性将使博弈分析的价值大打折扣,而谢林发展的聚点概念则可以在一定程度缓解上述两方面的矛盾。
聚点的概念的发展和分析同时也构成谢林对博弈理论重要的贡献之一。
让我们重新回到夜盗的故事。
如果故事发生在一个“盗亦有道”的社会,盗窃的目的仅仅是获得当日的基本食物,而不会给主人造成很大损失。
那么,一个可能的均衡是,夜盗在获得基本食物后平安地离开主人的房子,主人则乐观其成。
如果不是发生在上述这样的社会里,双方无法形成相同的“盗亦有道”预期,夜盗贪婪的信息非对称将使前面描述的各种结果都成为可能。
聚点对在众多均衡中出现唯一均衡的作用由此可见一斑。
事实上,聚点在政治经济生活中的重要性无所不在。
我们看到,即使在和平时期,很多国家为了划定国界,仍然不惜付出巨大的法律和外交努力。
其中十分重要的原因是经过严格界定并形成共识(法律文件)的国界将成为下一轮冲突的聚点,而国界本身的形成则同样或者是由于地理的原因,或者是由于历史的原因。
在夜盗的故事中,夜盗和房子的主人手中持有的仅仅是常规武器。
联想到超级大国掌控的核武器,好奇的读者会问,如果房子主人(或夜盗)拥有威力巨大的核武器,是否会使其在冲突中处于更为有利的地位?按照谢林的理论,拥有核武器的目的并不是用来先发制人,而是用来实施报复。
比如,在幼儿园,一个有能打架的哥哥的小朋友为了避免其他小朋友的欺负,并不会让哥哥首先教训所有的小朋友,哥哥的价值恰恰在于,如果遇到其他小朋友的欺负,他就可以让哥哥出面对其他小朋友实施惩罚,因为首先教训所有小朋友的一个可能是会遇到具有两个哥哥(从而更具报复力)的小朋友。
因此,核武器的作用来自于巨大的威慑力,而不是其先发制人的能力。
上述认识给我们的启发是,博弈中最终的优势不仅来自于战略应用的智慧,更来自于实力的竞争。
由于核武器的巨大威慑力,夜盗和房子的主人当然都希望首先拥有它。
在夜盗和房子主人开展的发展核武器的新的博弈中,谢林预言,双方都将有激励打破不首先拥有核武器的承诺。
原因是给定对方遵守承诺,从个体理性出发,自己首先发展核武器的战略利益要高于信守承诺的利益,结果就导致了著名的“囚徒困境”出现:每个人都不遵守承诺,双方陷入无休止的军备竞赛中。
尽管从社会的角度出发(集体理性),如果双方都信守承诺,可以避免军备竞赛中的大量非生产性投入,对双方都有益。
而在遵守承诺上,夜盗和房子主人开展的博弈将不可避免地导致集体和个体理性的冲突。
我们看到,现实的政治生活正如谢林在40多年前预言的那样,尽管存在各种限制发展核武器的公约和组织,但无论是在目前的朝鲜半岛和伊朗,还是之前的伊拉克,这种游戏反复出现,甚至成为一些国家发动战争的借口。
夜盗的寓言给我们的启示是,作为房子的主人,如果我们不仅具有充分的打击报复能力和实力(一旦夜盗行凶,我们可以将其绳之以法),同时向周边的人(包括夜盗)示善,如果足够幸运生活在一个崇尚和平的社会,则夜盗即使闯入房子也将平静地离开。
一个人如此,一个国家同样如此;看守一个房子如此,保卫一个国家同样如此。
■访谈谢林功在对博弈论的现实应用经济学家梁小民:谢林对博弈论的研究与别人最大的不同之处在于,别人都是用数学模型推导,他则是从实际例子出发,所用的数学知识很少。
上一次因博弈论而获得诺奖的纳什虽然研究的也是博弈论,但是重点在非合作博弈,而谢林更多关注的是在非合作博弈过程中如何化解冲突、实现和解、获得双赢,这个在实际运用中会更有帮助。
纳什的研究有更多悲观的成分,而在现实生活中,我们更多面对的是企业竞争等问题,所以更需要的是研究问题、化解冲突。
谢林的研究不仅仅停留在理论上,更多的是在现实中的应用,而且这些成果不仅仅运用在经济领域,更运用在很多国际大事上。
比如,要使战争双方实现合作,就要求交战双方具有第二次打击力,如果具备了第二次打击力,不合作的一方就会有包袱,在军事上具体的例子就是发展核潜艇。
上世纪60年代的苏美冷战,之所以最后没有转变成热战,就是因为双方都具备这样的第二次打击力。
另一个在国际关系中的应用,就是在合作中实现相互妥协让步,值得注意的是,谢林所讲的是强者要向弱者让步。
弱者在很多时候扮演无赖的角色,强者的损失肯定大于弱者。
谢林的博弈论思想最典型的运用是巴以冲突,现在的巴以局势因为沙龙病危而充满变数,但在这之前是走向缓和的。
以前巴以双方的口号就是消灭对方,但是后来发现谁也不能吃掉对方,所以只有合作、化解冲突,沙龙本来是斗士,后来成为了合作的推进者,他就是明白了该打就打、该让步就让步的道理,这是谢林理论的第一个应用。
第二个应用是双方都具有第二次打击力,以色列对巴勒斯坦的定点清除和巴勒斯坦的恐怖活动、人体炸弹,彼此威胁都很大。
此外就是强者向弱者让步,以色列是强者,当初沙龙以极其强烈的态度单边撤出,这就是让步,如果从这个思路走下去,巴以冲突应该可以逐渐和解,不幸的是沙龙现在虽生犹死,以色列没有什么人可以马上代替他。
如果说1994年纳什获奖是因为他对博弈论研究的重大突破,那么谢林这次获奖则是因为他在理论运用上的成功。
谢林是政策型经济学家清华大学中国经济研究中心常务副主任宁向东:谢林的研究从三四十年前开始,就对很多学者产生了深远影响,不管他获奖是早几年还是现在,比起一些应该得奖,但是到今天其所研究的领域成果仍未引起重视的学者来说,已经是非常幸运的了。
2005年获得诺贝尔经济学奖的两个人区别比较明显,奥曼的工作是非常技术化的,他从数学问题出发进行推理;而谢林分析问题的视角和手段则不大一样,他更多从政策制定者的视角提出问题,是结果导向的研究方法,使用较多的是几何的方法,这两个人用的工具完全不同,但是思想都非常重要。