从博弈论的视角解读历史事件-2019年精选文档
博弈论以及经典案例分析

• 变和博弈。即意味着在不同策略组合下各博弈方的得益之和是不 同的。倘若博弈各方之间相互配合,则可能争取到总得益和个人 得益均较大的理想结局;反之则社会总得益和个人得益均较小。
1.碟子、猫和古董商 有位古董商发现有个人用珍贵的碟子做猫食碗,于是假装对这 只猫相当喜爱,要从主人手中买下。猫主人不卖,为此古董商出高 价。
成交之后,古董商装作漫不经心地说:“这个碟子它用惯了, 就一块给我吧。”猫主人不干了:“你知道我用这个碟子已经买出 多少只猫了?”下面分析该故事。在这里
知识是“碟子是古董”
• 在这种情况下,无论是对开发商A还是开发商B,都不 存在一种策略优于另一种策略,也不存在严格劣策略: 如果A选择开发,则B的最优策略是不开发;如果A选 择不开发,则B的最优策略是开发;类似地,如果B选 择开发,则A的最优策略是不开发;如果B选择不开发, 则A的最优策略是开发。
第二节 生活中的博弈论
完全信息指的是每一个参与人对所有其他参与人的特征, 如策略集合及得益函数都有准确完备的知识;否则就是 不完全信息。
☞将上述角度的划分结合起来,我们就得到四种不同类型 的博弈,这就是:完全信息静态博弈、完全信息动态博 弈、不完全信息静态博弈、不完全信息动态博弈
表5-1 博弈的分类和均衡表
行动次序 信息
三、博弈论的基本概念
(一)博弈论的定义
博弈论(gametheory),又译为对策论,就是研究决策主体的行为 发生直接相互作用时的决策以及这种决策的均衡问题。实际上, 博弈是一种日常现象。
在经济学中,博弈论是研究当某一经济主体的决策受到其他经济主 体决策的影响,同时,该经济主体的相应决策又反过来影响其他 经济主体选择时的决策问题和均衡问题。
博弈论历史

博弈论历史博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
以下是我为你整理的博弈论发展历史。
欢迎欣赏阅读。
博弈论发展历程博弈的原始思想萌芽于两千多年前,《孙子兵法》、《孙膑兵法》、《三十六计》、《六韬》等书中就有许多博弈案例,“田忌与齐王赛马”就是博弈实例之一。
《摩诃婆罗多》、《梨俱吠陀》、《圣经》中记述了骰子游戏,我国在春秋战国时期就出现六博、围棋等博弈。
在西欧,德国哲学家和数学家莱布尼茨于1710年就预言了关于策略博弈理论出现的必要性和可能性。
其后两年,詹姆斯·华尔德格拉特James Waldradre首次提出了“极小极大”定理的概念。
虽然对具有策略依存特点的决策问题的零星研究则可上溯到18世纪初甚至更早,但是,博弈论的真正发展与成熟还是在20世纪。
在20世纪20年代,法国数学家波莱尔 Borel最早用数学语言刻画了博弈问题,提出了“策略”和“混和策略”概念,用最佳策略和概念研究了下棋和其它许多具体的决策问题,并试图把它们作为应用数学的分支加以系统研究。
冯·诺伊曼Von Neumann是博弈论又称对策论的创始人之一,1928年他发表“关于伙伴游戏理论”Zur Theorie der Gesellschaftsspiele提出两人零和博弈的极小极大定理。
他首次证明了博弈论基本定理,即“每个矩阵博弈都能通过引进混合策略而被严格决定”,现代博弈论正式诞生。
他讨论了合作对策问题,特别是三人零和博弈中有两方联合的情形,结果表明在附加条件下,N人博弈问题的解存在且唯一。
1944年冯·诺伊曼和摩根斯坦Morgenstern合作的《博弈论和经济行为》一书提出合作博弈的基本模型,标志着系统的博弈理论的初步形成。
他们创立了博弈论研究的基本概念。
到20世纪50年代,合作博弈发展到鼎盛时期,包括纳什Nash和夏普里shapley的“讨价还价模型”,吉尔斯Gillies和夏普里关于合作博弈中的“核”Core的概念以及其他一些人的贡献。
博弈论_中国古代著名事例与现代博弈论

2021/6/16
1
引言
作为一门学科,博弈论虽然只有几十年 的历史,但博弈的思想可以追溯上千年
具有灿烂文明的中国古代文化,其中的 优秀成果在今天看起来,对我们仍有很 多启迪。
这里从博弈论角度,选择几个著名事件, 进行一些分析、阐述
引言
所见到的文献,多数从古代军事家行为 进行分析,如田忌赛马等。
❖1,如果谁都不做这件事情 ❖3,如果自己做这件事情 ❖4,自己不做但其他人去做这件事情
事例2:三个和尚没水吃
该博弈有n个纯策略纳什均衡:恰好有 一个人去做这件事情
当n增大时,纯策略数目将相应增多 在实际中,哪一个纯策略均衡将会发生?
事例2:三个和尚没水吃
当人群中成员彼此存在差异时,这n个 纳什均衡的实际发生可能也存在“聚 点”(focus point)。比如,社会规范可 能要求人群中最年轻的或社会地位最低 的去做诸如“打水”的事情。
❖显然“鱼之乐”并不是庄子与惠子的共同 知识,按照庄子的逻辑,“鱼之乐”是私 人信息,因此庄子说“子非我,安知我不 知鱼之乐”,以此反击惠子的诘难。
事例1:子非鱼
议题2:不完全信息
❖由于存在着只有一方知道的信息(鱼是否 快乐),因此庄子与惠子间进行的是不完 全信息博弈。
事例1:子非鱼
议题2:不完全信息
事例2:三个和尚没水吃
上面分析可以推广到其他事情,如人员 合理组合、见义勇为事件减少的解释、 公共产品的建设等。
请大家作为课后练习选择其一。
结束语
若有不当之处,请指正,谢谢!
事例2:三个和尚没水吃
于是最佳p的确定应该是“打水”与 “不打水”的期望收益相同,即
3 = (1-p)n-1 +4[1-(1-p)n-1] 即p=1-(1/3)1/(n-1) (n≥2) 从上式不难看到,随着n增大,p值在减
博弈论案例分析报告

博弈论案例分析报告博弈论是一门研究决策主体的行为在直接相互作用时,人们如何进行决策以及这种决策如何达到均衡的问题的学科。
它在经济学、管理学、政治学、社会学等多个领域都有着广泛的应用。
下面通过几个具体的案例来深入分析博弈论的实际应用和原理。
案例一:囚徒困境假设有两个嫌疑犯 A 和 B 因涉嫌一起犯罪被警方抓获。
警方将他们分别关押在不同的房间进行审讯,并分别向他们提出以下条件:如果 A 坦白而 B 抵赖,A 将获释,B 将被判刑 10 年;如果 A 抵赖而 B 坦白,A 将被判刑 10 年,B 将获释;如果 A 和 B 都坦白,每人将被判刑 8 年;如果 A 和 B 都抵赖,每人将被判刑 1 年。
从个体角度来看,对于A 来说,如果B 坦白,A 坦白会判刑8 年,抵赖会判刑10 年,所以A 会选择坦白;如果B 抵赖,A 坦白会获释,抵赖会判刑1 年,A 还是会选择坦白。
同理,B 也会做出同样的选择。
因此,最终的结果往往是两人都坦白,各判刑 8 年。
然而,从整体最优的角度来看,如果两人都抵赖,每人只需判刑 1 年,这显然是更好的结果。
但由于双方无法信任对方会选择抵赖,最终陷入了都坦白的次优选择。
这个案例揭示了个体理性与集体理性之间的冲突。
在现实生活中,类似的情况屡见不鲜。
比如企业之间的价格战,每个企业都希望通过降低价格来吸引更多的客户,获取更大的市场份额。
但如果所有企业都这样做,最终可能导致整个行业的利润下降,大家都受损。
案例二:智猪博弈在一个猪圈里有一头大猪和一头小猪。
猪圈的一头有一个食槽,另一头安装着控制猪食供应的按钮。
按一下按钮会有 10 个单位的猪食进槽,但谁按按钮就需要付出 2 个单位的成本。
如果大猪先到食槽,大猪能吃到 9 个单位,小猪能吃到 1 个单位;如果小猪先到,大猪能吃到 6 个单位,小猪能吃到 4 个单位;如果同时到,大猪能吃到 7 个单位,小猪能吃到 3 个单位。
对于小猪来说,如果大猪去按按钮,小猪等待能吃到 4 个单位,去按按钮只能吃到 1 个单位;如果大猪等待,小猪去按按钮只能吃到-1 个单位,等待能吃到 3 个单位。
博弈论案例加分析

博弈论案例加分析博弈论是一门多领域的理论,它将个人主义的行为与社会化视结合起来,以改进决策分析过程。
它可以帮助人们更好地理解他们的行为的影响,从而做出更好的决策。
它也可以用于政府决策和公司经营决策,以改善整体社会福利。
本文将开始从博弈论的定义和基本概念开始,然后探讨一个实际案例,再从博弈论的角度分析此案例,探究两个人之间的最优决策。
最后,给出一个总结和展望,以及博弈论在实践中的应用。
首先,什么是博弈论?博弈论是一门研究人类决策的学科,它涉及多个学科,如政治学,经济学,社会学,心理学等,以及非常复杂的数学公式和技术。
它侧重于在某种情况下,多个参与者之间之间采取行动的有效方式。
每个参与者都试图达到最大利益,但最终结果未必能够满足所有参与者的想法。
其次,本文将介绍一个实际案例来说明博弈论的概念。
两个人A、B正在一起玩一场游戏。
他们可以采取两种行动:“合作”或“欺骗”。
如果他们都选择合作,他们将分别获得4分和4分;如果A选择合作而B选择欺骗,则A将失去2分,而B将获得6分;反之亦然。
最后,我们从博弈论的角度来分析这个案例。
从一般的角度来看,A和B的最佳选择应该是“合作”,因两人都能得到4分的收益。
但是,如果一方只顾自己的利益,没有关心对方,他可能会选择“欺骗”,因两人获得的收益就有了不同。
博弈论指出,给出A和B之间的最优解决方案有多种可能性。
一种可能性是奖励性平衡,即A和B最好都合作。
另一种可能性是惩罚性平衡,即A和B最好都欺骗。
综上所述,博弈论把个人主义行为和社会化歧视结合起来,以改善决策分析过程。
案例分析表明,政府决策和公司经营决策也可以从博弈论的角度分析,从而改善整体社会福利。
总之,博弈论可以帮助人们更好地理解自己的行为,从而做出更好的决策。
未来,博弈论还可以用于改善更多的政府决策、公司经营决策以及个人决策。
它也可以用于市场模型的设计和分析,以提高社会福利水平。
另外,博弈论还可以用于道德和责任感的基础研究,以及人际关系的研究。
用博弈论分析大国间的政治博弈

大国间的政治博弈二十年前,世界由美苏主导,对于其他国家而言,只有唯唯诺诺的份儿,因为美苏无论在军事还是经济,对别国都有绝对优势。
苏联解体后,超级大国美国也难独霸天下。
事实也已证明,不会再有哪一个国家有能力让全世界都对其言听计从(至少今天没有,明天不会)。
分析二十年前,世界几乎是处在一种零和状态中,尤其是大国对小国。
小国不听话了,大国可以随便经济制裁你,武力威胁你,甚至揍你,小国基本上只能处于被动状态。
虽然,苏联解体后,美国凭其遥遥领先的经济实力,绝对强大的军事实力,仍然可以成为超级大国,但还可以号令天下吗?那只是美国人的一厢情愿罢了!从1991年,美国人的确打了几次漂亮的仗,但打出了美国人一统天下的局面吗?没有。
美国人想再次以武力恫吓世界,已经不大可能。
眼下的世界,需要的是共赢。
没有国家能代表全世界,却又各自想着如何让自己的利益最大化,自然而然的,世界将进入一种非零和博弈状态。
(博弈论简介:The theory of relative balance about the mobile addicts and soul of animals in the nature and in the expectation of decision makers is called the game theory. (quoted from the article “The Blue Files Unknown to Humankind”in Bible of Game Theory。
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的;或者指动物利用大自然移动的瘾魂,在决策人期待的空间里,形成相对均衡的语文学理论。
其应用有著名的纳什均衡、囚徒困境、以牙还牙、人质困境、枪手博弈、猎鹿博弈、智猪博弈、警察与小偷、斗鸡博弈、协和谬误、蜈蚣博弈、脏脸博弈、零和博弈、非零和博弈等。
)下面将着重介绍非零和博弈是如何体现在当前国与国之间的政治博弈中的。
博弈论在战争中的应用

博弈论在兵法中的应用每个中国人对博弈都不会感到陌生,从经典到民谚,从战场到麻将桌,每个中国人都会使用博弈论,只是运用的恰当与否的区别罢了。
全世界都承认中国人是善良的,也是老练的。
博弈论在中国很早就流行了,并不是舶来品。
要知道什么事博弈论,首先要清楚什么事博弈。
《现代汉语词典》中对博弈一词的解释是:(1)古代指下围棋,也指赌博。
(2)比喻为谋取利益而竞争。
博弈无处不在,无时不在,无人不在博弈,无人不会博弈,但博弈有胜负,策略有高低。
因此,我们可以通过学习,通过探讨,作出更佳的抉择,让我们的生活、我们的社会变得更加美好。
既然我们如此离不开博弈,就必须学习博弈,一定要懂得博弈论。
博弈论是一种“游戏理论”。
其准确的定义是:一些个人、团体或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,对各自允许选择的行为或策略进行选择并加以实施,并从其中各自取得相应结果或收益的过程。
在战争中,如果我们在足够多的战场中集中足够多的兵力的话,我们将有很大可能赢得战争的胜利。
如果我们的兵力等可利用的资源有限时,我们要想在战争中取胜,就必须学会“集中优势兵力”这一战术原则,将我们的时间、精力、才能等投入最有希望获胜的战场,确保在这一领域的优势地位。
历史上有个发生过的真实例子,“田忌赛马”。
在这个故事中,齐王的上、中、下三种赛马都要比田忌的同等赛马要好,但却输掉比赛,这是因为孙膑采取了“下驷对上驷、上驷对中驷、中驷对下驷”的巧妙策略,取得了胜利。
这就是在足够多的战场中集中足够多的兵力最终取得胜利。
主动放弃在另一战场上的投入,有时并不会失败,相反,它才是赢得战争的正确思路。
由英国工程师蓝彻斯特提出的“蓝彻斯特定律”,给我们提供了一个优势兵力转化为优势战果的量化指标。
他设想了一个战斗模式,敌对双方彼此相互射击,而且双方在准确性、人员、武器等各方面都势均力敌。
因此,军队数量决定了敌对双方的攻击力:一方面增加自己的命中率,另一方面则分散对方的攻击火力。
博弈论案例分析报告(2篇)

第1篇一、案例背景博弈论是一种研究具有冲突和合作行为的决策制定过程的数学理论。
它广泛应用于经济学、政治学、军事学、生物学等多个领域。
本报告将以一场经典的博弈论案例——“囚徒困境”为基础,分析其背后的决策逻辑和结果。
二、案例描述“囚徒困境”是一个经典的博弈论模型,描述了两个犯罪嫌疑人被分别关押在两个不同的房间里,他们无法沟通。
警方告诉他们,如果两人都保持沉默,他们将各被判刑1年;如果两人都认罪,则各被判刑2年;如果一人认罪而另一人保持沉默,则认罪者将被释放,而保持沉默者将被判刑3年。
三、博弈论分析1. 收益矩阵| 行动 | A(沉默) | B(认罪) || ---------- | -------- | -------- || A(沉默) | (1, 1) | (3, 0) || B(认罪) | (0, 3) | (2, 2) |在这个收益矩阵中,行代表A的选择,列代表B的选择。
括号中的第一个数字代表A的收益,第二个数字代表B的收益。
2. 纳什均衡纳什均衡是指在博弈中,每个参与者都选择了最优策略,且任何参与者单独改变策略都不会得到更好的结果。
在这个案例中,(认罪,认罪)是唯一的纳什均衡。
3. 个人理性与集体理性从个人理性的角度来看,每个囚徒都倾向于选择认罪,因为这样可以确保自己被判刑2年,而不是3年。
然而,从集体理性的角度来看,如果两个囚徒都选择沉默,他们将各被判刑1年,这是一个更好的结果。
四、案例分析1. 信任与背叛在“囚徒困境”中,信任是关键因素。
如果两个囚徒之间有信任,他们可能会选择沉默,从而实现集体理性。
然而,由于他们无法沟通,信任难以建立,导致双方都选择认罪,实现了个人理性。
2. 合作与竞争在博弈中,合作和竞争是两种基本策略。
在“囚徒困境”中,竞争策略(即选择认罪)在短期内可能带来更好的结果,但在长期内可能导致双方都受损。
合作策略(即选择沉默)虽然短期内可能受损,但长期来看更有利于双方。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从博弈论的视角解读历史事件近年来,博弈论在西方世界发展迅速,应用广泛。
而在中国,博弈论并没有得到长足的发展,现有的博弈论教材也多是翻译国外学者的著作或引用西方学者的理论。
实际上,中国并不是没有博弈论,中国历史上发生的一幕幕历史事件,其精彩程度远远高于西方学者构造的博弈论模型。
中国的博弈论只是没有被作为一门系统化的学科单独提炼出来而已,它隐含在史学家的笔下,埋藏在中国古典文化里,流传至今。
一、历史背景在司马迁的《史记》中,关于汉高祖刘邦和丞相萧何,有这样一段记载:汉十一年,陈?反,高祖自将,至邯郸。
未罢,淮阴侯谋反关中,吕后用萧何计,诛淮阴侯,语在淮阴事中。
上已闻淮阴侯诛,使使拜丞相何为相国,益封五千户,令卒五百人一都尉为相国卫。
诸君皆贺,召平独吊。
……召平谓相国曰:"祸自此始矣。
上暴露於外而君守於中,非被矢石之事而益君封置卫者,以今者淮阴侯新反於中,疑君心矣。
夫置卫卫君,非以宠君也。
愿君让封勿受,悉以家私财佐军,则上心说。
"相国从其计,高帝乃大喜。
汉十二年秋,黥布反,上自将击之,数使使问相国何为。
相国为上在军,乃拊循勉力百姓,悉以所有佐军,如陈?时。
客有说相国曰:"君灭族不久矣。
夫君位为相国,功第一,可复加哉?然君初入关中,得百姓心,十馀年矣,皆附君,常复孳孳得民和。
上所为数问君者,畏君倾动关中。
今君胡不多买田地,贱贳贷以自污?上心乃安。
"於是相国从其计,上乃大说。
上罢布军归,民道遮行上书,言相国贱强买民田宅数千万。
上至,相国谒。
上笑曰:"夫相国乃利民!"民所上书皆以与相国,曰:"君自谢民。
"相国因为民请曰:"长安地狭,上林中多空地,弃,愿令民得入田,毋收稿为禽兽食。
"上大怒曰:"相国多受贾人财物,乃为请吾苑!"乃下相国廷尉,械系之。
数日,王卫尉侍,前问曰:"相国何大罪,陛下系之暴也?"上曰:"吾闻李斯相秦皇帝,有善归主,有恶自与。
今相国多受贾竖金而为民请吾苑,以自媚於民,故系治之。
"……是日,使使持节赦出相国。
相国年老,素恭谨,入,徒跣谢。
高帝曰:"相国休矣!相国为民请苑,吾不许,我不过为桀纣主,而相国为贤相。
吾故系相国,欲令百姓闻吾过也。
"(《史记o萧相国世家》)上述文字记载的是汉高祖刘邦和丞相萧何的一系列的博弈过程,下文将从博弈论的角度加以分析。
二、基于不完全信息静态博弈的分析1.不完全信息静态博弈假设博弈参与人的支付函数是所有参与人的共同知识,这样的博弈被称为"完全信息博弈"(game of complete information),而在刘邦与萧何的博弈中,信息是不完全的,这一博弈是"不完全信息博弈"。
规定一个参与人所拥有的所有私人信息(privateinformation,即所有不是共同知识的信息)是他的类型(type)。
"不完全信息"表示至少有一个参与人有多种类型,也就是说其他参与人可能不知道这个参与人的类型,反过来,这一参与人也不知道其他参与人是否知道自己的类型。
在"不完全信息博弈"的基础上,经济学家海萨尼提出了"贝叶斯纳什均衡",即在静态不完全信息博弈中,所有参与人同时行动,没有机会观察别人的选择。
给定别人的战略选择,每个参与人的最优战略依赖于自己的类型,他不可能准确地知道其他参与人实际上会选择什么战略;但是,他能准确地预测到其他参与人的选择是如何依赖于其各自的类型的。
这样,他决策的目标就变成了,在给定自己的类型、别人的类型以及别人类型依从战略的情况下,最大化自己的期望效用。
2.刘邦与萧何博弈的贝叶斯纳什均衡《史书》记载,萧何是位忠臣,对刘邦忠心耿耿,用古代的道德观念来评价,萧何是一个有道德的人。
但刘邦身居高位,高处不胜寒,不能确定萧何是否忠心耿耿。
从博弈论的角度讲,刘邦不知道萧何的类型。
古人是很看重后人对自己的评价的,例如曹操为了不留下"乱臣贼子"的骂名就没有杀汉献帝。
对于萧何而言,造反是有成本的,这些成本不但包括一旦失败会被诛杀灭族,还包括自己的名誉,所以如果萧何是一个有道德的人,他的造反成本就高,相反,如果萧何不是一个有道德的人,那么他的造反成本就低。
双方的支付矩阵如表1所示。
现对这个博弈做出假定:第一,博弈参与人有两个,分别是皇帝刘邦、丞相萧何;第二,刘邦的决策变量是"杀萧何/不杀萧何",而萧何的决策变量是"造反/不造反";第三,双方都以实现自身效用最大化为最终目的;第四,双方同时行动,但信息并不完全,即萧何了解刘邦的类型,但刘邦不了解萧何的类型。
表 1 刘邦与萧何的君臣博弈如果萧何是一个有道德的人,那么他的造反成本会比较高,即使刘邦选择杀他,他为了留下"忠臣"的美名也不会造反;如果萧何不是一个有道德的人,那么即使刘邦不杀他,他也会选择造反。
另一方面,在刘邦看来,萧何属于"造反成本高"的类型的概率是p,属于"造反成本低的概率是1-p。
那么刘邦究竟该做出什么样的选择呢?由于刘邦并不确切的知道萧何的成本是高是低,所以刘邦的选择依赖于他在多大程度上信任萧何造反是高成本的。
如果刘邦选择不杀萧何,那么刘邦的期望效用是:100p-100(1-p)=200p-100。
如果刘邦选择杀萧何,那么刘邦的期望效用是:50p+50(1-p)=50。
令200p-100=50,得到p=3/4。
这一结果说明,刘邦的最优选择是:如果p≥3/4,不杀萧何;如果p 上文引述的史料中提到,刘邦曾两次试探萧何,第一次是召平提出的"祸自此始矣。
上暴露於外而君守於中,非被矢石之事而益君封置卫者,以今者淮阴侯新反於中,疑君心矣",其大意为"您的祸患从此开始了。
皇上在外作战风餐露宿,而您留守京城,并不需要冒着矢石去冲锋陷阵,但皇上却要给您加封食邑、设置卫队,这是因为淮阴侯刚刚在关中谋反,皇上对您也起了疑心。
"第二次是萧何的门客提到的:"君灭族不久矣。
夫君位为相国,功第一,可复加哉?然君初入关中,得百姓心,十馀年矣,皆附君,常复孳孳得民和。
上所为数问君者,畏君倾动关中。
今君胡不多买田地,贱贳贷以自污?上心乃安";其大意是:"您要不了多久就会遭受灭族的惨祸了。
您位为相国,功居第一,难道功名还能再增加吗?但您从刚进关中的时候起,就深得民心,到现在已有十多年了,百姓们都拥戴您,您总是勤勉办事,深得民心。
皇上之所以屡次派人来问您的情况,是怕您利用自己的威望动摇关中。
现在您不如多买些田地,并低价赊购、借贷,以此来玷污自己,这样皇上对您就放心了。
"刘邦之所以一再地试探萧何,就是为了确定萧何作为博弈参与者的类型--萧何到底是属于造反成本高的类型还是造反成本低的类型。
三、基于不完全信息动态博弈的分析1.不完全信息动态博弈在动态博弈中,行动次序有先有后,后行动者可以通过观察先行动者的行动获得有关后者偏好、战略空间等方面的信息,修正自己的判断。
先行动者知道自己的行为有传递信息的作用,就会有意识地选择某种行动来揭示或掩盖自己的真实面目。
不完全信息动态博弈的均衡概念是"精炼贝叶斯均衡"(perfectBayesian equilibrium)。
精炼贝叶斯均衡的关键在于后行动者要根据所观察到的他人的行为来修正自己对他人类型的"信念"(主观概率),并据此选择自己的行动。
修正过程使用的是"贝叶斯规则",即每个参与人都假定其他参与人选择的是均衡战略。
具体而言,精炼贝叶斯均衡是所有参与人战略和信念的一种结合,他满足如下条件:(1)给定每个人有关其他人类型的信念的情况下,他的战略选择是最优的;(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得的。
2.刘邦与萧何博弈的精炼贝叶斯均衡一种行动要起到传递特定信息的功能,行动者必须为此付出足够的成本,否则行动者的行动就不可信。
对于萧何,简单的向刘邦诉说"我是忠臣","我不会谋反","我是个品德高尚的人"是起不到传递信息作用的,因为这种行动不花费任何成本。
所以萧何每次向刘邦表明自己的忠诚时都花费了很大的成本:刘邦第一次试探萧何,萧何"悉以家私财佐军",就是把自己家里全部的私有财产拿出来资助军队,表明自己没有私心,结果"高帝乃大喜";刘邦第二次试探萧何,萧何"多买田地,贱贳贷以自污",通过低价赊购、借贷来玷污自己的名声,以表明自己贪图小利,没有争夺天下的野心,结果"上乃大说",刘邦很开心。
以上这两种行为虽然在一定程度上减少了刘邦对萧何的猜忌,但要让刘邦彻底对萧何放心,还是不够的。
要想达到最佳的信息传递效果,萧何就必须付出更大的代价--"乃下相国廷尉,械系之",意思是"于是就下令把相国交给廷尉拘禁起来,还给他上了刑具"。
萧何通过这样三次传递信息终于使刘邦对他彻底地放心,使自己避免了杀身灭族之祸。
刘邦要试探萧何,也并不是不耗费成本的。
第一次试探,刘邦"使使拜丞相何为相国,益封五千户,令卒五百人一都尉为相国卫",派遣使者拜丞相萧何为相国,加封食邑五千户,命令安排五百名士兵由一名都尉率领充任相国的卫队;第二次试探,刘邦"数使使问相国何为",多次派遣使者探问相国在做什么;第三次把萧何打入监狱,要背负"暴君"的恶名。
这些都是搜索信息所必须付出的成本。
按照贝叶斯规则,刘邦与萧何博弈并得出均衡解的过程如下:在博弈的第一回合,萧何知道自己的类型,但刘邦并不知道。
假设在刘邦看来,萧何属于第一种类型(即造反成本高的类型)的概率和属于第二种类型的概率都是1/2,。
此时刘邦向萧何发出了第一次试探,萧何作为理性的参与者,向刘邦传递信号--舍弃自己的家财,证明自己的衷心。
刘邦收到信号后,依据自己的判断,将自己对萧何的信念修正,假设修正为3/5,这一概率大于刘邦试探之前对萧何的信任程度,双方进入第二回合的博弈。
刘邦再次做出试探,萧何通过"自污"的方式向刘邦传递信号,刘邦收到信号后再次修正自己的信念,假设修正为7/10,双方进入第三轮博弈。
在第三轮博弈中,刘邦虽然将萧何打入监狱,但实际上是刘邦主动发出信号,考验萧何的忠诚度,萧何出狱后,谦恭谨慎,进宫拜见刘邦时,光着脚步行表示谢罪,表现出绝对的服从,这时,刘邦终于将自己对萧何的信念修正为3/4或更高的水平,相信萧何属于造反成本高的类型,选择不杀萧何,最终得到的均衡解是(不杀,不造反)。