博弈论经典案例“囚徒困境”及其实证分析

博弈论经典案例“囚徒困境”及其实证分析
博弈论经典案例“囚徒困境”及其实证分析

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

浅析博弈中的囚徒困境

浅析博弈中的囚徒困境 班级: 姓名: 学号:

摘要:囚徒困境是博弈论的非零和博弈中具代表性的例子,个人最佳选择并非团体最佳选择,个人理性有时会导致集体的非理性——机关算尽却因而作茧自缚,这就是囚徒困境所反映的问题。 一经典的囚徒困境 “囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人隐瞒,则揭发者因为立功而立即获释,隐瞒者因不合作而入狱五年;若互相揭发,则因证据确实,二者都判刑三年。 从集体上看,他们应当互相合作,都隐瞒,这样总服刑时间最短(为2年)。但他们会仔细考虑对方可能采取什么样的选择,并从自身利益出发做出选择。他们会意识到,如果同伙隐瞒而自己背叛,就能使自身利益最大化(0年)。但他也意识到,他的同伙也不傻,也会这样来设想,这样的话,他就更不可能让同伙得利(服刑0年)而自己受害(服刑5年)所以结论就是,唯一正确的选择就是背叛同伙,把一切都告诉警方,如果他的同伙保持隐瞒,那么他就会是那个获释出狱,服刑0年。而如果他的同伙也向警方交代了,那么,他只需服刑3年而不是5年。所以结果只能是两个囚犯都坐牢服刑3年,而不是都服刑1年。所以对于他们个人来说都是理性的,然而对集体来说却是非理性的。 二重复多次 如果囚徒困境的情况重复多次,会有什么新的变化?假设重复10次。我们可以合理地设想,如果囚徒第一次被对方指控,第二次这个囚徒也会指控对方。相反,如果第一次相反,如果第一次别人保持隐瞒,建立了互信的关系,你也会保持隐瞒,导致最优。当然,两个囚徒都会有相似的想法,在第一局保持隐瞒,以期望建立互信关系,所以双方都会保持隐瞒。第二局时,双方亦应有相似的想法,继续保持隐瞒,以期继续在互信的情况下进行第三局,

浅析运筹学在实际生活中的应用

2011年5月

目录 摘要 (3) 一、引言 (3) 二、运筹学概述 (4) 三、运筹学的发展 (4) 四、运筹学的理论体系 (5) (1)规划论 (5) (2)决策论 (6) (3)运输问题 (6) (4)存储论 (6) (5)图论 (7) (6) 排队论 (7) (7)博弈论 (7) 五、运筹学的应用所涉及的领域 (8) (1)市场销售 (8) (2)生产计划 (8) (3)库存管理 (8) (4)运输问题 (9) (5)财政和会计 (9) (6)人事管理 (9) (7)城市管理 (9) 六、运筹学国内外应用现状 (9) 七、结论 (11) 八、结语 (11) 参考文献 (11)

浅析管理运筹学在实际生活中的应用 摘要:随着经济的快速发展和社会的进步,社会各行各业之间的竞争日益激烈,尤其表现为对资源的争夺。因此,在有限的资源下获得最大的利益是每个竞争者所考虑的问题,这也是经济学和运筹学所着重解决的问题。运筹学就是以数学为主要手段、着重研究最优化问题解法的学科。作为一门实用性很强的学科,运筹学可以用来很好的解决生活中的许多问题。运筹学有着广泛的应用,对现代化建设有重要作用。正因为如此,运筹学在企业决策领域中有着广泛的应用。众所周知,运筹学研究的根本目的在于对资源进行最优化配置,用数学的理论与方法指导社会管理,提高生产效率,创造经济效益。而企业投资的根本目的也是在资源的优化配置和有限资源的有效使用的基础上,达到既定目标,实现企业利润最大化。然而,随着市场竞争的日趋激烈,决策是否有效对于企业生存发展的影响愈来愈大。正确的决策可以使企业获利并促进企业的发展,而错误的或者无效的决策只能使企业无利可获甚至亏损,阻碍企业的发展。而运筹学、经济学、博弈论等决策性的科学可以引导投资者选择最佳投资组合策略,为决策者在投资决策过程中提供一些有价值的思路。用来解决人们用纯数学方法或者现实实验无法解决的问题,对企业正确决策的形成有着积极地促进作用。 关键词:管理运筹学;决策;应用;博弈论;理论体系;效益 一、引言 人们无论从事任何工作,不管采取什么行动,都希望所制订的工作或行动方案,是一切可行方案中的最优方案,以期获得满意的结果,诸如此类的问题,通常称为最优化问题。运筹学就是以数学为主要手段、着重研究最优化问题解法的学科。求解最优化问题的关键,一是建立粗细适宜的数学模型,把实际问题化

浅析囚徒困境与纳什均衡

浅析囚徒困境 囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。 囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效,中小学生课业负担不减反增。 又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。可是,我错了吗?没有。当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。可是,我对了吗?没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。 再看中国的法治之路。虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。不过,任何事物都有两面性,“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法治。 但囚徒困境一定是坏事吗?就以囚徒困境的经典案例来说,作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。 然而如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺,向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。比如在楼市的囚徒困境中,政府能适当调控房价,给予购房者房价稳定合理的承诺,那么楼市的囚徒困境是有可能破解的。 在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出

小议博弈论在日常生活中的应用

小议博弈论在日常生活中的应用 摘要:博弈过程本来就是一种日常现象。我们在日常生活中经常需要先分析他人的意图从而做出合理的行为选择,选出一种最优策略再加以行动。博弈融合在我们生活的点点滴滴之中,时时与我们相伴,所以,接下来的本文要为我们举例及讨论一些博弈论在生活中的应用。了解生活中的一些博弈事件后,希望我们日后能以理论结合实践,能从博弈论的理论角度出发,在实践中加以应用。 关键词:博弈、选择、策略、日常生活 正文:0引言 许慎在《说文解字》中说:“弈,围棋也!”班固的《弈旨》说:“北方之人谓棋为弈。”杨雄的《方言》也说:“围棋,自关东齐鲁之间谓之弈。”无论是六博还是围棋都是一种游戏,由此看,博弈最初的本意就是一种游戏。然而,随着博弈在社会生活中的发展与应用,现代数学中有博弈论,表示在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为理论。 在现实生活中的个体、团体或其他组织,面对一定的环境条件,在一定的规律约束下,依靠掌握的信息,同时或先后一次或多次,对各自允许选择的行为或策略进行选择并加以实施,并各自从中取得相应结果或受益,这个过程便是博弈的过程。博弈论的应用范围非常广

泛,市场竞争、环境保护、公共资源的开发与利用、各种经济比赛等都属于博弈现象。 1博弈论中的两个基本概念 (1)策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。 (2)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 2博弈论在日常生活中的几个应用 (1)个人选择困境 “人生如棋,一步下错,全盘皆输。”这句话主要表达人的一生中的某些抉择的重要性。所以,我们每一次的选择何尝不是一种博弈呢?记得某位老师曾和我们说过这样一种观念——世界存在的一种三维空间,即是在未来的某一时刻存在着无数个你,有当画家的你、当作家的你、当科学家的你、当教师的你等等等等无数的你,然而,就是因为你某一瞬间的决定,杀死了无数个你自己。所以,选择即是与自己博弈的一种形式。譬如,填高考自愿,在当时的一种环境条件下,考虑了各方面的原因,根据自己所掌握的信息,各种纠结后做出了我们最后的选择。所以,可以说,经过这么一场与自己博弈的过程,

浅谈博弈论中的囚徒困境的解决方法

浅谈博弈论中的囚徒困境的解决方法 摘要:囚徒困境是博弈论中的一个重要范例,这个问题涉及各个领域。本文通过三个简单的实例,来谈谈解决的方法。 案例一:一个面馆的囚徒困境 我曾经在路边一个小店里吃面,由于当时客人不是很多,就顺便与小老板聊了起来。通过老板的介绍听出了一些门道。以前面馆开店的时候请了一个师傅,开始的时候为了调动他的积极性他们采用按销售量分成,一碗面给5毛钱提成。这样的话,客人越多他挣得也就越多,为了吸引更多的顾客,他在碗里放很多的肉来吸引回头客,一碗面才6块钱,本来就靠薄利多销,他放的肉多,面馆自然也赚不到钱。后来呢,就换了一个结算方式,给厨师发固定的工资,这样客人多少跟他没有什么关系,但是新的问题又出现了,这次他在碗里放肉放很少,基本上把所有的客人都赶走了。客人少了,他就轻松了啊反正他拿的是固定的工资。通过这个案例我们可以了解到面馆的老板与厨师在工资的分配上存在一定的分歧,由于没有处理好,使得双方都处在不利的结局。 解决方法:面馆的老板应该对厨师明确,每碗面的元材料是固定的,大师傅的工资还是按照销售量提成走,但是前题是每个月使用的原材料不能超额,否则只有基本工资。或者就规定每碗面里就放多少克肉。此外,还有一个更简单的办法就是:面馆的小老板亲自放肉。因为关键的资源一定要掌握在关键的人手里。 经过以上的分析,我们可以得知解决的方法:1.工资加提成的制度确实能调动员工的积极性;2.权利下放可以,但是要有度;3.员工的工资提成不能只和销量挂钩,应该和老板的利润挂钩。4.有效的沟通、激励,平时给员工传达精神的奖励,让员工认为自己也是公司的主人。 案例二:小餐馆的囚徒困境 在天津新建的一片经济适用房社区里有两家小餐馆,他们都是经营当地的家常炒菜及快餐。因为这里是新开发的经济适用房,而周边像小饭馆这样的生活配套设施很缺乏,所以附近的建筑工人都是在这两家小饭馆解决三餐。 这两家餐馆因为在口味、价格、菜的品种等都基本相同,所以一直以来这两家面对都是这些人,营业额都差不多,而附近的建筑工人们对于吃饭也没有什么特殊的爱好。好景不长,就在今年的夏天,两家餐馆的其中一家,暂且称为A

生活中的博弈论论文

生活中的博弈论 这学期我在人文课的选择上,我选了“生活中的博弈论”这门课。本来以为会很枯燥乏味,现在课要结束了,回想起来觉得还是挺有趣的。其中含有很浓的智慧气息,趣味横生。下面就是我关于这门课的小论文。 我们首先就会问,什么是博弈论?其实就是研究个体如何在错综复杂的相互影响中得出最合理的策略。生活中每个人,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统化为一门科学。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性”的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。

博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,博弈论经过了这么多年的发展已经完善成为一门十分重要的经济学分支学科,不管是在结构分析还是决策预测等方面都发挥着越来越重要的作用,尤其对于理性人来说懂得如何博弈就显得越发重要。 下面我说一下我个人的想法。博弈其实就是一种游戏,是如何做出对自己有利选择的游戏,但又区别于传统的如体育运动、下棋、打牌等游戏,同时又和这些有些有本质的共同特征,如都有一定的规则,都有一个结果,策略至关重要,同时策略和得益有相互依存性,游戏者不同的策略会带来不同的结果。这样看来博弈好像和我们身边普通的游戏是一样的,其实这并不奇怪,其实博弈本身的含义就是博弈参与者在一定的规则条件下选择相应的策略以期获得足够的利益的过程,这和传统的游戏是相通的,如最常见的斗地主,就是在一定的规则下(如连牌至少5张一连等等),选择如何出牌(出牌的组合以及出牌的顺序等等)而获胜(当然也可能输)的过程,这本身就是一个三方博弈的过程。 为了能够了解博弈的含义,那么下面我们来看一下经典的博弈模型。 需要提到的当然是任何与博弈有关的书籍中都会讲到的“囚徒困境”。

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论论文囚徒困境的启示和思考

囚徒困境的启示和思考 二、囚徒困境的解释 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。 实际上囚徒困境在我们的实际生活中也有很多,下面举两个进行说明

三、经济学例子:关税战 两个国家,在关税上可以有以两个选择: 提高关税,以保护自己的商品。(背叛) 与对方达成关税协定,降低关税以利各自商品流通。(合作) 当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。) 四、商业例子:广告战 商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。 两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。 此二公司可以有二选择: 互相达成协议,减少广告的开支。(合作) 增加广告开支,设法提升广告的质量,压倒对方。(背叛) 若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 除了这些还有的很多类似的例子,比如说公共产品的提供,商家的价格战等等,在这里就不多赘述了。 五、“囚徒困境”现象的意义和启示 通过以上几个关于囚徒困境的例子,特别是作为经济管理学院的学生,我们可以将博弈论的一些知识运用好,更好的指导我们的经济生活。理论的重要意义在于类似的情况之下给人们社会经济生活带来指导。在经济发展中,我们应该认识到“看不见的手”还有更多内涵,有待我们去发掘。 本文主要通过对该理论的分析,从中发现对企业经营管理活动的有义启示。 第一,在市场竞争过程中,一名优秀的经营者,无论做任何决策还是考虑问题应该有战略眼观,特别是在做出对企业乃至行业今后发展的竞争策略时,从长远出发,做正确的决断。 第二,保存对手就是保存自己。在市场竞争中,让竞争对手发展就是自己发展,本着求同存异的思想,共谋发展,避免恶性竞争,避免两败俱伤的情况。 第三,市场竞争不是纯粹的竞争,在义和利之间应该如何取舍,是一位有战略眼观的企业家该做的第一个选择。 2杜兰:走出“囚徒困境”《通信企业管理》[J] 2003年第4期,第31页

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

囚徒困境博弈的行为博弈均衡分析

囚徒困境博弈的行为博弈均衡分析 Christopher Stephens: Modelling Reciprocal Altruism, The British Journal for the Philosophy of Science, vol.47, No.4, 1996, pp.533-551. 互动利他主义建模 1、利他主义困惑与标准模型 The altruism puzzle and the standard model 在一个囚徒困境博弈中,每个博弈者都有两种可能选择:背叛(Defect)或合作(Cooperate),可一般表示为: 囚徒困境博弈要求两个主要条件:(1)Y>W>Z>X(命令条件,The ordering condition);(2)(Y+X)<2W(反利用条件,The anti-exploitation condition) 尽管“背叛”策略是一次性博弈中每个博弈者的优超选择,但相互合作却比相互背叛要好。 2、利他主义的非正式条件 Informal condition for reciprocal altruism 3、对反利用条件的Axelrod证明的批评 Criticism of Axelrod’s justification of the anti-exploitation condition 4、相互利他主义的一组正式模型 A menu of formal models of reciprocal altruism 5、对于guppies、baboons和bats模型的互动利他主义建模 Modelling reciprocal altruism in guppies, baboons, and bats (1)建模guppies的同时合作

用博弈论的眼光来看日常生活中的事例

经 济 博 弈 论 作 业 —日常生活中有趣的小博弈 学院:经济学院 班级:09经济一班 姓名:朱广艳 学号:127生活中的小游戏——博弈无处不在

日常生活中的一切,均可从博弈中得到解释,大到即将进行的美国总统大选,小到宿舍提水事件。因为生活的本质,就是在进行一场游戏。博弈论的知识不仅能在学术界中光彩夺目,在其他领域例也得到充分地利用,在日常生活中我们可以凭借博弈论的思想来分析进而解决问题。博弈论是研究理性的行动者相互作用的形式理论,然而在生活中更多的游戏不仅仅是单人博弈,也是双人或多人的博弈。比如:商场谈判、政治斗争、恋爱结婚……都是这类博弈。以下例子就说明了这个问题。 情侣博弈: 某一天我觉得可能是女朋友的生日,但又不能肯定:如果是女朋友的生日的话,①我可以送一束花,女朋友会特别高兴,我的效用增加5个单位,②我不送花,但女朋友会埋怨你忘了她的生日,我的效用降低2个单位;如果不是女朋友的生日的话,①我可以送女朋友一束花,女朋友感到意外的惊喜,我的效用增加3个单位,②我不送花,结果生活同往常一样,可视为我的效用增加0单位。在这个博弈里,可以看到,“自然”可以有两种策略:确定今天是女朋友的生日或确定今天不是女朋友的生日,但不论“自然”采取何种策略,我的最好行动都是买花。买花是我的占优战略。博弈距阵如下(自然的得益皆为0): 自然 小偷和保安: 犯罪和防止犯罪是小偷和保安之间进行博弈的一场游戏。保安可以加强巡逻,或者休息。小偷可以采取作案、不作案两种策略。如果小偷知道保安休息, 他的最佳选择就是作案;如果保安加强巡逻,他最好还是不作案。对于保安,

如果他知道小偷想作案,他的最佳选择是加强巡逻,如果小偷采取不作案,自己最好去休息。当然,小偷和保安都不可能完全知晓对方将采取的行动,因此他们都将估计对方采取某种行动的概率,从而决定自己要采取的行动。结果是,他们将以一定的概率随机地采取行动,这叫“混合策略”。(假定小偷在保安休息时一定作案成功,在保安巡逻时作案一定会被抓住)如下图表示: 小偷 此矩阵可以表示,保安巡逻,小偷不作案,双方都没有收益也没有损失;保安巡逻,小偷作案,保安因抓到小偷受到上级领导的表彰,得到效用2单位,小偷被判刑丧失效用2单位;保安休息,小偷不作案,保安休息的很愉快得到效用2单位,小偷没有收益也没有损失;保安休息,小偷作案,保安因失职被处分而丧失效用1单位,小偷犯罪成功获得效用1单位。这个博弈是没有纳什均衡的。 电信价格: 根据我国电信业的实际情况,可以构造电信业价格战的博弈模型。假设次博弈参加者为电信运营商A与B,他们在电信某一领域展开竞争,一开始价格都为P0。A是中国电信老牌企业,实力雄厚,占据了绝大多数的市场份额,B中国联通则是刚刚成立不久,翅膀还没长硬,是政府为了打破垄断鼓励竞争而筹建起来的。正因为B是政府扶植起来鼓励竞争的,说以B得到了政府的一些优惠,其中就有B的接个可以比P0低5%。这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。在这样的市场分配下,A、B可以达到平衡,但是有一B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成影响。 这时候A该怎么做?不妨假定:

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论中的囚徒困境在生活中的应用

博弈论中的囚徒困境在生活中的应用 囚徒困境最早出现在1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 若二人都互相检举(互相“背叛”),则二人同样判监2年。 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: (1)若对方沉默、背叛会让我获释,所以会选择背叛。 (2)若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 一,囚徒困境之于异地恋

博弈论经典案例《智猪博弈》

在经济学中,在经济学中,智猪博弈”(PigS ' PayoffS(BoXed PigS) 是一个著名博弈论例子。 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择搭 便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之 间的距离。 如果改变一下核心指标,猪圈里还会出现同样的小猪躺着 大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小 猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡

献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然 是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小 猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的 共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效 果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费 宀 完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最 大。 原版的智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规 则的设计者是不愿看见有人搭便车的,政府如此,公 司的老板也是如此。而能否完全杜绝搭便车”现象,就要看游戏 规则的核心指标设置是否合适了。

博弈论中经典案例--“囚徒困境”

博弈论中经典案例--“囚徒困境” 博弈论中有一个经典案例--“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。囚犯可以做出如下选择:1、供出他的同伙(即与警察合作,从而背叛他的同伙),2、保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。囚徒困境模型的几个现实例子囚徒困境的例子在现实生活中很多。比如国家与国家之间的军备竞赛,显然,各国都不把大量的财富花在可能永远都用不上的军备上是最佳选择。可是,如果别的国家不把钱花在军备上,我们花,那么我们会在两国外交和贸易中占得优势,拥有国际影响力,在未来战争中赢得胜利。如果别国把钱花在军备上,我们也花,那么我们至少可以不吃亏。所以,不管别的国家把钱花不花在军备上,我们把大把大把的钱花在军备上都是优势选择。所以,我们会把钱花在军备上。显然,别国也会这样想。结果是各国都会把大把大把的钱花在军备上,而且还互相攀比,想要胜过对方,占得优势,以便给对方造成压力。这就造成了军备竞赛,你花一百亿,我花一百五十亿。你花一百五十亿啊,那么我花两

生活中的博弈论例子

生活中的博弈论有那些例子 那讲工作上的事假如你做的策划被上司偷了那你是要向更高级的领导告状还是忍受这也算一个博弈论问题你要是告状,也许能够伸冤,但也会若到上司他可能会给你下绊子但不上诉他也许会再偷,你的工作就白废了 还有物价方面假如几个店铺联合起来自然能够把东西卖的比较贵但只要其中一个降价其他店的客人就会全跑到那家去那另外几家也会被迫降价店铺联合本来是最好的赚钱方法但店铺间一般是敌对关系为防备有人订低价,引走客人所有的店铺都会尽可能低价其实我们学校门口的网吧刚上演了一出这个好戏真是有感触啊!!!!! 弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。 基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。 1.博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解”或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略怎样才是“合理” 应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运

相关文档
最新文档