浅谈博弈论的应用

浅谈博弈论的应用
浅谈博弈论的应用

浅谈博弈论的应用

摘要:博弈论又称对策论,是使用严谨的数学模型研究现实世界冲突对抗条件下最优决策问题的理论。博弈论应用广泛,目前已经深入到经济学、政治学、社会学和军事及人工智能等各个领域,被各门社会科学所应用。纳什均衡是博弈论的核心概念,它是博弈的一般均衡结果,是关于局中人最优策略的一致性预测。然而纳什均衡的多重性使得有些博弈存在多个一致性预测,博弈局中人仍然面临选择哪个均衡的不确定性问题,这限制了博弈论的应用和作用效果。

Game theory is also called countermeasure theory,and it focuses on the best decision-making at the condition of confliction of the real world with religious mathematics model.Game theory has a wide application,and it has penetrated into economics,politics,sociology,military and artificial intelligence.It is applied into nearly every study field.Nash equilibrium is the core conception of game theory.It is the general equilibrium of game result and it is the consistency prediction of the players’best decision.But the multi—equilibriums cause the multi—consistency prediction,and lead the players into an uncertainty of Nash equilibrium selection.

关键词:博弈论纳什均衡应用

1引言

博弈论又称对策论,是使用严谨的数学模型研究现实世界冲突对抗条件下最优决策问题的理论。两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽。随着时代的发展,博弈论在我们现实生活中的应用越来越广泛。

2 博弈论与纳什均衡

从古到今,人类活动中一直广泛存在着凭借策略决以胜负的竞争性现象,例如,在我们日常生活中,下棋、打牌、球赛等各种体育竞赛和游戏;经济领域内的广告与销售活动、贸易谈判、生产管理;政党之问的政治斗争;国家之间的外交谈判以及战争等。这些现象都是冲突各方处于一种竞争或对抗中,并且由于参加的各方在竞争中采取不同策略而得到不同的结果。在这些具有竞争或对抗性质的行为中,参加的各方各自具有不同的利益和目标。为了达到各自的目标和利益,各方必须考虑对手的各种可能的方案,并力图选取对自己最为有利或最为合理的方案。研究这种竞争性现象的各方是否存在最合理的行为方案,以及如何找到这

个合理的行动方案所形成的一门新的理论——博弈论。博弈论的出现给现实世界中合作对抗问题的解决提供了一种崭新的思路,带来了最优决策问题研究的新高潮。博弈论在各个领域的应用都取得了巨大的成就。

纳什均衡是博弈论的核心概念,它是指,在其他局中人的策略选择既定的前提下,每个局中人都会选择自己的最优策略,所有局中人的最优策略组合就是纳什均衡。它意味着,在给定别人策略的情况下,每个局中人都不能通过改变自己的策略得到更大的效用或收益,从而没有任何人有积极性打破这个均衡。换一种说法就是,其中每个局中人选择的策略是对其他局中人所选策略的最佳反应。

3 博弈论的应用及其分析

博弈论被称为“社会科学的数学”,从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而从实际上讲,它正深入到经济学、政治学、社会学和军事及人工智能等领域,被各门社会科学所应用。就我们所知道的博弈论的运用包括“囚徒困境”博弈、“价格问题”博弈、“贸易交易”博弈、“企业环境污染”博弈等,其中广为人知的当属“囚徒困境”博弈。

3.1 “囚徒困境”博弈

囚徒困境讲的是两个犯罪嫌疑人作案后被警察抓住,分别关在不同的房子里审讯。警察告诉他们,如果两人都坦白,各判刑3年;如果两人都抵赖(或因证据不足),各判1年;如果一人坦白,一人抵赖,坦白的获释,抵赖的判刑5年。可见,对两个犯罪嫌疑人整体而言,(抵赖,抵赖)是两个犯罪嫌疑人最佳的策略组合,但在两犯罪嫌疑人被抓后分别关押且彼此不知道对方会采取什么策略时,每个犯罪嫌疑人就会在警察所给的策略下选择自己的最优策略“坦白”,于是“囚徒困境”中的纳什均衡解正好是策略组合(坦白,坦白),警察最终达到了预定的目的。

囚徒困境这个简单的博弈模型之所以经典,在于它颠覆了“个人理性的选择会自然而然的达到集体理性”这个结论,从而为主流经济学的建立打下了现实的基础。求解囚徒困境博弈的困难在于个人激励与群体目标并不一致,因而,要求参与人把个人目标放在第二位,而把集体目标放在第一位。当然个体理性与集体理性的矛盾,有时对参与人而言是坏事,对集体而言却可能是好事,两个犯罪嫌疑人由于都“坦白”受到更严厉的惩罚,至少在关押期间不会再去犯罪,这对整个社会无疑是件好事。“囚徒困境”博弈正巧验证了一句话:个人利益必须服从整体利益,当两者相矛盾时,必须首先考虑集体利益。

此外,纳什均衡是一个“僵局”,当别人不动时,自己也没有动的积极性。当博弈只有唯一的纳什均衡时,这个纳什均衡会实际上发生,且参与人会在没有

任何压力时,自觉自愿的遵守它,这给了我们一个很大的启示,在设计规章制度时,应尽量达到纳什均衡,这样每个人都会做到自觉自愿地遵守它。

3.2 “价格问题”博弈

每逢节假日,我们经常会遇到各种各样的价格战,特别是大型商品的促销。厂家价格大战的结局是一个“纳什均衡”,结果是谁都没钱赚。因为博弈双方的利润正好是零,竞争的结果是稳定的,达到了一个“纳什均衡"。这个结果可能对消费者是有利的,但对厂商而言是灾难性的,它无疑是种自杀。

对于企业而言,若是降价销售,可能导致一个有效率的零利润结局。若不采取价格战,则必须考虑两种选择:采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所造成的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。由此可以看出,每个企业的战略都是建立在假定对手会按其最佳利益行动的基础上。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。

在这种均衡中,每一企业要使利润最大化,消费者要达到效用最大化,结果就导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。

3.3 “贸易交易”博弈

随着经济全球化的发展,每个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战而受到损害。X 国试图对Y国进行进口贸易限制,比如反倾销,则Y国必然会进行反击,也对X国进行反倾销,结果谁也没有捞到好处。反之,若X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少限制,结果大家都能从贸易自由中获得最大利益,而且全球贸易的总收益也会增加。

3.4 “企业环境污染”博弈

假如企业周围的环境受到污染,而政府并未管制,那么企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从集体利益出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争

机制”失败的例证。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将会更好。

除此之外,像法律、规则制定者可以利用博弈论制定出所有人都能自觉遵守的法律、规则和章程;企业可以利用博弈分析产量与价格的关系,建立博弈模型分析企业之间的竞争和合作,以获得最大的经济利益;在日常生活中,我们也会遇到各种形式的博弈,例如挤公交车等。

4 个人心得

通过上面几个博弈事例我们可以看到,博弈论在我们现实生活中的应用极其广泛。虽然取得了辉煌的成就,但是博弈论本身仍存在一些问题,这些问题限制了博弈论更广泛的应用,也是博弈论未来的发展和完善方向。

在我看来,博弈论对信息的处理是理想化的,这在实际应用中存在严重缺陷。纳什均衡的多重性使得有些博弈存在多个一致性预测,博弈局中人仍然面临选择哪个均衡的不确定性问题,这限制了博弈论的应用和作用效果。运用博弈论时,我们还应充分考虑特征、境域的影响,以便对纳什均衡作出更深层次的分析。

5 结论

博弈论的应用极其广泛。博弈理论已经渗透到我们社会的方方面面,小到生活的日常琐事,大到国际间的经济贸易和军事竞备。这些都使得博弈论的应用范围和作用效果越来越大。

参考文献

[1] 张维迎.博弈论和信息经济学.上海:三联书社,1996.

[2] 向楠.网络安全投资与博弈策略研究.北京:北京邮电大学,2008.

[3] 尚宇红.博弈论简史.西安:西北大学,2003.

[4] 侯定丕.博弈论导论.合肥:中国科学技术大学出版社,2003.

[5] 谢政.对策论.长沙:国防科技大学出版社,2004.

[6] 张长青.纳什均衡的效率及选择.黑龙江大学学报,2007.24(6):1-4.

浅谈生活中的博弈论

浅谈生活中的博弈论

浅谈生活中的博弈论

目录 一博弈论的简介 (2) 二博弈论的历史 (3) 三博弈论的基本概念 (4) 四博弈论的基本类型 (7) 五经典的博弈论 (7) 1 囚徒困境博弈.................. 错误!未定义书签。 2 智猪博弈...................... 错误!未定义书签。 3 博弈价格战.................... 错误!未定义书签。 4 二妓争子...................... 错误!未定义书签。六博弈论的重要性 (20)

博弈论,亦名“对策论”(Game Theory)、“赛局理论”,既属于现代数学的一个分支,也是运筹学的一个重要学科。博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 博弈论是博弈双方或者多方在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略,使得其行为能够为个体带来最优的效益。 我们研究的博弈论,是建立在博弈双方或者多方都属于理性人的基础上,通过对自己以及博弈对手状况的了解、博弈环境的要求及变化等诸多因素,博弈者做出对自己最有利最保险的决策和行动,从而使得自己能达到获利或者获胜的目的。

范里安《微观经济学:现代观点》(第9版)课后习题详解-(博弈论的应用)【圣才出品】

第30章博弈论的应用 1.在一个双人博弈纳什均衡中,每一个参与人都在针对什么作出最优的反应?在一个占优策略均衡中,每一个参与人又都在针对什么作出最优的反应? 答:(1)在纳什均衡中,每个参与人都对其他选手的最优反应作出了自己的最优反应。 (2)在一个占优策略均衡中,每个参与人的选择都是对其他选手所有选择的最优反应。特别地,占优均衡一定是纳什均衡,但纳什均衡却未必是占优均衡。 2.在有关混合策略的章节中,考虑行参与人和列参与人的最优反应。它们会产生最优反应函数吗? 答:行参与人和列参与人没有最优反应函数。如图30-1所示,这两条曲线分别体现了行参与人和列参与人对应于对方选择时的最优反应。曲线的交点就是纳什均衡。在这种情况下,博弈存在三个均衡,其中,两个是纯策略均衡,一个是混合策略均衡。当行参与人选择r=2/3时,列参与人存在无穷多个最优反应,而不是像函数的数学定义所要求的那样,只有一个最优反应。

图30-1 最优反应曲线 3.在一个合作博弈中,如果博弈双方作出相同的选择,那么,结果对于他们两个对这都令人满意。这个结论是否正确? 答:这个说法不正确。 这是因为合作博弈的结果取决于博弈的收益,而非两个人是否选择相同的策略。比如在汽车博弈中,如果双方都选择直线驾驶,他们将陷入最糟糕的境况。 4.本章正文指出,在均衡状态,行参与人在62%的时间内会得分。这个数值是如何得到的? 答:博弈的均衡策略为“行参与人按0.7的概率踢向左方,而列参与人以0.6的概率扑向左方”,由于射门方向和扑救方向共有四种组合,从而得到每种组合的概率分布如表30-1所示。 表30-1不同组合的概率分布

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

博弈论及其应用(期末学习报告)

博弈论及其应用长虹与同行家电业的价格战 姓名: 学号: 学院: 专业:

博弈论及其应用 长虹与同行家电业们的价格战 一、事件背景 由军工厂转型的长虹是国内最早从日本松下引进彩电生产线的企业。1985年,军人气质十足的倪润峰执掌长虹。1994年,长虹在上海证交所上市;1995宣布自己成为“中国最大彩电基地”。 1996年,长虹的指挥官倪润峰决定拿出更大的动作。提出一个令人意外的“产业报国”计划。1996年,本土彩电企业陷入最艰难的苦战时刻,一个潜在的危机正在步步逼近。4月1日开始,彩电的进口关税将大幅下降。3月26日,长虹宣布,所有品种彩电一律大幅度让利销售,降价幅度从8%到18%。随后,猝不及防的其他中国厂家纷纷选择跟进。彩电业的价格大战,就在这样一种“产业报国”的氛围之中,拉开大幕。 价格战刚刚开打一个月,长虹的市场占有率就上升到19%,比降价前增加了7.9%。到年底,长虹坐稳了“彩电大王”的宝座。中国每卖出三台彩电,有一台出自长虹,有一台是外资品牌,还有一台才是其他国内品牌。倪润峰逐渐把国内同行们逼到了死角。在此战之前,国内各省市其实还有60多个地方性的彩电品牌,它们大部分是国有企业,作为当地的支柱产业割据一方,小富即安。然而在长虹的降价冲击下,大多数企业迅速凋零,成为行业重组中一颗颗散落的棋子,只能到长虹、康佳、TCL那里请求收购。彩电业从此步入由五六家大公司瓜分市场的时代。这一年,预算内国有企业的净销售利润率降低到历史最低点,亏损总数是1985年的28.6倍。相比之下,全国乡镇企业的产值增长22%,中外合资企业的所得税增长40%。 1997年,用价格战给中国企业家们好好上了一课的倪润峰被推上了事业的巅峰,1998年,在价格战中得到洗礼的国内同行开始显山露水。1999年,长虹的净利润下降74%;2000年5月,倪润峰卸下总经理职务,退隐江湖。2000年6月9日,康佳和TCL在内的九大国内彩电巨头联手组成价格联盟,准备正面迎击长虹的价格战。2005年4月16日,在这个特意挑选的休市日,长虹公布了2004年年报,抛出中国股市有史以来上市公司亏损之最:36.81亿元。价格战的发明者和坚决的拥护者,为最后的豪赌交出了最昂贵的学费。 二、各方的观点

博弈论浅谈

博弈论浅谈 在查找博弈论课题资料的过程中,不禁发现自己已经深深地被这门数学分支吸引住了。我想,这门学问的魅力主要在于它的实用性,数学中很少有一个方面能够被如此广泛地应用到实际生产实践、解释自然界的现象当中。而博弈论无疑是这其中一个既吸引数学家也吸引着数学“门外汉”的“大众科学”了。 博弈论又称对策论,主要研究斗争性或竞争性现象的理论解决方法,是现代数学的分支,也是运筹学的一部分。博弈论会考虑竞争过程中的个体的预测行为和实际行为,并研究它们的优化以达到最优化策略。一般以1928年数学家、计算机专家冯·诺依曼证明了博弈论的基本原理这一事件作为博弈论正式诞生的标志。发展至今已经渐趋完善,此过程中有许多优秀的学者如冯·诺伊曼、约翰·纳什等为之作了卓越贡献。由于博弈论与经济学类相关甚紧,博弈论中某一理论的研究常常会带来经济学领域的一大突破,正如1994年约翰·纳什作为数学家获诺贝尔经济学奖所体现的一样,这种跨学科的效应在博弈论学中淋漓尽致地体现了出来。 “博弈论”该词在现代社会可以说是脍炙人口,在各种大型讲演和授课中经常能听到,但我个人觉得这个词的翻译不如它的英文源词“Game Theory”一样直白。“Game Theory”如果理解为“游戏的理论”更能够清晰地向一位不了解博弈论的人介绍这门科学。至于上升

到“博弈”的层次当然也是有其原因的。“Games”在当代早已将其内涵和外延延伸至社会科学、自然科学的方方面面,已经不仅仅停留在“游戏”的层面上。广义上来说,一个结构中的群体之间的相互作用构成一个博弈。狭义一点,社会中人群之间或集团之间的合作、承诺、互相利用等也是博弈论的体现。从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,因为博弈论的基本假定是博弈各方的行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。博弈论研究的是理性的博弈方之间如何进行策略选择的。由此可知,大到社会的发展、生物的繁衍,小至下棋打牌都可以看作是博弈。这么说来博弈论对于我们来说一点也不陌生,这些不正是与我们息息相关的日常事务?中国人对博弈论自古代就有深入的了解,甚至有将其理论系统化。比如《三十六计》就将当时军事上使用的计谋等集中收集到了一起,这种“计谋”其实就是指导人们的博弈理论。 作为数学的一个分支,且不论博弈论对自然科学的重要性,它还对社会科学有着重要的意义,是社科研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。它还深刻地改变着人们的思维,如人们熟知的“囚徒困境”“海盗分宝石”等问题已经作为经济学、心理学的经典案例;成功企业中的高管与智囊团因善于博弈、制定正确的发展战略而使公司利于不败之地;政府公务员在制订法律、颁布政策时也需要不断利用博弈理论,站在人民的角度看问题从而进一步完善规章制度以促进外

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

浅谈身边的博弈现象

浅谈身边的博弈现象 博弈论最基本的意思是弈棋,博弈本身是一种游戏,博弈论最初的主要研究对象是象棋,桥牌,赌博,研究做出何种选择让自己打败对手,因而最初的博弈论是一种经验的描述而非一种系统的理论。直到20世纪40年代,冯·诺伊曼与摩根斯坦合著《博弈论与经济行为》一书,第一次将博弈论引入经济学中;又在库克,纳什等研究后,20世纪60年代博弈论在经济领域中得到进一步的推广。如今博弈论已经成熟并向生物学,计算机科学,道德哲学等领域广泛扩展。 由此可见,我们日常生活中充满着博弈的过程,满布着博弈的结果。经济学家保罗·萨缪尔森曾说过:“要想在现代社会做一个有文化的人,你必须对博弈论有个大致的了解”可见现代博弈论对我们生活的参透。 下面的一些例子来描述发生在我们周围的博弈现象。 网络投票评选 每年,除了除夕当晚播出的春节晚会外,晚会之后进行的“我最喜爱的春晚节目”评选同样吸引了不少观众、网友参与,而评选结果最后也会在正月十五的央视元宵晚会上公布,并为获得的一二三等奖的节目颁奖。那么你是怎么投票的呢? 此时有大家的意见参与,所以你的正确策略并不是选自己最喜爱的节目,而是猜大多数会选哪个就投哪个一票,哪怕节目烂的不行。在这里,你的行为是建立在对大众心里猜测的基础上,而并非是你真实的想法。 每个参与着必须挑选出并非他自己认为最喜爱的节目,而是他认为最能吸引其他参与者注意的节目,其他参与者也正以同样的方式考虑这个问题。现在要选的不是根据个人最佳判断确定的真正最喜爱的节目,甚至也不是一般人的意见认为最喜爱的节目。我们必须做出第三种选择,即运用我们的智慧预计一般人的意见,认为一般人的意见应该是什么……这与哪个是我最喜爱的节目无关。你关心的怎样预测其他人认为最喜爱的,又或者其他人认为其他人认为最喜爱的。 在选择时,参与者必须同时设身处地从其他参与者的角度来思考。这是,他们选择胜者与其说取决于真正的好的标准,不如说努力找出大家的期待是不是落在某个焦点之上。假如某个节目中某个人的名气要比其他人高很多,那么这个节目就可能成为一个万众瞩目的焦点。又或者所有节目的水平不相上下,都具有特点,但这些节目中有个节目是这几年评选中一直得第一名的原班人马,你会不会选这个节目呢? 参与者的工作,是在缺乏沟通的情况下,确定人们究竟将打成怎样的共识。“选出最喜爱的节目”可能是书面规则,但这比选出声音最高的,人数最多的要难的多。任何可以将他们区别开来的东西都可以成为一个焦点,是大家意见得以会聚一处。出于这个理由,当我们发现最喜爱的节目不是最好的的时候,我们并不惊讶;实际上他们只是接近最好而已,都有一些瑕疵,这些瑕疵使他们各具特色,成为一个焦点。 生活中还有许多例子与这个模型相同。比如“十佳运动员”的评选,再比如“网络选美比赛”。投票人能够选中的话,或者说他能过被提名当选的话,关键是猜测别人的想法,猜对了你就能获胜,猜错了你就不能获奖。 在这种比赛中我们可以看到没有正确与否,或者谁应该被选上,谁应该不被选上的问题,而是投票人相互猜测的结果。当然,在这个过程中舆论的导向作用是很大的,它似乎告诉人们谁会被选上。 红包困惑 假如你和你的同事各自从老板哪里得到一个红包,里面的钱可能是500元,1000元,2000元,4000元,8000元或者16000元。你知道同事红包里的钱要么是你的两倍,要么是你的

浅谈博弈论在电力市场中应用

浅谈博弈论在电力市场中应用 博弈论又称为对策论,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。 博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。 2.博弈论的基本原理和方法 文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述 G={P,A,S,I,U} P:为局中人,博弈的参与者,也称为博弈方,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。 A:为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重

复博弈和微分对策等。 S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。 I:博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调知己知彼,百战不殆,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(game with complete information),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(game with incomplete information),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为具有完美信息的博弈(game with perfect information),例如下棋,双方都清楚对方下过的着数。反之称为不完美信息的动态博弈(game with imperfect information)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。 U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。 还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC

博弈论在经济学中的应用

博弈论在经济学中的应用 刘肃素 (华中师范大学经济与工商管理学院 2011211086) 摘要:博弈论是研究策略博弈的数学理论,亦称对策论。它的作用在于发现普遍有效的博弈原则。在现代经济社会中充满了博弈,这就需要了解博弈的思想,用科学理论来指导行为。博弈论应用于经济学,已经和正在引起现代经济学一系列的发展和突破。博弈论在经济学中所取得的重大进展发现,博弈论方法越来越成为经济学研究的主流方法。随着博弈论在现代经济学中的运用和研究的深化以及经济复杂性现象的不断涌现,博弈论的经济学研究呈现出合作化、对称化和连续化的发展新趋势。 关键词:博弈论经济学对策论应用 Abstract:game theory is the mathematical theory of research strategy game, which is also called game theory. It is found that the average effective principles of game. In the modern economic society is full of game, this game, you need to understand in a scientific theory to guide behavior. Game theory is applied to economics, has been and is causing a series of modern economics development and breakthrough. Major progress was made in the game theory in economics, found that the game theory method is becoming the mainstream in the economics research method. With

浅谈博弈论中的囚徒困境的解决方法

浅谈博弈论中的囚徒困境的解决方法 摘要:囚徒困境是博弈论中的一个重要范例,这个问题涉及各个领域。本文通过三个简单的实例,来谈谈解决的方法。 案例一:一个面馆的囚徒困境 我曾经在路边一个小店里吃面,由于当时客人不是很多,就顺便与小老板聊了起来。通过老板的介绍听出了一些门道。以前面馆开店的时候请了一个师傅,开始的时候为了调动他的积极性他们采用按销售量分成,一碗面给5毛钱提成。这样的话,客人越多他挣得也就越多,为了吸引更多的顾客,他在碗里放很多的肉来吸引回头客,一碗面才6块钱,本来就靠薄利多销,他放的肉多,面馆自然也赚不到钱。后来呢,就换了一个结算方式,给厨师发固定的工资,这样客人多少跟他没有什么关系,但是新的问题又出现了,这次他在碗里放肉放很少,基本上把所有的客人都赶走了。客人少了,他就轻松了啊反正他拿的是固定的工资。通过这个案例我们可以了解到面馆的老板与厨师在工资的分配上存在一定的分歧,由于没有处理好,使得双方都处在不利的结局。 解决方法:面馆的老板应该对厨师明确,每碗面的元材料是固定的,大师傅的工资还是按照销售量提成走,但是前题是每个月使用的原材料不能超额,否则只有基本工资。或者就规定每碗面里就放多少克肉。此外,还有一个更简单的办法就是:面馆的小老板亲自放肉。因为关键的资源一定要掌握在关键的人手里。 经过以上的分析,我们可以得知解决的方法:1.工资加提成的制度确实能调动员工的积极性;2.权利下放可以,但是要有度;3.员工的工资提成不能只和销量挂钩,应该和老板的利润挂钩。4.有效的沟通、激励,平时给员工传达精神的奖励,让员工认为自己也是公司的主人。 案例二:小餐馆的囚徒困境 在天津新建的一片经济适用房社区里有两家小餐馆,他们都是经营当地的家常炒菜及快餐。因为这里是新开发的经济适用房,而周边像小饭馆这样的生活配套设施很缺乏,所以附近的建筑工人都是在这两家小饭馆解决三餐。 这两家餐馆因为在口味、价格、菜的品种等都基本相同,所以一直以来这两家面对都是这些人,营业额都差不多,而附近的建筑工人们对于吃饭也没有什么特殊的爱好。好景不长,就在今年的夏天,两家餐馆的其中一家,暂且称为A

初探博弈论及其应用【开题报告】

毕业论文开题报告 信息与计算科学 初探博弈论及其应用 一、选题的背景与意义 在人类历史上,很早就有了博弈思想的故事,如众所周知的“田忌赛马”。在社会生活中,我们也能碰到类似的情形和现象,如下棋、打扑克、猜拳等想用自己的战术去取胜,这就是所谓的博弈现象。博弈论是研究理性的个体在相互依存时如何做出决策的一门理论知识,主要是强调决策主体的行为而引起的直接相互作用。 上世纪80年代以后,博弈论经历了突飞猛进的发展,主要是在经济方面的发展,越来越多的人把它归为主流经济学的重要组成部分。不仅是在经济上有广泛的应用,而且在军事、信息、政治等方面也能看见它的影子。1994年的诺贝尔经济学奖获得者就是三位博弈论的专家。以后又有三次奖授给了与博弈论有关的专家。在我国,经济学界对经济博弈论的关注和兴趣也在迅速增强。由于博弈论应用的广泛性和实用性,越来越来多的人开始学习和研究博弈论。可以说,博弈论正将进入一个崭新的阶段。 二、论文的主要思想 博弈论研究理性的个体在相互依存时如何作出决策。因此博弈论在研究时需要作出一定的假设,当然也包括一些基本定义。所以本文从介绍博弈论的基本假设和基本概念开始,在对基本概念了解的基础上学习博弈论中的经典模型,从中学习博弈过程中的双方博弈思维,然后再选取一些实际中的例子,运用所学的博弈论思维,从博弈双方的角度考虑得出该做出何种决策。 三、研究的步骤及方法 研究步骤 1. 1.10——1.20 明确毕业论文的设计方向,查阅文献资料,完成开题报告。 2. 2.10——2.25 撰写文献综述,翻译外文资料。 3. 2.26——3.05 列出论文正文部分的撰写提纲。 4. 3.06——4.01 撰写论文初稿。 5. 4.02——4.20 根据指导老师的建议进一步修改。 6. 4.21——4.27 论文定稿,装订成册,按时完成其它各项任务,准备答辩。 研究方法

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流治理(采购与供应链1班) 学号:1040407122 姓名:曾维乐

二〇一一年十二月十八日 价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。

关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单讲来确实是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自同意选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中能够看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人,也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论基础及应用

博弈论(对策论、游戏论) 博弈论又名对策论、游戏论,是一门研究互动关系“游戏”的参与者各自选择策略的科学,博弈论把这些复杂关系理论化,以便分析其中的逻辑和规律,并对实际决策提供指导和借鉴。 游戏三要素(博弈的规则、结构): 1、博弈、游戏参加者。 博弈论分析,假定参与者都是机智而理性的。 2、行为和策略空间。 博弈参与者必须知道他自己及其对手伙伴的策略选择范围,并了解各种策略之间的因果关系。 3、有可评价优劣高下的决策行为结果。 博弈论用数字表示这类结果,并称之为支付。 支付矩阵 可以用支付矩阵(得益矩阵、收益矩阵、赢得矩阵)来描述一个博弈结构。 厂商B 厂商A 支配策略: 由于游戏参与者试图实现自身利益最大化并具有理性的决策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具有一个简单而确定的结果。从厂商A角度来说,它采取策略“下”而得到的支付总是好于“上”(2,1分别对1,0)。同样,对于厂商B来说,选择策略“左”得到的利益总是优于“右”(1,2分别对0,1)。因此,我们可以确定预期均衡选择策略是A选择“下”而B选择“左”的策略。 囚徒困境: 下面支付矩阵表示著名的“囚徒困境”游戏,从博弈论角度看,这是一个存在支配均衡的博弈;因为对囚犯A、B来说,无论对方如何选择,“坦白”都是各自的最优选择。 虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处(3个月刑期)等竞争性动机阻碍了他们达到更好的互利选择,他们面临“囚徒困境”。我们将看到,寡头垄断厂商经常面临类似的困境。 囚犯B 囚犯A 纳什均衡: 支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支配均衡表示博弈中,厂商A、B在选择做广告问题上存在的策略关系。其中厂商A没有支配策略,因为A的最佳决策取决于B的选择。例如,当B选择做广告时,A应当选择做广告,由此得到10而不是6的支付得益,然而,当B选择不做广告时,A应当选择不做广告,从而得到20而不是15的支付得益。假定两个厂商需要同时决策,A应当如何决策?

博弈论三大经典案例

经典的囚徒困境 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ?若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ?若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ?若二人都互相检举(互相“背叛”),则二人同样判监2年。 用表格概述如下: 甲沉默(合作)甲认罪(背叛) 乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年 乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ?若对方沉默、背叛会让我获释,所以会选择背叛。 ?若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 由囚徒困境可以写出类似的员工困境: 一名经理,数名员工; 前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作 如果某人不听从吩咐,其他人听从吩咐,则此人下岗。其他人继续工作 如果所有人都不听从经理吩咐,则经理下岗 但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

博弈论在生活中的运用

TECHNOLOGY AND MARKET Vol.18,No.6,2011 0引言 博弈最基本的意思是弈棋,博弈本身是一种游戏,博弈论最初主要是研究象棋、桥牌、赌博,研究做出何种选择会让自己打败对手。因而最初博弈论只是一种经验的描述,而不是一种系统的理论,20世纪40年代,冯·诺伊曼(John Von Neumann)与摩根斯坦恩(Oskar M orgenstern)合作出版的《博弈论与经济行为》(1944)一书第一次系统地将博弈论引入经济学中,标志着系统的博弈理论的形成,他们定义博弈论(GameTheory)是“研究决策主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡的问题”[3]。 博弈论的应用范围非常广泛,在现实生活中一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后一次或多次,对各自允许选择的行为或策略进行选择并加以实施,并各自从中取得相应结果或收益,这个过程便是博弈的过程。[1]市场竞争、环境保护、公共资源的利用与开发,乃至国家间的军备竞争、各种竞技比赛等都属于博弈现象。它涉及经济学、政治学、军事、外交、国际关系、公共选择等领域。 1博弈论在日常生活中的运用 古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。我们最早接触的一个博弈论在生活中的运用恐怕就是,2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜。齐王与田忌各用上、中、下等马进行三场比赛,比赛为三局两胜制。在同等级的马中,齐王的马均优于田忌的马。在该比赛中我们知道会有六种策略: 为了赢得比赛,孙膑为田忌制定了对策,采取第六种策略。以劣马对齐王的上马,以上马对齐王的中马,以中马对齐王的下马,结果田忌赢得了两场比赛的胜利。田忌采用的是占优策略,即站在自己的立场上,无论对方如何选择,都能避免出现最糟糕的结果,实现自己的最大利益。在本故事中,齐王的参赛决策是透明的,依次用自己的上、中、下三匹马参与比赛,他没有考虑到对方为赢得最大利益将作出的决策,或者是没能发现自己的决策中存在的可被对手利用的漏洞。这种博弈在日常生活中很常见,参与人根据对方的策略选择自己的策略方式,以期得到利益最大化,甚至反败为赢。 这个例子是调整顺序来赢得比赛,在生活中我们也常遇到狭路相逢的情况,两辆车相向而行在一条很窄的路上,两位车主是都进还是都退,还是一个前进一个倒退。当然,如果哪方选择倒退可能导致耽误时间之类的损失,先行者可能会赢取时间,这就涉及到我们所说的斗鸡博弈,这是生活中很常见的一个现象,这个时候,我们用一个博弈标准式来表示,两位车主分别用甲乙代替,这个时候有四种策略,则标准式可以表示为: 有这个标准式的矩阵,我们可以选择这样的策略来达到纳什均衡,甲:乙选择(前进,后退)或(后退,前进),即其中一个选择后退,在生活中如果遇到这样的事,两个都想赢得时间的话只会两败俱伤,而如果一方选择倒退会给两方都带来好处。当然,我们在生活中还会遇到很多其他的博弈例子,例如恋爱中的男女是选择去看电影还是去选择看足球赛,男方是该求婚还是该放弃求婚。甚至是在儿童游戏剪刀石头布中是出剪刀,石头还是布都会涉及到博弈论。 2博弈论在经济生活中的运用 在经济生活中,各国之间的贸易谈判,同类产品的几个生产厂家进行广告宣传,争夺国际国内市场,企业对自己的一种商品定价,需要考虑市场上同类商品的价格等都涉及博弈[5]。博弈论在经济生活中的应用最广泛、最成功。经济学家对博弈论的贡献很大,特别是在动态分析和不完全信息中引入博弈论。经济学和博弈论的研究模式具有本质的相容性,其核心就是强调个体理性,也就是在给定的约束条件下追求效用最大化。这使得博弈论逐渐发展成为经济学的一部分。 在经济生活中,我们通常会遇到生产同种商品的厂家降低价格来扩大商品的市场份额,以此来击败对手,假如A、B两公司实力相当,市场份额既定。首先考虑厂商A,厂商A觉得,不管 博弈论在生活中的运用 付冬芹,丰容基 (安徽大学经济学院,安徽合肥230601) 摘要:博弈论研究的就是纳什均衡,把博弈双方每个阶段所要发生的事情罗列出来,然后再去按阶段进行分析,最终找到我们想要的均衡的最佳点。生活中,我们经常会有意无意地用博弈论知识来解决问题,掌握博弈论的相关知识有利于我们更好地进行决策。 关键词:博弈论;竞争;均衡 doi:10.3969/j.issn.1006-8554.2011.06.14 4专题研究 192

相关文档
最新文档