市场营销中的纳什均衡应用

市场营销中的纳什均衡应用
市场营销中的纳什均衡应用

市场营销中的纳什均衡应用

纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应,下面是搜集的一篇关于市场营销中的纳什均衡问题探究的论文范文,欢迎前来阅读参考。

一、导论

在现代经济条件下,在移动互联网逐步影响生产、生活、市场等各个方面时,营销与移动互联网的结合越来越紧密,甚至在有些领域成为引领,从互联网时代的邮件营销、短信营销到移动互联网的微博营销、微信营销等,在形式上、观念上和便捷性上都有了很大的改变。

在这些改变的背后,就是商家对这些营销方式方法的积极应用,在大多数商家尚未完全理解新的营销观念的时候,在新兴营销工具方法尚未得到印证的时候,为什么群起而用之,这其实是个纳什均衡在市场营销中所起的作用。

简而言之,对于新的营销方法,竞争对手使用了,自身没有采用,那么竞争对手便抢占了先机;竞争对手使用了新方法,自身也予以采用,那么竞争态势至少会保持之前的情形,这就是纳什均衡。

二、纳什均衡简介

纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡。

所有局中人策略构成一个策略组合(StrategyProfile)。纳什均衡,从实质上说,是一种非合作博弈状态。

纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。

所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

在经济学中,均衡是经济学家物理学中借鉴并发展出来的一个概念。最直接的含义被看成是“力量的平衡”,或者用来表示没有内在“变革倾向”的一种状态。

在西方经济学中,均衡是一个被广泛运用的概念。均衡的最一般意义指经济体系中一个特定的经济单位或经济变量在一系列经济

力量的相互制约下所达到的一种相对静止并保持不变的状态。与物体的运动一样,经济体系中一个特定经济单位也同样受到不同方向的各种经济力量的制约。

在微观经济分析中,市场均衡可以分为局部均衡和一般均衡。局部均衡是单个市场或部分市场的供求和价格之间的关系和均衡状

态进行分析。一般均衡就是对一个经济社会中所有市场的供求和价格之间的关系和均衡状态进行分析。一般均衡假设的各种商品的供求和价格都是相互影响的,一个市场的均衡只有在其他所有市场都达到均衡的情况下才能实现。

三、市场营销中的纳什均衡问题

1、囚徒困境

两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱五年;若互相揭发,则因证据确实,二者都判刑两年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。

两个被捕的囚徒之间的一种特殊博弈,说明商家为什么甚至在合作对双方都有利时,保持合作也是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。在市场竞争中,一方选择有利于自身而未必有利于所有商家的竞争策略时,便是在有意识或者无意识的状态下,做了囚徒困境中“揭发”的选择,如:促销、搭售等;即使“合作”有时会更有利于商家,但由于信息的不对称、国家法律的相关规定或者市场竞争的实际情况等问题的存在,商家之间多数情况下会做出“揭发”的决定。

2、价格战中的纳什均衡

价格战是我国企业家最熟悉也是经常使用的一种市场营销方法,尤其是在白色家电行业尤为明显。在我国特有的“五一”、“十一”的假期中,降价促销已经成为各个家电品牌、超市卖场的必选项目。通常是某一个知名品牌在假期正式开始之前的一段时间内,通常是半个月至一个月,便开始通过各种媒体广告宣传价格促销活动。此时,其他家电厂家便面临着一个纳什均衡的策略选择问题,如果选择不降价策略,则有可能流失消费者,使自己的市场占有率降低,销量的下降会带来收入和利润的双损失,虽然可以保持品牌的高端市场定位,但是国内的大多数消费者还暂时没有被培养成家电品牌的粉丝;如果

选择跟风降价策略,那么可以保持市场占有率,收入和利润的损失可以降到最低。因此理性均衡的选择策略是降价。

降价厂家的想法是通过销售数量的增长,弥补价格下跌引起的

利润损失,即使不能完全弥补,扩大了市场占有率,增加了市场知名度也是对自身有益的。因此,价格战成为了很多家电厂商的常用武器。

背后主要的原因是:在家电行业,产品同质化竞争严重,在功能、质量、外观和售后服务等方面已经很难给消费者留下足够的辨识度,而价格成为最后一个、也是在短期促销中最为有效的方法,在这种背景下,一旦行业中有任何一家企业选择价格,按照纳什均衡的策略选择,其他所有企业为了保持市场份额,将不得不选择被动价格,虽然得利的消费者,也折射出家电行业的市场是不成熟的。

3、微信应用

微信是最近新兴一种扩大市场知名度,加强与消费者直接沟通的新型营销手段,受到了大多数厂家的青睐。其实,微信营销和之前的邮件营销、短信营销、微博营销甚至电话、小广告营销,在策略选择上,是一致的。

很多厂家通过投入较少的市场营销费用,大量的通过邮件、短信、微信甚至小广告去宣传、推广自身的产品或者服务。通过借助移动互联网的技术手段,使得营销成本大幅下降,平均到每一条上的成本基本上可以忽略不计,因为产品或者服务肯定是有市场需求的,一旦成交一笔业务,那么带来的回报就是极大的。可以说,如果没有做邮件、短信、微信、电话等营销方式,那么一定不会有业务;如果选择去做这种低价的市场营销方式,至少存在带来业务的可能性,在营销成本极低的情形下,业务回报率是可观的。因此,理性的策略选择是“做”。

四、结论

通过对新的市场营销理论的跟踪,对纳什均衡的介绍,结合二者的应用,得出如下结论:

在任何新的市场营销方法或者工具出现的时候,在不违反现行国家法律、市场规章制度及行业道德的情况下,应当优先采用;若已有竞争对手先行采用、推广,那么应在自身条件允许的情况下,为了保持进而提升市场占有率,也应当予以使用。

纳什均衡

纳什均衡简介 纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以 约翰·纳什命名。在一 个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组 合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。 一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。 纳什均衡的得来 关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在 普林斯顿大学攻读博士学位时完成 的。实际上,博弈论的研究起始于1944年冯·诺依曼( Von Neumann)和 奥斯卡·摩根斯坦 (Oscar Morgenstern)合著的《博弈论和经济行 为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下, 证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而 对“合作博弈 (Cooperative Game)”和“ 非合作博弈”做了明确 的区分和定义。阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。” 纳什均衡例子 博弈论中一个著名的例子就是囚徒困境。 囚徒困境是一个 非零和博弈,说的是两个嫌疑犯 甲和乙私人民宅联手作案,被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉 两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。于是,两个人同时陷入招供还是不招供的两难处境。结果是,尽管甲不知乙是否招供,但他认为自己选择“招供”最好,因而甲会选择“招供”,同样乙也会选择“招供”,两人各判5年。而两人都选择不招供,虽证据不足但因私人民宅将各拘留1年的结果是不会出现的。 博弈矩阵囚犯甲 招供不招供 囚犯乙招供判刑五年 甲判刑十年;乙判刑三个月 不招供

浅析囚徒困境与纳什均衡

浅析囚徒困境 囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。 囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效,中小学生课业负担不减反增。 又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。可是,我错了吗?没有。当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。可是,我对了吗?没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。 再看中国的法治之路。虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。不过,任何事物都有两面性,“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法治。 但囚徒困境一定是坏事吗?就以囚徒困境的经典案例来说,作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。 然而如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺,向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。比如在楼市的囚徒困境中,政府能适当调控房价,给予购房者房价稳定合理的承诺,那么楼市的囚徒困境是有可能破解的。 在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

纳什均衡

1.纳什均衡:给出对方的策略,你所选的是最优的(至少不比其它策略差),如果每个局 中人都是这样,那么所构成的策略组合(对局),就称为纳什均衡。 2.效用:消费者偏好与收入之间的相互作用导致人们做出消费选择,效用则是人们从这种 消费选择中所获得的愉悦或满足。 3.边际产量:当其他要素不变时,可变要素增加一个单位所带来的总产量的增加量。 4.生产成本:经营一个企业,为达到利润最大化,必须支付一些资金来维持运营,如建造 厂房,采购机器及原料,雇用员工等支出都可视为厂家的生产成本。 5.帕累托标准:如果一种变化可以改善某些人的处境,同时对其他人都没有伤害。则这种 变化是好事,应该给予实行。 6.恩格尔系数:是食品支出总额占个人消费支出总额的比重。一个家庭收入越少,家庭收 入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购买食物的支出将会下降。恩格尔系数是用来衡量家庭富足程度的重要指标。 7.效用:消费者偏好与收入之间的相互作用导致人们做出消费选择,效用则是人们从这种 消费选择中所获得的愉悦或满足。 8.价格管制:是指政府对新药定价以及上市药品价格上涨实施严格的管制,企业不能自由 定价,而是由政府和制药企业谈判决定新药的价格。 9.软着陆:当一个国家经过强劲的经济增长后,仍维持缓和的增长,并未因此转入衰退, 即使“软着陆”。 10.硬着陆:一个国家的经济在高速增长的同时伴随着高度通货膨胀,使得经济迅速从增高 长直接走入低增长甚至衰退。 11.通货膨胀:平均物价水平持续上扬的状态,通货膨胀率通常是以消费者物价指数(CPI) 的变化率来表示。指数上升→物价上升,货币购买力下降。 12.再贴现率:一般商业银行可以直接向中央银行借贷的利率。所谓“贴现”:通过一定的 方式把发生在未来(或不同时间)的费用和效益转化为现值的方式就叫贴现。 13.机会成本:在资源一定的情况下,多生产一个单位的某种产品,就要以少生产若干单位 的另一种产品为代价。这种放弃若干单位另一种产品生产的代价,就是生产某种成品的机会成本。 14.需求价弹性价格:指在市场需求曲线的任何一点,价格每变动1%所导致的需求量变动 的百分比。它是衡量产品需求量对产品价格变动的敏感指标。 15.生产函数(生产成本):企业在每个时期投入的各种生产要素的数量与获得的产出品的 数量之间的关系。 16.均衡及均衡价格:均衡:供给和需求达到平衡的状态。均衡价格:供需平衡时的价格。 有时被称为市场出清价格。 17.资源的概念及分类:指用于生产能满足人类需要的东西的那些物品或劳务。分类:自由 资源和经济资源 18.恩格尔曲线:某种商品的均衡购买量与消费者货币收入之间的关系。 1.药物需求与供给的特征:需求的特征:需求的不确定性、需求的最高优先性、需求的不 可替代性、需求的外部效应性、需求缺乏弹性、需求的被动性、独特的需求三方结构供给的特征:高质量性、高技术性、高投入性、高风险性、高回报性、高度集中性 2.影响药品需求的因素有哪些: (一)一般经济学因素:1.经济发展水平;2.价格水平(1)是否实施医疗保障制度(2)医疗保障制度下保障的范围(3)医疗保障制度的报销制度和自付比例等(二) 社会人口学因素(三)流行病学因素(四)临床医生和药师因素(五)医药技

纳什均衡不动点

纳什均衡的存在性与多重性 对于数学家来说,一个数学概念的存在性与唯一性是特别需要加以关注的。这是因为,从形式逻辑角度看,如果某个事物并不存在,那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的,因为对于不存在的事物来说,任何关于它的陈述或判断都不可能加以证伪。所以,倘若某个概念所对应的事物并不存在。那么,关于这个概念所给出的研究结论都必然不存在被证伪的可能。因而根据波普尔的证伪主义观点,这样的研究不具备科学上的意义。所以,我们在对任何新提出来的数学概念加以系统研究之前,首先需要弄清楚所研究的对象事物是否存在。 有许多被称为伪科学的东西,它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。譬如,所谓的特异功能或“超灵学”并未得到证实,而UFO研究迷们至今也未能拿出一件存在球外生命的证据,所以,特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。除了存在性之外,概念事物的唯一性也是数学家们所关心的问题。从纯理论的兴趣上看,数学家们更多地是从审美的角度上看待概念的唯一性,但从波普尔的证伪主义哲学看,模型均衡解的唯一性关系到模型的预测功能,从而是科学理论应基本具有的特征。我们在第二章中曾指出,理论的预测功能是判别理论的科学性的准绳,而在第三章中,我们提出用纳什均衡作为模型的预测结果。按照这样的逻辑,一个自然的推论就是:模型能否具有科学意义取决于纳什均衡的唯一性。因为倘若纳什均衡不是唯一的,那么就难以根据模型对即将出现的结果加以预测,这种不确定性对于科学理论来说是不存在的。再加上前面谈到的存在性问题,我们可以这样说,模型能否具有科学意义取决于纳什均衡的存在性和唯一性,因为这正是科学理论所具有的基本性质。 博弈论目前发展的情况是这样的:已经证明在非常一般的情况下,纳什均衡是存在的,这是一个好的结果;但是,在许多情形,模型的纳什均衡解不是唯一的,这被称为纳什均衡的多重性问题。 纳什在1950年代证明了纳什均衡的存在性定理,为非合作博弈打下了重要基础。纳什的工作不仅解决了存在性问题,而且还为其后的博弈论研究提供了一整套方法论工具,即运用不动点定理(fixed point theorem)这一强有力的数学工具进行博弈论数学分析,这对后来的博弈论甚至数理经济学的发展产生了很大的影响。纳什均衡的多重性问题至今仍是困扰博弈论学者的一个主要问题。为了攻克这一问题,博弈论专家已经做出了许多贡献,如聚点均衡、相关均衡,子博弈精炼纳什均衡,颤抖手均衡,序贯均衡等概念的提出。但不幸的是,这类努力还未使得多重均衡问题完全得到解决,许多博弈论专家正在这一领域进行着不懈的工作。 本章将给出纳什均衡的存在性定理和讨论存在多重均衡情况下的均衡选择问题。

纳什均衡的应用

纳什均衡的应用 1.考虑不对称的古诺双头垄断,市场反需求函数为Q p -=115,A 企业生产的固定成本 为1000,B 企业没有固定成本,A 和B 两个企业的可变成本分别为2a q 和2b q 。 (1)请写出A 公司的古诺反应函数的表达式。 (2)请写出B 公司的古诺反应函数的表达式。 (3)请求出纳什均衡时两个企业的产量和利润。 2.在贝特兰德模型中,假定每个企业的最大生产能力是K ,单位生产成本为c =10,需求为100,如果两个企业的价格相同,市场需求在二者之间平分;如果j i P P < (i ,j =1,2,i ≠j),企业i 产量为Min{100-P i ,K},企业j 的产量为Min[Max(0,100-P i -K),K](即只有低价企业不能满足需求时,高价企业才生产,并且产量不超过生产能力)。 (1)求企业的得益函数; (2)假定300,即两国税收的替代系数。假定两国是同时决策,征税的边际成本为c 1,c 2>0,无固定成本。试求解该博弈问题的纳什均衡。 7.五户居民都可以在一个公共的池塘里放养鸭子。每只鸭子的收益v 是鸭子总数N 的函数,并取决于N 是否超过某个临界值N ;如果N N <,收益N N v v -==50)(;如果N N ≥时,0)(=N v 。再假设每只鸭子的成本为c =2元。若所有居民同时决定养鸭的数量,问该博弈的纳什均衡是什么? 8.一群渔夫在一个特定有限的区域内集体作业。该区域捕鱼的回报依赖于整体的总作业时

答疑]动态博弈与子博弈精练纳什均衡

我们已经了解了完全信息静态博弈的内容。这时候,参与人同时行动,或者不同时行动,但是后动的人观察不到先动的人的任何有关其行动的信息,这于同时行动等价。这时候,任何一个参与人选择行动的时候,没有任何可以依据的信息。 当博弈成为动态的时候,参与人先后行动,后动者可以观察到先动者的行动,因此,后动者选择他的行动的时候,可以依据观察到的信息作选择。因为先动者可能采取的行动是若干个,所以后动者就有可能观察到同样多的信息。因此,这时后动者选择的已经不简单的行动,而是一套完整的行动计划——这套行动计划指出,在观察到不同的信息时该怎样随机应变选择自己的行动。因此,现在后动者的选择变量就是行动计划,我们就把一套完整的行动计划叫做一个策略。 以下图为例,参与人1先动,之后参与人2行动,参与人2可以观察到参与人1的选择。参与人的选择就是L或者R,这既是他的行动有时他的策略,因为参与人1行动时可能出现的信息只有一种情况——空信息集——因为他先动,这时什么信息也没有。1行动之后,1的行动可以被2观察,因此2可能观察到的信息就有可能是L或者R,因此,2的行动会根据这些信息作出。2的一套完整的行动计划应该告诉他,在观察到L时选择什么,观察到R时选择什么,由此我们也可以看出,如果2把行动的选择委托给另外的人,这个人可以根据2的行动计划处理任何可能发生或者面对的形式。这样,2的行动计划——我们称为策略,就有四种可能: 1,观察到L时,选F,观察到R时,选F。我们用一个有序二维向量(F,F)表示。 2,观察到L时,选F,观察到R时,选C。我们用一个有序二维向量(F,C)表示。 3,观察到L时,选C,观察到R时,选F。我们用一个有序二维向量(C,F)表示。 4,观察到L时,选C,观察到R时,选C。我们用一个有序二维向量(C,C)表示。 总结:参与人1的行动是L或者R,由于是先动,没有信息,所以策略也就是行动。 参与人2的行动是F或者C,由于是后动,有信息,策略是建立在信息上的完整行动——计划,有四个策略:(F,F),(F,C)(C,F)(C,C)。 参与人1 L R 参与人2 参与人2 F C F C 6 4 5 8 6 1 ‐10 ‐3

浅析囚徒困境与纳什均衡

浅析囚徒困境 令狐采学 囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。 囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效,中小学生课业负担不减反增。 又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。可是,我错了吗?没有。当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。可是,我对了吗?没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的

经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。 再看中国的法治之路。虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。不过,任何事物都有两面性,“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法治。 但囚徒困境一定是坏事吗?就以囚徒困境的经典案例来说,作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。 然而如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺,向另一方表示合

高鸿业,微观经济学,第七版,课后答案,西方经济学18第十章博弈论初步

第十章 博弈论初步 第一部分 教材配套习题本习题详解 一、简答题 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是 最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒 困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人 (如 A和 B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211a a a a B 的支付矩阵=??? ???2221 1211b b b b 例如:a 11=a 12=a 21=a 22,b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。 具体事例为: 73737373?? ?? ??

3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的 纳什均衡可能有4个、3个、2个、1个和0个五种情况,所以可能有3个。例如,当参与 人A与B的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??? ???22211211a a a a B 的支付矩阵=11122122b b b b ???????? A 、 B 共同的支付矩阵=1111121222222121a b a b a b a b ?? ?????? 具体事例为: 76157323?? ?? ?? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所 有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解 为两个参与人的支付矩阵;其次,在第一个 (即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次,在第二个 (在位于整个博弈矩阵上 方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线;然后,将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合 代表的策略组合就是博弈的纳什均衡。 5.设有A、B两个参与人。对于参与人A的每一个策略,参与人B的条件策略有无 可能不止一个?试举一例说明。 解答:例如,在如表10—1的二人同时博弈中,当参与人 A选择上策略时,参与人 B 既可以选择左策略,也可以选择右策略,因为他此时选择这两个策略的支付是完全一样 的。因此,对于参与人A的上策略,参与人B的条件策略有两个,即左策略和右策略。 表10—1

纳什均衡点

纳什均衡点 纳什均衡点纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。 如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。 [编辑本段]例子 经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。于是,两人同时陷入招供还是不招供的两难处境。如果两人均不招供,将最有利,只被判刑三年。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。这时,个体的理性利益选择是与整体的理性利益选择不一致的。 囚犯甲的博弈矩阵 囚犯甲 招供不招供 囚犯乙招供判刑五年甲判刑十年;乙判刑一年 不招供甲判刑一年;乙判刑十年甲判刑三年 基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。事实上,这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。 [编辑本段]学术争议和批评 第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发

团队管理中的纳什均衡

团队管理中的纳什均衡 众所周知,团队就是由每一位个体员工和管理者个体组成的一个共同体,该共同体能够集中每个个体的知识、智慧和技能优势,促进个体之间的高度互补与工作协调,并形成团队优质,解决问题,实现共同目标,而纳什均衡则是指定博弈、对策和游戏中的一种情形,一种给定博弈、对策和游戏对手的最佳选择,自己的最佳选择,即每个人都从利己的角度出发做出最佳选择,选择对自己最有利的策略,而不考虑社会福利或其他对手的利益,这种策略组合由所有局中人的最佳策略组合构成,在缺乏有效外力推动的情况下,没有人会主动改变自己的策略以便获得更大利益。在团队管理中,如果团队成员之间的选择是在非完全信息对称的情况下做出的,则团队建设就很有可能遇到纳什均衡。下面我们试分析之。 企业文化与个人追求 企业文化是作为一个组织的企业内部的全体员工的共同价值观和道德准则,共同的精神追求和行为规范,从人本逻辑上来讲,企业文化则是企业家文化,而企业家文化的形成和确定,则必然打上企业家个人的价值取向烙印,即企业家自己的所谓最有利的选择。而团队成员在某种特定的企业文化氛围里边也有着每个人的追求,即所谓的

他所做的对自己最有利的选择,如果团队成员的选择与企业家的选择是一致的,这构成一种合作均衡,否则,团队成员的选择与企业的选择不同甚至完全相反,这就形成了纳什均衡。如在市场经济条件下,一家企业文化的价值追求体系是效率公平,则每一个团队在这种特定选择中,彼此的最佳选择就是追求效益最大化,更快更好地完成团队目标,其结果是企业目标的顺利实现;相反如果一家企业文化的价值追求体系是伦理公平,讲求平均主义,则每一个团队及其成员则会在这种给定选择中,彼此的最佳选择就是追求不劳而获,减少劳动量,甚至是高效能人才的大量流失和闲置,其结果是企业目标的落空。 团队精神与团队冲突团队 精神要求团队每个成员的行为能够积聚团队的整体优势,形成合力,解决问题,向团队目标迈进,而团队冲突则是由于团队成员在交往中产生意见与分歧,出现分歧,对抗导致彼此间关系紧张的局面,如果团队成员都能把团队精神视作其他成员的行为出发点和落脚点,那么该成员则也会做好他的最佳选择--做团队精神的捍卫者和实践者,从而达成每一个成员的最佳选择;相反如果团队成员认为其他成员完全站在对抗和竞争的立场上与之对话,那么该成员也必然会站在同样的立场上做出选择,其结果导致团队冲突升级,如果在冲突升级过程中没有任何成员做出重新的以团队精神为导向的选择,那么团队精神就会沦为乌有,团队也会走向解体。 职责分工与利益分配 在团队管理中,进行岗位的职责分工并进行相对应的利益分配是

浅析囚徒困境与纳什均衡

浅析囚徒困境 欧阳学文 囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。 囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效,中小学生课业负担不减反增。 又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。可是,

我错了吗?没有。当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。可是,我对了吗?没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。 再看中国的法治之路。虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。不过,任何事物都有两面性,“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法

浅谈纳什均衡

浅谈纳什均衡 第一次接触到纳什均衡是在电影《美丽心灵》里边,主人公约翰·纳什经过不断探索和创新提出了他梦想的原创理论——纳什均衡定律。 关于纳什均衡的来源,有一段有趣的小故事。约翰·纳什假设有四男五女,其中有位女士长得非常漂亮以至于所有的男士都去追求这个女士。由于漂亮女士的天生孤傲,她拒绝了所有人的追求。于是这四个男士退而求其次,去追求另外四个女士。而这四个女士都不想作为第二个选择,所以都拒绝了这四个男士,公共利益为零。这时,约翰·纳什就想道:如果这四个男士一开始都不去追求那位漂亮女士而是直接去追求那四个不那么漂亮的女士,那么毫无疑问都会成功,这时公共效益达到最大。不管信还是不信,这个故事便是纳什均衡的最初来源了。 亚当·斯密,现代经济学之父,曾经提出:在竞争中,个人的野心往往会促进公共效益。但是约翰·纳什在普林斯顿大学发表的博士论文彻底推翻了统治了经济学界100多年的亚当·斯密的重要理论。经过一段时间后,纳什的理论像是一个炸弹爆炸在了各相关学界,引起了相当大的轰动。约翰·纳什也由于他的原创理论获得了1994年的诺贝尔经济学奖。 随着时间的推移,纳什的理论逐渐进入到博弈学领域,并且成为博弈学界不可或缺的支撑理论。 纳什均衡的定义:假设有n个局中人参与博弈,给定其他人策略

的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态。 标准定义,在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1, si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1, sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。 关于纳什均衡最经典的案例莫过于囚徒困境了,关于这个经典案例已经分析得太多太多,这里就不详细介绍了。 那么就通过生活中的例子来简单加入纳什均衡定理吧。话说马上就要期末考试了,有小A同学和小B同学两位刻苦学习的好孩子。他们相约一起复习,假设两人对各个学科的掌握情况不一致,小A对《经济学原理》比较熟络,而小B则更加擅长于《博弈与实践》课程。于是他们两个就打起了小算盘:如果小A和小B都自己复习自己所掌握

对策论中的纳什均衡应用

对策论中的纳什均衡应用 相对于对策论中的其他模型方法,博弈论是一种独特的处于各学科之间的 研究人类决策行为的方法,或者是研究人们在互动情况下所采取的策略,在现 实生活的选择中,我们会经常运用使用博弈去选择策略,无论是自觉的还是无 意识的。本文主要探讨博弈博弈论中的纳什均衡在对策论中的应用,即在不确 定条件下,人们所冒的风险很大,这种情况选择合适的战略就显得尤为关键和 重要。 1.博弈论中的纳什均衡 以博弈论中,以经济主体人的自利行为以及相应的市场反应作为研究的出 发点,无论是消费者还是生产者,也无论是竞争形势还是垄断形势,基本上是 经济主体人面对市场做出自己的最优决策。但是我们知道,作为主体人作出决 策时,不但要面对市场,还要面对作为竞争对手的其他经济主体,因此主体人 作出决策的后果,则是主体人自己的决策及竞争对手决策的共同的结果,这就 是博弈,它有一个前提,即理性人的假定。 纳什均衡是一种不确定条件下的博弈,即非合作、不完全信息下的博弈, 又叫做非合作博弈均衡,是博弈论的一个重要术语,因约翰·纳什而得名。它的定义可以这样理解:假设有n个局中人参与博弈,在给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于、也可能不依赖于 他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合。 纳什均衡指的是这样一种策略组合:这种策略组合由所有参与人最优策略组成,即在给定另人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从 实质上是说是一种非合作博弈状态。 2.纳什均衡及其在对策论中的应用 2.1囚徒困境及其应用 博弈论中一个很著名的例子——囚徒困境,就是一具典型的纳什均衡。两个小偷在行窃现场附近被抓获并被警方隔离拷问。每个小偷都必须选择是否坦 白和揭发对方。如果两个小偷都不坦白,他们都将判刑1年,如果每个小偷都 坦白并揭发对方,他们都将判刑10年,但是,如果一个坦白并揭发对方,而另

纳什均衡的启示及其应用

纳什均衡的启示及其应用 【摘要】本文介绍了博弈论中的纳什均衡——非合作博弈的概念、进化、原理和现象,并列举了纳什均衡理论在社会生活、经济生活以及企业管理等方面的应用和作用机理,从而论证了纳什均衡的理论研究意义和其在实践中的价值。 【关键词】纳什均衡企业人才流失商业价格竞争环境污染贸易壁垒 “博弈”一词是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语。天才数学家纳什深入研究了非合作领域的博弈现象,对博弈论做出了杰出的贡献。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。 纳什均衡是完全信息静态博弈解的一般概念,是最常见的均衡,是非合作对策中的一种自然趋向解。纳什均衡理论彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石。 一、纳什均衡的进化 “纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。著名的“囚徒故事”中两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲,勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。 从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。博弈论在现实中的应用很多。首先,它是一种数学理论,可以用于经济学等领域;再者,它作为一种理论,并非产生直接

博弈类型及其表述形式

博弈类型及其表述形式 1 博弈的分类 博弈模型一般分为合作博弈(cooperative game )和非合作博弈(non- cooperative game ),如图 1.1。合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素(Martin J.Osborne and Ariel Rubinstein ,2000,P2),也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。合作博弈强调的是团体理性(collective rationality )、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的(张维迎,1996,P5)。20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下(Martin J.Osborne and Ariel Rubinstein ,2000,P2)。 合作博弈,有时也叫做联盟博弈(coalitional game ),一般根据有无转移支付而分为两类:可转移支付联盟博弈(coalitional game with transferable payoff )和不可转移支付联盟博弈(coalitional game with non-transferable payoff )。可转移支付也叫有旁支付(side payment ),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联盟博弈。 图1.1 博弈的分类 非合作博弈的分类主要从两个角度进行划分。一是参与者的行动顺序。 从这个角度博弈

寻找三个纳什均衡

1.首先将原始数据带入博弈计算程序,可以得到如下的答案:可以看到其中一个是纯策略,两个是混合策略。 2.首先用划线法找出可以找到第一个纯策略。 纯策略下张三和李四的收益组合为:(60,76),张三和李四的策略分别为(0,1,0)和(0,0,1)3.用消去法消去划线的两行 这样得到一个新的组合, P 1-P

假设新的组合是符合混合纳什均衡策略 那么 张三选上下的策略为P ,1-P ; 李四选左中的策略为S,1-S. 根据纳什均衡的条件:李四的策略概率S ,1-S ,使得张三选择上下策略收益相同: 得到一个等式:12S+42(1-S)=72S+36(1-S). S=1/11 1-S=10/11; 此时张三的收益为:=12×1/11+42×10/11 = 432/11 = 39.27; 同样张三的概率P,1-P,使得李四选择左中的收益相等: 得等式:83P+47(1-P)=56P+95(1-P) P=16/25;1-P=9/25; 此时李四的收益:=83×16/25+47×9/25=53.12+16.92=70.04 综上为第二个混合策略纳什均衡张三和李四的策略分别为:(16/25,0,9/25)和(1/11,10/11,0),张三和李四的收益为(39.27,70.04) 第三步:一般的混合纳什均衡 设张三选择上中下的策略概率分别为p,q,1-p-q ;李四选择左中右的策略概率分别为s,t,1-s-t ; 李四的策略要使张三的策略收益相同: 12s + 42t + 42(1-s-t)=24s + 12t + 60(1-s-t)=72s + 36t + 42(1-s-t) s=1/27, t=10/27, 1-s-t= 16/27 此时张三的收益 张三收益 = 12*1/27+42*10/27+42*16/27=(12+420+672)/27=1104/27=40.89 同上可知张三需要确定一个行动概率,以使李四的选择在其收益上没有差异,得等式: 83p + 12q +47(1-p-q) = 56p + 42q + 95(1-p-q)=45p + 76q + 59(1-p-q) p=113/200, q=5/16, 1-p-q=49/400 此时李四的收益为 李四收益 =83*113/200+12*5/16+47*49/400=46.895+3.755.7575=56.40 综上,此混合策略纳什均衡相对于张三和李四的策略选择用概率分别表述为(113/200,5/16, 49/400)和(1/27,10/27,16/27),收益分别为(40.89,56.40) 第四步:最后策略 三个策略的收益为:(60,76)(39.27,70.04)和40.89,56.40) 通过帕累托上策为(60,76)对双方来说收益最大,所以张三(0,1,0),李 四(0,0,1)的纳什均衡点应是实际行为最可能的结果。 1-S S

相关文档
最新文档