游戏-纳什均衡

游戏-纳什均衡
游戏-纳什均衡

纳什均衡

AB两家寡头共同占有一个市场,在每个企业都不做广告时,每年各获利润500万元,如果两家都做广告,每年两家各获利100万元,如果A做广告B不做,A每年获利1000万元,B每年损失100万元,如果B做广告A不做,则B每年获利1000万元,A损失100万元。用博弈矩形图分析两家共同广告行为:最后回是什么结果?

这是经典的囚徒困境,结果当然是都做广告,即:纳什均衡

因为假设B做广告,那么A的做法显然是做广告。因为在这种情况下A做广告的利润为:100万元,而A不做广告的利润为:损失100万元,换句话说:假设B做广告,A有两种选择,一种是得到100万,一种是损失100万,当然选择做广告得到100万。

再假设B不做广告,那么A的做法还是做广告,因为在这种情况下A做广告的利润为:1000万元,而A不做广告的利润为500万元,换句话说,假设B不做广告,A有两种选择,一种是得到1000万,一种是得到500万,当然选择做广告得到1000万。

同理B,也是理性的,他也可以用完全相同的思路,就是说不管对方做还是不做广告,选择做广告都是一种理性行为,尽管都不做广告比最后的结果都做广告利润更有吸引力,但这是合作的结果,并不是博弈均衡!

总结:尽管双方合作(不做广告)可以带来更多的好处,但在这种情况下A或者B都有改变主意的意愿,因为他们都可以通过改变主意使自己的处境变得更好,到最后只能两家都做广告,因为都做广告的时候,双方都没有任何方法余地改善自己的状况,即:纳什均衡!

总之:选择不做广告是有风险的,因为不做广告更使对方更有贪婪之心,而选择做广告,在这种情况下自己的情况是最坏的了(损失100万),文学家伏尔泰曾一语道破天机:有时候我们所指望的最好的结果,其实就是避免最差!

要对孩子有规划,定好格局。每年年初定目标,年尾总结。每天记一篇英文日记。坚决培养孩子的专注和坚持,毫不动摇。

在去虹桥机场的车上,张老师还谆谆教导:世界上没有一个过着舒适生活不知道自律的人能成功的,该严厉的时候做虎妈吧。

纳什均衡

纳什均衡简介 纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以 约翰·纳什命名。在一 个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组 合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。 一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。 纳什均衡的得来 关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在 普林斯顿大学攻读博士学位时完成 的。实际上,博弈论的研究起始于1944年冯·诺依曼( Von Neumann)和 奥斯卡·摩根斯坦 (Oscar Morgenstern)合著的《博弈论和经济行 为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下, 证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而 对“合作博弈 (Cooperative Game)”和“ 非合作博弈”做了明确 的区分和定义。阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。” 纳什均衡例子 博弈论中一个著名的例子就是囚徒困境。 囚徒困境是一个 非零和博弈,说的是两个嫌疑犯 甲和乙私人民宅联手作案,被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉 两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。于是,两个人同时陷入招供还是不招供的两难处境。结果是,尽管甲不知乙是否招供,但他认为自己选择“招供”最好,因而甲会选择“招供”,同样乙也会选择“招供”,两人各判5年。而两人都选择不招供,虽证据不足但因私人民宅将各拘留1年的结果是不会出现的。 博弈矩阵囚犯甲 招供不招供 囚犯乙招供判刑五年 甲判刑十年;乙判刑三个月 不招供

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论与社会选择中的理性

博弈论与社会选择中的理性 第一讲个体理性决策与博弈论 经济学的两个基本观念:理性(rationality)与折中权衡(trade-off) 什么意义上,我们可以运用理性选择理论,实现什么目的?描述或解释人类行为,进行机制设计的基础 行为者(决策者、博弈者)对所处场景的主观认知:物我两分;形式系统及其解释 有界理性: 理论性概念与经验性概念:Craig定理 社会物理学:个体理性决策、博弈论与社会选择,机制设计 社会科学的两大基石:博弈论与社会选择 博弈论的两个互补观念:协调性与稳定性(稳健性) 作为描述性理论的as if解释:图灵实验 描述性与规范性之间的不协调 个体理性决策

阿罗:“方法论个人主义的当代形式是博弈论”,“所有解释都必须以个人之间的行动和对行动的回应的方式进行”(Arrow, 1994, p5, p1)。 “我们研究的模型假设每个决策者在如下意义上是理性的,他知道他的可选择对象,形成关于任何未知事物的预期,具备清晰的偏好,在某些优化过程后深思熟虑地选择他的行为”(Osborne & Rubinstein, 1994, p4)。 选择、偏好、效用 选择:一致性(consistency),弱显示偏好公理 偏好: 完全性:不能不选择 传递性: R A x M∈ ? A = ∈ A , y } : { , (xRy ) x R A G? = A ∈ ? ∈ { y , } ) : A (yPx , Rational Fool :tie-breaking 布里丹的驴子 “全局理性”:How to decide … how to decide to how decide rationally Herbert Simon:“bounded rationality”;满意原则(秘书问题),是一种进化出来的能力而非计算的结果 选择规则 如果假设一个决策者对所有备选方案都是无差异的,那么任何行为都可以被理性化。但是,理论的强度越弱,预见性也越差。 满足连续性的偏好可以被一个效用函数所表示。 偏好和效用反映了行为主体的主观性判断。利己主义、利他主义与妒忌型人格可以被区分开。 不确定环境(行动与结果之间的对应关系)下的决策 个体知识的划分(partition)刻画:非幻觉性;如果你知道某事,那么你知道你知道某事;如果你不知道某事,那么你知道自己不知道某事 风险、不确定性、无知 两类模型,决策者在两类模型中都是在彩票中进行选择。概率(probability)模型定义的彩票是彩金的概率分布,适用于描述客观未知(objective unknowns)情形,即奈特所谓的风险(risk)和(Anscombe & Aumann ,1963)中的轮盘(roulette)彩票;状态变量

纳什均衡

1.纳什均衡:给出对方的策略,你所选的是最优的(至少不比其它策略差),如果每个局 中人都是这样,那么所构成的策略组合(对局),就称为纳什均衡。 2.效用:消费者偏好与收入之间的相互作用导致人们做出消费选择,效用则是人们从这种 消费选择中所获得的愉悦或满足。 3.边际产量:当其他要素不变时,可变要素增加一个单位所带来的总产量的增加量。 4.生产成本:经营一个企业,为达到利润最大化,必须支付一些资金来维持运营,如建造 厂房,采购机器及原料,雇用员工等支出都可视为厂家的生产成本。 5.帕累托标准:如果一种变化可以改善某些人的处境,同时对其他人都没有伤害。则这种 变化是好事,应该给予实行。 6.恩格尔系数:是食品支出总额占个人消费支出总额的比重。一个家庭收入越少,家庭收 入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购买食物的支出将会下降。恩格尔系数是用来衡量家庭富足程度的重要指标。 7.效用:消费者偏好与收入之间的相互作用导致人们做出消费选择,效用则是人们从这种 消费选择中所获得的愉悦或满足。 8.价格管制:是指政府对新药定价以及上市药品价格上涨实施严格的管制,企业不能自由 定价,而是由政府和制药企业谈判决定新药的价格。 9.软着陆:当一个国家经过强劲的经济增长后,仍维持缓和的增长,并未因此转入衰退, 即使“软着陆”。 10.硬着陆:一个国家的经济在高速增长的同时伴随着高度通货膨胀,使得经济迅速从增高 长直接走入低增长甚至衰退。 11.通货膨胀:平均物价水平持续上扬的状态,通货膨胀率通常是以消费者物价指数(CPI) 的变化率来表示。指数上升→物价上升,货币购买力下降。 12.再贴现率:一般商业银行可以直接向中央银行借贷的利率。所谓“贴现”:通过一定的 方式把发生在未来(或不同时间)的费用和效益转化为现值的方式就叫贴现。 13.机会成本:在资源一定的情况下,多生产一个单位的某种产品,就要以少生产若干单位 的另一种产品为代价。这种放弃若干单位另一种产品生产的代价,就是生产某种成品的机会成本。 14.需求价弹性价格:指在市场需求曲线的任何一点,价格每变动1%所导致的需求量变动 的百分比。它是衡量产品需求量对产品价格变动的敏感指标。 15.生产函数(生产成本):企业在每个时期投入的各种生产要素的数量与获得的产出品的 数量之间的关系。 16.均衡及均衡价格:均衡:供给和需求达到平衡的状态。均衡价格:供需平衡时的价格。 有时被称为市场出清价格。 17.资源的概念及分类:指用于生产能满足人类需要的东西的那些物品或劳务。分类:自由 资源和经济资源 18.恩格尔曲线:某种商品的均衡购买量与消费者货币收入之间的关系。 1.药物需求与供给的特征:需求的特征:需求的不确定性、需求的最高优先性、需求的不 可替代性、需求的外部效应性、需求缺乏弹性、需求的被动性、独特的需求三方结构供给的特征:高质量性、高技术性、高投入性、高风险性、高回报性、高度集中性 2.影响药品需求的因素有哪些: (一)一般经济学因素:1.经济发展水平;2.价格水平(1)是否实施医疗保障制度(2)医疗保障制度下保障的范围(3)医疗保障制度的报销制度和自付比例等(二) 社会人口学因素(三)流行病学因素(四)临床医生和药师因素(五)医药技

答疑]动态博弈与子博弈精练纳什均衡

我们已经了解了完全信息静态博弈的内容。这时候,参与人同时行动,或者不同时行动,但是后动的人观察不到先动的人的任何有关其行动的信息,这于同时行动等价。这时候,任何一个参与人选择行动的时候,没有任何可以依据的信息。 当博弈成为动态的时候,参与人先后行动,后动者可以观察到先动者的行动,因此,后动者选择他的行动的时候,可以依据观察到的信息作选择。因为先动者可能采取的行动是若干个,所以后动者就有可能观察到同样多的信息。因此,这时后动者选择的已经不简单的行动,而是一套完整的行动计划——这套行动计划指出,在观察到不同的信息时该怎样随机应变选择自己的行动。因此,现在后动者的选择变量就是行动计划,我们就把一套完整的行动计划叫做一个策略。 以下图为例,参与人1先动,之后参与人2行动,参与人2可以观察到参与人1的选择。参与人的选择就是L或者R,这既是他的行动有时他的策略,因为参与人1行动时可能出现的信息只有一种情况——空信息集——因为他先动,这时什么信息也没有。1行动之后,1的行动可以被2观察,因此2可能观察到的信息就有可能是L或者R,因此,2的行动会根据这些信息作出。2的一套完整的行动计划应该告诉他,在观察到L时选择什么,观察到R时选择什么,由此我们也可以看出,如果2把行动的选择委托给另外的人,这个人可以根据2的行动计划处理任何可能发生或者面对的形式。这样,2的行动计划——我们称为策略,就有四种可能: 1,观察到L时,选F,观察到R时,选F。我们用一个有序二维向量(F,F)表示。 2,观察到L时,选F,观察到R时,选C。我们用一个有序二维向量(F,C)表示。 3,观察到L时,选C,观察到R时,选F。我们用一个有序二维向量(C,F)表示。 4,观察到L时,选C,观察到R时,选C。我们用一个有序二维向量(C,C)表示。 总结:参与人1的行动是L或者R,由于是先动,没有信息,所以策略也就是行动。 参与人2的行动是F或者C,由于是后动,有信息,策略是建立在信息上的完整行动——计划,有四个策略:(F,F),(F,C)(C,F)(C,C)。 参与人1 L R 参与人2 参与人2 F C F C 6 4 5 8 6 1 ‐10 ‐3

纳什均衡不动点

纳什均衡的存在性与多重性 对于数学家来说,一个数学概念的存在性与唯一性是特别需要加以关注的。这是因为,从形式逻辑角度看,如果某个事物并不存在,那么关于这个杜撰中的事物所给出的任何陈述或判断都可认为是正确的或错误的,因为对于不存在的事物来说,任何关于它的陈述或判断都不可能加以证伪。所以,倘若某个概念所对应的事物并不存在。那么,关于这个概念所给出的研究结论都必然不存在被证伪的可能。因而根据波普尔的证伪主义观点,这样的研究不具备科学上的意义。所以,我们在对任何新提出来的数学概念加以系统研究之前,首先需要弄清楚所研究的对象事物是否存在。 有许多被称为伪科学的东西,它们之所以被人们认为是“伪科学”的原因就是它们大肆谈论的东西并不存在或并未被证实其存在性。譬如,所谓的特异功能或“超灵学”并未得到证实,而UFO研究迷们至今也未能拿出一件存在球外生命的证据,所以,特异功能学或“超灵学”或“不明飞行物学”实际上都可被归入伪科学。除了存在性之外,概念事物的唯一性也是数学家们所关心的问题。从纯理论的兴趣上看,数学家们更多地是从审美的角度上看待概念的唯一性,但从波普尔的证伪主义哲学看,模型均衡解的唯一性关系到模型的预测功能,从而是科学理论应基本具有的特征。我们在第二章中曾指出,理论的预测功能是判别理论的科学性的准绳,而在第三章中,我们提出用纳什均衡作为模型的预测结果。按照这样的逻辑,一个自然的推论就是:模型能否具有科学意义取决于纳什均衡的唯一性。因为倘若纳什均衡不是唯一的,那么就难以根据模型对即将出现的结果加以预测,这种不确定性对于科学理论来说是不存在的。再加上前面谈到的存在性问题,我们可以这样说,模型能否具有科学意义取决于纳什均衡的存在性和唯一性,因为这正是科学理论所具有的基本性质。 博弈论目前发展的情况是这样的:已经证明在非常一般的情况下,纳什均衡是存在的,这是一个好的结果;但是,在许多情形,模型的纳什均衡解不是唯一的,这被称为纳什均衡的多重性问题。 纳什在1950年代证明了纳什均衡的存在性定理,为非合作博弈打下了重要基础。纳什的工作不仅解决了存在性问题,而且还为其后的博弈论研究提供了一整套方法论工具,即运用不动点定理(fixed point theorem)这一强有力的数学工具进行博弈论数学分析,这对后来的博弈论甚至数理经济学的发展产生了很大的影响。纳什均衡的多重性问题至今仍是困扰博弈论学者的一个主要问题。为了攻克这一问题,博弈论专家已经做出了许多贡献,如聚点均衡、相关均衡,子博弈精炼纳什均衡,颤抖手均衡,序贯均衡等概念的提出。但不幸的是,这类努力还未使得多重均衡问题完全得到解决,许多博弈论专家正在这一领域进行着不懈的工作。 本章将给出纳什均衡的存在性定理和讨论存在多重均衡情况下的均衡选择问题。

高鸿业,微观经济学,第七版,课后答案,西方经济学18第十章博弈论初步

第十章 博弈论初步 第一部分 教材配套习题本习题详解 一、简答题 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是 最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒 困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人 (如 A和 B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211a a a a B 的支付矩阵=??? ???2221 1211b b b b 例如:a 11=a 12=a 21=a 22,b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。 具体事例为: 73737373?? ?? ??

3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的 纳什均衡可能有4个、3个、2个、1个和0个五种情况,所以可能有3个。例如,当参与 人A与B的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??? ???22211211a a a a B 的支付矩阵=11122122b b b b ???????? A 、 B 共同的支付矩阵=1111121222222121a b a b a b a b ?? ?????? 具体事例为: 76157323?? ?? ?? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所 有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解 为两个参与人的支付矩阵;其次,在第一个 (即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次,在第二个 (在位于整个博弈矩阵上 方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线;然后,将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合 代表的策略组合就是博弈的纳什均衡。 5.设有A、B两个参与人。对于参与人A的每一个策略,参与人B的条件策略有无 可能不止一个?试举一例说明。 解答:例如,在如表10—1的二人同时博弈中,当参与人 A选择上策略时,参与人 B 既可以选择左策略,也可以选择右策略,因为他此时选择这两个策略的支付是完全一样 的。因此,对于参与人A的上策略,参与人B的条件策略有两个,即左策略和右策略。 表10—1

团队管理中的纳什均衡

团队管理中的纳什均衡 众所周知,团队就是由每一位个体员工和管理者个体组成的一个共同体,该共同体能够集中每个个体的知识、智慧和技能优势,促进个体之间的高度互补与工作协调,并形成团队优质,解决问题,实现共同目标,而纳什均衡则是指定博弈、对策和游戏中的一种情形,一种给定博弈、对策和游戏对手的最佳选择,自己的最佳选择,即每个人都从利己的角度出发做出最佳选择,选择对自己最有利的策略,而不考虑社会福利或其他对手的利益,这种策略组合由所有局中人的最佳策略组合构成,在缺乏有效外力推动的情况下,没有人会主动改变自己的策略以便获得更大利益。在团队管理中,如果团队成员之间的选择是在非完全信息对称的情况下做出的,则团队建设就很有可能遇到纳什均衡。下面我们试分析之。 企业文化与个人追求 企业文化是作为一个组织的企业内部的全体员工的共同价值观和道德准则,共同的精神追求和行为规范,从人本逻辑上来讲,企业文化则是企业家文化,而企业家文化的形成和确定,则必然打上企业家个人的价值取向烙印,即企业家自己的所谓最有利的选择。而团队成员在某种特定的企业文化氛围里边也有着每个人的追求,即所谓的

他所做的对自己最有利的选择,如果团队成员的选择与企业家的选择是一致的,这构成一种合作均衡,否则,团队成员的选择与企业的选择不同甚至完全相反,这就形成了纳什均衡。如在市场经济条件下,一家企业文化的价值追求体系是效率公平,则每一个团队在这种特定选择中,彼此的最佳选择就是追求效益最大化,更快更好地完成团队目标,其结果是企业目标的顺利实现;相反如果一家企业文化的价值追求体系是伦理公平,讲求平均主义,则每一个团队及其成员则会在这种给定选择中,彼此的最佳选择就是追求不劳而获,减少劳动量,甚至是高效能人才的大量流失和闲置,其结果是企业目标的落空。 团队精神与团队冲突团队 精神要求团队每个成员的行为能够积聚团队的整体优势,形成合力,解决问题,向团队目标迈进,而团队冲突则是由于团队成员在交往中产生意见与分歧,出现分歧,对抗导致彼此间关系紧张的局面,如果团队成员都能把团队精神视作其他成员的行为出发点和落脚点,那么该成员则也会做好他的最佳选择--做团队精神的捍卫者和实践者,从而达成每一个成员的最佳选择;相反如果团队成员认为其他成员完全站在对抗和竞争的立场上与之对话,那么该成员也必然会站在同样的立场上做出选择,其结果导致团队冲突升级,如果在冲突升级过程中没有任何成员做出重新的以团队精神为导向的选择,那么团队精神就会沦为乌有,团队也会走向解体。 职责分工与利益分配 在团队管理中,进行岗位的职责分工并进行相对应的利益分配是

纳什均衡点

纳什均衡点 纳什均衡点纳什均衡点(港译:纳殊均衡点),又称为非合作博弈均衡点,是博弈论的一个重要概念,以约翰·纳什命名。 如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。 [编辑本段]例子 经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。于是,两人同时陷入招供还是不招供的两难处境。如果两人均不招供,将最有利,只被判刑三年。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。这时,个体的理性利益选择是与整体的理性利益选择不一致的。 囚犯甲的博弈矩阵 囚犯甲 招供不招供 囚犯乙招供判刑五年甲判刑十年;乙判刑一年 不招供甲判刑一年;乙判刑十年甲判刑三年 基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三年就不会出现。事实上,这样两人都选择坦白的策略以及因此被判五年的结局被是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。 [编辑本段]学术争议和批评 第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发

博弈类型及其表述形式

博弈类型及其表述形式 1 博弈的分类 博弈模型一般分为合作博弈(cooperative game )和非合作博弈(non- cooperative game ),如图 1.1。合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素(Martin J.Osborne and Ariel Rubinstein ,2000,P2),也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。合作博弈强调的是团体理性(collective rationality )、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的(张维迎,1996,P5)。20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下(Martin J.Osborne and Ariel Rubinstein ,2000,P2)。 合作博弈,有时也叫做联盟博弈(coalitional game ),一般根据有无转移支付而分为两类:可转移支付联盟博弈(coalitional game with transferable payoff )和不可转移支付联盟博弈(coalitional game with non-transferable payoff )。可转移支付也叫有旁支付(side payment ),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联盟博弈。 图1.1 博弈的分类 非合作博弈的分类主要从两个角度进行划分。一是参与者的行动顺序。 从这个角度博弈

生活中的博弈论感悟

生活中的博弈论感悟集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

《生活中的博弈论》学习感悟 第一讲初试博弈论 生活中的资源是有限和稀缺的,于是就产生了竞争,这种竞争就需要一种形式把大家聚在一起,这种形式就是博弈。博弈论是在力图在最简单的假设下得到最大范围的推广和应用,其伟大在于对后世的引导和激发作用。博弈论不仅从古代就散发着智慧,还体现在我们生活中的种种小事中,如双方互拨打电话,放弃球赛陪女友逛街等。博弈论是建立在博弈双方或者多方都属于理性人的基础上,通过对自己以及博弈对手状况的了解、博弈环境的要求及变化等诸多因素,博弈者做出对自己最有利最保险的决策和行动,从而使得自己能达到获利或者获胜的目的。每个人都可以成为博弈高手,但人的决策又具有有限理性,因此博弈论也不是万能的。 第二讲纳什均衡 在某一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲,勿施于我。 第三讲囚徒困境 囚徒困境博弈反映个人最佳选择并非团体最佳选择。用囚徒困境博弈对两个势均力敌的竞争对手进行分析,可以发现合作是可以实现双赢的。如:两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。此二公司可以有二选择:互相达成协议,减少广告的开支。(合作)增加

寻找三个纳什均衡

1.首先将原始数据带入博弈计算程序,可以得到如下的答案:可以看到其中一个是纯策略,两个是混合策略。 2.首先用划线法找出可以找到第一个纯策略。 纯策略下张三和李四的收益组合为:(60,76),张三和李四的策略分别为(0,1,0)和(0,0,1)3.用消去法消去划线的两行 这样得到一个新的组合, P 1-P

假设新的组合是符合混合纳什均衡策略 那么 张三选上下的策略为P ,1-P ; 李四选左中的策略为S,1-S. 根据纳什均衡的条件:李四的策略概率S ,1-S ,使得张三选择上下策略收益相同: 得到一个等式:12S+42(1-S)=72S+36(1-S). S=1/11 1-S=10/11; 此时张三的收益为:=12×1/11+42×10/11 = 432/11 = 39.27; 同样张三的概率P,1-P,使得李四选择左中的收益相等: 得等式:83P+47(1-P)=56P+95(1-P) P=16/25;1-P=9/25; 此时李四的收益:=83×16/25+47×9/25=53.12+16.92=70.04 综上为第二个混合策略纳什均衡张三和李四的策略分别为:(16/25,0,9/25)和(1/11,10/11,0),张三和李四的收益为(39.27,70.04) 第三步:一般的混合纳什均衡 设张三选择上中下的策略概率分别为p,q,1-p-q ;李四选择左中右的策略概率分别为s,t,1-s-t ; 李四的策略要使张三的策略收益相同: 12s + 42t + 42(1-s-t)=24s + 12t + 60(1-s-t)=72s + 36t + 42(1-s-t) s=1/27, t=10/27, 1-s-t= 16/27 此时张三的收益 张三收益 = 12*1/27+42*10/27+42*16/27=(12+420+672)/27=1104/27=40.89 同上可知张三需要确定一个行动概率,以使李四的选择在其收益上没有差异,得等式: 83p + 12q +47(1-p-q) = 56p + 42q + 95(1-p-q)=45p + 76q + 59(1-p-q) p=113/200, q=5/16, 1-p-q=49/400 此时李四的收益为 李四收益 =83*113/200+12*5/16+47*49/400=46.895+3.755.7575=56.40 综上,此混合策略纳什均衡相对于张三和李四的策略选择用概率分别表述为(113/200,5/16, 49/400)和(1/27,10/27,16/27),收益分别为(40.89,56.40) 第四步:最后策略 三个策略的收益为:(60,76)(39.27,70.04)和40.89,56.40) 通过帕累托上策为(60,76)对双方来说收益最大,所以张三(0,1,0),李 四(0,0,1)的纳什均衡点应是实际行为最可能的结果。 1-S S

博弈论 蒋文华 浙江大学

第一讲、博弈论概述 献给诸位 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 第一章何为“博弈” 博:博览全局弈:对弈棋局→谋定而动 是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 第一节从一个简单的故事说起 博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!

行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。 特别提示: 博弈既可以是竞争,也可以是合作! 特别提示: 博弈,必须学会换位思考! 特别提示: 博弈,只需领先一步,高人一筹! 博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。 特别提示: 站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉

如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示: 请不要在一个充分竞争的市场去追求成功! 特别提示: 选对市场(对手)比选对策略更重要! 特别提示: 在博弈之前,博弈就已经开始了! 第二节博弈的渊源 一、中国的理解 博+弈=下围棋 略观围棋,法于用兵,怯者无功,贪者先亡。

----汉代刘向,《围棋赋》二、西方的理解 game(规则) 费厄泼赖(fairplay) 第三节学习博弈论的收益一、当局者清 更有利的选择 更快速的反应 二、旁观者更清 理解历史与现实 预测未来的发展

《管理经济学(二)》论纳什均衡及其启示

装订处 论纳什均衡及其启示 摘要:纳什对博弈论的贡献有两个方面,一是合作博弈理论中的讨价还价模型,称为纳什讨价还价解;二是非合作博弈理论方面,这是他的主要贡献所在。纳什对非合作博弈的主要贡献是他在1950年和1951年的两篇论文中在非常一般的意义上定义了非合作博弈及其均衡解,并证明了均衡解的存在。这样,他便奠定了非合作博弈论的基础。纳什所定义的均衡称为“纳什均衡”,它己成为经济学中的专用术语。 关键词:纳什均衡;启示 博弈论可以划分为合作博弈和非合作博弈。合作博弈与非合作博弈是根据博弈者之间是否能够通过某种契约的约束采取合作的策略而区分的。合作的博弈是指在这种博弈中,博弈者能够通过谈判达成一个有约束的契约以限制博弈者行为,使之相互采取以一种合作的策略。如果博弈者无法通过谈判达成一个有约束的契约以限制博弈者的行为,则该种博弈为非合作博弈。 合作博弈强调的是团体理性,强调的是效率、公正、公平。非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。目前,非合作博弈的理论相对成熟。在以下的分析中,由于分析对象大都是强调个体理性,并且,博弈的参与人之间没有一个具有约束力的契约来限制博弈者的行为,只是强调个人的理性。 在非合作博弈论中,又可以从两个角度对博弈进行分类:一是参与人行动的顺序。从这个角度,可以将博弈划分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈指的是博弈中,参与人同时选择行动,或者是参与人虽然不是同时行动,但是后行动者不能知道先行动者所采取的行动;动态博弈指的是参与人的行动有先有后,且后行动者能够通过一定的手段知道先行动者的具体行动是什么;二是对其他参与人的特征、战略空间和支付函数的知识。从这

大学mooc博弈论(首师大)满分章节测验答案

第一讲认识博弈论 1单选(10分) 博弈论的基本要素以下内容,除了()。 A.策略与策略集 B.均衡 C.支付与支付函数 D.局中人 正确答案:B你选对了 2单选(10分) 博弈论的基本假设是强调()。 A.均衡状态 B.利益最大化 C.个人理性 D.集体理性 正确答案:C你选对了 3单选(10分) 哪种表述模型更适合表示二人博弈()。 A.特征函数式 B.标准式 C.扩展式 D.以上都不适合 正确答案:B你选对了 4单选(10分) 根据人们行动为相互作用时,参与人能否达成一个具有约束力的协议,可将博弈分为( )。 A.静态博弈与动态博弈 B.常和博弈与非常和博弈 C.完全信息博弈与不完全信息博弈

D.合作博弈与非合作博弈 正确答案:D你选对了 5单选(10分) “要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”出自哪位诺贝尔经济学奖获得者的名言( )。 A.1994年诺贝尔经济学奖获得者John·Nash B.2012年诺贝尔经济学奖获得者Lloyd S. Shapley C.2005年诺贝尔经济学奖获得者Robert·Aumann D.1970年诺贝尔经济学奖获得者Paul A. Samuelson 正确答案:D你选对了 6多选(15分) 博弈论的研究特点包括()。 A.博弈论存在信息的对称性 B.博弈论涉及的决策者至少为两人 C.博弈论存在信息的不对称性 D.博弈论需要考虑其他决策者的决策对自身利益的影响 正确答案:B、C、D你选对了 7多选(15分) “囚徒困境”反映了()。 A.“看不见的手”是有力的,但不是万能的 B.个人理性通过市场机制导致社会福利最优的结论并不总是成立的 C.个体理性与集体理性的冲突 D.以自我利益为目标的“理性”行为,最终导致了两个囚徒得到相对较劣的收益 正确答案:A、B、C、D你选对了 8判断(5分) 博弈论是一种以数学为基础、研究发生对抗与冲突时如何选择最优策略的一门学问。正确答案:√你选对了 9判断(5分) 博弈论是单向的理性决策。 正确答案:×你选对了 10判断(5分) 理性选择是个人有意地使某个目标函数极小化的行为。

纳什均衡理论

纳什均衡理论 “纳什均衡”:合作是有利的“利己策略”。它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。 1994年诺贝尔经济学奖的获得者美国普林斯顿大学的约翰·纳什。纳什获得诺贝尔经济学奖的原因是他在博奕沦领域的贡献,他提出了“纳什均衡”理论、关于博奕论,流传最广的是一个叫做“囚徒困境”的故事: 话说有一天,一个富翁在家中被杀,财物被盗;警方在此案的侦破过程中,抓到两个犯罪嫌疑人张三和李四,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称他们只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。警察分别对张三和李四说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。” 张三和李四怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐3个月,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招?结果都被判5年刑期。原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。 实际上,如果两个都抵赖,各判刑1年,显然比都判5年好,但实际上做不到,因为它不满足个人理性要求。作为一个理性的人,张三和李四都会想,如果我抵赖而对方坦白的话,自己就可能判刑10年,理性的人是不会冒这种险的。但张三和李四都理性选择的结果,两人都被判了5年,最优的被判1年的结果并没有出现。也就是说,对每个人而言都是理性的选择,但对于整个集体来说却是不理性的。 这与传统经济学所言的结论相悖。传统经济学认为市场经济存在“看不见的手”,它调节的结果是每个人的理性选择最终会造成对整个集体的最大利益。实际上,就像囚徒困境一样,这只看不见的手在参与选择的人数只有少数几个的时候会失去作用,因为这个时候,人们决策的过程会考虑其他参与者的想法,就像赌博和下棋的时候一样,这就和买家和卖家数量都巨大时的完全竞争不完全一样,需要新的一套思路进行研究。

第十章 博弈论初步 微观经济学微观课后答案

第十章 博弈论初步 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是最优的;即使在纳什均衡是唯一时,它也可能不是最优的——因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人(如A 和B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A 与B 的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211 a a a a B 的支付矩阵=?? ????22211211b b b b 3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有4个、3个、2个、1个和0个,五种情况,所以可能有3个。例如,当参与人A 与B 的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??????22211211a a a a B 的支付矩阵=11122122b b b b ???????? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解为两个参与人的支付矩阵;其次,在第一个(即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大

博弈论习题

博弈论习题 一、判断题 1、纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。 2、若一博弈有两个纯战略纳什均衡则一定还存在一个混合战略纳什均衡。 3、博弈中混合策略纳什均衡一定存在,纯策略的不一定存在。 4、后行为的博弈方可以先观察到对方行为后再做选择,因此总是有利的。 5、如果扩展式博弈的一个策略组合不仅在均衡路径上是纳什均衡,而且在非均衡路径上也是纳什均衡,就是该扩展式博弈的一个子博弈精炼纳什均衡。 6、逆向归纳法并不能排除所有不可置信的威胁。 7、如果阶段博弈有唯一的纳什均衡,对于一个有限次重复博弈来说,重复阶段博弈中的纳什均衡是完善纳什均衡路线的唯一的子博弈精炼纳什均衡。 8、无限次重复博弈的均衡解一定优于原博弈均衡解的收益。 9、所有博弈方都有关于收益的信息,至少部分博弈方缺乏博弈进程信息的扩展式博弈,称为完全但不完美信息扩展式博弈。 10、不完美信息扩展式博弈中的信息不完美性都是客观因素造成的。 11、子博弈可以从一个多节点信息集开始。 12、不完美信息是指至少某个博弈方在一个阶段完全没有博弈进程的信息。 13、在贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他交易方,从而可以获得对自己更有利的均衡。 14、古玩市场的交易中买卖双方的后悔都来自于自己对古玩价值判断的失误,若预先对价值的判断是正确的,那么交易者肯定不会后悔。 15、只要消息的发送者和接手者的利益不是对立的,那么肯定能传递一些信息。 16、教育程度在劳动力市场招聘员工时受到重视的理由是,经济学已经证明教育对于提高劳动力素质有不可替代的作用。 17、引入“自然”这个虚拟参与者后,不完全信息博弈与不完美信息博弈基本上是相同的。 18、因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈

相关文档
最新文档