博弈论原理第5讲不完全信息静态博弈

第五章博弈论

第五章博弈论占优策略无论对方选择什么策略，都能使自己的支付大于其他选择的策略，相对于占优策略，其他策略均为劣策略。纳什均衡是一个博弈均衡解的概念。 1、纳什均衡作为一个最优策略组合，每个局中人的策略都是给定其他局中人的策略情况下的最佳反应； 2、该策略具有自我实施的功能，没有一个人有动力改变自己的策略。混合策略的纳什均衡在两个局中人标准式博弈{}2121,;,u u s s G =中混合策略组合),(*2*1p p 是纳什均衡的充要条件为，每一个参与人的混合策略是另一个参与人的混合策略的最优反应，即),(),(*211*2*11P P V P P V ≥且),(),(2*12*2*12P P V P P V ≥。子博弈精炼纳什均衡的定义扩展式博弈的最优战略组合S=(S1，SI,Sn)，如果它是原博弈的纳什均衡，且是在每一个子博弈上给出的纳什均衡，则该最优战略组合是该扩展式博弈的一个子博弈精炼纳什均衡。 1. 论述海撒尼转换的思路与目的在博弈中，信息不完全使得博弈参与人必须预测其他参与人的类型。至于“类型”概念，可以通过两个企业博弈的例子来加以说明。假设参与人1为在位者企业，参与人2为进入者企业。进入者依据在位者的生产成本高低选择是否进入该行业，高则进，低则不进。但是进入者不知道在位者的成本是高还是低。因此，进入者必须预测在位者的成本“类型”，究竟是高成本的还是低成本的。海萨尼提出通过引入“自然”概念解决这个问题。由自然实现行动，确定其他参与人的类型，从而转换成我们已讨论过的扩展式动态博弈结构。即通过自然选择类型，实现不完全信息向完全信息的转换，我们称之为海萨尼转换。 2、精炼内叶斯纳什均衡的求解原理假定有n 个参与人，参与人i 的类型是i i Θ∈θ，i θ是私人信息，)(i i i p θθ-是属于类型i θ的参与人i 认为其他1-n 个参与人属于类型),,,,,(111n i i i θθθθθ +--=的先验概率。令i S 是参与人i 的战略空间，i i S s ∈是一个依赖于类型i θ的特定的战略。),,,,,(111h n h i h i h h i a a a a a +--=是在第h 个信息集i 观察到其他1-n 个参与人的行动组合，它是战略组合),,,,,(111n i i i s s s s s +--=所规定的行动的一部分。)(~h i i i a p --θ是在观察到h i a -的情况下，参与人i 认为其他1-n 个参与人属于类型 ),,,,,(111n i i i θθθθθ +--=的后验概率。 1()() ()()P{}Pr {}()() h k k h k k k h K h h j j j p a p p a p a ob a p a p θθθθθθθ=≡≡∑ i p ~是所有后验概率)(~h i i i a p --θ的集合，),,(i i i i s s u θ-表示参与人i 的效用函数。于是，精炼贝叶斯均衡可以定义如下：精炼贝叶斯均衡是一个战略组合))(,),(()(11n n s s s θθθ***= 和一个后验概率组合 )~,,~(~1n p p p =，满足： (P)对于所有参与人i ，在每一个信息集h ， );,()(~m ax arg ),(i i i i h i i i s i i i s s u a p s s i i θθθθ----*∑-∈ (B))(~h i i i a p --θ是使用贝叶斯法则从先验概率)(i i i p θθ-，观测到的h i a -和最优战略 )(?*-i s 得到的。 3、比较经典均衡分析理论与博弈分析理论的异同

博弈论(课一)

课程内容和时间安排第一讲：概述（第一、二章）第二讲：术语解读和基本假设（第三、四章）第三讲：囚犯困境和破解之道（第五、六、七章）第四讲：万元陷阱和智猪博弈（第八、九章）第五讲：懦夫博弈和性别战（第十、十一章）

博弈学 -----博览全局对弈棋局课一博弈在中国的理解--略观围棋，法于用兵，怯者无功，贪者先亡。西方国家的理解--Game fair play。（中国人在博弈中关注的是获胜，西方人在博弈中关注的是怎么玩的开心。）博弈可以在工作领域，可以在社交往来，可以在家庭相处，无处不在，博大精深。知人者智，自知者明; 胜人者力，自胜者强; 小胜者术，大胜者德。

推荐书刊 1、蒋文华：《用博弈的思维看世界》，浙江大学出版社，2014年。 2、张维迎：《博弈论与信息经济学》，上海三联书店，上海人民出版社，1996年。 3、詹姆斯·米勒：《活学活用博弈论－如何利用博弈论在竞争中取胜》，中国财政经济出版社，2006年。 4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫：《策略思维》，中国人民大学出版社，2002年。 5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫：《妙趣横生博弈论》，机械工业出版社，2009年。博弈指在一定的游戏规则约束下，基于直接相互作用的环境条件，各参与人依据所掌握的信息，选择各自的策略（行动），以实现利益最大化的过程。故事1，两人同行打猎，忽遇一猛狮。一人卸下身上物品狂奔，同伴不解，问道：“汝能胜狮？”答曰：“非需胜狮，只需胜汝！” （博弈既可以是竞争，也可以是合作！）游戏1，每位同学写1个介于1与100之间的自然数（整数，包括1与100在内），然后求出所有数字的平均数，如果你所写的数字最接近该平均数的二分之一，那么你将在游戏中胜出。（博弈，必须学会换位思考！）

博弈论谢识予第四五章参考答案

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的，回头客、常客比较少，这些经济交易具有一次性博弈的特征，它们的价格总是较高而质量又会差一些，顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多，有明显的重复博弈特征，在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格，还能得到较好的服务，甚至有些还可以信用消费（赊账），因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看，有限次重复博弈研究的主要是有明确结束时间的（合作、竞争等）关系，无限次重复博弈研究的主要是没有明确结果时间，或者较长期的关系。从分析方法的角度，动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用，因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法，即根据特定效率意义等构造了博弈完美纳什均衡。此外，也可以运用某些技巧解决问题，如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。从博弈的结果看，无限次重复博弈的效率往往高于有限次重复博弈，有些在有限次重复博弈中无法实现的效率较高的结果，在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。最后，在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题，在我限次重复博弈问题中这是必须考虑的。上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别，区分研究这两类博弈问题是非常重要的，在实践方面的主要启发是促进和保持经济关系的长期稳定性，对于提高社会经济效率等常常有非常重要的意义。 6、用画线法容易找出该博弈的两个纯策略纳什均衡（T，L）和（M，R）。这两个纳什均衡的得益都帕累托劣于（B，S）。一次性博弈中效率较高的（B，S）不可能实现。但该博弈的结构表明存在双方合作的利益，在两次重复博弈中也有构造惩罚机制的条件，因此我会考虑运用试探合作的触发策略争取部分实现（B，S），提高博弈的效率。我作为博弈方1会采用这样的触发策略：第一次重复采用B；第二次重复时，如果前一次的结果是（B，S），则采用M，如果前一次的结果是其他，则采用T。如果另一个博弈方有同样的分析能力，或者比较有经验，那么他（或她）也会采用相似的触发策略：在第一次重复时采用S；第二次重复时，如果前一次的结果是（B，S），则采用R，否则采用L。双方采用上述触发策略构成一个子博弈完美纳什均衡，因此是稳定的。这时候前一次重复实现了（B，S），提高了博弈的效率。当然，上述触发策略也是有风险的，因为当另一个博弈方不理解和没有采用上述策略时，我的得益会较低。当然如果考虑到人们具有学习进步的能力，而且缺乏分析和学习能力，采用效率较低策略的博弈方长期中会逐步被淘汰掉，那么采用上述触发策略的合理性就得到了进一步的支持。

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述： 1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设： 1、决策主体是理性的，最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别： 3、博弈论与传统决策的区别： 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P,I)，其中P为市场价格，I为消

费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 2、参与人的行动顺序，即每个参与人在何时行动； 3、序列结构：每个参与人行动时面临的决策问题，包括参与人行动时可供选择的行动方案、所了解的信息； 4、参与人的支付函数。比较： 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论浅谈

博弈论浅谈在查找博弈论课题资料的过程中，不禁发现自己已经深深地被这门数学分支吸引住了。我想，这门学问的魅力主要在于它的实用性，数学中很少有一个方面能够被如此广泛地应用到实际生产实践、解释自然界的现象当中。而博弈论无疑是这其中一个既吸引数学家也吸引着数学“门外汉”的“大众科学”了。博弈论又称对策论，主要研究斗争性或竞争性现象的理论解决方法，是现代数学的分支，也是运筹学的一部分。博弈论会考虑竞争过程中的个体的预测行为和实际行为，并研究它们的优化以达到最优化策略。一般以1928年数学家、计算机专家冯·诺依曼证明了博弈论的基本原理这一事件作为博弈论正式诞生的标志。发展至今已经渐趋完善，此过程中有许多优秀的学者如冯·诺伊曼、约翰·纳什等为之作了卓越贡献。由于博弈论与经济学类相关甚紧，博弈论中某一理论的研究常常会带来经济学领域的一大突破，正如1994年约翰·纳什作为数学家获诺贝尔经济学奖所体现的一样，这种跨学科的效应在博弈论学中淋漓尽致地体现了出来。 “博弈论”该词在现代社会可以说是脍炙人口，在各种大型讲演和授课中经常能听到，但我个人觉得这个词的翻译不如它的英文源词“Game Theory”一样直白。“Game Theory”如果理解为“游戏的理论”更能够清晰地向一位不了解博弈论的人介绍这门科学。至于上升

到“博弈”的层次当然也是有其原因的。“Games”在当代早已将其内涵和外延延伸至社会科学、自然科学的方方面面，已经不仅仅停留在“游戏”的层面上。广义上来说，一个结构中的群体之间的相互作用构成一个博弈。狭义一点，社会中人群之间或集团之间的合作、承诺、互相利用等也是博弈论的体现。从理论上讲，博弈论是研究理性的行动者相互作用的形式理论，因为博弈论的基本假定是博弈各方的行动者具有推理能力，在具体策略选择时的目的是使自己的利益最大化。博弈论研究的是理性的博弈方之间如何进行策略选择的。由此可知，大到社会的发展、生物的繁衍，小至下棋打牌都可以看作是博弈。这么说来博弈论对于我们来说一点也不陌生，这些不正是与我们息息相关的日常事务？中国人对博弈论自古代就有深入的了解，甚至有将其理论系统化。比如《三十六计》就将当时军事上使用的计谋等集中收集到了一起，这种“计谋”其实就是指导人们的博弈理论。作为数学的一个分支，且不论博弈论对自然科学的重要性，它还对社会科学有着重要的意义，是社科研究范式中的一种核心工具，以至于我们可称博弈论是“社会科学的数学”，或者说是关于社会的数学。而实际上它正深入到经济学、政治学、社会学等等，被各门社会科学所应用。它还深刻地改变着人们的思维，如人们熟知的“囚徒困境”“海盗分宝石”等问题已经作为经济学、心理学的经典案例；成功企业中的高管与智囊团因善于博弈、制定正确的发展战略而使公司利于不败之地；政府公务员在制订法律、颁布政策时也需要不断利用博弈理论，站在人民的角度看问题从而进一步完善规章制度以促进外

博弈论与社会科学方法论(潘天群)

通识课课程中文名称：博弈论与社会科学方法论课程英文名称：Game Theory and Methodology of Social Sciences 课程代号：开课学期：第一学期（秋学期）主讲教师：潘天群职称：教授、博导研究专长：博弈论、逻辑学、科学方法论所在院系：哲学联系电邮：tqpan@https://www.360docs.net/doc/0c2911470.html, 授课对象：全校二、三年级本科生（不限专业）一、主讲教师简介：潘天群，哲学博士，现为南京大学哲学系、南京大学现代逻辑与逻辑应用研究所教授、博士生导师。兼任中国逻辑学会常务理事、中国逻辑学会经济逻辑专业委员会副主任委员。教育部新世纪人才（2006）。曾于2001年9月-2002年2月在美国纽约大学政治学系从事“博弈论中的方法论问题”的访问研究。主要研究领域为：逻辑学、哲学、博弈论。在《哲学研究》等国内外学术杂志发表学术论文约70余篇。独立出版著作5部：《行动科学方法论》，《博弈生存——社会现象的博弈论解读》、《博弈思维——逻辑使你决策制胜》、《社会决策的逻辑结构》与《合作之道——博弈中共赢方法论》。其中《博弈生存——社会现象的博弈论解读》，自2002年出版以来深受读者欢迎，为畅销书与长销书，已出版第三版。主持国家社会科学基金项目“博弈论的哲学基础与应用功能研究”（2009）。二、课程简介由于“他人”与“我”是既合作又竞争的关系，研究冲突与合作的博弈论自上一世纪由冯?诺依曼等人创立与发展以来，对社会现象表现出强大的解释力，已经成为社会科学的一个通用工具。迄今至少有五位博弈论专家获得诺贝尔经济学奖，许多诺贝尔经济学奖获得者其研究与博弈论相关。博弈论也也渐渐渗透到自然科学（如生物学、人工智能）之中。本课程突破数理博弈论的框架，结合主讲教师十年来的研究工作，构建适合

博弈论经典例子

博弈论经典例子篇一:《博弈论三大经典案例》经典的囚徒困境 1950年，由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论，后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述，并命名为"囚徒困境"。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检举对方(相关术语称"背叛"对方)，而对方保持沉默，此人将即时获释，沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作")，则二人同样判监半年。若二人都互相检举(互相"背叛")，则二人同样判监2年。用表格概述如下：甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年如同博弈论的其他例证，囚徒困境假定每个参与者(即"囚徒")都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为"严格劣势"，理性的参与者绝不会选择。另外，没有任何

其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁，并不知道对方选择;而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境：一名经理，数名员工;前提，经理比较苛刻; 如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人

博弈论

博弈论是一种处理竞争与合作问题的数学决策方法；研究竞争中参加者为争取最大利益应当如何做出决策的数学方法；根据信息分析及能力判断，研究多决策主体之间行为相互作用及其相互平衡，以使收益或效用最大化的一种对策理论；研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。近代对于博弈论的研究，开始于策墨洛（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。 1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般

化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。博弈的分类根据不同的基准也有所不同。一般认为，博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。从行为的时间序列性，博弈论进一步分为两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。通俗的理解："囚徒困境"就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈。按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息，在这种情况下进行的博弈就是不完全信息博弈。目前经济学家们现在所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博弈论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为：完全信

耶鲁大学博弈论_精简版

第一讲导论-五个入门结论 1.通过成绩博弈模型可以知道，不选择严格劣势策略，因为每次博弈会得到更好的收益。 2.通过囚徒的困境博弈模型可以知道，理性选择导致次优的结果（协商难以达成目的的原因不是因为缺少沟通，而是没有强制力）。 3.通过愤怒天使博弈模型可以知道，汝欲得之，必先知之；永远选择优势策略，选择非劣势策略，损失小，如果对手有优势策略则应以此作为选择策略的指导。 4.如果想要赢，就应该站在别人的立场去分析他们会怎么做。第二讲学会换位思考 1.构成博弈要素包括，参与人，参与人的策略以及收益。 2.所谓严格优势策略，就是指不论对方采取什么策略，采取的这个策略总比采取其他任何策略都好的策略。 3.在博弈中剔出某些选择时需要站在别人的角度去思考结果，因为对手不会选择劣势策略；同时要考虑到对手也是一个理性的参与人。 4.在博弈中剔除某些选择是一种直接思考，同时也是作为一个理性参与人的选择。第三讲迭代剔除和中位选民定理 1.在选民投票博弈模型中，通过不断地迭代以及剔除来决定策略，由此，我们得到了一种新的选择策略的方法：迭代剔除法。 2.选民投票博弈模型的结果与现实存在偏差，主要是因为：①现实中选民并不是均匀分布的；②选民通常根据候选人的性格而非政治立场来进行投票，而政治立场只是单一维度；③只适用于只有两个候选人的情况；④同时存在弃权票；⑤选民未必相信候选人所声明的立场。 3.建立模型，是为了更好的描述事实以激发灵感，模型是有重要的事是抽象而来，逐步增加约束条件完善模型观察结果，比较分析结果的变化。第四节足球比赛与商业合作之最佳对策 1.点球博弈模型告诉我们，不要选择一个在任何情况或信念下都不是最佳对策的策略。 2.最佳对策：①参与人针对对手策略的定义：参与人i的策略s^i（简写成BR）是对手策略S-i的最佳对策，如果参与人i在对手的策略S-i下选S^i的收益弱优于其它对策Si`，这对参与人i的所有Si`都适用，则策略S^i是其它参与人策略S-i的最佳对策。S^i最大化了对手选S-i时我的收益；②最佳对策广义定义：参与人i的策略S^i是最佳策略（你对其他参与人可能采取的策略持信念P时的最佳策略），在参与人i仍持信念P的情况下选S^i 的获得预期收益比在同样的信念P下选其它的策略获得的预期收益都要高（对于所有可选的Si`均成立）即Eu（S^i，P）≥Eu（Si`，P） Si` in Si 我从Si选择可选策略时S^i而非S-i最大化了我的预期收益。第五讲坏风气与银行挤兑 1.纳什均衡，即对任意一个此博弈内的参与者A，他所选择的策略是其他参与人所选策略的最佳策略。

1.3.7 博弈论分析方法的主要特征

博弈论分析方法的主要特征博弈论已形成一套完整的思想体系和方法论体系。其分析方法具有下列特征： 1. 研究对象的普遍性和应用范围的广泛性人们的行为之间存在相互作用与相互依赖，不同的行为主体及其不同的行为方式所形成的利益冲突与合作，已成为一种普遍现象，这使博弈论的研究对象具有普遍性。一切涉及到人们之间利益冲突与一致的问题、一切关于竞争或对抗的问题都是博弈论的研究对象。现实社会中广泛存在的合作与非合作博弈、完全信息与不完全信息博弈的事实，使博弈论的研究内容和应用范围十分广泛，涉及到政治学、社会学、伦理学、经济学、生物学、军事学等诸多领域，在经济学中的应用尤为突出。 2. 研究方法的模型化、抽象化以及涉及学科的综合性一是运用数学模型来描述所研究的问题，使博弈论的分析更为精确。二是研究方法具有抽象化的特征，由于博弈论分析大量使用了现代数学，使它所描述和分析的过程及所揭示的结论都带有抽象、一般化的特点。三是博弈论分析方法所体现的模式化特征，博弈论为人们提供了一个统一的分析框架或基本范式，从而使博弈论能够分析和处理其它数学工具难以处理的复杂行为，成为对行为主体间复杂过程进行建模的最适合的工具。

四是博弈论方法所涉及的学科的综合性。在博弈论分析中，不仅要应用现代数学的大量知识，还涉及到经济学、管理学、心理学和行为科学等学科。 3. 研究方法的实证性与研究结论的真实性博弈论中的最佳策略是经济学意义上的最优化，它只回答是什么导致博弈均衡，均衡的结果是什么，所遵循的基本原则是科学结论的客观性和普遍性。从实践上看，博弈论突破了传统的完全竞争、完全信息假定，更加强调决策者的个人理性，强调不完全信息、不完全竞争条件下的经济分析，强调决策个体之间的相互影响和相互作用等外部性，强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致，等等。作为一门方法论科学，除了提供分析和解决博弈问题的独特和新颖的具有战略思维的思想方法以外，还提供了更加贴近现实的分析工具并填补了传统经济分析的许多空白。从这个意义上说，博弈论方法具有实证的特征，使研究结果更具有真实性。

博弈论的基本概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者：参与者是指一个博弈中的决策主体，通常又称为参与人或局中人。参与人的目的是通过合理悬着自己的行动，以便取得最大化的收益。参与者可以是自然人，也可以是团体。 ?信息：信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要，每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略：策略是参与者如何对其他参与者的行动作出反应的行动规则，它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略，用S i表示参与者i的所有可选择的策略的集合（又成为而i的策略空间）。如果n个参与者没人选择一个策略，那么s=（s1，s2，…，s n）称为一个策略组合。 ?收益：收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益，它是策略组合的函数。 ?均衡：均衡是所有参与者的最优策略组合，记为s*。几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕，并受到指控。除非至少一人认罪，否则警方无充分证据将他们按最论刑。警方把他们隔离审讯，并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度，因警方证据不足，两人将均被判为轻度犯罪入狱一个月；如果双方都坦白，根据案情两人将被判入狱六个月；如果一个招认而另一个拒不坦白，招认者因由主动认罪立功的表现将立即释放，而另一人将被判入狱九个月。

生活中的博弈论感悟(优.选)

《生活中的博弈论》学习感悟第一讲初试博弈论生活中的资源是有限和稀缺的，于是就产生了竞争，这种竞争就需要一种形式把大家聚在一起，这种形式就是博弈。博弈论是在力图在最简单的假设下得到最大范围的推广和应用，其伟大在于对后世的引导和激发作用。博弈论不仅从古代就散发着智慧，还体现在我们生活中的种种小事中，如双方互拨打电话，放弃球赛陪女友逛街等。博弈论是建立在博弈双方或者多方都属于理性人的基础上，通过对自己以及博弈对手状况的了解、博弈环境的要求及变化等诸多因素，博弈者做出对自己最有利最保险的决策和行动，从而使得自己能达到获利或者获胜的目的。每个人都可以成为博弈高手，但人的决策又具有有限理性，因此博弈论也不是万能的。第二讲纳什均衡在某一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲，勿施于我。

囚徒困境博弈反映个人最佳选择并非团体最佳选择。用囚徒困境博弈对两个势均力敌的竞争对手进行分析，可以发现合作是可以实现双赢的。如：两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告，收入增加很少但成本增加。但若不提高广告质量，生意又会被对方夺走。此二公司可以有二选择：互相达成协议，减少广告的开支。（合作）增加广告开支，设法提升广告的质量，压倒对方。（背叛）若二公司不信任对方，无法合作，背叛成为支配性策略时，二公司将陷入广告战，而广告成本的增加损害了二公司的收益，这就是陷入囚徒困境。在现实中，要二互相竞争的公司达成合作协议是较为困难的，多数都会陷入囚徒困境中。第四讲斗鸡博弈所谓“斗鸡博弈”就是两只公鸡面对面斗争，继续斗下去，两败俱伤；一方退却便意味着认输。在这样的博弈中，要想取胜，就要在气势上压倒对方，至少要显示出破釜沉舟、被谁一站的决心来，以迫使对方退却。但到最后的关键时刻，必有一方要退下来，除非真正抱定鱼死网破的决心。学习了知识，就要善于联想，善于联系生活。在很多的时候我们都可能是在不知不觉中就使用了或者是接触到了博弈论，就像是平常我们和其他人之间的争执问题，每次都可能弄得脸红脖子粗的，双方都不服气，最终的结果是有一个人妥协，然后彼此达成一致；冷战期间的美苏两大军事集团的争斗也是一种“斗鸡博弈”。

历史的制度分析：博弈论分析方法

历史的制度分析：博弈论分析方法把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究，目前主要有两种方法。一种是“进化博弈论方法”（evolutionary game approach）。经济学中的进化博弈论是在生物学的进化博弈论的基础上产生、发展起来的。它将人类的经济活动和竞争性经济行为同生物的进化相类比，研究人类经济行为中的策略和行为方式的均衡，以及向均衡状态调整、收敛的过程与性质。采用这一方法的研究者认为，社会制度并不是由什么人有意设计出来的，而是在那些适应环境和社会变化的新的制度结构不断被发现、更为理想的制度结构不断被保存的过程中产生的。这就是所谓的“适应性进化”过程。进化博弈论的引入，就是为了分析和说明社会制度的这一适应性进化过程。进化博弈论之所以在制度变迁理论中受到重视，主要是因为它是在不严重依赖决策者计算能力的前提下来说明均衡选择过程，从而在纳什均衡的理性主义解释遇到理论困难时，显示出了通过进化机制实现纳什均衡的可能性。应用博弈论研究制度变迁的另一种新方法是“重复博弈论方法”（repeated game approach），它运用更精细的均衡概念，如“子博弈精炼均衡”（subgame perfect equilibrium）来分析历史与现实中的制度选择与变迁过程。其中最具代表性的，就是格瑞夫进行的“历史的比较制度分析”。所谓的重复博弈，实际上是指同样结构的博弈重复地进行多次。与一次性博弈不同，它是由若干个阶段博弈（stage game）构成的一个完整的和相对长期的博弈过程。因此，在重复博弈中，各博弈方的着眼点就不是其在某一阶段上的局部利益或短期利益，而是他们在整个博弈过程中的总体利益和长期利益。当各博弈方面对不同的策略选择时，他必须考察到其在当前阶段的博弈中所采取的策略，不致在随后阶段中引起其他博弈方的对抗、报复或恶性竞争。也就是说，他不能像在一次性博弈中那样，毫不顾及其他博弈方的利益。有时，一方若作出一种合作姿态，可能会使其他博弈方在随后的阶段中也采取合作态度，从而实现共同的长远利益。这样，在重复博弈中就存在着比一次性博弈更大的合作的可能性，也有可能实现比一次性博弈更有效率的均衡。重复博弈论的这一特征，为它说明人类之间的合作行为，特别是说明历史与现实社会中体制与制度的演变过程，提供了强有力的支持。在历史的比较制度分析那里，制度被定义为本身是“自我实施的对行为的非技术决定的约束” ，即所谓的自我实施制度（self-enforcing institution ）。自我实施制度的一个最基本的特征，就是它的自发产生和自我实施的性质。与那些由国家和法律强制实施的制度不同，自我实施制度必须是参与人各方经过协商、谈判、讨价还价后自愿达成一致的结果。因此，历史的比较制度分析将自我实施制度视为特定历史条件下制度博弈的一种均衡状态或均衡结果。自我实施制度产生的过程，也就是制度博弈各方在特定的战略局势中，根据自己不同的目标自主地选择各自的最优策略与对手进行博弈，最后求得制度均衡的过程。而所谓的“子博弈精炼均衡”，恰恰是指在构成动态博弈的所有子博弈阶段上都实现了纳什均衡。这就是说，一个子博弈精炼均衡，必须是各博弈方在整个博弈的每个阶段（子博弈）都选择了不愿单独改变的策略（纳什均衡）的最终结果。如果我们从博弈论的角度来观察自我实施制度，就会发现自我实施制度与子博弈精炼均衡之间的内在联系。简单地说，自我实施制度所具有的自发产生和自我实施的基本属性，说明了它必定是制度博弈各方在每个子博弈中都选择了不愿单独改变的最优策略的结果，也即实现子博弈精炼均衡的结果。更直接地说，自我实施制度的产生，必定是一个制度博弈实现了子博弈精炼均衡的结果。反过来说，如果一个制度博弈实现了子博弈精炼均衡的结果，那它也应该是自我实施的。

(完整word版)博弈论给我的心得

博弈论给我的心里体会潘慧明 201202034049 12金融数学我是大学第二学期开始选修学习《博弈论》的，并且以前对它停留在表面意思。而在我的进一步对《博弈论》的学习下，我懂得了这门课程在我们的生活中无处不在，在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述，经过这个学期的学习后，我才知道我身边发生的很多事情都可以用这门课程概述。那么什么是“博弈论”？所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。并且学习后我还有个感受就是：博弈论有两个比较enlightening的观点，一是more information can hurt you(掌握更多的信息可能是一件坏事)，二是more options can hurt you（拥有更多的选择可能是一件坏事）.虽然博弈论主要用于研究经济问题,但是我觉得这些原理在我们现实生活中同样是适用的。而且经过这段时间的学习，我现在对《博弈论》有了些比较肤浅的认识。诚然，一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈，有人说没有，那是因为缺少发现博弈现象的眼睛。因此在生活中我们要懂得学以致用，要会灵活的去使用这门学科。人生就是在弈棋，学会博弈。虽说博弈不是万能的，但没有博弈现象存在的生活是万万不能的。社会生活中，共赢是一种优良的博弈方式。双赢策略其实是一种很高的智慧，帮助别人的同时接受别人的帮助，双方最终将获得独自奋战所不能拥有的东西。放弃内心的宁予外贼不予家奴的思想。中国人对竞争的理解大多不是“你死”就是“我活”，胜利的含义似乎就是阻止别人成功，可是这“胜利”是那么虚假，经不起风吹雨打，经不起时间考验。拥抱双赢，拥抱明天。双赢强调的是博弈双方的利益都要兼顾，就是所谓的“赢者不全赢，输者不全输”。但是双方都得到了满意的结果。这些双赢的事例，在商务上经常可以看到的。如：商务上的谈判，完完全全的运用到了《博弈论》的知识与原理来分析问题，并且从而找到最佳的均衡点，也就是最好的解决方法。在所有的对抗和较量中，其胜负成败常常取决于三个基本的因素：机会或者说运气、体能和智能。头脑技能是一种策略技巧，或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关，因此人们试图获得成功，就有必要研究在对抗局势中如何策略性地选择自己的行动。而今，博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上，每

博弈论与策略行为

博弈论与策略行为 G a m e T h e o r y a n d S t r a t e g y B e h a v i o r 蔡继明教授/主任清华大学政治经济学研究中心 Center for Political Economy at Tsinghua University CPET

目录第一讲：导论一、博弈论的研究对象第二讲：占优战略与社会两难第三讲：纳什均衡和双人博弈第四讲：三人博弈与n人博弈第五讲：纯战略和混合战略第六讲：博弈的合作解第七讲：序贯博弈与子博弈完美均衡第八讲：重复博弈第九讲：企业经营决策的博弈分析第十讲：企业内部组织分析第十一讲：政府行为分析第一讲导论博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略（给自己带来最大收益的策略）。二、博弈论的产生和发展博弈又称博戏，是一门古老的游戏。 1. 博弈在中国《学弈》（《孟子 ?告子》）：弈秋，通国之善弈也。使弈秋侮二人弈，其一人专心致志，惟弈秋之为听；一人虽听之，一心以为有鸿鹄将至，思援弓缴而射之。虽与之俱学，弗若之矣。为是其智弗若与？吾曰：非然也。《世本》说，“乌曹作博”，乌曹乃是夏代著名之能工巧匠。千百年来，博弈更是与人们的生活紧紧相连，从博棋到牌戏，从斗戏到彩票，中华民族的历史长河中就这样形成了别具风情的博弈文化从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战

博弈论

经济博弈论思想 “要想在现代社会做一个有文化的人，你必须对博弈论有一个大致了解。”经济学的最后一个通才，美国诺贝尔经济学奖第一人保罗.萨缪尔森选择两条路在树林里分叉，而我选择人迹罕至的那一条，从此一切变了样。电影《死亡诗社/Dead Poets Society》教学目的 1、本次教学介绍博弈论的基本概念，包括什么是博弈和博弈论，给出一些经典博弈例子。对博弈分类和博弈理论的结构作一些讨论，对博弈论的发展历史等作简单介绍。 2、目标是让大家对博弈论的内容和博弈模型有更直观的概念和印象，对博弈分析的基本思想方法等形成初步的认识，为今后工作提供新的分析思路教学内容 1、博弈论的概念和发展； 2、博弈论的结构和分类 1、什么是博弈论：1.1 从游戏到博弈；1.2 一个非技术性定义；1.3 博弈论的发展。 1.1 从游戏到博弈博弈Game，Game即游戏、竞技，博弈论Game Theory，博弈论研究与游戏有共同特征的决策或者说策略问题游戏和经济等决策竞争较量的共同特征：规则；结果；策略选择；策略和利益相互依存。为什么是博弈论而不是游戏论？ 1.2 一个非技术性定义定义：博弈就是一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。四个核心方面博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行为(Actions) 博弈的次序(Order) 博弈方的得益(Payoffs) 均衡均衡是经济学中的重要概念。均衡即是平衡的意思，英文是：equilibrium。在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能将商品卖出去。此时我们就说，该商品的供求达到了均衡。此时的价格可称之为均衡价格，产量称之均衡产量。均衡分析是经济学中的重要分析。纳什均衡在对方策略确定的情况下，每个参与者的策略都是最好的，此时没有人愿意先改变自己的策略。通俗解释：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你的最好的策略。（谢识予《纳什均衡论》）博弈分析的目的：预测博弈的均衡结果。即给定“每个参与人都是理性的，每个参与人都知道每个参与人都是理性的”是共同知识，什么是每个参与人的最优策略？什么是所有参与人的最优策略组合？而均衡就是博弈分析的解，均衡是博弈结果之一。

论文-博弈论方法在经济学中

经济生活中的博弈论应用摘要：博弈，这个原来只是在学术圈出现的名词，如今已经越来越多地走进了我们的生活。博弈论是运筹学的一个重要分支，其中，非合作博弈（non- cooperative game）是现代博弈理论中的核心内容和重要基础，下面通过对经典案例囚徒困境和智猪博弈的分析，对纳什均衡相关定义的研究，得到了在经济决策中行为人如何决定最优决策的方法。在此基础上，以纳什均衡作为理论支撑点，结合得益矩阵分析解决了经济生活中商家价格战的一些实际问题。关键词：博弈论；均衡点；得益矩阵；纳什均衡

目录一.引言 (3) 二．博弈论与纳什均衡的主要内容 (3) 2.1博弈论的主要思想 (3) 2.2博弈论的分类 (4) 2.3纳什均衡 (4) 2.4 纳什均衡的分类 (4) 三．案例分析 (5) 3.1 囚徒困境（1950年，图克） (5) 3.1.1案例分析 (5) 3.1.2案例应用 (6) 3.2 智猪博弈（1950年，约翰.纳什） (6) 3.1.1 案例分析 (7) 3.1.2 案例应用 (7) 四．价格战博弈 (8)

一.引言近代对于博弈论的研究，开始于策墨咯（Zermelo），波雷尔（Borel）以及冯·诺伊曼（V on·Neumann）。1928年冯·诺伊曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺伊曼和摩根斯坦共同撰写了时代巨著《博弈论与经济行为》并将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学期的基础和理论体系。1950-1951，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，以此为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼等人的研究也对博弈论的发展起到了不小的推动作用。二．博弈论与纳什均衡的主要内容 2.1博弈论的主要思想书上是这样定义的：博弈是指一些个人或者组织面对一定的环境条件，在一定的规则下同时或者先后一次或者多次从各自允许选择的行为或策略中进行选择并加以实施，进而各自取得相应结果的结果。现代科学将这种“对策论”、“对局理论”称之为博弈论，主要研究公式化了的激励结构间的相互作用。从上述定义中可以看出，一个完整的博弈一般由以下几个要素组成：博弈的参加者，各博弈方各自选择的全部策略或行为的集合、博弈方的得益（得益矩阵）、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的

博弈论原理 第5讲 不完全信息静态博弈

第五章 博弈论