博弈论GameTheory

合集下载

博弈论定义与主要思想

Selten and Harsanyi
泽尔腾（1965）将纳而海萨尼则发展了刻
什均衡的概念引入了动态分析，提出了 “精炼纳什均衡”概念；以及进一步刻画不完全信息动态博弈的 “完备贝叶斯纳什均
画不完全信息静态博弈的“贝叶斯纳什均衡”（1967－1968）。总之，他俩进一步将纳什均衡动态化，加入了接近实际的不完全信息条件。他们的
著名经济学家保罗.萨缪尔森说：“要想在现代社会做一个有文化的人，您必须对博弈论有一个大致了解。”
我们从博弈中学习什么
博弈论告诉人们，要学会理解他人都有自己的思想，每个个体都是理性的，所以必须了解竞争对手的思想。商业关系被认为是一种相互作用。但博弈论并不是疗法，并不是处方，它并不告诉你该付多少钱买东西，这是计算机或者字典的任务。博弈论只是提供一些关系的例证，一些有用的解决问题的方法。这种思维方法也许是企业家应该学习的。对于经济学家，也许需要学习它的理论模型，它的实验方式。
2005年诺奖授予有以色列和美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林，以表彰他们在博弈论领域作出的贡献。
主要思想
博弈论并不是经济学的一个分支，它只是一种方法，这也是为什么许多人将其看成数学的一个分支的缘故。
在对参与者行为研究这一点上，博弈论和经济学家的研究模式是完全一样的。经济学越来越转向人与人关系的研究，特别是人与人之间行为的相互影响和相互作用，人与人之间利益和冲突、竞争与合作，而这正是博弈论的研究对象。
4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识；
5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西；

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论（Game Theory)，它是现代数学的一个新分支，也是运筹学的一个重要组成内容。

在《博弈圣经》中写到：博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法，博弈论就是研究互动决策的理论。

所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策，选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛，在经济学、政治科学（国内的以及国际的）、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外，它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法，标准的博弈论分析出发点是理性的，而不是心理的或社会的角度。

不过，近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。

1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。

博弈论

博弈论是一种处理竞争与合作问题的数学决策方法；研究竞争中参加者为争取最大利益应当如何做出决策的数学方法；根据信息分析及能力判断，研究多决策主体之间行为相互作用及其相互平衡，以使收益或效用最大化的一种对策理论；研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。

博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

近代对于博弈论的研究，开始于策墨洛（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。

1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。

1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。

1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。

纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。

此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的学科。

博弈的分类根据不同的基准也有所不同。

一般认为，博弈主要可以分为合作博弈和非合作博弈。

它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。

从行为的时间序列性，博弈论进一步分为两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。

博弈论介绍

•
为什么博弈论在经济学领域会产生如此大的影响呢？这是因为博弈论改变了传统微观经济学的某些基本假设，从一个独特的视角帮助我们更加深刻地理解和把握经济现象，并指导更加有效的经济政策制订。博弈论作为现代经济学的前沿领域，已成为占据主流的基本分析工具。
一、博弈论的基本概念
博弈论，英文为Game theory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。 • 这些相互依赖、相互影响的决策行为及其结果的组合称为博弈(Game)。
行动次序
信息
静态纳什均衡纳什贝叶斯均衡海萨尼
动态子博弈精练纳什均衡泽尔腾精炼贝叶斯均衡泽尔腾等
完全信息
不完全信息
二、博弈的种类
• 一、完全信息静态博弈 • (一)完全信息静态博弈定义 • 所谓完全信息静态博弈指的是各博弈方同时决策，或者决策行动虽有先后，但后行动者不知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。 • 在博弈论中,一个博弈可以用两种不同的方式来表达： • 一种是策略式表达:另一种是扩展式表达.策略式表达更适合于静态博弈，而扩展式表达更适合于讨论动态博弈。
•性别战(battle of sexes) 女足球男足球芭蕾 2，1 0，0 芭蕾 0，0 1，2
• 斗鸡博弈(chicken game)(胆小鬼博弈)
B 进退
A
进退
-3，-3
0，2
2，0
0，0
• 进入阻挠(entry deterrance) 在位者默许斗争
进入者
进入不进入
40，50
0，300
-10，0
0，300

博弈论介绍 Game Theory

2. 生活中的“囚徒困境”例子
例子1 商家价格战例子1
出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利，但实际上却是相互杀价，结果都赚不到钱。当一些商家共谋将价格抬高，消费者实际上不用着急，因为商家联合维持高价的垄断行为一般不会持久，可以等待垄断的自身崩溃，价格就会掉下来。
表2 智猪博弈小猪按按大猪等待 5,1 9, -1 等待 4,4 0,0
这个博弈大猪没有劣战略。但是，小猪有一个劣战略“按”，因为无论大猪作何选择，小猪选择“等待”是比选择“按”更好一些的战略。所以，小猪会剔除“按”，而选择“等待”；大猪知道小猪会选择“等待”，从而自己选择“按”，所以，可以预料博弈的结果是(按,等待）。这称为“ 重复剔除劣战略的占优战略均衡 ”，其中小猪的战略“等待” 占优于战略“按”，而给定小猪剔除了劣战略“按”后，大猪的战略“按”又占优于战略“等待”
表4 有补贴时的博弈空中客车开发开发波音不开发 -10,10 0, 120 不开发 100,0 0,0
这时只有一个纳什均衡，即波音公司不开发和空中客车公司开发的均衡（不开发,开发），这有利于空中客车。在这里，欧共体对空中客车的补贴就是使空中客车一定要开发（无论波音是否开发）的威胁变得可置信的一种“承诺行动”。
类似的例子还有：渤海中的鱼愈来愈少了，工业化中的大气及河流污染，森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制政策加强管理，如我国政府规定海洋捕鱼中，每年有一段时间的“休渔期”，此时禁止捕鱼，让小鱼苗安安静静地生长，大鱼好好地产卵，并对鱼网的网眼大小作出规定，禁用过小网眼的捕网打鱼，保护幼鱼的生存。又如在三峡库区，为了保护库区水体环境，关闭了前些年泛滥成灾的许多小造纸厂等。问题：1、为什么在城市中心道路上禁止汽车鸣喇叭？

第三节博弈论（GameTheory）

第三节博弈论(Game Theory)在国际关系的研究过程中，我们时常会运用到博弈论这样一个工具。

博弈论在英语中称之为“Game Theory”。

很多人会认为这是一种所谓的游戏理论，其实不然，我们不能把Games 与Fun 同论，而应该将博弈论称之为是一种“Strategic interaction”（策略性互动）。

“博弈”一词现如今在我们的生活中出现的已经很频繁，我们经常会听说各种类型的国家间博弈（如：中美博弈），“博弈论”已经深刻的影响了世界局势和地区局势的发展。

在iChange创设的危机联动体系中，博弈论将得到充分利用，代表也将有机会运用博弈论的知识来解决iChange 核心学术委员会设计的危机。

在这一节中，我将对博弈论进行一个初步的介绍与讨论，代表们可以从这一节中了解到博弈论的相关历史以及一些经典案例的剖析。

（请注意：博弈论的应用范围非常广泛，涵盖数学、经济学、生物学、计算机科学、国际关系、政治学及军事战略等多种学科，对博弈论案例的一些深入分析有时需要运用到高等数学知识，在本节中我们不会涉及较多的数学概念，仅会通过一些基本的数学分析和逻辑推理来方便理解将要讨论的经典博弈案例。

）3.1 从“叙利亚局势”到“零和博弈”在先前关于现实主义理论的讨论中，我们对国家间博弈已经有了初步的了解，那就是国家是有目的的行为体，他们总为了实现自己利益的最大化而选择对自己最有利的战略，其次，政治结果不仅仅只取决于一个国家的战略选择还取决于其他国家的战略选择，多种选择的互相作用，或者策略性互动会产生不同的结果。

因此，国家行为体在选择战略前会预判他国的战略。

在这样的条件下，让我们用一个简单的模型分析一下发生在2013年叙利亚局势1：叙利亚危机从2011年发展至今已经将进入第四个年头。

叙利亚危机从叙利亚政府军屠杀平民和儿童再到使用化学武器而骤然升级，以2013年8月底美国欲对叙利亚动武达到最为紧张的状态，同年9月中旬，叙利亚阿萨德政府以愿意向国际社会交出化学武器并同意立即加入《禁止化学武器公约》的态度而使得局势趋向缓和。

博弈论的定义和主要思想

著名经济学家保罗.萨缪尔森说：“要想在现代社会做一个有文化的人，您必须对博弈论有一个大致了解。”
清华诚志
9
我们从博弈中学习什么
博弈论告诉人们，要学会理解他人都有自己的思想，每个个体都是理性的，所以必须了解竞争对手的思想。商业关系被认为是一种相互作用。但博弈论并不是疗法，并不是处方，它并不告诉你该付多少钱买东西，这是计算机或者字典的任务。博弈论只是提供一些关系的例证，一些有用的解决问题的方法。这种思维方法也许是企业家应该学习的。对于经济学家，也许需要学习它的理论模型，它的实验方式。
清华诚志
12
两种均衡
占优策略是无论其他局中人采取什么策略对于自己来说都是最好的策略。
占优均衡所有局中人都有占优策略而形成的均衡。
纳什均衡是指某一局中人在其他局中人的策略给定时选择最好策略而形成的均衡。
清华诚志
13
占优均衡一定是纳什均衡，但纳什均衡不一定是占优均衡。
占优均衡
– “不管你做什么，我所做的都是最佳选择。” – “不管我做什么，你所做的都是最佳选择。”
纳什均衡
– “给定你的行为，我所做的是最佳选择。” – “给定我做什么，你所做的是最佳选择。”
清华诚志
14
博弈的分类
1）根据参与人的多少，可将博弈分为两人博弈和多人博弈；
2）根据博弈结果的不同，又可分为零和博弈、常和博弈和变和博弈；
3）根据博弈方策略的数量，可分为有限博弈和无限博弈；
清华诚志
清华诚志
5
Selten and Harsanyi
泽尔腾（1965）将纳什均衡的概念引入了动态分析，提出了 “精炼纳什均衡”概念；以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”

博弈论-game-theory-两人轮流进行游戏

g(a(k+1))=0 !
当k∞时 x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 …… g(x) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 …… 这有啥用
游戏的联合
定义：对于n个给定的公平组合博弈G1, G2, …, Gn，定义他们集的合联；合对为于G一=个G1局+G面2+x…i属+G于n.X对i，于设游F戏i(xGi)i表Байду номын сангаас示设xXi的i为后它继的局局面面集合对。于G那的么一G个的局局面面x集=合{x1X,x=2,X…1*,xXn2}*，…它*X的n（后其继中局*为面笛集卡合儿积）；
gn(x1,x2,…,xn) = g(x1)⊕g(x2)⊕…⊕g(xn)
= x1⊕x2⊕…⊕xn
经典Nim游戏
图的游戏
3
0
2 0
1
3 ⊕0 ⊕0=3
0 0
1 0
1
Anti-Nim
有n堆石子，每堆ai个，两个人轮流游戏，每次游戏者取走某一石碓中至少1枚，至多k枚的石子。谁取走最后一颗石子算谁输。
一方算输无论游戏如何进行，总可以在有限步之内结束。(the
Ending Condition)
N局面，P局面
N局面——先手必胜局面
winning for the Next player
P局面——后手必胜局面
winning for the Previous player
定义：
每一个最终局面都是P局面对于一个局面，若至少有一种操作使它变成一个P局面，
还扩展
游戏4：游戏有n堆石子，第i堆有ai枚，两人轮流进行游戏，每次游戏者可以从任意一堆取走任意多枚石子，也可以将任意的一堆石子任意的分成两堆。谁取走最后一颗石子为胜。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

譬如， 2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位，他们搞了一个“彩电厂家价格自律联盟”，并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时，国家有关部门还未出台相关的反垄断法律，对于这种在发达国家明显属于违法行为的所谓 “自律联盟”，国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋，并且还通过媒体大肆炒作，这在发达国家是不可思议的。
他的故事被好莱坞拍成了电影《美丽心灵》，该影片获得了2002年奥斯卡金像奖的四项大奖
三、
1. 囚犯困境（Prisoners’ dilemma 囚犯困境是图克（Tucker）1950年提出的该博弈是博弈论最经典、著名的博弈该博弈本身讲的是一个法律刑侦或犯罪学方面的问题，但可以扩展到许多经济问题，以及各种社会问题，可以揭示市场经济的根本缺陷
第七章博弈论（Game Theory）
基本概念二人有限非零和博弈
§1 基本概念
一、博弈论的定义
又称对策论，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。是研究具有竞争、对抗、冲突性质的现象的数学理论和方法。
二、博弈理论的历史
•
• •
我国春秋战国时期的“孙子兵法” ；
围棋，发明于我国殷代；博弈作为一种数学理论开始于1944年。
由美国数学家冯· 诺依曼(Von. Neumann)和经济学家摩根斯坦(Morgenstern))发表了题为“博弈论与经济行为”的著作 • 1950年，纳什完成博士论文“非合作博弈”，
• 九十年代以来博弈理论在金融、管理和经济领域中得到广泛应用
坦白
抵赖 0，-10 -1，-1
继续讨论“囚犯困境”问题：坦白
抵赖
-8，-8 -10，0
启示：个人理性和集体理性的矛盾当一个社会中的每个个体都为自身的利益打算时，即使大家都遵守社会规则，个体的行为不一定能实现个体的最佳利益。
结论：政府在社会经济活动中的组织协调工作是必需的，放任自流不是导致全社会最大福利的最佳政策。
三、
1. 囚犯困境（Prisoners’ dilemma
两名囚犯I和II因涉嫌抢劫被捕。警方因证据不足先将二人分关二室，并宣布：若二人均不坦白，则只能因藏有枪支而被判刑1年；若有一人坦白而另一个不坦白，则坦白者无罪释放，不坦白者被判刑10年；若二人都坦白了，则同判8年。此二人确系抢劫犯，请分析他们的抉择。
• 博弈论和诺贝尔经济奖
1994：非合作博弈：纳什(Nash)、泽尔腾（Selten）、海萨尼（Harsanyi） 1996：不对称信息激励理论：莫里斯（Mirrlees）和维克瑞（Vickrey） 2001：不完全信息市场博弈：阿克罗夫（Akerlof）（商品市场）、斯潘塞（Spence）（教育市场）、斯蒂格里兹（Stiglitze）（保险市场） 2002：实验经济学：史密斯（Smith），心理经济学：卡尼曼（Kahneman） 2005:诺贝尔经济学奖授给了罗伯特· 奥曼与托马斯· 谢林，以表彰他们通过博弈理论的分析增强世人对合作与冲突的理解。
囚犯困境问题在经济、政治、军事等领域的应用举例
例：寡头垄断企业定价的博弈
卡特尔价格不是纳什均衡，最终结果：每个企业按照纳什均衡的价格进行定价，其利润小于卡特尔价格条件下的利润。
例：公共产品的供给博弈
如果大家都出钱兴办公用事业，所有人的福利都会增加。问题是，如果我出钱你不出钱，我得不偿失；而如果你出钱我不出钱，我就可以占便宜。
Ⅱ
坦白
抵赖
坦白 Ⅰ 抵赖
-8，-8 -10，0
0，-10 -1，-1
均衡解：二人均坦白
相关概念介绍
博弈分析的基本假设（1）个人理性假设当事人在决策时能够充分考虑他所面临的局势，并能做出合乎理性的选择。
（2）最大化自己的收益
假设当事人在决策时通常选择使自己收益最大化的策略。
坦白
抵赖
-8，-8 0，-10 博弈问题的基本要素坦白抵赖 -10，0 -1，-1 （1）局中人（Players）参与对抗的各方；不一定指自然人（2）策略集（Strategies）局中人选择对付其它局中人的行动方案称为策略；某局中人的所有可能策略全体称为策略集；
博弈双方的策略集一般记为：
S s1 , s2 ,, sm D d1 , d 2 ,, d n
例：囚犯困境中，每个囚犯均有2个策略：
{坦白，抵赖}
坦白
抵赖 0，-18 -10，0
当每个局中人从各自策略集合中选择一策略而组成的策略组成为一个局势，用 ( si , d j )来表示。（4）赢得（支付）局中人采用某局势时的收益值。例:当局中人甲选择策略si ，局中人乙选策略（si , d j ) 表示。 dj 时，局中人甲的赢得值可用 R甲
但是，尽管政府当时无力制止这种事情，公众也不必担心彩电价格会上涨。这是因为，“彩电厂商自律联盟”只不过是一种“囚徒困境”，彩电价格不会上涨。在高峰会议之后不到二周，国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态：无论其他厂商是否降价，我自己降价是有利于自己的市场份额扩大的。问题：明确该博弈问题的各要素：局中人、策略集、赢得矩阵

纳什简介 1994年诺贝尔经济学奖获得者，纳什在普林斯顿读博士时刚刚20岁出头，他的一篇关于非合作博弈的博士论文和其他两篇相关文章确立了他博弈论大师的地位。到上世纪50年代末，他已是闻名世界的大牌科学家了。
然而，正当他的事业如日中天的时候，天妒英才，他得了严重的精神分裂症。多亏前妻艾莉西亚的爱心呵护和普林斯顿大学诸多朋友和同事无私的帮助才没有使他流落街头，并最终把他推上诺贝尔经济学奖宝座（1994年获奖）。
最终结果：每个人都“不出钱”。这种纳什均衡使得所有的人的福利都没法得到提高。
例：军备竞赛
冷战期间，美苏两国的军备竞赛，使得两国的社会福利都变得更糟。
案例分析：生活中的“囚徒困境”例子
—— 商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利，但实际上却是相互杀价，结果都赚不到钱。当一些商家共谋将价格抬高，消费者实际上不用着急，因为商家联合维持高价的垄断行为一般不会持久，可以等待垄断的自身崩溃，价格就会掉下来。