博弈论
博弈论定义与主要思想

Selten and Harsanyi
泽尔腾(1965)将纳 而海萨尼则发展了刻
什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概念; 以及进一步刻画不完 全信息动态博弈的 “完备贝叶斯纳什均
画不完全信息静态博 弈的“贝叶斯纳什均 衡”(1967-1968)。 总之,他俩进一步将 纳什均衡动态化,加 入了接近实际的不完 全信息条件。他们的
著名经济学家保罗.萨缪尔森说:“要想在现代 社会做一个有文化的人,您必须对博弈论有一 个大致了解。”
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的 思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式 。
2005年诺奖授予有以色列和美国双重国籍的罗 伯特·奥曼和美国人托马斯·谢林,以表彰他们 在博弈论领域作出的贡献。
主要思想
博弈论并不是经济学的一个分支,它只是一种 方法,这也是为什么许多人将其看成数学的一 个分支的缘故。
在对参与者行为研究这一点上,博弈论和经济 学家的研究模式是完全一样的。经济学越来越 转向人与人关系的研究,特别是人与人之间行 为的相互影响和相互作用,人与人之间利益和 冲突、竞争与合作,而这正是博弈论的研究对 象。
4、信息指的是参与人在博弈中所知道的 关于自己以及其他参与人的行动、策略 及其得益函数等知识;
5、得益是参与人在博弈结束后从博弈中 获得的效用,一般是所有参与人的策略 或行动的函数,这是每个参与人最关心 的东西;
博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
博弈论

博弈论是一种建立在抽象推理基础之上“研究处于利益冲突的各方在竞争性活动中制定最优化胜利的策略”的理论。
作为科学行为主义学派的重要一支,博弈论不仅是研究国际冲突的策略理论,而且还是处理国际关系问题的实际手段。
(二)、博弈论的要素
1、弈者(想获得最优结果的参与者);
双方让路
(最保险、最可靠选择) A让B不让
(B的最佳方案)
A不让B让
(A的最佳方案) 相撞
(最差的结果)
双方零合博弈的典型事例是:冷战时期的美苏争夺格局。
②、多方零合博弈
多方零合博弈的典型事例是:国际关系中的领土或资产纠纷。
(3)、零合博弈强调冲突的可能性以及解决冲突的机制。
(结构现实主义理论强调国际结构中冲突的可能性,认为国际结构中的国家为了获取自己的相对收益,常常是以牺牲别国为代价的(零合博弈))。
双方变数博弈的典型即,长期以来美苏之间的军备竞赛政策的运用。
②、多方变数博弈
它是“有三方以上参与者的博弈,并且一方所得并非其他方所失,得失之和并不等于零”。
该博弈与两方变数博弈特点相似。但由于独立决策者的增多,策略的相互依存关系也就更为复杂,策略的数目按几何级数上升(2的n次方),因此目前学术界并没有关于多方非零和博弈的成熟理论。尽管如此,政治学家还是指出,该类博弈的“关键问题就是如何能够实现让所有博弈者都满意的合理的收益分配”。
(二)、支持
博弈论提出假设的有效方法,为对外政策决策者说面临的战略选择作出了解释。
博弈论是国际关系和外交决策研究的“思想发动机”,有助于一国实现最佳的策略选择,有助于认识国际冲突的性质、动力和结果,不失为一种具有实用价值的关于对策的研究方法。
《西方经济学》第七章 博弈论

21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼 精炼 贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡 这个概念是完全信息动态博弈的子博弈精炼纳 什均衡与不完全信息静态均衡的贝叶斯纳什均 衡的结合.具体来说,精炼贝叶斯均衡是所有 参与人战略和信念的一种结合.它满足如下条 件:第一,在给定每个参与人有关其他参与人 类型的信念的条件下,该参与人的战略选择是 最优的.第二,每个参与人关于其他参与人所 属类型的信念,都是使用贝叶斯法则从所观察 到的行为中获得的.
22
贝叶斯法则 贝叶斯法则是概率统计中的应用所观察 到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23
习
题
1. 什么是占优策略均衡?什么是重复剔除的占优策 略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性 博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品 的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产 多少产量?各获得多少利润?
25
�
第七章
第一节 第三节 第四节 第五节
博弈论
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
第一节 博弈问题概述
一,博弈的基本概念 二,博弈的分类
2
一,博弈的基本概念
博弈论 博弈论(game theory)是研究决策主体的 行为发生直接相互作用时候的决策以及这 种决策的均衡问题的. 博弈论的基本概念包括:参与人 行动 参与人,行动 参与人 行动, 战略,信息 支付函数,结果 均衡. 信息,支付函数 结果,均衡 战略 信息 支付函数 结果 均衡
什么是博弈论?

什么是博弈论?博弈论是一门研究策略决策的学科,它涉及到两个或多个参与者的博弈过程。
博弈论的研究对象可以是经济、政治、社会等领域,也可以是日常生活中的人际交往。
下面,我们来详细了解一下这门学科。
一、博弈论的起源博弈论起源于20世纪40年代,当时美国数学家冯·诺依曼(John von Neumann)和经济学家奥斯卡·莫根斯特恩(Oskar Morgenstern)合著了《博弈论与经济行为》一书。
这是一本奠定博弈论基础的重要著作,它将博弈论应用于经济学领域,从而成为博弈论的奠基之作。
二、博弈论的基本概念1.参与者博弈论的参与者指的是博弈过程中参与决策的个体或组织,例如一个独立的个人、两个公司或国家之间的竞争。
2.策略策略是指参与者在博弈中所采用的行为方式或决策方法。
不同的策略可能导致不同的博弈结果,因此博弈过程中策略的选择非常重要。
3.收益收益是博弈过程中参与者所能获取的利益,包括经济利益、社会地位、权力等。
收益对参与者而言是决策的目的和结果,因此其大小和分布会影响博弈的结果。
4.博弈形式博弈形式指的是博弈参与者、策略和收益之间的关系,是博弈过程的精神核心。
博弈形式一般分为合作博弈和非合作博弈两种,而在这两种博弈形式下,又分别有多种复杂的形式。
三、博弈论的应用1.经济学领域博弈论在经济学领域的应用最为广泛。
经济学研究的主题之一是市场竞争,而博弈论可以帮助我们透彻理解市场竞争的规律。
例如,博弈论可以用来研究企业之间的价格战、垄断行为、拍卖等问题。
2.政治学领域博弈论在政治学领域的应用也非常重要。
政治学研究的主题之一是国家之间的竞争和协作,而博弈论可以帮助我们研究国际关系、外交政策等问题。
例如,博弈论可以用来研究国际贸易谈判、军备竞赛等问题。
3.人际交往领域博弈论在人际交往领域的应用也相当重要。
通过博弈论,我们可以学习如何有效地沟通和合作,避免双方的冲突和误解。
例如,博弈论可以用来研究双方的协调、合作等问题。
博弈论

博弈论是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的学科。
博弈的分类根据不同的基准也有所不同。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
博弈论概述
一般地,称 si*为局中人i的(严格)占优策略, 若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地,所有的 si' si* 被称为“劣策略”。注意:这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1,则甲选3;乙选2,则甲选1;乙选3, 则甲选1。乙在行动时会估计到甲的行动,它估计三种选择 中的最高代价为策略1(损失900万),其次为策略2(损失 600万),最低为策略3(损失为500万)。因此,乙必选代 价最低的策略3。——最大最小原理。结论:乙选择3,甲选 1作为回应,乙损失500万,甲获益500万。
在博弈论里,一个博弈可以有两种表述方式:一种是策 略式(strategic form representation)表述,另一种是 扩展式( extensive form representation )表述。前者 适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式 表述中,所有参与人同时选择各自的策略,所有参与人选择 的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.
博弈论的定义和主要思想
清华诚志
9
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的 思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式 。
清华诚志
12
两种均衡
占优策略是无论其他局中人采取什么策 略对于自己来说都是最好的策略。
占优均衡所有局中人都有占优策略而形 成的均衡。
纳什均衡是指某一局中人在其他局 中人的策略给定时选择最好策略而 形成的均衡。
清华诚志
13
占优均衡一定是纳什均衡,但 纳什均衡不一定是占优均衡。
占优均衡
– “不管你做什么,我所做的都是最佳选择。” – “不管我做什么,你所做的都是最佳选择。”
纳什均衡
– “给定你的行为,我所做的是最佳选择。” – “给定我做什么,你所做的是最佳选择。”
清华诚志
14
博弈的分类
1)根据参与人的多少,可将博弈分为两人 博弈和多人博弈;
2)根据博弈结果的不同,又可分为零和博 弈、常和博弈和变和博弈;
3)根据博弈方策略的数量,可分为有限博 弈和无限博弈;
清华诚志
清华诚志
5
Selten and Harsanyi
泽尔腾(1965)将纳 什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概 念;以及进一步刻画 不完全信息动态博弈 的“完备贝叶斯纳什 均衡”
博弈论
博弈论研究的主题是:理性人的互动行为。
博弈论作为一种解释力非常强的理论有三个基本假定:1 、理性人假定;2 、利益相关性假定; 3 、每个人是理性的是所有参与者的公共知识。
博弈论是一门数学,这是博弈论的学科特点。
主要有三种博弈:零和博弈;变和博弈;常和博弈。
对于任何一个博弈来说,都有一个均衡点,也就是那什均衡,那什均衡是博弈的解。
博弈论中的典型例子:囚徒困境。
囚徒困境在博弈论中有一个经典案例--囚徒困境,非常耐人寻味。
“囚徒困境”说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了。
但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
博弈论
支付
支付是指在一个指定的战略组合下参与 人得到的确定效用水平,或者是参与人 得到的期望效用水平
结果
结果是博弈分析者所要揭示的东西,是 分析者感兴趣的要素的集合,如均衡战 略组合,均衡行动组合,均衡支付组合 等。
均衡
均衡,是所有参与人的最优战略组合或 行动组合
博弈类型
博弈的类型可以从两个角度描述; (1) 参与人行动的先后顺序。从此度,博 弈可以分为静态和动态两种。(2)参与 人对有关其他参与人(竞争对手)的特 征、战略空间及支付函数的知识。从此 角度,博弈可分为完全信息博弈和不完 全信息博弈
囚犯的难题
博弈的纳什均衡的另一个问题是它并不 一定导致帕累托有效的结果。 囚犯的难题深刻揭示了这一问题。 囚犯的难题在经济和政治现象中有广泛 的应用。如:裁军计划、两个寡头选择 产量的博弈等。
完全信息动态博弈: 子博弈精炼纳什均衡
动态博弈和精炼纳什均衡 有限次重复博弈:“连锁店之迷” 无限次重复博弈:“针锋相对”策略
动态博弈与精炼纳什均衡
用混合策略解决有些博弈中不存在纳什均衡的问题, 除此之外,纳什均衡还有另外的问题,即有些博弈中 可能不止一个(甚至是无穷个)纳什均衡,而究竟哪 个均衡实际上会发生?很难回答。在纳什均衡中,参 与人在选择自己的战略时,把其他参与人的策略当作 给定的,不考虑自己的选择将如何影响对手的 策略。 实际上,当一个人行动在前,另一个人行动在后时, 后者自然会根据前者的选择调整自己的选择,前者在 作选择时自然会理性地考虑这一点,所以,不可能不 考虑自己的选择对其对手选择的影响。由于纳什均衡 中,不考虑这种影响,事实上便允许了“不可置信威 胁的”存在,于是增加了纳什均衡的个数。而泽而腾 机敏地引入动态博弈分析完善了纳什均衡的概念。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。
博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。
简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。
1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。
20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。
在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。
1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。
博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。
它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。
正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。
正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。
”张维迎:《博弈论与信息经济学》,上海人民出版社2004 年版,第3 页。
②2001 年诺贝尔经济学奖授予了在不对称信息市场理论方面做出杰出贡献的三位博弈论专家,他们是美国加利福尼亚大学伯克利分校的阿克诺夫(GorgeAkerlof)教授、斯坦福大学的斯宾塞(A. M. Spence)教授和哥伦比亚大学的斯蒂格利茨(J. Stiglitz)教授。
在博弈论分析中,一定场合下的每个博弈者在决定采取何种行动时都策略地、有目的地行事,他既要考虑其他博弈者对自己决策行为的影响,又要考虑自己的决策对其他博弈者决策的可能影响,并在寻求自身效益最大化的前提下,来确定自己的决策。
一个博弈所包括的要素有:参与人、信息、策略、行动的次序、收益、结果。
1、参与人:参与人是博弈的决策主体,他们的目的是通过选择行动(或策略)以最大化自己的支付(效用)水平。
参与人可以是自然人,也可以是各种社会组织,如企业、政府、社团等。
2、信息:信息是参与人有关博弈的知识,特别是有关“自然①”的选择、其他参与人的特征和行动的知识。
信息对于博弈参与者的意义和作用至关重要,掌握信息的多少将直接影响到决策的准确性,从而关系到整个博弈的成败。
3、策略:策略是指在博弈的每一环上,参与者的行事规则,即按什么规则选择行动。
在不同的博弈中可供博弈方选择的策略或行动很不相同。
即使在同一博弈中,不同博弈方的可选策略或行为也常常不同,有时只有有限的几种,甚至只有一种,而有时又可能有许多种,甚至无限多种。
4、行动的次序:在现实的各种决策中,当多个独立博弈方进行决策时,有时候这些博弈方必须同时做出选择(这样能保证公平合理),但有时候各博弈方的决策又必须有先后之分。
并且,在一些博弈中每个博弈方还要不止一次地做出选择,这就免不了有一个次序问题。
因此,规定一个博弈就必须规定其中的次序,不同的次序必然是不同的博弈,即使其他方面都相同。
5、收益:在博弈论中,收益或者是指在一个特定的战略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用水平。
收益可以是正值,也可以是负值。
虽然各博弈方在各种情况下的收益是客观存在的,但这并不意味着各博弈方都充分了解各方的收益情况。
在许多博弈中,总存在某些博弈方对其他博弈方的收益无法肯定的情况。
6、结果:结果是指博弈中参与者的行动所产生的每一种可能性,包括策略的组合、行动组合以及支付组合等。
①这里所说的“自然”是指代表随机选择作用的博弈方。
2.2.2 纳什均衡纳什在他1950 年的经典论文中,首先提出了他自己称为“均衡点(Equilibrium Point)”的纳什均衡概念,并且同时证明了在相当广泛的博弈类型中,混合策略意义上的纳什均衡是普遍存在的。
纳什均衡可以描述为:如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。
纳什均衡揭示了博弈均衡与经济均衡的内在联系,它奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开。
纳什均衡的普遍存在性,意味着纳什均衡在分析大多数博弈问题中,都是一种基本的分析方法。
因此,在本文的分析中也把纳什均衡作为基本的分析工具之一。
一博弈理论概述经典博弈论概述博弈论又被称为对策论,它是研究决策者在决策主体各方相互作用情况下如何进行决策及有关这种决策的均衡问题的理论。
与其他理论不同,博弈论强调决策主体各方策略的相互依存性,即任何一个决策主体必须在考虑其他局中人可能的策略选择基础上来确定自己的最优行动策略。
其精髓在于博弈中的一个理性决策者必须考虑局中其他人反应的基础之上来选择自己最理想的行动方案。
所谓均衡即所有局中参与人的最优策略组合,各方博弈产生的结果是一个均衡结局,它可能不是局中各方及整体的利益最大化,但它是在已给定信息与知识条件下的一种必然结果,因为任何一方改变策略而导致均衡的变化都有可能使自己得到一个更差的结果。
博弈论研究人们的行为在直接相互作用时的决策以及决策的均衡问题。
经典博弈论预设人是完全理性的,即人人都会在给定的约束条件下最大化自身的利益,人们的行为互相影响且通常信息不对称。
博弈的结局往往是一种博弈策略组合所产生的均衡结果,我们称之为纳什均衡。
,即给定对手的策略,每个参与人选择自己的最优策略。
本文根据理性假设依据的不同,把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈论,它是依据完全理性的经济人出发来研究均衡问题的将经典博弈论与生态演化论相结合的博弈理论称之为演化博弈论,它是依据有限理性的社会人出发来研究均衡问题的。
演化博弈论概述演化博弈论概念。
演化博弈论又称进化博弈论,是经典博弈论与生态演化论相结合的研究成果,它从有限理性的社会人出发来分析参与人的资源配置行为,并以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。
演化博弈理论基本均衡概念一进化稳定策略。
进化稳定策略,,是由梅纳德·史密斯和普赖斯在年引入,并由史密斯在著作《演化与博弈论》中得到了进一步的发展。
其直观思想是如果一个群体原群体的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体更高的期望支付,随着时间的演化,突变者群体最终会从原群体中消失,原群体所选择的策略就是进化稳定策略。
如果用于分析人类的群体行为,那么进化的结果将是那些选择突变策略的群体最终会改变策略而选择进化稳定策略。
演化博弈论基本动态概念一模仿者动态。
进化博弈论用系统论的观点看待群体行为的调整过程,主要研究群体行为演化系统的变化,如何描述动态系统的状态变化是进化博弈论的关键,对此经济学家从不同的方面对演化系统的过程进行了描述,提出了不同的动态模型。
到目前为止,在进化博弈论中应用得最多的还是由在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态即。
所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。
经典博弈论与演化博弈论的区别理性假定不同。
经典博弈论从完全理性出发,把经济中参与人之间的行为关系看作为一种原子式的互动或者机械式的反应。
该理论认为在任何情况下,参与人都能对环境的任何变化做出最优反应,然而在多数情况下这个理性假定是难以满足的。
演化博弈论从有限理性出发,认为经济中参与人只能知道世界状态的一部分而不可能知道世界的所有状态,参与人也不可能知道各种状态出现的客观概率及不同状态对自己支付的意义,在多数情况下参与人并不能对环境的任何变化做出最优反应,其决策是基于某种常规而非理性的计算结果,这种常规一般来自于博弈的历史,因为历史已经包含了对手如何行动的相关信息,同时通过对历史的观察有助于参与人知道什么是成功策略什么是不成功策略。
研究对象及方法不同。
经典博弈论以参与者个人为研究对象,它虽然认为个人之间的行为是相互影响的,但却在假定其他参与人行为选择一定的情况下来考察个人最优化行为。
即假定每个参与人都能从对手的选择中正确地推断出博弈的支付结构进而预测到均衡结果,所以不需要考察达到均衡的动态过程。
演化博弈论以参与人群体为研究对象,假定各群体、个体之间的行为相互影响且不同群体的个体之间进行重复博弈,个体在给定信息下并不一定选择最优化行为,而是通过学习、模仿等动态调整过程做出决策,其均衡的结果依赖于博弈的历史及博弈所处的社会环境等。
达到均衡的过程影响均衡的结果,因而演化博弈论主要利用动态方法研究群体达到均衡的行为调整过程,这种方法可以把从个体行为到集体行为的形成机制、组织和制度等因素都纳入到模型中,因此能够更真实地反应经济主体行为的多样性和复杂性。
动态概念不同。
经典博弈论虽然也研究动态博弈,但与演化博弈论所研究的动态不同。
经典博弈论的动态博弈假定各参与人都有特定的对手,以参与人行为的时间顺序及信息的传递为依据。
在动态博弈中后行动者通过观察选择先行动者的选择而做出最优反应决策,先行动者也会预期到自己的行动会传递自己的信息,因而先行动者在给定预期后行动者的行为反应下选择自己的最优策略,后行动者在给定先行动者行为所传递的信息下做出自己的最优选择。
显然这种动态博弈并不涉及达到均衡的调整过程也不涉及外在因素对均衡的影响。
演化博弈论假定参与人并没有特定的博弈对手,它所强调的动态是相对于群体行为达到均衡的调整过程。