不存在纯策略纳什均衡的重复博弈

不存在纯策略纳什均衡的重复博弈
不存在纯策略纳什均衡的重复博弈

平新乔《微观经济学十八讲》课后习题详解(策略性博弈与纳什均衡)

第10讲 策略性博弈与纳什均衡 1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是 50020D Q p =- (1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。理由如下: 假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,A p 和B p 都不会严格大于10。否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足10A p ≤,10B p ≤。但是由于A p 的下限也是10,所以均衡时10A p =。给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。综上可知,均衡时的价格为10A p =,10B p ε=-。 (2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为: max pq cq ε>- ①

其中10p ε=-,()5002010q ε=-?-,把这两个式子代入①式中,得到: ()()0 max 1085002010εεε>----???? 解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为: ()()500201010εε-?--????。 (3)这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本,所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1)中,第一个数表示A 的支付水平,第二个数表示B 的支付水平,a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”,那么: 表10-1 博弈的支付矩阵 (1)1b >且1d < (2)1c <且1b < (3)1b <且c d < (4)b c <且1d < (5)1a <且b d <

博弈论与纳什均衡

《博弈论与纳什均衡理论》 姓名张贺祺 学号 2010010404 专业政治经济学 指导老师张秉云

摘要 博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 关键字:博弈论;纳什均衡;合作博弈;非合作博弈

目录 摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) (一)博弈论的主要思想 (4) (二)博弈论的分类 (5) 三、经典案例 (7) (一)博弈论的经典案例 (7) (二)纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) (一)博弈论的重要影响 (8) (二)纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论 一、引言 近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。 博弈论(Game Theory):亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 纳什均衡:(Nash equilibrium)又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。假设有n人局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 二、博弈论与纳什均衡的主要内容 (一)博弈论的主要思想 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P:为局中人,博弈的参与者,也称为博弈方,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。决策人:在博弈中率先做出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者:在博弈二人对局中行动滞后的那个人,与决策人要做出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,因此对

平新乔《微观经济学十八讲》课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第 10 讲策略性博弈与纳什均衡 跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。 以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。 1.假设厂商 A与厂商 B的平均成本与边际成本都是常数, MC A 10, MC B 8,对厂商产出的需求函数是 Q D 500 20p ( 1)如果厂商进行 Bertrand 竞争,在纳什均衡下的市场价格是多少? ( 2)每个厂商的利润分别为多少? ( 3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行 Bertrand 竞争,纳什均衡下的市场价格是 p B 10 , p A 10 ,其中是一个极小的正数。理由如下: 假设均衡时厂商 A 和 B 对产品的定价分别为 p A 和 p B ,那么必有 p A 10 , p B 8 ,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,p A和 p B 都不会严格大于 10。否 则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足p A 10, p B 10。但是由于 p A 的下限也是10,所以 均衡时 p A 10。给定 p A 10,厂商 B的最优选择是令 p B 10 ,这里是一个介于 0到2 之间的正数,这时厂商 B可以获得整个市场的消费者。综上可知,均衡时的价格为p A 10 , p B 10 。 ( 2)由于厂商 A 的价格严格高于厂商 B 的价格,所以厂商 A 的销售量为零,从而利润也是零。下面来确定厂商 B 的销售量,此时厂商 B是市场上的垄断者,它的利润最大化问题为: max pq cq ① 其中 p 10 ,q 500 20 10 ,把这两个式子代入①式中,得 到: max 10 0 8 500 20 10 解得0 ,由于必须严格大于零,这就意味着可以取一个任意小的正 数, 所以厂商 B的利润 为: 500 20 10 10 。 (3)这个结果不是帕累托有效的。因为厂商 B 的产品的价格高于它的边际成本,所以 如果厂商 B和消费者可以为额外 1 单位的产品协商一个介于 8 到10 之间的价格,那么厂商 B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商 A的剩余(因为A 的利润还是零)。

博弈论和纳什均衡

博弈论和纳什均衡文件管理序列号:[K8UY-K9IO69-O6M243-OL889-F88688]

关于博弈论和纳什均衡你应该知道这些 腾讯财经[]2015-05-25 10:05 我要分享 [摘要]纳什在与命运的博弈中找到均衡,纪念大师最好的方式就是尝试了解博弈论。 腾讯财经综合报道(风生)奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸,两人均不幸遇难。事发当时,这辆出租车失控撞向栏杆,两人均被抛出车外。 约翰-纳什因发表两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即着名的纳什均衡。 不均衡人生中孕育出均衡论 纳什于1928年在美国西弗吉尼亚州出生,曾在麻省理工学院任教,晚年为普林斯顿大学担任数学系教授,死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名,1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。

纳什在数学领域上取得多项突破,但他同时深受精神分裂症困扰,其生平故事在2001年被改编成电影《美丽心灵》,赢得包括最佳电影在内的4项奥斯卡奖项。 尽管西维亚-纳萨斯(Sylvia Nasars)广为人知的小说《美丽心灵》(A Beautiful Mind)和改编自该书的、由拉塞尔-克罗(Russell Crowe)主演的同名奥斯卡电影探究了纳什错综复杂的生平,但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界,人们普遍认为,与牛顿和爱因斯坦的数学理论相比,纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题,而纳什的数学却可以应用在生物学和社会学领域。 如若不是精神疾病的困扰,纳什今天可能已与那些科学伟人齐名。尽管如此,他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就,他与约翰海萨尼(John Harsanyi)和莱茵哈德-泽尔腾(Reinhard Selten)一起获得了1994年诺贝尔经济学奖。 什么是博弈论与纳什均衡 博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争

博弈论和纳什均衡

博弈论和纳什均衡

关于博弈论和纳什均衡你应该知道这些 美股腾讯财经[微博]2015-05-25 10:05 我要分享 139 [摘要]纳什在与命运的博弈中找到均衡,纪念大师最好的方式就是尝试了解博弈论。 腾讯财经综合报道(风生)奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸,两人均不幸遇难。事发当时,这辆出租车失控撞向栏杆,两人均被抛出车外。 约翰-纳什因发表两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。 不均衡人生中孕育出均衡论 纳什于1928年在美国西弗吉尼亚州出生,曾在麻省理工学院任教,晚年为普林斯顿大学担任数学系教授,死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名,1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。 纳什在数学领域上取得多项突破,但他同时深受精神分裂症困扰,其生平故事在2001年被改编成电影《美丽心灵》,赢得包括最佳电影在内的4项奥斯卡奖项。 尽管西维亚-纳萨斯(Sylvia Nasars)广为人知的小说《美丽心灵》(A Beautiful Mind)和改编自该书的、由拉塞尔-克罗(Russell Crowe)主演的

同名奥斯卡电影探究了纳什错综复杂的生平,但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界,人们普遍认为,与牛顿和爱因斯坦的数学理论相比,纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题,而纳什的数学却可以应用在生物学和社会学领域。 如若不是精神疾病的困扰,纳什今天可能已与那些科学伟人齐名。尽管如此,他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就,他与约翰海萨尼(John Harsanyi)和莱茵哈德-泽尔腾(Reinhard Selten)一起获得了1994年诺贝尔经济学奖。 什么是博弈论与纳什均衡 博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 纳什均衡:又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰-纳什命名。假设有n人局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 近代对于博弈论的研究,开始于策墨咯,波雷尔及冯-诺伊曼。1928年,冯-诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯-诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰-福布斯-纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡 1 ?假设厂商A与厂商B的平均成本与边际成本都是常数,MC A=10, MC B =8,对厂 商产出的需求函数是 Q D二500 -20 p (1)如果厂商进行Bertrand竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand竞争,纳什均衡下的市场价格是p B =10 一;,p A =10 , 其中;是一个极小的正数。理由如下: 假设均衡时厂商A和B对产品的定价分别为p A和p B,那么必有p A刃0 , p B K8,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,p A和p B都不会严格大于10。否 则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高 自己的利润。所以均衡价格一定满足p A空10 , p B?「0。但是由于p A的下限也是10,所以均衡时P A =10。给定P A =10 ,厂商B的最优选择是令 P B =10- ;,这里:是一个介于0到2 之间的正数,这时厂商B可以获得整个市场的消费者。综上可知,均衡时的价格为P A =10 , P B =10 -;。 (2)由于厂商A的价格严格高于厂商B的价格,所以厂商A的销售量为零,从而利润也是零。下面来确定厂商B的销售量,此时厂商B是市场上的垄断者,它的利润最大化问题为: max pq —cq ①其中p =10 _ q =500 -20 107、把这两个式子代入①式中,得到: max (10 —芯―)500 —20(10 —名卩 解得;=0,由于;必须严格大于零,这就意味着;可以取一个任意小的正数,所以厂商 B 的利润为:||500-20 10 -; 10-;。 (3)这个结果不是帕累托有效的。因为厂商B的产品的价格高于它的边际成本,所以 如果厂商B和消费者可以为额外1单位的产品协商一个介于8到10一;之间的价格,那么厂商B的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A的剩余(因为A的利润 还是零)。 2.(单项选择)在下面的支付矩阵(表10-1 )中,第一个数表示A的支付水平,第二个数表示B的支付水平,a、b、c、d是正的常数。如果A选择“下”而B选择“右”,那么: (1) b .1 且 d :::1

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲 策略性博弈与纳什均衡 1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是 50020D Q p =- (1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。理由如下: 假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,A p 和B p 都不会严格大于10。否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足10A p ≤,10B p ≤。但是由于A p 的下限也是10,所以均衡时10A p =。给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。综上可知,均衡时的价格为10A p =,10B p ε=-。 (2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为: max pq cq ε>- ① 其中10p ε=-,()5002010q ε=-?-,把这两个式子代入①式中,得到: ()()0 max 1085002010εεε>----???? 解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为:()()500201010εε-?--????。 (3)这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本,所以 如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1)中,第一个数表示A 的支付水平,第二个数表示B 的支付水平,a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”,那么: 表10-1 博弈的支付矩阵

博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较 【摘要】均衡概念是构成整个博弈论的基石,对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。本文首先将博弈划分为不同的类型,并对主要的均衡概念进行了数学描述,最后对不同的均衡概念进行了比较。 【关键词】博弈论;纳什均衡;重复博弈 博弈论在现代经济学中占据着相当重要的位置,在微观经济学的本科教学环节中,如果将博弈论这一部分排除在外,那么教学内容是不完整的,并且和现代微观经济学的发展严重脱节。但是由于课时以及学生接受能力的限制,对博弈论的内容进行全面深入地讲解难以做到,因此,将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。在博弈论的基本概念当中,最重要的当属博弈均衡的概念,这些概念的掌握有助于学生把握博弈论的整体框架,并对博弈论的后续学习至关重要。因此,本文将主要的博弈均衡概念进行分类和表述,并对不同的博弈概念进行比较,以期对博弈论的教学有所助益。 一、博弈的主要类型 博弈构成的基本要素包括:1、参与人(1~N);2、各个参与人各自可选择的行动集合Ai={ai};3、参与人i的策略Si,给定信息集,该策略决定在博弈的每一阶段他选择的行动;4、参与人的收益Ui (S1,S2…SN)。依据不同的分类标准,博弈可以被划分为不同的类型。 1、静态博弈、动态博弈和重复博弈 博弈各方同时选择策略的博弈称为静态博弈,如猜硬币、投标等,静态博弈一般可以用支付矩阵来表达。动态博弈是指博弈各方按照一定的先后次序进行策略的选择,典型的例子如对弈,动态博弈一般可以用“博弈树”来表达。Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。重复博弈是指同一个博弈(静态或动态)反复进行所构成的博弈过程,如体育比赛中的多局赛制等。 2、完全信息和不完全信息博弈 完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈,不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。 3、完美信息和不完美信息博弈 在动态博弈中,一参与人完全了解在自己行为之前的博弈进程,则称此参与人为有完美信息的参与人,如果博弈中所有的参与人都具有完美信息,则称此动态博弈为完美信息的动态博弈。反之,如果在存在具有不完美信息的参与人(参

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡 在纳什均衡中,你不一定满意其他的策略,但你的策略是回馈对手招数的最佳策略。 从囚徒困境中我们会发现,作为博弈各方的行动就是针对对方行动而确定的最佳对策,而一旦知道对方在做什么,就没人愿意改变自己的做法。博弈论学把这么一个结果称为均衡。这个概念是有普林斯顿大学数学家约翰·纳什提出的,因此被称为纳什均衡。 诺贝尔经济学奖获得者萨缪尔森有句名言,你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词,供给与需求。博弈论专家坎多瑞引申说:“要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是纳什均衡”。 1950年,还是一名研究生的纳什写了一篇论文,题为《n人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。 纳什的贡献是,他证明了在这一类的竞争中,在很广泛的条件下是有稳定解存在的,只要是别人的行为确定下来,竞争者就可以有最佳的策略。 那么,什么纳什均衡呢?简单说,就是一策略组合中,所有的参与者面临这样的一种情况:给定你的策略,我的策略是我最好的策略。给定我的策略,你的策略也是你最好的策略,即双方在对方给定的策略下不愿意调整自己的策略。 纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具,所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展,甚至说是一场革命。 纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战,按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果,

从纳什均衡引出一个悖论:从利己的目的触发,结果损人不利己。“囚徒困境”就是如此,从这个意义说,纳什均衡提出的悖论实际上动摇了西方经济学的基石。 纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。这个法则如下:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。 在囚徒困境中存在唯一的纳什均衡点,即两个囚犯均选择“招认”,这是唯一稳定的结果。 有些博弈的纳什均衡点不止一个,如下述夫妻博弈中有两个纳什均衡点。 丈夫和妻子商量晚上的活动,丈夫喜欢看拳击,而妻子喜欢欣赏歌剧,但两个人都希望在一起度过夜晚。在这个夫妻博弈中有两个纳什均衡点:要么一同去看歌剧,要么一同去看拳击。在有两个或两个以上纳什均衡点的博弈中,其最后的结果难以预测。在夫妻博弈中,我们无法知道,最后结果是一同欣赏歌剧还是一同看拳击。 是不是所有的博弈均存在纳什均衡点呢?不一定存在纯策略纳什均衡点,但至少存在一个混合策略均衡点。 这里所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略,所谓混合策略是指参与者采取的不是唯一的策略,而是其策略空间上的概率分布。 我们下面将在警察与小偷的博弈中给出混合策略的说明。 在西部片里,我们常能看到这样的故事:某个小镇上只有一名警察,他要负责整个镇的治安,现在我们假定,小镇的一头有一家酒馆,另一头有一家银行,再假定该地有一个小偷,要实施偷盗。因为分身乏术,警察一次只能在一个地方

博弈论与纳什平衡

博弈论与纳什平衡 博弈论(game theory)对人的基本假定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。 纳什(John Nash)编制的博弈论经典故事"囚徒的困境",说明了非合作博弈及其均衡解的成立,故称"纳什平衡"。 所有的博弈问题都会遇到三个要素。在囚徒的故事中,两个囚徒是当事人(players)又称参与者;当事人所做的选择策略(strategies)是承认了杀人事实,最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认杀人,另外一个抵赖,不承认杀人,那么承认者将会得到减刑处理,而抵赖者将会得到最严厉的死刑判决,在纳什故事中两个人都承认了犯罪事实,所以两个囚徒得到的是中间的结果。 类似的:我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。 在互联网这个原始丛林中:最优策略是如何产生的呢? 一、博弈中最优策略的产生 艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。 社会实践中有很多合作的问题。比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。 A和B各表示一个人,他们的选择是完全无差异的。选择C代表合作,选择D代表不合作。如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。 显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。如果一方选C,一方选D,总体得5分。如果两人都选D,总体得2分。 对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于A来说,当对方选C,他选D得5

博弈论与纳什均衡

第22卷哈尔滨师范大学自然科学学报 Vol .22,No .42006 第4期 NAT URAL SC I E NCES JOURNAL OF HARB I N NOR MAL UN I V ERSI TY 博弈论与纳什均衡 郭 鹏 (中国矿业大学) 杨晓琴 (鸡西大学) 【摘要】 纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础. 关键词:博弈论;纳什均衡;非合作博弈 收稿日期:2006-02-15 0 引言 博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论.两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽.作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期.然而,它过于抽象,实用性不强,其局限性日益暴露出来.50年代以来,纳什(Nash )、泽尔腾(Selten )、海萨尼(Harsanyi )等人使博弈论成熟并最终进入实用.最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究.1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情.博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具. 简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡.博弈论由3个基本要素组成:一是决策主体(Player ),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是 效用(U tility ),是可以定义或量化的参与人的利 益,也是所有参与人真正关心的东西,又称偏好或支付函数.参与人、策略集和效用构成了一个基本的博弈. 1 博弈论的主要思想 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失. 博弈论模型可以用五个方面来描述:G ={P,A,S,I,U ) P:为局中人,博弈的参与者,也称为“博弈 方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标. A:为各局中人的所有可能的策略或行动的集合.根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等.

3-混合策略的纳什均衡

博弈论教学/混合策略的纳什均衡 出自MyKnowledgeBase < 博弈论教学 Bread crumbs: Main Page > 博弈论教学/混合策略的纳什均衡 目录 ■1 复习 ■2 混合策略(Mixed strategy) ■2.1 举例/Example ■2.2 概念 ■2.3 纯策略和混合策略 ■2.4 混合策略的争议 ■3 混合策略的纳什均衡 ■3.1 基本概念 ■3.2 混合策略纳什均衡的存在性/纳什定理 ■3.3 学术争议与批评 ■4 混合策略纳什均衡举例 ■4.1 社会福利博弈Social Welfare Game ■4.1.1 博弈分析(方法1:收益无差异) ■4.1.2 博弈分析(方法2:图形分析法) ■4.1.3 博弈分析(方法3:导数(Derivative)极值法) ■4.2 普通例子 ■4.3 审计博弈(Tax Game) ■4.4 激励的悖论[5] ■4.5 求解纳什均衡的一般方法 ■5 多重纳什均衡 ■5.1 多重纳什均衡举例 ■5.1.1 夫妻之争 ■5.1.2 制式问题 ■5.1.3 市场机会博弈 ■5.2 多重纳什均衡分析 ■5.2.1 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.1 帕累托最优Pareto optimality ■5.2.1.2 帕累托上策均衡(Pareto Dominated Equilibrium) ■5.2.1.3 举例分析 ■5.2.2 风险上策均衡(Risk-dominant Equilibrium) ■5.2.3 聚点均衡(Focal Points Equilibrium) ■5.2.4 相关均衡 ■5.2.5 抗共谋均衡(coalition-proof Nash equilibrium)■6 纳什均衡的意义 ■7 作业 ■8 参考文献

智猪博弈论与纳什均衡

智猪博弈理论 介绍 在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:

从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。 在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为! 高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。 博弈与制度由智猪博弈故事得到的启示 在这个例子中,对小猪而言,无论大猪是否踩动踏板,不去踩踏板总比踩踏板好。反观大猪,明知小猪不会去踩踏板,但是去踩踏板总比不踩强,所以只好亲历亲为了。这个案例令我们不得不思考—— 【博弈与制度】 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。

论博弈论与纳什均衡的影响及局限

论博弈论与纳什均衡的影响及局限 摘要:纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。同时,纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础。 关键词:纳什均衡、博弈论、影响、局限 引言:Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在。以两家公司的价格大战为例,Nash 平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡。纳什均衡理论正如克瑞普斯①书中所说,?在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。? 博弈论是研究决策主体的行为发生直接相互作用时候的决

以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 一.博弈论的影响 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。 博弈论所研究的是理性的决策者之间冲突及合作的理论,可以为实际决策提供理论基础和方向指导。其最终追求结果是使博弈方达到利益最大化的均衡。 博弈论不仅仅存在于数学的运筹学中,也正在经济学中占据越来越重要的地位,但如果你认为博弈论的应用领域仅限于此的话,那你就大错了。实际上,博弈论甚至在我们的工作和生活中无处不在!在工作中,你在和上司博弈,也在和下属博弈,你也同样会跟其他相关部门人员博弈;而要开展业务,你更是在和你的客户以及竞争对手博弈。在生活中,博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。诺贝尔经济学奖获得者包罗·萨缪尔逊如是说:要想在现代社会

博弈论复习题及答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

纯策略纳什均衡

纯策略纳什均衡 纯策略纳什均衡(Pure Strategy Nash Equilibrium ) 什么是纯策略纳什均衡 纯策略纳什均衡 是指在一个纯策略组合中,如果 给定其他的策略不变,该节点不会单方面改变自己的 策略,否则不会使节点访问代价变小。 如果重复博弈中有惟一纯策略纳什均衡,那么我 们怎么找出它的纯策略纳什均衡呢?首先看下面囚徒 的困境的博弈的例子: 我们现在考虑该博弈重 以理解成给囚徒两次坦白机 会,最后的得益是两个阶 段博弈中各自得益之和.在两次博弈过程中,双方知 道第一次博弈的结果再进行二次博弈.用逆推归纳法 来分析,先分析第二阶段,也就是第二次重复时两 博 存在纯策略纳什均衡的有限次重复博弈 [1] 复两次的重复博弈,这可

弈方的选择.很明显,这个第二阶段仍然是两囚徒之 间的一个囚徒的困境博弈,此时前一阶段的结果已成 为既成事实,此后又不再有任何的后续阶段,因此实 现自身当前的最大利益是两博弈方在该阶段决策中的 惟一原则. 因此我们不难得出结论,不管前一次的博弈得到 的结果如何,第二阶段的惟一结果就是原博弈惟一的 纳什均衡 (坦白,坦白 ) ,双方得益 (-5 ,-5) . 现在再回到第一阶段,即第一次博弈.理性的博 弈方在第一阶段就对后一阶段的结局非常清楚,知道 第二阶段的结果必然是 (坦白,坦白 ) ,因此不管第一 阶段的博弈结果是什么,双方在整个重复博弈中的最 终得益,都将是第一阶段的基础上各加 -5 .因此从第 一阶段的选择 来看,这个 于是我们可以得出惟一纯策略均衡的 有限次重复 博弈的结果就是重复原博弈惟一的纯策略纳什均衡, 这就是 这种重复博弈惟一的 子博弈完美纳什均衡 路 径. 重复博弈 与图 l 表示的一次性博弈实际上是完全等价的. 中得益矩阵

博弈论复习题与答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

相关文档
最新文档