策略博弈第二版)

策略博弈第二版)
策略博弈第二版)

《策略博弈》(第二版)

书名:《策略博弈》(第二版)

书号:978-7-300-10135-4

着译者:阿维纳什·迪克西特苏珊·斯克丝着

蒲勇健译

开本:16 开

出版时间:2009.02

定价:65.00元

◆作者简介◆

阿维纳什·迪克西特(Avinash.Dixit)教授是美国当代最负盛名的经济学家之一,1968年获美国麻省理工学院经济学博士学位,1977年当选计量经济学会院士,自1981年起一直在普林斯顿大学任经济学教授,同时被世界多所知名大学聘为客座教授,曾在加州伯克利大学、牛津大学任教。他于1992年当选为美国艺术和科学研究院院士,2001年任计量经济学会会长,2002年任美国经济学联合会副会长,2005年当选国家科学院院士,曾在加州伯克利大学、牛津大学任教。研究领域广泛,在微观经济理论、博弈论、国际贸易、产业组织、增长和发展理论、公共经济学以及新制度经济学等多个领域有重要建树,近年来主要致力于政策制定中的政治经济学的研究。他着作甚丰,除在《美国经济评论》、《经济学季刊》、《政治经济学杂志》、《经济研究评论》等顶级专业期刊上发表多篇学术论文外,他还撰写了一系列着作,其中大部分均已成为经济学相关研究领域的名着或经典教科书。

迪克西特教授的代表着作《策略思维》、《经济政策的制定》、《不确定条件下的投资》、《法律缺失与经济学》均由中国人民大学出版社出版。

◆内容简介◆

《策略博弈》(第二版)是其在《策略思维》基础上进一步完善写作和案例上之后的通俗博弈论力作。如果说《策略思维》是20世纪80年代国际上最为流行的通俗博弈论教科书之一,那么《策略博弈》就是20世纪90年代以来国际上最为流行的通俗博弈论教科书之一。知识渊博的迪克西特在本书中通过运用标准的博弈论方法,通过对日常生活中的智慧、经济活动中的竞争与合作、政治活动中的技巧、军事活动及战争中的策略等的演绎,比较系统但又很简要地介绍了博弈论的有关基础知识,语言生动诙谐,故事精彩有趣,使得读者在漫游于引人入胜的故事情景之中的同时也可以通过博弈论的精致分析工具去了解其所以然。

◆名家推荐◆

迪克西特与斯克丝认识到了在大学课程计划的开始阶段教授博弈论概念的可能性;这是一个非常大的进步,值得赞许。通过使用《策略博弈》这本书,每一个地方的学生——正在安纳波利斯学习的年轻的军事战略家以及在芝加哥接受训练的经济理论家们——将可以获得一种对该领域的初步的介绍。大量的各种各样的解释性特例具有这样一种效果,即比起只有理论陈述而没有启发性例子来说,从该书里所学到的更加容易记住。

——约翰· F·纳什普林斯顿大学教授,诺贝尔经济学奖得主

了解博弈论将改变你整个一生中的思维方式。《策略博弈》为了解21世纪的新兴文化提供了一种令人赏心悦目的关键性构架。——保罗·A·萨缪尔森

麻省理工学院教授,诺贝尔经济学奖得主

《策略博弈》是一部会给初学者们开辟一个崭新世界的详尽准确且令人感到非常愉快的作品……每一个例子都非常艺术性地被挑选出来用以对策略性行为分析中的诸多难题之一加以解释……作者采用这样的思路和方法,使得其例子都是如此生动鲜明,从而产生了一种极为精细的和特别清晰的写作效果……这种非同寻常的力量组合使其成为一部理想的、内容自给的(self-contained)教材。——文森特·P·克

劳福德

加州大学圣地亚哥分校经济学系

该书是一部极棒的非技术性的博弈论导论。行文令人赏心悦目且不失幽默。作者对该主题的处理是非数学化的,但仍不失严谨和准确性。该书作为一部非常全面的优秀教科书十分引人注目,并且它对于学习非技术性的入门水平的博弈论来说是一个非常好的选择。“

——加琳娜·A·施瓦茨

密歇根大学商学院教授“作为博弈论的一部导论性教材,该书绝无对手。“

——萨德什·穆疆达尔

南印地安纳大学商学院

“我极为愿意赞美该作者写了一部启迪心智和有如此分析深度的,并且同时又是极具可读性和令人愉悦的书。干得好!“

——琳恩·佩帕尔

图辅(Tufts)大学经济学系◆读者定位◆

本书适合于作为经济管理各个专业高年级本科生基础博弈论课程的教科书,也可以作为相关专业研究生(包括博士研究生)的辅助读物,当然,学习政治、军事、法律及其他社会科学专业的学生,以及博弈论发烧友们也可以从本书中找到许多乐趣和汲取到许多知识营养。

智慧树知到《博弈策略与完美思维》章节测试题[完整答案]

智慧树知到《博弈策略与完美思维》章节测 试题[完整答案] 见面课:信号博弈 2、如果动态博弈的一个策略组合不仅在均衡路径上是纳什均衡,而且在非均衡路径上也是纳什均衡,这就是该动态博弈的一个子博弈完美纳什均衡。 A.对 B.错 正确答案:对 3、颤抖手均衡解决了博弈方犯错误的问题,因此能够保证它的预测一定就是实际博弈的结果。 A.对 B.错 正确答案:错 4、不完全信息动态博弈分析的基本方法也是逆推归纳法。 A.对 B.错 正确答案:错 5、在动态经济博弈论问题中,各个博弈方的选择和博弈的结果,与各个博弈方在各个博弈阶段选择各种行为的可信程度有很大关系。

B.错 正确答案:对 见面课:纳什均衡与应用 1、在囚徒困境的博弈中,两个囚徒合作的策略会形成( )。 A.纳什均衡 B.占优策略均衡 C.重复剔除的占优均衡 D.非纳什均衡 正确答案:非纳什均衡 2、在社会福利博弈中,流浪汉和政府博弈的均衡属于( )。 A.纯战略纳什均衡 B.混合战略纳什均衡 C.重复剔除的占优均衡 D.占优策略均衡 正确答案:混合战略纳什均衡 3、合作博弈就是博弈方采取相互合作态度的博弈。 A.对 B.错 正确答案:错 4、任何理性的博弈方都不可能采用严格下策。 A.对

正确答案:对 5、在考虑混合策略的情况下,我们不可利用重复剔除的方法进行分析求解。 A.对 B.错 正确答案:对 6、囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 A.对 B.错 正确答案:错 见面课:纳什生平故事漫谈 1、下列哪个博弈属于零和博弈( )。 A.囚徒困境 B.懦夫博弈 C.智猪博弈 D.硬币博弈 正确答案:硬币博弈 2、“敌不动,我不动”指的就是纳什均衡。 A.对

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

平新乔《微观经济学十八讲》课后习题详解(策略性博弈与纳什均衡)

第10讲 策略性博弈与纳什均衡 1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是 50020D Q p =- (1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。理由如下: 假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,A p 和B p 都不会严格大于10。否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足10A p ≤,10B p ≤。但是由于A p 的下限也是10,所以均衡时10A p =。给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。综上可知,均衡时的价格为10A p =,10B p ε=-。 (2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为: max pq cq ε>- ①

其中10p ε=-,()5002010q ε=-?-,把这两个式子代入①式中,得到: ()()0 max 1085002010εεε>----???? 解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为: ()()500201010εε-?--????。 (3)这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本,所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1)中,第一个数表示A 的支付水平,第二个数表示B 的支付水平,a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”,那么: 表10-1 博弈的支付矩阵 (1)1b >且1d < (2)1c <且1b < (3)1b <且c d < (4)b c <且1d < (5)1a <且b d <

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲 策略性博弈与纳什均衡 1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是 50020D Q p =- (1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。理由如下: 假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。其次,达到均衡时,A p 和B p 都不会严格大于10。否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。所以均衡价格一定满足10A p ≤,10B p ≤。但是由于A p 的下限也是10,所以均衡时10A p =。给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。综上可知,均衡时的价格为10A p =,10B p ε=-。 (2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为: max pq cq ε>- ① 其中10p ε=-,()5002010q ε=-?-,把这两个式子代入①式中,得到: ()()0 max 1085002010εεε>----???? 解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为:()()500201010εε-?--????。 (3)这个结果不是帕累托有效的。因为厂商B 的产品的价格高于它的边际成本,所以 如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。 2.(单项选择)在下面的支付矩阵(表10-1)中,第一个数表示A 的支付水平,第二个数表示B 的支付水平,a 、b 、c 、d 是正的常数。如果A 选择“下”而B 选择“右”,那么: 表10-1 博弈的支付矩阵

博弈论习题

、选择题 A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D 每个局中人在做决策时,不需考虑对手的反应 A. 策略式博弈无法刻划动态博弈; B. 策略式博弈无法表明行动顺序; C. 策略式博弈更容易求解; D. 策略式博弈就是一个支付矩阵。 B. 混合策略是博弈方根据一组选定的概率,在两种或两种以上可能的行为 中随机选择的策略; C. 有些博弈不存在纯策略纳什均衡,但存在混合策略的纳什均衡; D. 有些博弈既存在纯策略纳什均衡,也存在混合策略的纳什均衡。 博弈论》习题 1. 博弈论中,局中人从一个博弈中得到的结果常被称为( ): A. 效用; B. 损益; C. 决策; D. 利润 2. 下列关于策略的叙述哪个是错误的( ): 3. 囚徒困境说明( ): 4. 一个博弈中,直接决定局中人损益的因素是( ): 5、 A. 策略组合; B. 策略; C. 信息; D. 行动。 策略式博弈,正确的说法是( ): 6. 下列有关策略和纳什均衡的叙述正确的有( ): A. 纯策略是博弈方采取“要么做,要么不做” 的策略形式; 7、 古诺模型体现了寡头企业的 ( ) 决策模型。 A 成本 价格 产量 质量

8、伯特兰德模型体现了寡头企业的什么决策模型。 A 成本价格产量质量 9、用囚徒困境来说明两个寡头企业的情况,说明了:( A、每个企业在做决策时,不需考虑竞争对手的反应 B、一个企业制定的价格对其它企业没有影响 C、企业为了避免最差的结果,将不能得到更好的结果 D、一个企业制定的产量对其它企业的产量没有影响 10、子博弈精炼纳什均衡(): A.不是一个一般意义上的纳什均衡; B.和纳什均衡没有什么关系; C.要求某一策略组合在每一个子博弈上都构成一个纳什均衡; D.要求某一策略组合在原博弈上都构成一个纳什均衡。 11. 下列关于重复博弈的叙述哪些是正确的(): A.重复博弈又称为序贯博弈; B.影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性; C.如果博弈重复无限次,则局中人采取的针锋相对策略意味着任何一方参 与人的一次性不合作将触发永远的不合作; D.在有限次重复博弈中,若阶段博弈纳什均衡的唯一性存在,则每个阶段 出现的都是一次性博弈的均衡结果。 12. 在动态博弈战略行动中() : A. 首先作出选择并采取相应行动的局中人往往可以获得更多的收 益; B. 斯塔克博格模型与古诺模型对垄断厂商行为的分析方法及结论相同; C. 一般而言,只有当局中人从实施某一威胁所能获得的总收益大于不实施 该威胁所获得的总收益时,该威胁才是可信 的; D. 承诺是当事人使自己的威胁策略变得可信的行动,但它也是有风险的。 13、市场交易中普遍存在的讨价还价属于哪种博弈。( A 完全信息静态博弈完全信息动态博弈 C 不完全信息静态博弈不完全信息动态博弈 14、下面哪种模型是一种动态的寡头市场博弈模型( A 古诺模型伯川德模型

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论与策略行为

博弈论与策略行为 G a m e T h e o r y a n d S t r a t e g y B e h a v i o r 蔡继明 教授/主任 清华大学政治经济学研究中心 Center for Political Economy at Tsinghua University CPET

目录 第一讲:导论 一、博弈论的研究对象 第二讲:占优战略与社会两难第三 讲:纳什均衡和双人博弈第四讲:三 人博弈与n人博弈第五讲:纯战略和 混合战略第六讲:博弈的合作解第 七讲:序贯博弈与子博弈完美均衡第 八讲:重复博弈第九讲:企业经营决 策的博弈分析第十讲:企业内部组织 分析第十一讲:政府行为分析 第一讲 导论 博弈论是研究理性的决策主体在其行为发生直 接的相互作用时的策略选择及策略均衡的理论。 博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大 收益的策略)。 二、博弈论的产生和发展 博弈又称博戏,是一门古老的游戏。 1. 博弈在中国《学弈》(《孟子 ?告 子》):弈秋,通国 之善弈也。使弈秋侮 二人 弈,其一人专心致志,惟 弈秋之为听;一人虽 听之,一心以为有鸿 鹄将至,思援弓缴而射 之。虽与之俱学,弗若 之矣。为是其智弗若 与?吾曰:非然也。 《世本》说,“乌曹作博”,乌曹乃是 夏代著名之能工巧匠。千百年来,博 弈更是与人们的生活紧紧相连,从博 棋到牌戏,从斗戏到彩票,中华民族 的历史长河中就这样形成了别具风情 的博弈文化 从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战

1

博弈论知识点总结完整版

博弈论 (一):基本知识 1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。 1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。 合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。 博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈: a、完全信息静态博弈,纳什均衡,Nash(1950) b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965) c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968) d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form) 1.6占优均衡: a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 对于所有的s-i,si*称为参与人 i的严格占优战略,如果满足: ui(si*,s-i)>ui(si',s-i) ?s-i, ?si' ?si* b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡: a、“严劣”和“弱劣”的含义: 设s i’和s i’’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。 上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’’。 b、定义:重复剔除严格策略就是 各参与人在其各自策略集中, 不断剔除严劣策略…如果最终 各参与人仅剩下一个策略,则 该策略组合就被称为重复剔除 严劣策略均衡。 (二):纳什均衡(Nash Equilibrium) 2.1纳什均衡定义:对于一个策略式表述的博弈G={N,S i, u i,i∈N},称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡,如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i 的最优策略(经济理性策略),即:u i(s i*, s-i*)

策略博弈(第二版)

《策略博弈》(第二版) 书名:《策略博弈》(第二版) 书号:978-7-300-10135-4 著译者:阿维纳什·迪克西特苏珊·斯克丝著 蒲勇健译 开本:16 开 出版时间:2009.02 定价:65.00元 ◆作者简介◆ 阿维纳什·迪克西特(Avinash.Dixit)教授是美国当代最负盛名的经济学家之一,1968年获美国麻省理工学院经济学博士学位,1977年当选计量经济学会院士,自1981年起一直在普林斯顿大学任经济学教授,同时被世界多所知名大学聘为客座教授,曾在加州伯克利大学、牛津大学任教。他于1992年当选为美国艺术和科学研究院院士,2001年任计量经济学会会长,2002年任美国经济学联合会副会长,2005年当选国家科学院院士,曾在加州伯克利大学、牛津大学任教。研究领域广泛,在微观经济理论、博弈论、国际贸易、产业组织、增长和发展理论、公共经济学以及新制度经济学等多个领域有重要建树,近年来主要致力于政策制定中的政治经济学的研究。他著作甚丰,除在《美国经济评论》、《经济学季刊》、《政治经济学杂志》、《经济研究评论》等顶级专业期刊上发表多篇学术论文外,他还撰写了一系列著作,其中大部分均已成为经济学相关研究领域的名著或经典教科书。 迪克西特教授的代表著作《策略思维》、《经济政策的制定》、《不确定条件下的投资》、《法律缺失与经济学》均由中国人民大学出版社出版。 ◆内容简介◆ 《策略博弈》(第二版)是其在《策略思维》基础上进一步完善写作和案例上之后的通俗博弈论力作。如果说《策略思维》是20世纪80年代国际上最为流行的通俗博弈论教科书之一,那么《策略博弈》就是20世纪90年代以来国际上最为流行的通俗博弈论教科书之一。知识渊博的迪克西特在本书中通过运用标准的博弈论方法,通过对日常生活中的智慧、经济活动中的竞争与合作、政治活动中的技巧、军事活动及战争中的策略等的演绎,比较系统但又很简要地介绍了博弈论的有关基础知识,语言生动诙谐,故事精彩有趣,使得读者在漫游于引人入胜的故事情景之中的同时也可以通过博弈论的精致分析工具去了解其所以然。 ◆名家推荐◆ 迪克西特与斯克丝认识到了在大学课程计划的开始阶段教授博弈论概念的可能性;这是一个非常大的进步,值得赞许。通过使用《策略博弈》这本书,每一个地方的学生——正

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

《博弈策略与完美思维》2019章节测试题与答案

《博弈策略与完美思维》2019章节测试题与答案 第1章单元测试 1、博弈论中,参与人从一个博弈中得到的结果常被称为()。 答案:支付 2、根据博弈的参与人之间是否达成具有约束力的契约来分,博弈可分为()。 答案:合作博弈和非合作博弈 3、和威廉·维克瑞共同分享1996年诺贝尔经济学奖的是()。 答案:詹姆斯·莫里斯 4、每一个参与者对所有其他参与人的特征、策略空间和支付函数有准确的认识,这样的博弈为()。 答案:完全信息博弈 5、博弈的关键要素包括()。 答案:战略、参与人、信息、支付 第2章单元测试

1、在具有占优战略均衡的囚徒困境博弈中()。 答案:两个囚徒都会坦白 2、严格劣战略是指参与人的某一个战略()。 答案:相对于本人某个战略,得分是较低的 3、下列关于古诺模型的假设,说法正确的是()。 答案:某产品市场上仅有两家企业,高进入壁垒阻止了其他企业进入 4、下列说法正确的是下列说法正确的是 答案:购买实物的原始凭证,必须有验收证明、原始凭证必须记录真实,内容完整、有关现金和银行存款的收支凭证,如果填写错误,必须作废、一般原始凭证发生错误,必须按规定办法更正 5、一个博弈如果有多个纳什均衡,我们一般如何来实现某个具体的纳什均衡? 答案:帕累托上策均衡、风险上策均衡、聚点均衡、相关均衡第3章单元测试 1、下列描述哪个是正确的 ( ) 。 答案:策略与行动是两个不同的概念,策略是关于行动的详细计

划 2、下列说法正确的有()。 答案:资产负债表日后发生的调整事项如涉及现金收支项目的,均不调整报告年度资产负债表的货币资金项目和现金流量表正表各项目数字、资产负债表日后事项期间发生的“已证实资产发生减值损失”,可能是调整事项,也可能是非调整事项 3、子博弈精炼纳什均衡是哪一位博弈论专家提出的()。 答案:泽尔腾 4、里昂惕夫在 1946 年提出的劳资双方的博弈模型,属于什么类型的博弈? 答案:完全信息动态博弈 5、博弈树的基本结构包括()。 答案:结、枝、信息集 第4章单元测试 1、某一次性博弈中至少某一个局中人不完全了解另一个局中人的特征,即不知道某一参与人的真实类型,但是知道每一种类型出现的频率。这样的博弈是()。

策略博弈习题部分解答

博弈论与政治第三小组作业 第二章名词解释: 1、理性行为(rational behavior):参与人精于算计并严格按照其最优策略行事。其中理性有两个重要的内涵:一个人对自己的利益完全了解,并能完美地计算出何种行动可以最大化其利益。 2、不完美信息(imperfect information):在博弈的每一个行动时点上,参与人可能无法获悉决策所需的全部信息。这包括相关的外部环境——比如天气——的不确定性,以及对方先前或当前的行动。这类情况称为不完美信息。 3、不完全信息(incomplete information):当一个参与人比另一个参与人了解更多信息时,阴谋诡计就会产生。这类情况称为不完全信息。 4、合作博弈(cooperative game):博弈论使用两个专门术语来区分协议具有强制力和不具有强制力的情况。若协议对参与人行为具有强制力,则称此类博弈为合作博弈。 5、非合作博弈(noncooperate game):个体参与人可根据其利益采取行动,则称此类博弈为非合作博弈。 第三章名词解释: 1、中间评估函数(intermediate valuation function):赋予非终点结支付的规则被称为中间评估函数。 2、先动优势(firstmover advantage):在博弈的过程中先做决策带来的优势。先动优势来自于将其自身置于一个优势地位以及迫使其他参与人接受它的承诺能力。 后动优势(second-mover advantage):在博弈的过程中后做决策带来的优势。后动优势源于自己可对他人选择做出的灵活性。 第四章名词解释: 1、占优策略(dominant strategy)、劣策略(dominated strategy): 每一个博弈中的参与者通常都拥有不止一个竞争策略,其所有策略的集合构成了该企业的策略集。在参与者各自的策略集中,如果存在一个与其他竞争对手可能采取的策略无关的最优选择,则称其为占优策略(Dominant Strategy),与之相对的其他策略则为劣势策略。 占优策略是博弈论(game theory)中的专业术语,所谓的占优策略就是指无论竞争对手如何反应都属于本企业最佳选择的竞争策略。 2、占优可解(dominance solvable): 在规模较大的博弈中,或许没有单个策略占优于其他所有的策略,但可能也存在一些策略劣于其他某些策略。如果参与人发现自己处于这样一种博弈中,他

博弈论习题参考答案(2)

《博弈论》习题参考答案(第2次作业) 一、选择题 1.B 2.C 3.A 4.A 5.B 6.ABCD 7.C 8.B 9.C 二、判断正误并说明理由 1.F 上策均衡是比纳什均衡更严格的均衡概论 2.T 上策均衡是比纳什均衡更严格的均衡概论 3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈 4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战 5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性 6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡 7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。 8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标 9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益 10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标 11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标 12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高

三、计算与分析题 1、 (1)画出A 、B 两企业的损益矩阵。 (2)求纯策略纳什均衡。 (做广告,做广告) 2、画出两企业的损益矩阵求纳什均衡。 (1)画出A 、 B 两企业的损益矩阵 (2)求纳什均衡。 两个:(原价,原价),(涨价,涨价) 3、假定某博弈的报酬矩阵如下: 甲 乙 左 右 上 下 (1)如果(上,左)是上策均衡,那么,a>?, b>?, g? 答:a>e, b>d, f>h, ge, b>d 4、答:(1 )将这一市场用囚徒困境的博弈加以表示。 (2)解释为什么均衡结果可能是两家公司都选择竞争性策略。 答:若新华选择“竞争”,则北方也会选择“竞争”(60000>0);若新华选择

第五章-博弈论与竞争策略

第五章博弈论与竞争策略 第一节第二节第三节博弈论的基本概念完全信息静态博弈重复博弈和序列博弈 在现实经济社会,完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力,又面临很大的竞争压力。厂商之间具有相关性和依存性。因此,可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家:纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi),他们都对博弈论在经济学中的应用作出了贡献。 70年代以来,博弈论已经发展成为现代经济学的基础重要基础之一,改变了传统经济学的结构,这主要有两 个方面的原因: 1.传统经济学着重研究市场机制和价格制度,分析完全竞争市场中的最优决策,不考虑决策者之间的相互影响。但是,现实经济运行中市场是不完全竞争的,行为主体之间的决策具有相互影响。 2.完全竞争市场是以完全信息为条件的,这在现实经济运行中也难以保证。在信息不对称条件下,考虑行为主体相互影响的非价格制度可以用博弈论分析。 当然,应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外,关键是正确估计各参与者的策略空间和收益函数。 第一节博弈论的基本概念 一.博弈论及其特点 1.博弈和博弈论 博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。 博弈论(Game Theory)也称对策论,它是一种分析博弈过程和结果的数学方法,研究具有理性的多个行为主体的决策和行动直接相互作用和影响时,事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。 2.特点: (1)参与者具有各自的目标: (2)参与者都是理性行为者; (3)参与者之间具有相关性; (4)事态发展的结果取决于全部参与者的共同行为; (5)参与者要根据对其他参与者的判断决定自己的行动,因而是对策。 可见,博弈论是与优化论不同的决策理论。优化论是一种单人决策理论;博弈论所揭示的规律是一种多人决策理论。 二.博弈论的基本概念 在博弈论中,博弈的基本要素被概括为以下概念: 1)参与者Players (玩家):即参加博弈过程的行为和决策主体,也是利益主体。在一个博弈中,最少要有两个参与者。 2)策略Strategies (战略或策略行为):即参与者在某个博弈时点,根据其掌握的有关博弈信息而选择的决策变量和行动计划,一个参与者的全部可行策略称为他的策略空间。 接上页 3)收益Payoff(支付、得益)和收益函数:收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略,称为收益函数。 4)结局 outcome(结果):指博弈的结果,指既定策略组合条件下全部参与者所得收益的集合。 5)均衡 Equilibrium (均势):指达到稳定的策略组合或结局。 6)博弈规则:指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。 例: 可口可乐与百事可乐(参与者)的价格决策: 双方都可以保持价格不变或者提高价格(策略) 博弈的目标和得失情况体现为利润的多少(收益) 利润的大小取决于双方的策略组合(收益函数) 博弈有四种策略组合,其结局是: (1)如果双方都不涨价,各得利润10单位; (2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; (3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;

博弈论06 混合策略4

博弈论石头剪子布游戏 石头剪子布游戏 石头剪子布游戏 石头剪子布游戏 石头剪子布游戏 石头剪子布游戏 求混合策略的收益等值法 求混合策略的收益等值法

田忌赛马 田忌赛马出自《史记》卷六十五:《孙子吴起列传第五》,是中国历史上有名的揭示如何善用自己的长处去对付对手的短处、从而在竞技中获胜的事例。 田忌赛马 齐使者如梁,孙膑以刑徒阴见,说齐使。齐使以为奇,窃载与之齐。齐将田忌善而客待之。忌数与齐诸公子驰逐重射。孙子见其马足不甚相远,马有上、中、下辈。于是孙子谓田忌曰:“君弟重射,臣能令君

胜。”田忌信然之,与王及诸公子逐射千金。及临质,孙子曰:“今以君之下驷与彼上驷,取君上驷与彼中驷,取君中驷与彼下驷。”既驰三辈毕,而田忌一不胜而再胜,卒得王千金。于是忌进孙子于威王。威王问兵法,遂以为师。 田忌赛马 田忌赛马的均衡 田忌赛马的均衡 田忌赛马的均衡 情侣博弈混合策略均衡

情侣博弈有两个纯策略纳什均衡,同时情侣博弈是协调博弈,博弈中的两个局中人具有策略一致性,如果一方知道了另一方的选择,则会选择与对方一致的策略,换句话说,两个局中人都不害怕对方猜到自己的选择。 但由于该博弈有两个纳什均衡,而情侣双方对两个纳什均衡的偏好各不相同,因此当俩人从自身最大利益出发独立同时决策时,仍然无法确定博弈的结果是那个纯策略组合,因此需要考虑局中人采用混合策

略的可能性。 情侣博弈混合策略均衡 如果男方不想让女方利用自己的选择占上风,则自己的概率选择应使 情侣博弈混合策略均衡 男方的(3/4,1/4)和女方的(1/4,3/4)构成一个混合策略纳什均衡。 在该均衡下,双方的期望收益都是0.5,显然不如双方能协调一致、或者一方迁就另一方

博弈中最优策略的产生

博弈中最优策略的产生 艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。 社会实践中有很多合作的问题。比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。 A和B各表示一个人,他们的选择是完全无差异的。选择C代表合作,选择D代表不合作。如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。 显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。如果一方选C,一方选D,总体得5分。如果两人都选D,总体得2分。 对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于A来说,当对方选 C,他选D得5分,选C只得3分;当对方选D,他选D得1分,选C得零分。因此,无论对方选C或D,对A来说,选D都得分最多。这是A单方面的优超策略。而当两个优超策略相遇,即A,B都选D时,结果是各得1分。这个结构在矩阵中并非最优。困境就在于,每个人采取各自的优超策略时,得出的解是稳定的,但不是帕累托最优的,这个结果体现了个体理性与群体理性的矛盾。在数学上,这个一次性决策的矩阵没有最优解。 如果博弈进行多次,只要对策者知道博弈次数,他们在最后一次肯定采取互相背叛的策略。既然如此,前面的每一次也就没有合作的必

相关文档
最新文档