博弈论基础

合集下载

博弈论基础吉本斯课后答案

博弈论基础吉本斯课后答案

博弈论基础吉本斯课后答案
一、原题
1. 什么是博弈论?
答:博弈论是一门研究决策者之间的竞争性行为的学科,它研究的是如何在竞争性环境中获得最佳结果。

它涉及到决策者之间的博弈,以及如何利用策略来获得最佳结果。

2. 什么是吉本斯博弈论?
答:吉本斯博弈论是一种研究两个或多个决策者之间的博弈的学科,它研究的是如何在竞争性环境中获得最佳结果。

它是由美国经济学家约翰·吉本斯在20世纪50年代提出的,他提出了一种新的方法来研究博弈,即使用数学模型来分析博弈的结果。

3. 吉本斯博弈论的基本概念是什么?
答:吉本斯博弈论的基本概念是博弈矩阵,它是一个表格,用来描述两个或多个决策者之间的博弈。

它由行和列组成,每一行代表一个决策者,每一列代表另一个决策者,每个单元格中的数字代表每个决策者在每种可能的结果下的收益。

4. 吉本斯博弈论中的均衡点是什么?
答:吉本斯博弈论中的均衡点是指当两个或多个决策者之间的博弈结果达到一种平衡时,每个决策者都不会有更多的收益。

这种平衡可以是一个纳什均衡,也可以是一个非纳什均衡,具体取决于博弈的结构。

博弈论基础

博弈论基础

博弈论基础第一节博弈问题概述一、博弈的基本概念博弈论的基本概念包括:参与人、行为、信息、战略、支付函数、结果、均衡。

参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。

行动是指参与人的决策变量。

战略是指参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。

例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。

这里,“犯”与“不犯”是两种不同的行动。

战略规定了什么时候选择“犯”,什么时候选择“不犯”。

信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。

支付函数是参与人从博弈中获得的效用水平,它是所有参与人战略或行动的函数,是每个参与人真正关心的东西。

结果是指博弈者感兴趣的要素的集合。

均衡是所有参与人的最优战略或行动的组合。

上述概念中,参与人、行动、结果统称为博弈规则。

博弈分析的目的是使用博弈规则决定均衡。

二、博弈的分类根据博弈者选择的战略,可以将博弈分成合作博弈(cooperative games)与非合作博弈(non-cooperative games).合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。

如果有,就是合作博弈;反之,就是非合作博弈。

根据参与人行动的先后顺序,可以将博弈分成静态博弈(static game)与动态博弈(dynamic game)。

静态博弈是指,博弈中参与人同时选择行动;或者虽非同时行动,但行动在后者并不知道行动在先者采取了什么具体行动。

动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。

根据参与人对其他参与人的了解程度,可以将博弈分成完全信息博弈(games of complete information)和不完全信息博弈(games of incomplete information)。

完全信息博弈是指:在每个参与人对所有其他参与人(对手)的特征、战略和支付函数都有精确了解的情况下,所进行的博弈。

博弈论基础

博弈论基础

其他参与人选择什么策略,某参与人的 最优策略是唯一的,这样的唯一的最优 战略被称为“占优策略”; � “博弈均衡”指博弈中的所有参与人都不想 改变自己的策略的这样一种状态。
(一)占优策略均衡
� 在一个博弈中,如果每个参与人都有一
个占优策略,且每个参与人都采取占优 策略,那么由所有参与人的(占优)策 略组合所构成的均衡就是占优策略均衡。 � 占优策略均衡的求解: 常用方法——划线法
“囚犯的困境”博弈中的“报酬矩阵” (Payoff Matris)
嫌犯B 坦白 不坦白 坦白 -10,-10 0,20 嫌犯A 不坦白 -20,0 -1,-1
三、占优策略均衡和纳什均衡
� (一)占优策略均衡 � (二)纳什均衡 � (三)占优策略均衡和纳什均衡比较
(一)占优策略均衡
� 占优策略(Dominant Strategies):不论
二、博弈的基本概念
� 1、参与人(players):一个博弈中独立决策、
独立承担结果的主体。 � 2、行动(actions or moves):参与人在博弈 的某个时点的决策变量。 � 3、策略(strategies):参与人在给定信息 集的情况下的行动规则 � 4、得益(pay off)(或支付、报酬):指在 一个特定的策略组合下参与人得到的确定效用 水平,或者是指参与人得到的期望效用水平。
(二)纳什均衡
� 在一个纳什均衡里,如果其他参与人不
改变策略,任何一个参与人都不会改变 自己的策略。
(二)纳什均衡
例:斗鸡博弈 B 进 A 退 0, 2 0,0 进 -3,-3 退 2,0
(三)占优策略均衡与纳什均衡比较
� 占优策略均衡要求任何一个参与人对于
其他参与人的任何策略选择来说,其最 优的策略都是唯一的。 � 纳什均衡只要求任何一个参与人在其他 参与人的策略选择给定的条件下,其选 择的策略是最优的。 � 占优策略均衡一定是纳什均衡,但纳什 均衡不一定就是占优策略均衡。

纳什均衡——博弈论的基础

纳什均衡——博弈论的基础

纳什均衡——博弈论的基础下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。

文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by the editor. I hope that after you download them, they can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!In addition, our shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!纳什均衡——博弈论的基础引言博弈论作为一门交叉学科,融合了数学、经济学、政治学等多个领域的知识,旨在研究决策者在相互影响下的最佳策略选择。

博弈论前四章笔记整理

博弈论前四章笔记整理

博弈论前四章笔记整理第一章:博弈论基础概念。

- 博弈的定义与要素。

- 博弈是指在一定的规则下,多个参与者(至少两个)进行策略选择并得到相应结果(收益)的过程。

- 要素包括参与者(局中人)、策略(每个参与者可选择的行动方案)、收益(每个参与者在不同策略组合下的所得)。

例如在“囚徒困境”中,两个囚犯是参与者,坦白或不坦白是他们的策略,不同策略组合下的刑期长短就是收益。

- 博弈的分类。

- 按参与者数量可分为两人博弈和多人博弈。

- 按策略空间是否有限分为有限博弈和无限博弈。

如猜硬币是有限博弈(正面或反面两种策略),企业的产量竞争(产量可在一定范围内连续取值)可能是无限博弈。

- 按收益情况分为零和博弈(一方的收益就是另一方的损失,总和为零,如赌博)、常和博弈(收益总和为常数)和非零和博弈(收益总和不为零,如企业合作共同开拓市场,双方都可能获利)。

第二章:完全信息静态博弈。

- 策略式表述(标准式表述)- 通常用一个矩阵来表示,行代表一个参与者的策略,列代表另一个参与者的策略,矩阵中的元素是对应的收益组合。

以“性别战”为例,丈夫和妻子选择看电影或看球赛,就可以构建一个2×2的收益矩阵。

- 占优策略均衡。

- 占优策略是指无论其他参与者选择什么策略,该策略都是某个参与者的最优策略。

如果每个参与者都有占优策略,那么由这些占优策略组成的策略组合就是占优策略均衡。

例如在“囚徒困境”中,每个囚徒的占优策略都是坦白,所以(坦白,坦白)是占优策略均衡。

- 纳什均衡。

- 纳什均衡是指在一个策略组合中,每个参与者的策略都是对其他参与者策略的最优反应。

即给定其他参与者的策略,没有参与者有动机单方面改变自己的策略。

与占优策略均衡不同,纳什均衡并不要求每个参与者都有占优策略。

例如在“性别战”中,(看电影,看电影)和(看球赛,看球赛)都是纳什均衡。

第三章:完全信息动态博弈。

- 扩展式表述。

- 包括博弈树的构建,节点表示参与者的决策点,树枝表示可选择的策略,终端节点表示博弈的结果并标有相应的收益。

博弈论基础

博弈论基础

博弈论基础本讲要点:博弈论的基本思想,博弈的构成要素,简单博弈的求解方法,纳什均衡的概念,博弈的分类,动态博弈与重复博弈,信息不对称,道德风险,逆向选择,信号传递。

重点:博弈论的基本思想,纳什均衡的概念,信息不对称。

难点:博弈的构成要素,纳什均衡的概念。

讲授时间:6学时一、博弈的基本要素1、博弈论与古典经济学的区别古典经济学的基本思路:给定约束条件,考虑行为主体的最优结果。

博弈论的基本思路:以行为主体之间的相互影响为前提,考虑行为主体的最优结果。

两者的根本区别:是否考虑对方的行为。

古典经济学中消费者行为理论:假定收入、商品价格以及效用函数给定,求最优消费组合。

消费者A不会考虑消费者B的影响。

古典经济学中的厂商理论:假定生产函数、成本函数、商品价格给定,求厂商的最优生产决策。

厂商A不会考虑厂商B的影响。

古典经济学中的宏观经济理论:假定一国的资源禀赋给定,考虑价格指数、利率等因素的变化对国民收入、就业等的影响。

国家A不会考虑国家B的影响。

博弈论:每个人要考虑别人的行为怎样影响自己的选择。

扑克牌游戏:一个人不可能只顾自己出牌,而不考虑别人怎么出牌。

下棋:无论中国象棋、国际象棋、围棋,一个人在走某一步之前,都要考虑对手是怎么走的,以及对手在我走了一步之后会怎么走,以及我又会在对手走了一步之后怎么走,以至无穷。

高手与俗手的区别也就在此。

高手往往能够考虑10步甚至20步以后的变化。

总之:你的输赢不仅取决于你的决策,而且取决于你对手的决策。

2、博弈论简史博弈论的思路在古诺(Cournot,Antoine Augustin,1801-1977)的双头垄断模型中最早提出,冯•诺伊曼(John von Neumann,1903-1957)和摩根斯坦恩(Oskar Margenstern, 1902-1977)在1944年出版了《博弈论与经济行为》(Theory of Games and EconomicBehavior)一书,最早提出了博弈论的概念。

博弈论基础

博弈论基础

博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

参见:行为生态学(behavioral ecology)。

约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。

1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

五讲博弈论基础 共72页

五讲博弈论基础 共72页

第一节 博弈论导论
博弈的四要素: 1.博奕的参加者,即博奕方或参与人。
2.各博奕方可选择的全部策略或行为的集合。
3.进行博奕的次序。
4.博奕方的得益。 例:囚徒困境
囚徒A
坦白 抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为:A、B都选择坦白,各判8年刑
第一节 博弈论导论
比如说:夜间唱歌
科斯定理图示
农场主的边际净损失
牧羊的边际利润
S
P
O
社会最优量
牧养人放牧的数量
说明
如果产权归农场主,农场主可以禁止放牧(点0),小于 社会最优量S;但此时,增加放牧给牧羊人带来的边际利 润大于给农场主造成的损失,牧羊人将有积极性贿赂农场 主,直到放牧量达到S为止;
如果产权归牧羊人,牧羊人的利润最大点是P,大于社会 最优量S;但此时,减少放牧量对牧羊人的边际利润损失 小于给农场主节约的边际成本,所以,农场主将有积极性 贿赂牧羊人,直到S;
博奕论前提假设:博弈的参与者都是理性人 所谓理性人是指有一个很好定义的偏好,在面临给定的约束 下最大化自己的偏好。 理性人可能是利己主义者,也可能是利它主义者。
第一节 博弈论导论
例:囚徒困境
囚徒A
坦白 抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为:A、B都选择坦白,各判8年刑
革命通常不是一个帕累托改进。
外部性与科斯定理
个人收益与社会收益:一项活动的社会收 益等于决策者个人得到的收益加社会其他 成员得到的收益,如养花;
个人成本与社会成本:社会成本等于决策 者的个人承担的成本加社会其他成员承担 的成本,如环境污染,交通堵塞;
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

ECON 40050Game TheoryExam 1- Answer KeyInstructions:1) You may use a pen or pencil, a hand-held nonprogrammable calculator, and a ruler. No other materials may be at or near your desk. Books, coats, backpacks, etc... must be placed against the wall. No electronic communication devices may be used.2) As soon as the instruction to begin the test is given, please check that you have 10 numbered pages.3) Be sure to show all of your work. Answers without supporting calculations will receive zero credit. You will receive credit only for the answers and supporting calculations that appear in this test packet.4) All exams must be turned in by 1:45 pm. No extensions will be granted.5) Be sure to read each question in its entirety before beginning your analysis.6) The time estimates at the beginning of each question are only suggestions to help you manage your time.NAME ____________________________________________Question 1 (10 minutes)_______ (15 points)Question 2 (10 minutes)_______ (15 points)Question 3 (10 minutes)_______ (15 points)Question 4 (15 minutes)_______ (15 points)Question 5 (20 minutes)_______ (20 points)Total: (65 minutes)_______ (80 points)1. Define each of the terms in a-f. Do not use equations. Rather explain what each of these concepts means in words.a. Strategy profile - A list consisting of one strategy for each player. (2)b. Nash equilibrium - A strategy profile for which each player's strategy is a best response to the profile of all other players' strategies. (2)c. Dominant strategy - A strategy is dominant for a player if it is the player's best strategy no matter what strategy choices all other players make. (2)d. Dominated strategy - A strategy is dominated for a player if there is a second strategy that does at least as well no matter what strategy choices other players make and, for some profile of strategies for all other players, the second strategy does strictly better. (2)e. Mixed strategy - A mixed strategy involves a player randomizing over 2 or more pure strategies. (2)f. Reaction function - A reaction function describes a player's optimal strategy as a function of the strategy choices of all other players. (2)g. What are the components of a strategic form game? The set of players, the space of all possible strategy profiles, and a description of payoffs for each player as a function of the strategy profile. (3)2. The questions in this problem refer to the following game.Player2L M RU1,23,52,1Player 1M0,42,13,0D-1,14,30,2a. Determine if either player has any dominated strategies. If so, identify them.R for player 2 is dominated by M. For each player 1 strategy, M gives player 2 a higher payoff than does R. (2)b. Does either player have a dominant strategy? Why or why not?No. For either player to have a dominant strategy, 2 of her 3 strategies would need to be dominated. (2)c. Use iterated elimination of dominated strategies to solve this game. Be clear about the order in which you are eliminating strategies. Also specify whether you are eliminating strictly or weakly dominated strategies.1. Eliminate R as above. (Strict)2. In the 3 x 2 game, U strictly dominates M.3. In the2 x 2 game, M strictly dominates L. 4. In the 2 x 1 game, D strictly dominates U.IEDS Solution = (D,M). (5)d. Is your solution a Nash equilibrium? Why or why not?Yes, all IEDS solutions are Nash equilibria. If starting at (U,M), one player had an alternative strategy that gave her a higher payoff, IEDS would not have eliminated that alternative strategy. (3)e. Give an example of a game that has a pure strategy Nash equilibrium that cannot be found using iterated elimination of dominated strategies.One example would be the Battle of the Sexes game. (3)Player2B OPlayer 1B2,10,0O0,01,23. Consider the following strategic-form game.Player2L M RPlayer 1U2,43,01,-1D3,210,30,4a. Find all pure- and mixed-strategy Nash equilibria of this game. Be sure to show all of your steps.1. For any 8 between 1/5 and 1/2, a strategy of playing L with probability 8 and R with probability 1-8 strictly dominates M.2. Show that the 2x2 game has no pure strategy Nash equilibrium.2. Let p denote the probability with which player 1 plays U and let q denote the probability with which player 2 plays L.3.Eu1(U) = 2q + 1 - q = 1+qEu1(D) = 3qEu2(L) = 4p + 2(1-p) = 2 + 2pEu2(R) = -p + 4(1-p) = 4 - 5p4. Player 1 will be willing to mix if Eu1(U) = Eu1(D) or when q = 1/2.Player 2 will be willing to mix if Eu2(L) = Eu2(R) or when p=2/7.5. There is one Nash equilibrium of this game: (p,q) = (2/7,1/2).b. What is the strategic advantage of using a mixed strategy?It keeps the other player(s) off balance. They cannot anticipate how you will play the game.c. Show that one of player 2's strategies is never a best response to any of player 1's pure strategies. Show for this game that this strategy is dominated by a mixed strategy.L is the best response to U and R is the best response to D. Thus, M is never a best response. See part (a), step 1.ScoringSet-up (2)No Pure Nash(2)Eu1 and Eu2calculations(4)Solution(2)M dominated - q2 = 0(1)part (b)(2) part (c)(2)4. If 2 spiders find a dead insect at the same time, each spider will make menacing gestures to scare off the other. If one spider backs down, that spider gets nothing and the other spider gets the insect to itself. If both spiders back down, they can share the insect. If neither backs down, the spiders will fight. The payoffs resulting from the fight depend on the sizes of the spiders and are described below.Spider2BackFightdown5,50,10Spider 1BackdownFight10,0x,ya. Suppose the spiders are the same size so that x=y. For what values of x, will each spider have a dominant strategy? What is the dominant strategy? (Show your work)Since Fight is a best response Back Down. Fight is the only candidate for a dominant strategy. Fight will be a best response to Fight as long as x=y > 0. (5)b. Again, suppose the spiders are the same size. For what values of x, will this game be a Prisoners' Dilemma? (Show your work)To be a Prisoners' Dilemma, the game must have a dominant strategy equilibrium and this equilibrium must be Pareto inferior to some other set of payoffs. If 0 < x=y < 5, then the dominant strategy equilibrium will be (Fight, Fight) but both spiders would be better off if they both played Back Down.(5)c. Suppose when spider 1 is smaller than spider 2 that x < 0 < y. Show that this game does not have a dominant strategy equilibrium but that it can be solved using IEDS.For spider 1, Back down is a best response to Fight so spider 1 does not have a dominant or a dominated strategy.For spider 2, Fight will be a dominant strategy so we can eliminate Back Down for the larger spider.In the resulting 2x1 game, Fight is strictly dominated by Back Down for the smaller spider. Thus, IEDS yields the unique solution (Back Down, Fight). (5)5. There are two firms that produce identical products. These firms compete in each of two periods. Each firm starts out with 100 units of capital. In period 1, each firm must decide how much capital to invest in research (k 1 for firm 1 and k 2 for firm 2). In period 2, the firm will use the rest of its capital to produce its product. One unit of capital generates one unit of the firm's product. If firm 1 produces q 1 units in period 2 and firm 2 produces q 2 units in period 2, then the market price will be 200 - q 1 - q 2.Period 1 research reduces a firm's second period production cost. Without any research, the firm will be able to produce at a constant marginal cost of $50/unit. With research, the firm 1's constant marginal cost of production will equal50(200 - k 1- .001k 1k 2)/200and firm 2's constant marginal cost of production will equal50(200 - k 2- .001k 1k 2)/200.a. Write down the strategic form of this game. (5)N = {1,2}; S i = {k i | 0 # k i # 100 }b. Calculate each firm's reaction function. (4) Plot these reaction functions on the same graph.(3)c. Calculate the Nash equilibrium and locate it on your graph from part (b). (3)The Nash equilibrium must satisfyUsing the quadratic formula, the symmetric Nash equilibrium is k 1 = k 2 = 48.98.d. Without calculating the cooperative solution directly, determine if the Nash equilibrium will result in too much or too little research in period 1?(3) Add the appropriate isoprofit curves to(2)positive externality for the other firm. This positive externality is not accounted for in each firm's profit-maximization calculations. Thus, the Nash equilibrium will result in too little research relative to the amounts that would maximize the firms' joint profit.。

相关文档
最新文档