博弈论课件 1

1

Lecture 1

Introduction to Game Theory,Extensive &Normal Form,Mixed Strategies and Beliefs 2

2

Readings

?Watson: Strategy_ An introduction to game theory

–Ch 1‐5:1rd ed p.1-40; 3rd ed p.1‐46.

?Introduction;The Extensive Form;Strategies &the Normal Form;Beliefs,Mixed Strategies and Expecte d Payoffs;General Assumptions and Methodology.?Appendix A:Review of Mathematics p.409‐420.3

2

Outline

?Introduction.

?Extensive form representation.

?Strategies.

?Examples.

?Normal form representation.?Mixed strategies.

?Beliefs.

?Expected payoffs.

?General assumptions.

4

2

Game Theory

?Mathematical models of strategic situations :

–Each agent’s behavior affects the well-being of other agents.?Perfect competition and monopoly are not strategic situations.

–In perfect competition no agent considers the specific action of any other individual agent.

–In monopoly the monopolist doesn’t worry about specific consumer’s actions.(Chooses price/quantity based on overall demand.)?Duopoly (2firms producing)is strategic.

–Each firm considers the other’s action when deciding on its own.

5

Ch2:The Extensive Form

1

6

2

Example 1

?A family is on vacation is San Diego.Their young children decide whether to behave or misbehave duri ng breakfast.

?After breakfast the parents decide whether the family goes to Legoland(乐高) or sits quietly in their hotel room for the rest of the day.

?This is a strategic situation.–Each party considers what the other is likely to do (or has already done)when making their own decision.

7

2

Formal Definition of a Game ?A game is (formally):

–A list of players ;

–Specification of all possible actions each player can take and when;

–The players’knowledge ?(what each player knows when he acts);

–How actions lead to outcomes ;

–A specification of preferences over outcomes.?A game can be non-cooperative or cooperative .–Non-cooperative:All decisions are made individually

8

2

Example 1

?Players:

–The children and their parents.

?Actions:

–Children –{Behave,Misbehave}

–Parents –{Legoland after the kids behave, Hotel after the kids behave, Legoland after the kids misbehave, Hotel after the kids misbehave}?Knowledge:

–We typically assume the players know the game and that each player is rational.

–Children –Don’t know anything else.

–Parents –Knows whether the children have behaved or misbehaved.?Outcomes &Preferences:

–We still need to specify these.We’ll do so later.9

2

Extensive Form Representation ?One way to represent games is with the extensive form.

–Nodes:Where players choose actions (or the game ends).–Branches:Specific actions.

–Labels: ?Player making a decision (for decision nodes);

?or actions (for branches).

–Payoffs:Represent preferences over outcomes.

–Information sets:Reveal what a player knows when he or she makes a decision.

10

Example1:Extensive Form

2

,

,

11

2

Information Sets

?An information set of player i is a collection of player i ’s nodes among which i cannot distinguish.–Perfect information : all information sets in the tree have just one node.

–Imperfect information : not perfect information.12

2

Example 1:Information Sets ?The children have one information set.–The initial node.

?Their parents have two information sets.

–When the parents make their decision they knows if the children behaved or misbehaved.?This is why their actions are labeled differently.

?For this example each information set is a single node.

?Each decision is associated with a single information set.13

2

Example 1(b)

?The children decide to behave or misbehave.?Their parents decide whether to take the family to Legoland or sit quietly in their hotel room.–But they don’t observe whether the children behaved or misbehaved.?This time the parents only have one information set.–Their decision cannot be contingent on anything.

14

Example1(b):Extensive Form

2

15

2

Example 1(b):Information Sets ?The children have one information set.–The initial node.

?The parents also have one information set.–When the parents make their decision they don’t know if the children behaved or misbehaved.?They don’t know which node they’re at when they makes their decision.

?This is why their actions are labeled the same at both nodes.?Each decision is still associated with a single information set.16

2

Strategies

?Strategy:A complete contingent plan for a player in a game.

–Prescribes an action for each of this player’ information sets.

?Example 1–strategy example:

–Children:Behave.

–Parents:Sit quietly in the hotel room if the children behave,and go to Legoland if the children misbehave.?Example 1(b)–strategy example:

–Children: Behave

–Parents: ?

17

Notation

2

18

2

Example 1

?S Children ={Behave,Misbehave},or for short {B ,M }?S Parents ={Legoland if behave and Legoland if misbehave,Legoland if behave and Hotel if misbehave,Hotel if behave and Legoland if misbehave,Hotel if behave and Hotel if misbeha ve}–We can simplify this notation to {LL ’, LH’, HL ’, HH ’}?One specific s is (B , LL ’)

19

2

Example 1(b)

?S Children ={Behave,Misbehave}

?S Parents ={Legoland,Hotel}

?One specific s is (Behave,Legoland)20

博弈论入门进阶书籍大全——如何成为智谋博弈大师

博弈论入门进阶书籍大全——如何成为智谋博弈大师 选书如选老师,因此选择书籍是一件十分重要的事。在此,向给大家推荐与博弈论相关书籍,让你少走弯路,成为智谋博弈大师! 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 入门书籍: 《妙趣横生博弈论》 21世纪的经典博弈书——《妙趣横生博弈论》。2005年诺贝尔经济学奖获得者托马斯·谢林“一生中最不能错过的一本书”——“西方孙子兵法”——《妙趣横生博弈论》。该书由阿维纳什K.迪克西特和巴里J.奈尔伯夫合著。核心思想:在本性上,人们都倾向于以自我为中心,只关注自己的理解和自身的需要。但博弈的艺术要求,不要以自我为中心,要理解他人的立场、观念以及看重什么,并运用这种理解来指导行动。

《身边的博弈》 《身边的博弈》用浅显易懂的语言、近百个故事讲述了博弈论的基本原理及其在现实世界的运用,使你通过快乐地学习生活中无时不在的博弈掌握竞争的技巧。 《博弈论的诡计》

博弈论的目的在于巧妙的策略,而不是解法。学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈的思想既然来自现实生活,它就可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。博弈时时存在,它就在你的身边。《博弈论的诡计》就是试图通过日常生活中常见的例子,来介绍博弈论的基本思想及运用,并且寻求用种智慧来指导生活决策的方法。阅读本书,我们除了了解到令人震撼的社会真实轨迹之外,还可以学到最合适的为人处世方法。 《太极博弈原理》

博弈论的基础知识(doc 21页)

博弈论的基础知识与应用(转) 1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括: 1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略

性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是 博弈论的基础知识与应用(转) 1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括: 1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论基础复习

《博弈论基础》复习大纲 一、名词解释(5×2=10分) 策略型博弈 它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡 指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略 局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈 博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树 对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈 是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈 指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。 行为策略 是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法 逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略 又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 一般地,将一个参与人所拥有的所有私人信息称为他的类型。 静态贝叶斯均衡 是一种与类型有关的策略组合,其中每个局中人在给定自己类型和其它局中人策略的情况下最大化自己的期望效用函数。

信号博弈 是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡 信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡 信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 联盟 设},,2,1{I =ζ为局中人集合,则其中任意一非空子集ζ?S 为一个联盟。 特征函数 特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 核 多人合作博弈中所有不被超优的分配的集合。 核仁 合作博弈核仁解所依据的基本思想是:在分配属于核仁的条件下,最不理想的联盟也要优于任何其它分配向量的最不理想的联盟。 二、 判断题(5×1=5分) 三、 简答题(4×7=28分) 策略型博弈的基本要素。 策略型博弈的基本要素有: 局中人:即博弈的参与者,可以是自然人﹑企业﹑政府﹑社团等。 策略:指每个局中人在博弈中可选择采用的行动方案。 支付:指每个局中人从各种策略组合中获得的收益。 什么是纳什均衡?你是如何理解的? 纳什均衡及其理解: 在一个博弈过程中,无论其它局中人的策略选择如何,局中人都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,局中人谁都没有动机单方面偏离该状态,那么这个组合就被定义为纳什均衡。 1.是完全信息静态博弈的解的一般概念。 2.每一个严格占优战略均衡一定是纳什均衡,反之不然。

博弈论基础

ECON 40050 Game Theory Exam 1- Answer Key Instructions: 1) You may use a pen or pencil, a hand-held nonprogrammable calculator, and a ruler. No other materials may be at or near your desk. Books, coats, backpacks, etc... must be placed against the wall. No electronic communication devices may be used. 2) As soon as the instruction to begin the test is given, please check that you have 10 numbered pages. 3) Be sure to show all of your work. Answers without supporting calculations will receive zero credit. You will receive credit only for the answers and supporting calculations that appear in this test packet. 4) All exams must be turned in by 1:45 pm. No extensions will be granted. 5) Be sure to read each question in its entirety before beginning your analysis. 6) The time estimates at the beginning of each question are only suggestions to help you manage your time. NAME ____________________________________________ Question 1 (10 minutes)_______ (15 points) Question 2 (10 minutes)_______ (15 points) Question 3 (10 minutes)_______ (15 points) Question 4 (15 minutes)_______ (15 points) Question 5 (20 minutes)_______ (20 points) Total: (65 minutes)_______ (80 points)

博弈论战略分析入门

当当网购买 货到付款 点击查看详情 市场价:¥42.00 当当价:¥36.30 点击查看 本书简介 本书主要针对经济学专业入门课程和非经济专业学生编写,是一本全面介绍博弈论的具有指导意义的入门教材。 阐释清晰:本书以基础性知识作为重点,以清晰的思路和简洁明了的方法阐述了博弈论知识及其应用,并覆盖了所涉及的各个学科。全书讲解深入浅出,循序渐进,具有很强的逻辑性。每章开头的“预备知识”介绍了学习该章之前应该经已掌握的内容,增加了章节安排的灵活性;同样位于各章开头的“本章主要概念”介绍了该章将会出现的关键概念,以使学生对整章内容有所准备。 案例生动:案例是本书的一种重要讲解工具,涉及商业、拍卖、军事、生物学和博彩等方面,不仅使概念的引出更加出动,而且能够激发读者的全面思考。方便学生理解的应用实例及各章后面的“练习与讨论”,不仅进一步阐释了博弈理论,而且涉及不同的学科领域,既可以用来检验学生的

知识掌握程度,也可以作为教师的课堂问题。 结构科学:对一般的导论性教材中关未特别说明或不会涉及的概念、容易混淆的概念,本书也做了必要的解释。书中没有涉及过多、过于复杂的数学计算,而是设置了部分选修章节,介绍一些与概率相关的概念,详细分析解读,对于只想简单了解博弈论的读者来说,略去选修章节,其中,不会影响全书逻辑的连贯性。 目录 译者序 前言 第一部分 基本原理 第1章 冲突、战略与博弈 第2章 护展式博弈与标准式博弈 第二部分 标准式博弈的非合作均衡 第3章 占优战略与社会两难 第4章 纳什均衡 第5章 博弈论中的经典例子 第6章 三人博弈 第7章 概率与博弈论 第8章 混合战略纳什均衡 第9章 非合作均衡的深入讨论 第10章 双寡头垄断的战略与定价 第11章 多人博弈 第三部分 博弈的合作解 第12章 合作博弈的要素 第13章 核在经济学中的应用 第四部分 序贯博弈 第14章 序贯博弈 第15章 嵌套博弈 第16章 重要博弈 第17章 无限重要博弈 第五部分 博弈论的应用 第18章 博弈论、法律与社会机制设计 第19章 投票博弈 第20章 博弈与实验 第21章 拍卖 第22章 演进和有限理性学习 术语表 当当网购买 货到付款 点击查看详情

博弈论课件 3

Game Theory 1 Spring2015 1

1 Lecture 3 Rationalizability and Iterated Dominance 2

Readings ?Watson: Strategy_ An introduction to game theory –1rd ed: Ch7pp.56-63; 3rd ed: Ch7pp.67-77. 2?Exercises: 3

2Outline ?Iterated Dominance. ?Rationalizable Strategies. ?Relationship between Iterated Dominance and Rationalizable Strategies. ?First Two Strategic Tensions. 4

2 ?For the submissive pig(S): –W S dominates P S.A rational S will never play P S. ?The dominant pig(D)doesn’t have a dominant strategy. –What should D do if it knows S is rational? –u D(P D,W S)=2>u D(W D,W S)=0?Play P D. 5

2 ?Our simple theory from last time was that no rational player would play a (strictly)dominated strategy.–If a rational player knows she’s playing a game with another rational player it makes sense that she won’t expect the other player to play a dominated strategy.–Her knowledge of the other player’s rationality helps her to refine her beliefs about the other player’s strategy.–If the other player has similar knowledge about her, the other player may refine his beliefs. 6

博弈论基础知识

1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰•冯•诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡•摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括: 1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是“理性”的? 3)如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的,在什么样的情况下合作是理性的? 4)在特定情况下,正在持续的关系与单方退出这种关系是不同的吗? 5)在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现吗? 6)在这些情况下,真正的人类行为与“理性”行为是否相符? 7)如果不符,在那些方面不符?相对于“理性”,人们更倾向于合作?或者更倾向于侵略?抑或二者皆是? 因而,博弈论研究的“博弈”包括:  破产  门口的野蛮人(Barbarians at the Gate)  网络战(Battle of the Networks)  货物出门,概不退换(Caveat Emptor)  征召(Conscription)  协调(Coordination)  逃避(Escape and Evasion)  青蛙呼叫配偶(Frogs Call for Mates)  鹰鸽博弈(Hawk versus Dove)  Mutually Assured Destruction  多数决定原则(Majority Rule)  Market Niche  共同防卫(Mutual Defense)  囚徒困境(Prisoner’s Dilemma)  补贴小商业Subsidized Small Business  公共地悲剧Tragedy of the Commons  最后通牒Ultimatum  视频系统协调Video System Coordination ■理性 新古典经济学与博弈论之间的关键链接就是理性。新古典经济学建基于这样一个假设之上,即人类在其经济选择行为中是绝对理性的。确切地说,这个假设意味着每个人在其所面临的环境中都会最大化自身的报酬——利润、收入或主观利益。在资源配置研究中,上述假说服务于两个目的:一是稍稍缩小可能发

博弈论入门

博弈论入门 1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰?冯?诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡?摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括: 1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是“理性”的? 3)如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的,在什么样的情况下合作是理性的? 4)在特定情况下,正在持续的关系与单方退出这种关系是不同的吗? 5)在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现吗? 6)在这些情况下,真正的人类行为与“理性”行为是否相符? 7)如果不符,在那些方面不符?相对于“理性”,人们更倾向于合作?或者更倾向于侵略?抑或二者皆是? 因而,博弈论研究的“博弈”包括: 破产 门口的野蛮人(Barbarians at the Gate) 网络战(Battle of the Networks) 货物出门,概不退换(Caveat Emptor) 征召(Conscription) 协调(Coordination) 逃避(Escape and Evasion) 青蛙呼叫配偶(Frogs Call for Mates) 鹰鸽博弈(Hawk versus Dove) Mutually Ass ured Destruction 多数决定原则(Majority Rule) Market Niche 共同防卫(Mutual Defense) 囚徒困境(Prisoner's Dilemma) 补贴小商业Subsidized Small Business 公共地悲剧Tragedy of the Commons

博弈论基础复习.doc

《博弈论基础》复习大纲 一、名词解释(5X2 = 10分) 策略型博弈 它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡 指参与博弈的每-局屮人在给定其他局屮人策略的条件下选择上策所构成的一种策略组合。 混合策略 局屮人的混合策略是其纯策略空间上的一种概率分布,表示局屮人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈 博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树 对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈 是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈 指由原扩展型博弈屮的一个决策节点与它的所冇后续节点组成的博弈。 行为策略 是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法 逆向归纳法是求解子I■専弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略 又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 一般地,将一个参与人所拥有的所有私人信息称为他的类型。 静态贝叶斯均衡 是-种与类型有关的策略组合,其屮每个局屮人在给定自己类型和其它局屮人策略的情况下最大化自己的期果效用函数。 信号博弈 是研究具有信息传递作用的信号机制的一般傅弈模型,其基本特征是两个I■専弈方,分别称为信号发出方和信号接收方。

博弈论初学心得总结

博弈论学习心得 (全校性选修课期末论文) 序:初识博弈论 通过“囚徒困境”,我走进了博弈论这一精彩世界。为了让大家对博弈思想有一认识与掌握,老师课堂上让我们思考了不少或生动或实际的问题,比如“帽子”问题、强盗分金币问题、猜全班数字的平均数问题、拍卖问题、市场进入问题等等。我曾自嘲地对舍友说:博弈论简直就是对智商的考验,总觉得自己脑子不够使啊。不过,我相信,学习博弈论是会使人变聪明的,脑子越用越灵嘛。 学习博弈论的过程中,脑子里经常出现的几句话是:原来这个问题可以这么去想,原来这种问题还可以用博弈的思想来解决,原来博弈的应用范围这么广,原来看似与数学无关的问题都可以通过数学来解决。 博弈论,为我呈现了一方新天地。我好奇它的广度,敬畏它的深度,视之如导师如利器,小心摸索着。 一、博弈思想 学习博弈论,我最大的收获不是记住了什么模型、公式、转换,而是博弈思想。“授之以鱼,不如授之以渔”,博弈思想尤如“渔”一般重要,是分析问题的基础。 博弈,需要换位思考,需要知已知彼。一定要充分考虑自己和其他参与者的各种战略以及对彼此的影响,从而采取最佳行动。 比如课堂上一个问题:让每个人选一个介于1~100的数,谁的数字最接近全班平均数的2/3,谁就是赢家。如果每个人随机选择的话,大家平均值应该在50左右,50的2/3应该是33. 3,不过其他人可能也想到了这一点,这样就应该写22.2。如果继续想下去,大家的平均值应该越来越小,最后1应该是理性分析的最佳答案。实际结果,普通如我的只想了一步,33,有的人多想了一步,有的人多想了两步……答案总不会是1。 其实答案是什么不重要了,重要的是一个思考的过程。是一个“你知道我知道你知道我知道你知道……”的N次换位思考的过程,你要知道他人有有多聪明,还要站在对方的角度考虑对方认为你有多聪明…… 面对一些事情时,可能不需要过分多虑,太过天才,在一群平凡人中,反而不会是赢家。比如那些选了1的人。但是换位思考的方式却是受用终生的,可指导我们少吃亏、少走弯路、尽可能快乐且适如地生活在复杂的社会中。 博弈的另一个重要思想,我认为是缜密的逻辑推理、全局意识以及化繁为简的转换。比如在不完全信息博弈中,你所了解的信息是有限的,这就需要你想出各种可能性以及各种战略组合下的收益。要分析别人的心理、分析影响别人行动的因素,分析各种战略组合的概率,从而执果索因,比如完全信息动态博弈中的“逆向归纳法”,比如通过“海萨尼转换”将不完全信息博弈表述为完全但不完美信息的博弈(市场进入问题),从而充分利用已有信息找到最优战略或均衡。可谓是“眼观六路,耳听八方”,“运筹帷幄”。 二、博弈案例分析两则

博弈论基础复习

〈〈博弈论基础》主要知识点 一、名词解释(5X 2= 10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 仑内什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略 是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型:一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方, 分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率i选择 不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种 集合函数,称为特征函数。 联盟

博弈论基础及其应用

第一讲博弈论基础及其应用 一.要学点博弈论 1.几个富有启发性的案例 (1)商家作出最低价格承诺的真相是什么?所谓最低价格承诺是指商家承诺自己的价格比任何对手都低,一旦有对手的价格比自己低,作承诺的商家将退回差额,并且承诺支付一定金额的违约罚金。 思考:商家为什么要作出这种承诺呢?是为了促销或者恶性竞争吗? (2)假设有三个候选人或候选方案:x、y 和z;有三个参加投票的人:甲、乙、丙。三个人对候选对象的态度分别如下:甲:x y z;乙:y z x;丙:z x y。(注:候选对象排位越靠前,表示越喜欢) 现在分别有三个投票程序:程序1,x与y先pk,然后胜利者进入下一轮与z进行pk;程序2,x与z先pk,然后胜利者进入下一轮与y进行pk;程序3,z与y先pk,然后胜利者进入下一轮与x进行pk。 思考:(1)上面每个程序的最终获胜者是谁?(2)为了保证丙自己心目中最喜欢的z当选,如果丙能够操纵投票程序,他应该采用哪个投票程序?(3)如果您是甲,为了避免自己最不喜欢的丙当选,应该怎么办? (3)配硬币博弈的启示

乙 甲正面 反面 A.配硬币博弈属于典型的零和博弈,它的制胜要点:a,切忌自己的行为有规律性,应该使自己的策略选择具有随机性,即采用混合策略(即以某个概率分布随机选择自己的策略)而已;b,绝对不能让对手知道自己的选择,能骗则骗,博弈双方没有通过沟通、交流、谈判实现双赢的可能;c,看看对手的行为选择是否具有规律,或想方设法获知对手的选择;d,猜硬币博弈具有后发制人的优势。 B.配硬币博弈的若干重要应用场合:a,是否监控员工就有可能演变成猜硬币博弈博弈:单位有时监控员工,员工有时会偷懒或偷单位的东西;b纳税人与税务部门也可能玩猜博弈博弈:税务部门可能查税,纳税人有时偷税。c,两军对垒时最容易出现猜硬币博弈,如二战时同盟国与纳粹在确定登陆地点时就存在配硬币博弈。 (4)斗鸡博弈的启示 案例 白军 进攻后退

期末复习博弈论基本概念

1.博弈论: 研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 一些个人或组织,面对一定的环境条件,在一定的规则下,同时或先后、一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。本质为存在策略依存性的决策问题。 2.博弈与一般决策的区别: 决策论在技术分析上将对方(其他参与人)的情况列入自己的约束条件,作为一个环境因素对待,将对方的影响作为外生变量处理,未考虑对自己效用的直接的主动的影响。 3.博弈模型的要素 a)参与人(局中人、博弈方):博弈中的决策主体。他的目的是通过选择策略以最大 化自己的支付(效用)水平。虚拟参与人(自然):指决定外生的随机 变量的概率分布的机制。自然作为虚拟参与人没有自己的支付与目标函数,即所有 的结果对他来说都是无差异的。 b)策略:参与人在给定信息集(信息集包含了一个参与人有关其他参与人之前行动的 知识,可理解为参与人在特定时刻有关变量值的知识。一个参与人无法准确指导的 变量全体属于一个信息集)的情况下的行动规则。它规定参与人在什么时候选择什 么行动。(策略是可供局中人选择对付其他局中人的完整行动方案)各参与人 的策略选择范围称为策略空间(策略集)。每个博弈方各选一个策略构成一个 策略组合(局势) c)博弈过程:各博弈方行为的顺序及博弈的规则等。关键是自己选择时能否知道其他

博弈方的选择。 d)支付(得益)函数:各策略组合下各博弈方获得的数值结果(常为效用)。表示为 Ui=Ui(s1,…,si,…,sn)。可见其不仅取决于自己的策略,还取决于他人的策略。 e)信息结构:博弈方对得益和博弈过程信息的掌握情况和程度 f)理性基础:博弈方的行为选择时以个体理性还是集体理性为基础,有完美理性还是 有限理性 若设定博弈时不专门设定后两个方面,就隐含假定就是完全、完美信息、完全理性的非合作博弈 4.博弈的分类(类型) a)据是否具有有约束力的协议:非合作博弈、合作博弈。(非合作博弈无约束力、核 心是策略选择、追求个人优化、不注重效率;合作博弈有约束力、核心是利益分配、 追求公平公正和效率) b)据理性程度:完全理性博弈、有限理性博弈。(完全理性指有完全的计算能力,不 会犯错) c)据博弈过程的不同:静态博弈、动态博弈 d)据博弈方对得益信息的掌握情况:完全信息博弈、不完全信息博弈。(完全信息: 指每个参与人的特征/类型、策略空间、支付函数在所有参与人中是共同知识) e)据策略数量:有限博弈(参与人数有限且策略集均为有限集)、无限博弈 f)据得益特征:零和博弈(对抗性最强)、常和博弈(对抗性较强)、变和博弈(可能 出现双赢或多赢)

相关文档
最新文档