博弈论的基础知识(doc 21页)

合集下载

《博弈论》知识点总结

《博弈论》知识点总结

《博弈论》知识点总结博弈论作为一门交叉学科,涵盖了数学、经济学、政治学、心理学等多个学科领域。

其研究对象包括零和博弈、非零和博弈、合作博弈、序贯博弈等。

博弈论的应用领域也非常广泛,包括经济学、政治学、社会学、管理学等。

博弈论在求解决策问题、预测市场行为、推导策略和解释社会现象等方面有着广泛的应用。

博弈论的主要内容包括:1.博弈的定义博弈是指互相影响的参与者所进行的一种决策活动。

在博弈中,每个参与者都要做出一个选择,其结果受到其他参与者的选择的影响。

博弈的结果取决于所有参与者的选择。

2.博弈的基本元素博弈的基本元素包括参与者、策略和结果。

参与者是进行决策的主体,策略是参与者可以选择的行为方式,结果是参与者选择策略后所得到的收益或损失。

3.博弈的分类根据参与者的利益关系和决策方式,博弈可以分为零和博弈和非零和博弈。

零和博弈指参与者的利益完全相反,一方获利即意味着另一方损失,而非零和博弈则指参与者的利益可能存在重叠或者是共同合作的情况。

4.博弈的解博弈的解是指在博弈参与者做出决策选择之后,通过某种机制确定最终的结果。

常见的博弈解包括纳什均衡、霍夫达均衡、帕累托最优等。

5.博弈论的应用博弈论在经济学、政治学、社会学等领域有着广泛的应用。

在经济学中,博弈论可以用来解释市场行为、预测价格变动等。

在政治学中,博弈论可以用来分析政治决策、议事程序等。

在社会学中,博弈论可以用来解释群体行为、合作问题等。

博弈论是一门具有重要理论意义和广泛应用价值的学科,它不仅可以帮助人们更好地理解决策制定的规律和机制,还可以为人们提供更科学的决策指导。

在日常生活中,我们可以通过学习和应用博弈论的知识,更加理性地做出决策,并更好地理解他人的选择和行为。

希望未来博弈论能够继续在各个领域发挥作用,为人类社会的进步和发展做出更大的贡献。

博弈论知识考点

博弈论知识考点

博弈是人们的行为之间的交互作用博弈论的含义博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。

策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。

在所有社会,人们经常互动。

有时,互动是合作,其他的时候,互动是竞争。

在这两种情况下,都可以用一个术语,即相互依赖性来表示一个人的行为对另外一个人的福利造成的影响。

相互依赖的情形可称为策略环境。

因为人们为了确定所采取的最优行动,必须考虑他周围的其他人会怎样选择行动。

策略对于社会的运行来说,是非常基本的。

我们要学会了解在策略环境下,人们实际上是如何采取行动的,以及他们应该怎样采取行动。

这种系统的研究形成了策略互动的理论。

博弈论三要素:博弈的三个基本要素三个基本要素,即参与人、参与人的策略和参与人的支付。

所谓参与人(或称局中人),就是在博弈中进行决策的个体;所谓参与人的策略,指的是一项规则,根据该规则,参与人在博弈的每一时点上选择如何行动;所谓参与人的支付是指,在所有参与人都选择了各自的策略且博弈已经完成之后,参与人获得的效用(或期望效用)。

3.博弈的简单分类根据参与人的数量,可以分为二人博弈和多人博弈;根据参与人的支付情况,可分为零和博弈和非零和博弈;根据参与人拥有的策略的数量多少,可分为有限博弈和无限博弈;根据参与人在实施策略上是否有时间的先后,可分为同时博弈和序贯博弈。

一些概念:局中人或参与者(Players)规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。

策略(Strategy):一整套的行动方案,规定了各种情况下的行动。

比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。

相机策略(contingent strategy):仅在不确定事件发生时才会采取的策略。

如:人不犯我,我不犯人;人若犯我,我必犯人。

行动:局中人在特定条件下的行为支付( Pay-off ):博弈结束时,各方得到的收益。

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。

它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。

下面是博弈论中的一些重要知识点的总结。

1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。

-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。

-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。

2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。

-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。

3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。

-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。

-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。

4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。

-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。

-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。

5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。

-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。

-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。

6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。

-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。

-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。

7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。

-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。

本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。

关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。

博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。

本文将对博弈论的相关知识进行详细的总结和归纳。

一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。

博弈的基本要素包括:参与者、策略、收益和信息。

1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。

参与者的目标是实现自身利益的最大化。

1.3 策略策略是指参与者在博弈中所能采取的行动或选择。

通常分为纯策略和混合策略。

1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。

收益可以用来衡量参与者的利益大小。

1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。

信息可以分为对称信息和非对称信息。

二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。

常见的均衡概念有纳什均衡、帕累托最优和博弈解。

2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。

2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。

帕累托最优是一种资源分配的有效方式。

2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。

博弈解往往是均衡的特殊情况。

三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时,通过考虑对方的行动和可能的结果来进行决策的一门学科。

它主要关注对策略的选择与分析,以及对方可能的反应。

下面我们来对博弈论的知识点进行总结归纳。

1.普通博弈和扩展博弈:博弈论分为两类,即普通博弈和扩展博弈。

普通博弈是指参与者在同一时间同时做出决策的博弈,扩展博弈是指参与者在不同的时间节点上做出决策的博弈。

2.博弈的组成要素:博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。

博弈论的目标是通过合理的策略选择来实现最优的支付和效用。

3.纳什均衡:纳什均衡是博弈论中一个重要的概念,指的是当每个参与者都选择了最优的策略后,没有人会改变自己的策略来获得更好的支付。

纳什均衡是博弈的稳定状态。

4.博弈的分类:根据参与者的合作与否,博弈可以分为合作博弈和非合作博弈。

合作博弈中,参与者可以通过合作与其他参与者达成协议,而非合作博弈中,参与者彼此之间没有合作关系。

5.零和博弈和非零和博弈:零和博弈是指所有参与者的支付之和为零的博弈,即一方获利就意味着其他方会损失相应的支付。

非零和博弈是指所有参与者的支付之和不为零的博弈,即所有参与者都有可能获得一定的支付。

6.博弈的解析方法:解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。

解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。

7.博弈的策略选择:博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。

策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。

8.博弈的应用领域:博弈论的应用十分广泛,包括经济学、政治学、生物学、社会学等多个领域。

在经济学中,博弈论被用来研究市场竞争、价格形成等问题,在政治学中,博弈论被用来分析政治决策与合作等问题。

9.孤立型博弈和重复博弈:孤立型博弈是指只进行一轮博弈的情况,参与者只能根据当下的情况来做出决策。

重复博弈是指进行多轮博弈的情况,参与者可以根据之前的决策和结果来进行策略的调整。

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。

即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。

1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。

1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。

倘若不能,则称非合作博弈(Non-cooperative game)。

合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。

把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。

博弈论基础

博弈论基础

博弈论基础本讲要点:博弈论的基本思想,博弈的构成要素,简单博弈的求解方法,纳什均衡的概念,博弈的分类,动态博弈与重复博弈,信息不对称,道德风险,逆向选择,信号传递。

重点:博弈论的基本思想,纳什均衡的概念,信息不对称。

难点:博弈的构成要素,纳什均衡的概念。

讲授时间:6学时一、博弈的基本要素1、博弈论与古典经济学的区别古典经济学的基本思路:给定约束条件,考虑行为主体的最优结果。

博弈论的基本思路:以行为主体之间的相互影响为前提,考虑行为主体的最优结果。

两者的根本区别:是否考虑对方的行为。

古典经济学中消费者行为理论:假定收入、商品价格以及效用函数给定,求最优消费组合。

消费者A不会考虑消费者B的影响。

古典经济学中的厂商理论:假定生产函数、成本函数、商品价格给定,求厂商的最优生产决策。

厂商A不会考虑厂商B的影响。

古典经济学中的宏观经济理论:假定一国的资源禀赋给定,考虑价格指数、利率等因素的变化对国民收入、就业等的影响。

国家A不会考虑国家B的影响。

博弈论:每个人要考虑别人的行为怎样影响自己的选择。

扑克牌游戏:一个人不可能只顾自己出牌,而不考虑别人怎么出牌。

下棋:无论中国象棋、国际象棋、围棋,一个人在走某一步之前,都要考虑对手是怎么走的,以及对手在我走了一步之后会怎么走,以及我又会在对手走了一步之后怎么走,以至无穷。

高手与俗手的区别也就在此。

高手往往能够考虑10步甚至20步以后的变化。

总之:你的输赢不仅取决于你的决策,而且取决于你对手的决策。

2、博弈论简史博弈论的思路在古诺(Cournot,Antoine Augustin,1801-1977)的双头垄断模型中最早提出,冯•诺伊曼(John von Neumann,1903-1957)和摩根斯坦恩(Oskar Margenstern, 1902-1977)在1944年出版了《博弈论与经济行为》(Theory of Games and EconomicBehavior)一书,最早提出了博弈论的概念。

博弈论知识

博弈论知识

博弈论知识及十四章几个问题
1. 扳机策略:冷酷策略(grim strategy)是指在重复博弈中,只要所有的人都采取合作的策略,那么就一直合作下去,如果有一方背叛了合作,比如提高产量,那么合作就永远终止,所有的人对此行为加以惩罚,大家都提高产量。

一寡头厂商背叛是一个触发点,在此之后寡头厂商间都是不合作的,所以冷酷到底策略又称“扳机策略”。

2. 占优策略:无论其他参与者采取什么策略,某参与者的惟一的最优策略就是他的占优策略。

也就是说,如果某一个参与者具有占优策略,那么,无论其他参与者选择什么策略,该参与者确信自己所选择的惟一策略都是最优的。

3. 占优策略均衡:由博弈中的所有参与者的占优策略组合所构成的均衡就是占优策略均衡。

4. 囚徒困境的有限次重复博弈:请参阅张维迎《博弈论与信息经济学》第二章
第五节之 连锁店悖论
5. 触发策略: 如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为触发策略(Trigger strategy ),或称冷酷策略。

6. 纠正P412“公有地悲剧”中的推导错误:最大化的解代入目标函数中并非最大
其错误在于对称条件B A γγ=在求导前就应该使用,或者说在对A γ求导中应该把B γ也看成与A γ相同的变量,而不是将B γ看成是不变的常数
7. 第十四章P385古诺均衡产量大于垄断或卡特尔产量,但小于竞争性产出,注意课文的解释:从代数式(最优化条件)和几何图形上解释
8. P386的价格领导模型的分析也有问题:自己思考
(1)价格在1P 以上时的供给,
(2)价格在2P 以下时的供给,。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论的基础知识与应用(转)1 基础知识博弈论是一种独特的处于各学科之间的研究人类行为的方法。

与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。

博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。

博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。

当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。

■一个科学的隐喻由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。

在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。

在博弈论中常常讨论的问题包括:1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么?2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是博弈论的基础知识与应用(转)1 基础知识博弈论是一种独特的处于各学科之间的研究人类行为的方法。

与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。

博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。

博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。

当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。

■一个科学的隐喻由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。

在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。

在博弈论中常常讨论的问题包括:1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么?2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是“理性”的?3)如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的,在什么样的情况下合作是理性的?4)在特定情况下,正在持续的关系与单方退出这种关系是不同的吗?5)在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现吗?6)在这些情况下,真正的人类行为与“理性”行为是否相符?7)如果不符,在那些方面不符?相对于“理性”,人们更倾向于合作?或者更倾向于侵略?抑或二者皆是?因而,博弈论研究的“博弈”包括:破产门口的野蛮人(Barbarians at the Gate)网络战(Battle of the Networks)货物出门,概不退换(Caveat Emptor)征召(Conscription)协调(Coordination)逃避(Escape and Evasion)青蛙呼叫配偶(Frogs Call for Mates)鹰鸽博弈(Hawk versus Dove)Mutually Assured Destruction多数决定原则(Majority Rule)Market Niche共同防卫(Mutual Defense)囚徒困境(Prisoner’s Dilemma)补贴小商业Subsidized Small Business公共地悲剧Tragedy of the Commons最后通牒Ultimatum视频系统协调Video System Coordination■理性新古典经济学与博弈论之间的关键链接就是理性。

新古典经济学建基于这样一个假设之上,即人类在其经济选择行为中是绝对理性的。

确切地说,这个假设意味着每个人在其所面临的环境中都会最大化自身的报酬——利润、收入或主观利益。

在资源配置研究中,上述假说服务于两个目的:一是稍稍缩小可能发生事物的范围;二是提供了一个衡量经济体制效率的标准。

如果经济体制导致部分人的报酬减少,而又没有对其他人产生更多的报偿(宽泛地讲就是成本大于收益),那么在某些方面就产生了失误。

污染、渔业资源的过度开发、不恰当的资源用于研究(inadequate resources committed to research)都是这类问题的例子。

在新古典经济学中,理性的个人面临特定的体制或制度,包括产权、货币和高度竞争的市场。

这些是个人纳入最大化报酬计算的许多“情况”之一。

财产权利、货币经济以及理想化的竞争市场的隐含意义是经济个体不需要考虑自己与其他经济个体的行为互动。

他或她只需要考虑自己的境况和“市场条件”。

但这导致了两个问题:一是理论的范围受到局限。

只要竞争受到限制(但没有垄断)或者产权没有完全界定,众望所归的新古典经济学理论就不适用了,并且新古典经济学也从未产生可接受的理论扩展以覆盖上述情况。

对于新古典经学来说,决策是在货币经济之外做出的,这也是有问题的。

博弈论正好面对上述问题:提供一个关于人们直接(而不是“通过市场”)互动的经济和战略行为的理论。

在博弈论中,“博弈”始终是针对人类社会严肃的互动行为的一个隐喻。

博弈论也许是关于纸牌游戏或者棒球运动的理论,但却不是关于象棋的理论,它是关于这样一些严肃的互动行为比如市场竞争、军备竞赛和环境污染的理论。

只不过博弈论涉及这些问题的时候使用的是博弈的隐喻意义:在这些严肃的互动行为中,就象在游戏中一样,个体的选择实质上是战略选择,行为互动的结局依赖于每个参与人所选择的战略。

通过这样的阐释,研究“博弈”可以真正告诉我们关于严肃的互动行为的一些事情。

但是,究竟会告诉我们多少?在新古典经济学理论中,理性地进行选择就是要最大化自身的收益。

在某种观点看来,这是一个数学问题:在给定环境条件下选择最大化报酬的行动。

因而我们可以把理性的经济选择当作一个数学问题的“解”。

在博弈论中,情况就更复杂了。

既然结局不仅依赖于自身的战略和“市场”条件,也直接依赖于其他人所选择的战略,但我们仍然可以把理性的战略选择当作一个数学问题——最大化行为互动中的决策制定者群体的报酬——从而我们再次称理性的结果是博弈的“解”。

2 囚徒的困境博弈论近来的发展,特别是1994年诺贝尔纪念奖授予给三位博弈论理论家以及89岁高龄的塔克(A. W. Tucker)在1995年1月的去世,唤起了人们对博弈论创立时的回忆。

尽管博弈论可以追索到更早的时代,但其兴起的关键时期是20世纪40年代。

当然,《博弈论与经济行为》的出版是一个特别重要的台阶。

但是,在某种程度上,塔克发明的“囚徒困境”例子更为重要。

这个可以在一页纸上求解出来的例子在20世纪下半叶的社会科学中可能是最具影响的一页。

这个杰出的创见并不是出自研究论文,而出自于课堂。

正如S. J. Hagenmayer在《费城调查者(Philadelphia Inquirer)》(“Albert W. Tucker, 89, Famed Mathematician,“ Thursday, Feb. 2, 1995, p.. B7)中写到:“在1950年,作为访问教授,塔克在斯坦福大学向由心理学家组成的听众发表演说的时候,创造了‘囚徒困境’来说明分析某些类型博弈的困难。

塔克的简单解释导致了后来大量的文献。

这些文献来自不同的领域,比如哲学、伦理学、生物学、社会学、政治科学、经济学,当然还有博弈论。

”■囚徒困境博弈塔克是从这样一个小故事开始的:两个夜贼,鲍伯(Bob)和艾尔(Al),在行窃现场附近被抓获并被警方隔离拷问。

每个夜贼都必须选择是否坦白和揭发对方。

如果两个贼都不坦白,他们都将被判刑一年。

如果每个贼都坦白并揭发对方,他们都将在监狱中度过10年。

但是,如果一个贼坦白并揭发对方,而另一个贼不坦白,那么与警方合作的贼将被释放而另一个贼将在监狱中度过20年。

在这个例子中的战略是:坦白与不坦白。

赢利(payoff)(实际上是处罚)是判刑。

我们可以用“赢利表(payoff table)”简洁地表达上述信息,这类赢利表已经成为博弈论中很好的标准表达式。

以下是囚徒困境博弈的赢利表。

表2-1艾尔坦白不坦白鲍伯坦白10,100,20不坦白20,01,1这个表的读法是这样的:每个囚犯从两个战略中选择一个。

即,艾尔选择一列,鲍伯选择一行。

每个单元格的两个数字告诉两个囚犯相应的战略被选择后的结果。

逗号左边的数字表示选择行的人(鲍伯)的赢利,逗号右边的数字表示选择列的人(艾尔)的赢利。

因此(先阅读第一列),如果他们都选择坦白,每人将判刑10年,但是如果艾尔坦白而鲍伯不坦白,鲍伯被判20年而艾尔将被释放。

那么:怎样求解这个博弈?如果双方都想使自己呆在监狱的时间最短,他们选择什么战略是“理性的”?艾尔可能会做这样的推理:“两种事件可能发生:鲍伯要么坦白要么保持沉默。

假定鲍伯坦白,我不坦白的话将被判20年,我也坦白的话则判10年。

另一方面,如果鲍伯不坦白,我不坦白我被判刑1年,但在这种情况下,如果我坦白我可以被释放。

无论怎样,我选择坦白都是最好的。

因此,我将坦白。

”但是鲍伯能够而且大概也将做同样的推理——因此他们都将坦白并且都在监狱呆10年。

然而,如果他们“不理性”地行动,都保持沉默,他们都可以在1年后被释放。

■占优战略(Dominant Strategies)这里发生的情况是,两个囚犯陷入了“占优战略均衡”。

定义:占优战略——让博弈的参与人单独地评估他面临的战略组合中的每一个战略,并且,对于每一个组合,他从自己的所有战略中选择一个使他赢利最多的战略。

如果对于参与人面临的每一个不同的战略组合,参与人都选择同一个战略,这个被选择的战略就叫该参与人在博弈中的“占优战略”。

定义:占优战略均衡——在一个博弈中,如果每个参与人都有一个占优战略,且每个参与人都采取占优战略,那么(占优)战略组合及其相应的赢利被认为是构成了博弈的占优战略均衡。

在囚犯困境博弈中,坦白是占优战略,当两个囚犯都选择坦白时,那就是占优战略均衡。

■囚犯困境中需要考虑的问题这个不同寻常的结果——两个囚犯出于自利的个体理性行动导致双方情况变得更糟糕——在现代社会科学中产生了广泛的影响。

相关文档
最新文档