博弈论的基础知识与应用

合集下载

博弈论的定义

博弈论的定义

博弈论的定义1. 博弈论的基本概念博弈论,是现代数学的一个分支学科,研究在多人决策环境中人们的策略选择以及可能产生的结果。

从经济学、管理学、政治学、心理学等方面来分析和解决问题时,博弈论可以为人们提供决策的基础。

因此,博弈论不仅在学术上很有价值,在实践中也具有很高的应用价值。

2. 博弈论的应用范围博弈论的应用范围广泛,如军事策略、商业竞争、政治谈判、社会决策、环境决策等领域。

另外,也被广泛应用于运输、公共建设、医学治疗等社会实践活动中。

3. 博弈论的基本元素博弈论的基本元素是“参与者”、“策略”、“收益”和“信息”。

“参与者”是指在某一决策环境中的所有相关人员,如消费者、企业、政府或其他组织和个人等。

“策略”是参与者在决策过程中选择的行动方案,也是促进参与者在决策中优化收益的关键。

“收益”或“效用”是参与者最终得到的结果,通常在博弈论中用数字来表示,这些数字可以是财务收入、数字权益等。

“信息”也是参与者在决策中极为重要的因素。

它可以分为完全信息和不完全信息两种,完全信息是指参与者对决策过程中的所有信息都有充分了解,而不完全信息是指参与者对决策过程中的某些信息存在不确定性。

因此,在不完全信息博弈中,有时决策者需要采取一些策略来“模糊化”自己的策略,以避免让其他人知道他们实际上所做的决策。

4. 博弈论的经典模型- 零和博弈零和博弈是博弈论的基本模型之一,是指参与者的利益总和为零。

在这种情况下,一个人赢得的收益等于另一个人失去的收益,如象棋、扑克等所有参与者的输赢情况总是相互抵消的。

- 非零和博弈非零和博弈是一种参与者的利益总和不为零的博弈。

在这种情况下,一方的收益可以与另一方的收益同时增加,如合作博弈中的合作关系。

- 合作博弈合作博弈是指参与者可以在决策中合作以实现双方或多方的利益最大化。

在此类博弈中,参与者通常需要通过协商和合作达成共识。

- 非合作博弈非合作博弈是指参与者在决策中只考虑自己的利益。

《管理学博弈论》课件

《管理学博弈论》课件
《管理学博弈论》PPT课 件
博弈论是一门研究决策者在互动中作出最优选择的学科。在管理学中,博弈 论被广泛应用于解决策略性决策问题。
一、简介
博弈论是一门研究决策者在互动中作出最优选择的学科。本课程将介绍博弈论的基本概念和在管理学中的应用。
二、博弈论基础
博弈论的基本概念
介绍博弈论的基本概念,如 玩家、策略和利益的分析。
七、总结
1 博弈论的优点与不足
总结博弈论的优点,如帮助决策者分析和优 化策略,以及其限制和假设。
2 博弈论的未来研究方向
展望博弈论的未来研究方向,如与人工智能 和大数据分析结合的应用。Biblioteka 四、双人合作博弈1
特征函数游戏
2
介绍特征函数游戏,用于分配值给合作
博弈中的不同决策组合。
3
战略性合作博弈
讲解战略性合作博弈中的合作策略,以 实现共同利益最大化。
估价博弈
探索估价博弈,用于确定合作博弈中参 与者的收益分配。
五、多人博弈
传统博弈 极端博弈 模糊博弈
介绍多个玩家参与的传统博弈模型,如囚徒困境 和霸权竞争。
博弈的分类
讨论博弈的分类,包括双人 非合作博弈、双人合作博弈 和多人博弈。
策略和利益的分析
探讨如何分析博弈中的策略 和利益,帮助决策者做出最 优选择。
三、双人非合作博弈
策略型博弈
介绍策略型博弈,包括两个玩家 相互竞争的决策模型。
矩阵博弈
解释矩阵博弈,以方便比较各种 决策选择的结果。
纳什均衡
探索纳什均衡的概念,即无法通 过改变策略获得更好结果的状态。
讲解多人参与的极端博弈,如零和游戏和多方冲 突博弈。
解释模糊博弈的概念,其中参与者的信息和目标 存在不确定性。

博弈论在市场分析中的应用

博弈论在市场分析中的应用

博弈论在市场分析中的应用前言:市场分析是金融领域中的重要一环,而博弈论则是解决决策问题的理论基础。

将博弈论应用于市场分析中,有助于我们更好地理解市场行为和参与者的决策。

本文将探讨博弈论在市场分析中的应用,并分析其对决策的影响。

一、博弈论的基本概念博弈论是以参与者之间的决策和行为互动为基础的数学模型。

在一个博弈中,每个参与者都会根据自己的利益和目标来做出决策。

博弈论假设参与者都是理性的,即他们会选择能给自己带来最大利益的决策。

二、1. 竞争策略分析在市场竞争中,不同企业之间存在着一种相互制衡的关系。

博弈论可以帮助研究人员分析企业之间的竞争策略。

通过建立数学模型,可以模拟不同企业在不同策略下的行为和结果,进而预测市场的发展和企业之间的相互影响。

2. 价格战分析价格战是市场竞争中常见的一种策略。

博弈论可以帮助我们分析不同参与者在价格战中的决策和行为。

通过建立数学模型,可以预测价格战的结果以及参与者所能获得的最大利益。

这有助于企业在市场中做出更明智的决策。

3. 股市分析博弈论在股市分析中也有广泛的应用。

股市中的投资者都希望通过买卖股票获取更多的回报。

博弈论可以帮助分析投资者之间的博弈关系,预测市场的走势。

例如,股市中的牛市和熊市往往是由投资者的预期和行为共同决定的,博弈论可以帮助我们理解这种行为背后的机制。

4. 市场操纵分析市场操纵是指通过不正当手段控制市场价格或者制造虚假交易来获利的行为。

博弈论可以帮助分析市场操纵者的策略和行为,并预测他们可能采取的举措。

这对于监管部门来说是非常重要的,可以借助博弈论的分析结果来制定相应的监管措施。

三、博弈论对决策的影响博弈论的应用对于市场参与者的决策具有重要的影响。

通过博弈论的分析,参与者可以更好地了解不同策略下的利弊和风险,从而做出更明智的决策。

同时,博弈论的应用也可以帮助市场参与者预测其他参与者的行为,提前做出应对措施。

此外,博弈论在市场分析中的应用也可以对政策制定者产生一定的影响。

博弈论—基本知识

博弈论—基本知识

莫里斯
维克瑞
阿克洛夫
斯宾塞
斯蒂格利茨
以色列希伯莱大学的罗伯特· 奥曼(Robert J· Aumann) 和美国马里兰大学的托马斯· 谢林(Thomas C· Schelling)“通过博弈论分析,促进了人们对冲突 和合作的理解”,以此获得了2005年诺贝尔经济学奖。
奥曼
谢林
二、什么是博弈论
• 从“齐威王田忌赛马”说起 春秋战国时期,齐威王常与旗下大将田忌赛马。 规则是:每次赛三局,每一局齐威王与田忌各出一 匹马比赛奔跑速度。每一局中的胜者赢败者一千斤 铜。田忌有上、中、下三匹马,齐威王也有上、中、 下三匹马。每次比赛,第一局田忌出上马,齐威王 也出上马;第二局田忌出中马,齐威王也出中马; 第三局,田忌出下马,齐威王也出下马。齐威王的 上马比田忌的上马好,齐威王的中马也比田忌的中 马好,齐威王的下马还是比田忌的下马好。于是, 每次比赛的结果都是田忌连输三局。
• 1944年 冯· 诺伊曼、摩根斯坦 《博弈论和经济行为》
1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽 尔腾和海萨尼,这是对博弈论在经济学发展中的贡献和 作用的充分肯定,确立了博弈论在现代主流经济学中的 地位。
纳什
海萨尼
泽尔腾
1996年,两位将博弈论应用于不对称信息下机制设计的经济学 家莫里斯(Mirrlees)和维克瑞(Vickrey)、以及2001年三位经 济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞 (Spence)因运用博弈论研究信息经济学所取得的成就而成为这 两个年度的诺贝尔经济学奖得主。
田忌 上 中 下 上中下 上 下 中 中 上 下 中 下 上 下 上 中 下 中 上
3 1,-1
1,-1 1,-1 3,-3 1,-1

博弈论与经济学

博弈论与经济学

博弈论与经济学博弈论与经济学是两个相互关联且相互支持的学科领域。

博弈论是研究决策者在决策过程中相互竞争和合作的一种数学模型。

经济学则是研究资源配置、市场运作和经济行为等方面的学科。

博弈论用于经济学中,可以帮助我们更好地理解和分析经济活动中的决策行为和结果。

一、博弈论基础知识博弈论是一种数学方法,用来研究多个决策者在特定环境下做出的决策。

在博弈的过程中,每个决策者都追求自己的最优利益,并且预期其他决策者的行为对自己的利益产生影响。

博弈论通过建立数学模型来描述和分析这种决策过程。

博弈论中的核心概念包括博弈、策略、支付和均衡。

博弈是指多个决策者在特定环境下做出的选择和行动。

策略是每个决策者选择的行动方案。

支付是表示每个决策者在不同策略组合下所获得的利益或损失。

均衡是指所有决策者都根据自己的利益来做出理性决策,无法通过改变自己的策略来获得更大利益的状态。

二、博弈论在经济学中的应用博弈论在经济学中有广泛的应用,它可以用来分析市场竞争、资源分配、合作与冲突等经济活动。

以下是博弈论在经济学中的几个重要应用领域:1. 市场竞争博弈论可以用来分析市场中的竞争行为和价格形成过程。

在博弈论中,我们可以建立数学模型来描述企业之间的竞争策略和结果,从而预测市场的竞争格局和价格水平。

2. 合作与冲突博弈论可以用来研究参与者之间的合作和冲突行为。

在合作方面,博弈论可以帮助我们分析合作的条件和机制,了解合作是否稳定可持续。

在冲突方面,博弈论可以研究损失分摊、战略选择等问题,帮助我们理解冲突的本质和解决途径。

3. 信息与不完全信息博弈论可以用来分析经济活动中的信息不对称和不完全信息问题。

在博弈论中,我们可以建立数学模型来描述信息的流动和选择的影响,从而研究信息的价值和利用。

4. 合约设计博弈论可以用来研究合约设计和机制设计等问题。

在博弈论中,我们可以通过建立数学模型来探讨不同的合约形式和机制设计对经济活动的影响,从而提高合约效率和资源配置。

博弈论前四章笔记整理

博弈论前四章笔记整理

博弈论前四章笔记整理第一章:博弈论基础概念。

- 博弈的定义与要素。

- 博弈是指在一定的规则下,多个参与者(至少两个)进行策略选择并得到相应结果(收益)的过程。

- 要素包括参与者(局中人)、策略(每个参与者可选择的行动方案)、收益(每个参与者在不同策略组合下的所得)。

例如在“囚徒困境”中,两个囚犯是参与者,坦白或不坦白是他们的策略,不同策略组合下的刑期长短就是收益。

- 博弈的分类。

- 按参与者数量可分为两人博弈和多人博弈。

- 按策略空间是否有限分为有限博弈和无限博弈。

如猜硬币是有限博弈(正面或反面两种策略),企业的产量竞争(产量可在一定范围内连续取值)可能是无限博弈。

- 按收益情况分为零和博弈(一方的收益就是另一方的损失,总和为零,如赌博)、常和博弈(收益总和为常数)和非零和博弈(收益总和不为零,如企业合作共同开拓市场,双方都可能获利)。

第二章:完全信息静态博弈。

- 策略式表述(标准式表述)- 通常用一个矩阵来表示,行代表一个参与者的策略,列代表另一个参与者的策略,矩阵中的元素是对应的收益组合。

以“性别战”为例,丈夫和妻子选择看电影或看球赛,就可以构建一个2×2的收益矩阵。

- 占优策略均衡。

- 占优策略是指无论其他参与者选择什么策略,该策略都是某个参与者的最优策略。

如果每个参与者都有占优策略,那么由这些占优策略组成的策略组合就是占优策略均衡。

例如在“囚徒困境”中,每个囚徒的占优策略都是坦白,所以(坦白,坦白)是占优策略均衡。

- 纳什均衡。

- 纳什均衡是指在一个策略组合中,每个参与者的策略都是对其他参与者策略的最优反应。

即给定其他参与者的策略,没有参与者有动机单方面改变自己的策略。

与占优策略均衡不同,纳什均衡并不要求每个参与者都有占优策略。

例如在“性别战”中,(看电影,看电影)和(看球赛,看球赛)都是纳什均衡。

第三章:完全信息动态博弈。

- 扩展式表述。

- 包括博弈树的构建,节点表示参与者的决策点,树枝表示可选择的策略,终端节点表示博弈的结果并标有相应的收益。

学弈的主要内容

学弈的主要内容

学弈的主要内容一、引言学弈是指在竞争性的环境中学习和应用博弈论的原则和策略,目的是通过分析问题和制定决策,达到最优解或最优策略的一门学科。

博弈论是数学的一个分支,主要研究决策者在不同的情景下如何作出最佳决策,以达到个人或群体的最大利益。

学弈作为一种学问,不仅可以应用于经济学、管理学和社会科学等领域,还可以用于解决现实生活中的问题。

二、博弈论基础知识博弈论是学习和应用学弈的基础,其主要内容包括以下几个方面:2.1 基本概念•玩家:参与博弈的个体或团体。

•策略:玩家在不同情况下可以采取的行动方案。

•支付矩阵:记录了玩家采取不同策略所获得的收益。

•占优策略:在其他玩家采取特定策略的情况下,某玩家的策略能够使其获得最大收益。

2.2 二人博弈•囚徒困境:经典的博弈局面,描述了两个囚犯在是否坦白的选择下所面临的利益和风险。

•博弈树:用于描述博弈过程的决策树形式,有助于分析每个玩家的最佳策略。

•纳什均衡:指玩家在互相了解对方策略的情况下作出的最佳决策,任何一方的策略改变都不会使其单方面获得更大收益。

2.3 多人博弈•合作博弈:多个玩家在博弈过程中可以合作,共同获得更大利益。

•共同最大化:多个玩家共同作出决策,追求最大化的收益。

•Shapley值:用于衡量博弈过程中每个玩家所贡献的价值,以公平地分配收益。

三、学弈在生活中的应用范围学弈的应用范围非常广泛,以下是一些常见的应用领域:3.1 经济学领域•市场竞争:博弈论可用于分析市场上的供求关系、定价策略和市场竞争格局。

•拍卖机制:通过博弈分析可以设计出合理的拍卖机制,提高拍卖的效率和公平性。

•产业政策:政府在制定产业政策时可以运用博弈论来预测企业的反应和选择最佳政策。

3.2 管理学领域•战略管理:企业在战略决策时需要考虑竞争对手的策略反应,博弈论可提供决策支持。

•谈判策略:博弈论可用于分析不同谈判策略的利弊,帮助决策者制定合适的谈判策略。

•风险管理:博弈论可用于分析不同的风险决策情景,帮助企业降低风险和损失。

《资源环境经济学》博弈论基本知识

《资源环境经济学》博弈论基本知识

一、博弈论基本知识(从游戏到博弈)1、概念博弈论,译自英文“Game Theory”,Game的基本意义是游戏,因此,直译为“游戏理论”。

说起游戏,人们一般都会想到小朋友玩的躲猫猫、比大小、石头剪刀布、围棋等棋类游戏、扑克游戏等,以及田径、球类等各种体育比赛。

但实际上,博弈论研究的主要不是这些真正的游戏,而是与这些游戏有共同本质特征的决策或者说是策略问题。

其实,上述很多游戏都有一个共同的特点,那就是策略,或者说,策略在其中有举足轻重的作用,一些因素(如运气、身体素质等)既定以后,策略选择的好坏是左右这些游戏结果的关键因素,而有些游戏,如棋类比赛等,策略选择的好坏更是决定游戏结果的唯一因素。

因此,游戏中真正值得研究的是其中的策略问题。

2、游戏的共同的基本特征进一步分析还可以发现,许多游戏都有下列特征:(1)都有一定的规则:规定游戏的参加者(可以是个人,也可以是队组),可以做什么,不可以做什么,应该按怎样的次序做,什么时候结束游戏、一旦参加者犯规将受什么样的处罚等等。

(2)都有一个结果:如一方赢一方输、平局或参加者各有所得等,而且结果能用正或负的数值表示,或能按一定的规则折算成数值。

(3)策略至关重要:游戏者不同的策略选择常会带来不同的游戏结果。

(4)策略和利益有相互依存性:即每一个游戏者所得结果的好坏,不仅取决于自身策略的选择,而且取决于其他参加者的策略选择。

有时一个差的策略选择也许会带来并不差的结果,原因是其他游戏者选择了更差的策略。

因此,在有策略依存性的游戏中,策略本身常常并没有决定的好坏之分,只有相对于他方策略的相对好坏。

——策略较量3、博弈的四要素博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。

(1)博弈的参加者(players):博弈中究竟有哪几个独立决策、独立承担结果的个人或组织。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论的基础知识与应用(转)1 基础知识博弈论是一种独特的处于各学科之间的研究人类行为的方法。

与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。

博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。

博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。

当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。

■一个科学的隐喻由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。

在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。

在博弈论中常常讨论的问题包括:1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么?2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是“理性”的?3)如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的,在什么样的情况下合作是理性的?4)在特定情况下,正在持续的关系与单方退出这种关系是不同的吗?5)在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现吗?6)在这些情况下,真正的人类行为与“理性”行为是否相符?7)如果不符,在那些方面不符?相对于“理性”,人们更倾向于合作?或者更倾向于侵略?抑或二者皆是?因而,博弈论研究的“博弈”包括:破产门口的野蛮人(Barbarians at the Gate)网络战(Battle of the Networks)货物出门,概不退换(Caveat Emptor)征召(Conscription)协调(Coordination)逃避(Escape and Evasion)青蛙呼叫配偶(Frogs Call for Mates)鹰鸽博弈(Hawk versus Dove)Mutually Assured Destruction多数决定原则(Majority Rule)Market Niche共同防卫(Mutual Defense)囚徒困境(Prisoner’s Dilemma)补贴小商业Subsidized Small Business公共地悲剧Tragedy of the Commons最后通牒Ultimatum视频系统协调Video System Coordination■理性新古典经济学与博弈论之间的关键链接就是理性。

新古典经济学建基于这样一个假设之上,即人类在其经济选择行为中是绝对理性的。

确切地说,这个假设意味着每个人在其所面临的环境中都会最大化自身的报酬——利润、收入或主观利益。

在资源配置研究中,上述假说服务于两个目的:一是稍稍缩小可能发生事物的范围;二是提供了一个衡量经济体制效率的标准。

如果经济体制导致部分人的报酬减少,而又没有对其他人产生更多的报偿(宽泛地讲就是成本大于收益),那么在某些方面就产生了失误。

污染、渔业资源的过度开发、不恰当的资源用于研究(inadequate resources committed to research)都是这类问题的例子。

在新古典经济学中,理性的个人面临特定的体制或制度,包括产权、货币和高度竞争的市场。

这些是个人纳入最大化报酬计算的许多“情况”之一。

财产权利、货币经济以及理想化的竞争市场的隐含意义是经济个体不需要考虑自己与其他经济个体的行为互动。

他或她只需要考虑自己的境况和“市场条件”。

但这导致了两个问题:一是理论的范围受到局限。

只要竞争受到限制(但没有垄断)或者产权没有完全界定,众望所归的新古典经济学理论就不适用了,并且新古典经济学也从未产生可接受的理论扩展以覆盖上述情况。

对于新古典经学来说,决策是在货币经济之外做出的,这也是有问题的。

博弈论正好面对上述问题:提供一个关于人们直接(而不是“通过市场”)互动的经济和战略行为的理论。

在博弈论中,“博弈”始终是针对人类社会严肃的互动行为的一个隐喻。

博弈论也许是关于纸牌游戏或者棒球运动的理论,但却不是关于象棋的理论,它是关于这样一些严肃的互动行为比如市场竞争、军备竞赛和环境污染的理论。

只不过博弈论涉及这些问题的时候使用的是博弈的隐喻意义:在这些严肃的互动行为中,就象在游戏中一样,个体的选择实质上是战略选择,行为互动的结局依赖于每个参与人所选择的战略。

通过这样的阐释,研究“博弈”可以真正告诉我们关于严肃的互动行为的一些事情。

但是,究竟会告诉我们多少?在新古典经济学理论中,理性地进行选择就是要最大化自身的收益。

在某种观点看来,这是一个数学问题:在给定环境条件下选择最大化报酬的行动。

因而我们可以把理性的经济选择当作一个数学问题的“解”。

在博弈论中,情况就更复杂了。

既然结局不仅依赖于自身的战略和“市场”条件,也直接依赖于其他人所选择的战略,但我们仍然可以把理性的战略选择当作一个数学问题——最大化行为互动中的决策制定者群体的报酬——从而我们再次称理性的结果是博弈的“解”。

2 囚徒的困境博弈论近来的发展,特别是1994年诺贝尔纪念奖授予给三位博弈论理论家以及89岁高龄的塔克(A. W. Tucker)在1995年1月的去世,唤起了人们对博弈论创立时的回忆。

尽管博弈论可以追索到更早的时代,但其兴起的关键时期是20世纪40年代。

当然,《博弈论与经济行为》的出版是一个特别重要的台阶。

但是,在某种程度上,塔克发明的“囚徒困境”例子更为重要。

这个可以在一页纸上求解出来的例子在20世纪下半叶的社会科学中可能是最具影响的一页。

这个杰出的创见并不是出自研究论文,而出自于课堂。

正如S. J. Hagenmayer在《费城调查者(Philadelphia Inquirer)》(“Albert W. Tucker, 89, Famed Mathematician,“ Thursday, Feb. 2, 1995, p.. B7)中写到:“在1950年,作为访问教授,塔克在斯坦福大学向由心理学家组成的听众发表演说的时候,创造了‘囚徒困境’来说明分析某些类型博弈的困难。

塔克的简单解释导致了后来大量的文献。

这些文献来自不同的领域,比如哲学、伦理学、生物学、社会学、政治科学、经济学,当然还有博弈论。

”■囚徒困境博弈塔克是从这样一个小故事开始的:两个夜贼,鲍伯(Bob)和艾尔(Al),在行窃现场附近被抓获并被警方隔离拷问。

每个夜贼都必须选择是否坦白和揭发对方。

如果两个贼都不坦白,他们都将被判刑一年。

如果每个贼都坦白并揭发对方,他们都将在监狱中度过10年。

但是,如果一个贼坦白并揭发对方,而另一个贼不坦白,那么与警方合作的贼将被释放而另一个贼将在监狱中度过20年。

在这个例子中的战略是:坦白与不坦白。

赢利(payoff)(实际上是处罚)是判刑。

我们可以用“赢利表(payoff table)”简洁地表达上述信息,这类赢利表已经成为博弈论中很好的标准表达式。

以下是囚徒困境博弈的赢利表。

表2-1艾尔坦白不坦白鲍伯坦白10,100,20不坦白20,01,1这个表的读法是这样的:每个囚犯从两个战略中选择一个。

即,艾尔选择一列,鲍伯选择一行。

每个单元格的两个数字告诉两个囚犯相应的战略被选择后的结果。

逗号左边的数字表示选择行的人(鲍伯)的赢利,逗号右边的数字表示选择列的人(艾尔)的赢利。

因此(先阅读第一列),如果他们都选择坦白,每人将判刑10年,但是如果艾尔坦白而鲍伯不坦白,鲍伯被判20年而艾尔将被释放。

那么:怎样求解这个博弈?如果双方都想使自己呆在监狱的时间最短,他们选择什么战略是“理性的”?艾尔可能会做这样的推理:“两种事件可能发生:鲍伯要么坦白要么保持沉默。

假定鲍伯坦白,我不坦白的话将被判20年,我也坦白的话则判10年。

另一方面,如果鲍伯不坦白,我不坦白我被判刑1年,但在这种情况下,如果我坦白我可以被释放。

无论怎样,我选择坦白都是最好的。

因此,我将坦白。

”但是鲍伯能够而且大概也将做同样的推理——因此他们都将坦白并且都在监狱呆10年。

然而,如果他们“不理性”地行动,都保持沉默,他们都可以在1年后被释放。

■占优战略(Dominant Strategies)这里发生的情况是,两个囚犯陷入了“占优战略均衡”。

定义:占优战略——让博弈的参与人单独地评估他面临的战略组合中的每一个战略,并且,对于每一个组合,他从自己的所有战略中选择一个使他赢利最多的战略。

如果对于参与人面临的每一个不同的战略组合,参与人都选择同一个战略,这个被选择的战略就叫该参与人在博弈中的“占优战略”。

定义:占优战略均衡——在一个博弈中,如果每个参与人都有一个占优战略,且每个参与人都采取占优战略,那么(占优)战略组合及其相应的赢利被认为是构成了博弈的占优战略均衡。

在囚犯困境博弈中,坦白是占优战略,当两个囚犯都选择坦白时,那就是占优战略均衡。

■囚犯困境中需要考虑的问题这个不同寻常的结果——两个囚犯出于自利的个体理性行动导致双方情况变得更糟糕——在现代社会科学中产生了广泛的影响。

因为在现代世界里有大量的行为互动与此极其相似,从军备竞赛到道路拥挤,以及渔业资源贫化污染和地下水资源的过度开发等,莫不如此。

这些行为互动在细节上有很大差异,但却如我们想象的一样,个体理性给每个人带来了更差的结果,囚犯困境暗示了它们的发展方向。

这就是“囚犯困境”的威力所在。

当然,我们也必须坦白地承认,囚犯困境对于上述行为互动来说是只一个非常简明扼要的概括——如果你愿意,也可说它“不切实际”。

囚犯困境也孕育了许多对其进行批评的论点,这些论点构成了许多学术文献的基础:囚犯困境是二人博弈,但是这一思想的许多应用场合是真正的多人行为互动。

我们假定两个囚犯之间没有进行过沟通。

如果他们能够相互沟通并谋求协调战略,我们有可能得到不同的结局。

在囚犯困境中,两个囚犯仅博弈一次。

重复的博弈行为可以导致大相径庭的结果。

导致占优战略均衡的推理也许是强制进行的,但它并不是推导出问题的唯一方式。

也许它根本就不是最理性的答案。

3 一个信息技术的例子博弈论提供了一个很有发展前途的方法去理解各类战略问题,囚犯困境及其他类似例子的简明和威力使它们有了一个自然而然的起点。

但是在更为复杂和现实的应用中,常常有一些我们必须考虑的冲突。

怎样从一个简化的博弈转移到更现实的博弈模型?现在让我们来看一个真实世界的战略思考的例子:选择信息系统。

相关文档
最新文档