张维迎《博弈论与信息经济学》习题答案

张维迎《博弈论与信息经济学》习题答案
张维迎《博弈论与信息经济学》习题答案

张1.5

张1.6

假定消费者从价格低的厂商购买产品,如果两企业价格相同,就平分市场,如果企业i

的价格高于另一企业,则企业i 的需求量为0,反之,其它企业的需求量为0。因此,企业i 的需求函数由下式给出:

i i i i i i i i p pi p p p p 0)/2Q(p )Q(p q --->=

从上述需求函数的可以看出,企业i 绝不会将其价格定得高于其它企业;由于对称性,其它企业也不会将价格定的高于企业i ,因此,博弈的均衡结果只可能是每家企业的价格都相同,即p i =p j 。但是如果p i =p j >c 那么每家企业的利润02

i i j i p c q ππ-==>,因此,企业i 只要将其价格略微低于其它企业就将获得整个市场的需求,而且利润也会上升至()()22

i i i i p c p c Q p Q p εε---->,()0ε→。同样,其它企业也会采取相同的策略,如果此下去,直到每家厂商都不会选择降价策略,此时的均衡结果只可能是p i =p j =c 。此时,企业i 的需求函数为2

i a c q -=

。 张

1.8

张2.3

张2.4

张2.9

(1)由于古诺博弈的阶段均衡是1i a c q n -=+,此时的利润为21a c n -?? ?+??

;若各家企业合作垄断市场,则此时的最优产量是()argmax i i i a nq c q ∈--?,可求得2i a c q n -=,此时的利润为24a c n -?? ???

,此时若有企业i 背叛,其产量就是()124j j i i a c q n q a c n

≠--+==-∑,其收益为()2214n a c n +??- ???

。下面我们来看重复博弈下的古诺博弈。在这个博弈中,有两个博弈路径,我们分别进行讨论。

首先,在惩罚路径上,由于每个阶段参与企业选择的都是最优的产量,因此能够获得最优的收益,因此是均衡的。

其次,在合作路径上,只要合作的收益大于背叛的收益,则均衡也是可以实现的,这要求:()222211141411a c n a c a c n n n δδ-+-??????≥-+

? ? ?--+??????,解得()12411n n δ-??≥+??+????。

(2)伯川德博弈的阶段均衡是i p c =,此时参与者的利润均为0。若各企业合作,则此时的最优价格是:()()argmax i i i p p c a p ∈--,此时2i a c p -=,则2i a c q n

-=,利润为()24a c n -。而若有企业i 背叛,则其选择价格(),02i a c p εε-=

-→,其产量为Q ,利润为()24a c -。下面我们来看重复博弈下的伯川德博弈,在这个博弈中,也有两个博弈路径,

我们分别讨论如下:

首先在惩罚路径上,由于每个阶段的企业选择都是眼前最优,因此,它能够实现均衡。 其次,在合作路径上,只要合作的收益大于背叛的收益,则均衡也是可以实现的,这就要求:()()22

10414a c a c n δ--≥+-,求得1n n δ-≥。

(3)伯川德博弈中的最低贴现因子小于古诺博弈中的贴现因子的原因在于其惩罚要严重的多,因此其对于耐心的要求也就要相对较小。

张3.4

类似的题:

张3.8

张4.2

张4.5

类似的题:

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例一一“海盗分金”问题 5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。 “海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢 “挑战者”分配方案中最不得意的人们。 假设前提 假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程 从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。 3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。 不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3 号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。 同样,2号的方案也会被1号所洞悉,1号并将提出(97, 0,1, 2, 0)或(97, 0,1, 0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97, 0, 1, 2, 0)或(97, 0, 1, 0, 2)。分析 1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。 不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。 首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。 如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方 案岂不成了自掘坟墓! 再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就_ 大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5 号大放烟幕弹,宣称对于1号所提出任何分配方案,他一定会再多加上一个金币给他们。这样,结果又当如何? 通常,现实中人人都有自认的公平标准,因而时常会嘟嚷:“谁动了我的奶

博弈论期末习题

《博弈论》期末习题 专业:经济学学号:2 ;姓名:王兆丽 一、试写出掷硬币博弈的局中人及其策略与得益函数,并写出双变量得 益矩阵。 答:局中人:盖硬币者和猜硬币者。 策略:有正面和反面两种可选择策略,若猜对,猜者得1盖者-1.否则猜者-1盖者1.由于每一方都不会让对方在选择之前知道自己的决策,所以可以看做是同时做决策的。 双变量得益矩阵; 猜硬币方 二、试举生活中的一例,说明囚徒困境是如何产生的?并试分析可能走 出囚徒困境的途径。 答:例子:中国移动和中国联通之间的价格战。 产生原因:囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单的说,囚徒困境问题都是个体理性与集体理性的矛盾引起的。 可能走出的囚徒困境途径:(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚,那么就会制止这种现象发生。(2)忠诚文化。有时候,建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中,团体产生所面临的囚徒困境问题的轻重程度是不同的,这种差异的根本来源就是各个组织有自己的文化。(3)长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复,如果这个“多次”足够长,那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财,合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。 答:1、该博弈共包括四个子博弈:(1)从博弈方1选择R 以后博弈方2的第二 阶段选择开始的三阶段动态博弈;(2)从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈;(3)第三阶段博弈方1选择A 以后博弈方2 的单人博弈;(4)第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中 任何一个的得益都相同,因此在这阶段随意选择一个都可以。倒退回第三阶段, 博弈方1选择AB中任何一个都可以。再推回第二阶段,博弈方2选择L将得到 3选择R得到2,因此选择L;最后回到第一阶段,博弈方1选择L得到2选择 R得到3,。所以该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择R, 博弈方2第二阶段选择L,即(3,1)是该博弈的完美纳什均衡。 四、两个寡头企业进行价格竞争博弈,企业1的利润函数是 q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1 的价格,q 是企业2的价格。求: 1.两个企业同时决策的纯战略纳什均衡; 两个企业同时定价。根据两个企业的得益函数,很容易导出它们各自的反应 函数:απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

博弈论视角去思考生活中的问题与现象

姓名:学院:专业: 年级:2010级 学号: 题目:博弈论视角去思考生活中的问题与现象 关键词:经济学,大学生,考试作弊。 内容摘要: 考试是人才培养过程中的一个重要的教学环节,是检查教师教学效果, 是检验学生对知识和技术掌握程度的一种手段。近年来考试作弊现象越来越普遍、越来越严重,并呈现不断蔓延之势,严重影响了考试应有的严肃性、公正性和科学性,引起了社会公众的广泛关注。考试作弊行为的存在严重影响着考试功能的正常发挥,同时也严重损害着学生的心理健康和品德培养。如何有效地杜绝和减少学生考试作弊行为已成为近年来高等教育势在必行的一项工作。本文从从成本-收益分析维度对考试作弊行为进行简要分析,通过分析考生作弊的成本,提出控制作弊的对策。 一、大学生考试作弊的成本-收益之博弈 作弊行为包括夹带小抄、桌面留言、互对答案、偷看他人答卷、互换试卷、替考等,呈现出方式多样化、主体多样化、规模集团化、过程组织化、人员职业化、手段现代化、水平专业化等特点.经济学原理告诉我们,经济活动主体总是在一定约束条件下追求自身利益的最大化,这也正是大学生考试作弊的内在动因。因为考试成绩是衡量学生表现的关键指标,它直接影响着大学生的奖学金、评优、入党、提干、推研、就业和心理满足。在这一动因的作用下,大学生在考试中可能会违背学校规定,具有作弊、不作弊和按照一定的概率分布进行作弊等三种不同的行为选择。寻求最佳的作弊与不作弊的概率分布是大学生的行为选择。在个体理性作用下,大学生选择行为时常从两方面考虑,一是将作弊带来的超常收益与作弊被发现而受惩罚的损失进行对比,若作弊的超常收益低于受惩罚的损失,将不会试图作弊,否则,作弊有利可图,就会发生作弊现象;二是估计作弊被监考教师发现的可能性,如果这一可能性很大,作弊概率就小,否则作弊概率就大。 1.学习机会成本大,课堂学习收益小

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

博弈论论文囚徒困境的启示和思考

囚徒困境的启示和思考 二、囚徒困境的解释 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。 实际上囚徒困境在我们的实际生活中也有很多,下面举两个进行说明

三、经济学例子:关税战 两个国家,在关税上可以有以两个选择: 提高关税,以保护自己的商品。(背叛) 与对方达成关税协定,降低关税以利各自商品流通。(合作) 当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。) 四、商业例子:广告战 商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。 两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。 此二公司可以有二选择: 互相达成协议,减少广告的开支。(合作) 增加广告开支,设法提升广告的质量,压倒对方。(背叛) 若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 除了这些还有的很多类似的例子,比如说公共产品的提供,商家的价格战等等,在这里就不多赘述了。 五、“囚徒困境”现象的意义和启示 通过以上几个关于囚徒困境的例子,特别是作为经济管理学院的学生,我们可以将博弈论的一些知识运用好,更好的指导我们的经济生活。理论的重要意义在于类似的情况之下给人们社会经济生活带来指导。在经济发展中,我们应该认识到“看不见的手”还有更多内涵,有待我们去发掘。 本文主要通过对该理论的分析,从中发现对企业经营管理活动的有义启示。 第一,在市场竞争过程中,一名优秀的经营者,无论做任何决策还是考虑问题应该有战略眼观,特别是在做出对企业乃至行业今后发展的竞争策略时,从长远出发,做正确的决断。 第二,保存对手就是保存自己。在市场竞争中,让竞争对手发展就是自己发展,本着求同存异的思想,共谋发展,避免恶性竞争,避免两败俱伤的情况。 第三,市场竞争不是纯粹的竞争,在义和利之间应该如何取舍,是一位有战略眼观的企业家该做的第一个选择。 2杜兰:走出“囚徒困境”《通信企业管理》[J] 2003年第4期,第31页

工作中的博弈论与思考

工作中的博弈论与思考 这是一篇看最后面才有意思和意义的文章 今天在职场中遇到一件事,上面发下一个任务,需要几个人同时完成,一位同事做事效率很高,先于其它几位同事倍许的速度先完成其负责的部分工作,而其它人的工作还只进行了一半,新加入的同事则刚刚开始工作,尚在熟悉中。为了加快工作进度,我决定给效率高的同事再一分配其他人的一部分任务,以便以最快的时间完成工作。但是,这位同事先前已完成了其它人任务量的140%左右,再加量从感情上是难以接受的,并出现了抵触情绪,我个人也很难忍心再给其加工作量,不作休息,由此,我想到了很多。 在现实中,我们经常会发现在工作中许多同事都有自己善长和效率较高的工作能力,在从事同样工作时,会比他人有更高的效率(我们要感谢这些伟大的人带领我们,提供给我们贵的经验和学习的榜样),但一个人又不能单独完成全部工作(因为一个人单位效率再高,也不如人多一起干,而且会加长完成工作总时间),而在工作中我们又不能对每项工作中的效率高个体作出奖励(虽然绩效工资很常见,我个也比较倾向这种工作方式,但工作中不是每一件都绩效的),这就出现一个问题,当效率高的人先完成工作,而其它人未完成时,如果为了尽快完成总工作量,他会被分配更多的工作量,其个工作量会加大,在报酬相同情况

下,显然对其是不公平的,是一种对个体单位劳动力报酬的损失,降低自己的报酬。对于个人最好的选择就是停下来等他人完成工作,再一起进入下一项工作,其它人同样如此,在完成工作后会等待其它人的工作完成,以使自己不会比其他人做的更多,使自己的利益得到最大化。但我们也可看出,这样的等待加长了总工作时间,使任务完成总是以团队中效率最低的成员的效率为标准,这对所有团队成员也都是不利的,因为这会减少成员总的完成任务休息时间。 听到这里,我想大家已经想到了这是一个博弈论问题,当然,也有人不知道这个问题的,下面,我就摘录一些百度上的囚徒困境问题回顾和讨论一下。 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将 即时获释,沉默者将判监10年。 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。 若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都 寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何 情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝 监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人 的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚 徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛 是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参 与者都背叛对方,结果二人同样服刑8年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利 益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果 也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只

博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

博弈论与决策思维

《博弈论与决策思维》感想 这次很荣幸的去听了郑教授的《博弈论与决策思维》讲座,非常感谢浙江大学东方财智能给我提供的这次机会,听完这个课程之后,内心深处感受颇深,第一次觉得博弈思维是如此的精湛,更令人感叹的是郑教授教了我们在生活当中如何运用博弈思维来处理一些棘手的事。与我以前听过的所有精彩的课程相比,我只想说一句:教授不愧是教授,教授与老师的讲课方式与方法是截然不同的! 在整个博弈论课程演讲的过程中,郑教授都是用一些有趣的例子来引导大家在课堂上的互动,从而通过在例子上总结出来的一些启示来告诉大家,在生活当中遇到一些进退两的困境时,我们应当如何巧妙地运用博弈思维来思考问题,并让那些问题能得到妥善的处理。 如果就像宣读课本一样把那些道理说给大家听,把那些PPT画面一页页放给大家看的话,那效果肯定就犹如过眼云烟,但是郑教授说的每一点重点我们都会牢牢紧记!比如:田忌赛马,这是大家都知道的故事。大家都只知道田忌之所以赢了齐王是因为他改变了策略,然而改变策略视需要前提条件的:第一就是对方愚蠢,第二就是对方的信息的公知的。所以在现实生活中我们应该用全局、动静思维来考虑问题! 博弈分为很多种:换位思考、信任危机、收益问题、隐性激励、推理方式、、、、、其中有一点我记得最清楚的就是隐性激励。说的大概就是一个公司的上层不能什么事都必须是亲力亲为,应该对有些事松松手或者对于有些事假装不清楚,让下属自己拿主意,让他们以后做事能越来越有自信,在这个过程中能逐渐成长起来,正好验证了那句话“水至清则无鱼,人至察则无徒”! 不仅人与人之间存在博弈,物品之间也同样存在博弈,只不过换了一种说法。物品间的竞争是替代,合作就是互补。而市场决定着物品之间的关系,所以说博弈是无处不在的。郑教授所讲的博弈内容远不止这么点,用一句话来概括:只可意会不可言传。只有亲自去听了之后才会有那种突然觉自己的智慧一下子就升华了的感觉。 学会博弈论会让你活的更有智慧!

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈期末考试总结

博弈与决策答案 一、名词解释(每小题2分,共16分) 1、博弈 博弈是指一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以施,并从中各自取得相应结果或收益的过程, 2、占优战略均衡 占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的优策略的基础上达到均衡. 3、重复博弈 重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题, 4、序列博弈 序列博弈是指对局者选择策略有时问先后的顺序,某些对局者可能率先采取行动.序列博也是一种动态博弈. 5、动态博弈 动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动. 6、占优战略均衡--占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的占优策略的基础上达到均衡. 7、完全信息---完全信息是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息. 8、得益 得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西. 9,博弈论:博弈论就是系统的研究各种各样的博弈问题,寻求各博弈方合理选择策略的情况下博弈的解,并对这些解进行讨论分析的理论。 10,纳什战略均衡:纳什战略均衡指在均衡中,每个博弈参与人都确信,在给定其他参与人选择的策略的情况下,该参与人选择了最优策略以回应对手的策略。 11,静态博弈:静态博弈是指在博弈中,参与人同时选择或非同时选择但后行动者并不知道先行动者采取了什么具体行动。 二、、简答题(每小题6分,共24分) 1、占优战略均衡和纳什均衡的联系与区别如下: 1)每一个占优战略均衡都是纳什均衡,而每一个纳什均衡却未必是占优战略均衡; 2)用重复剔除严格劣战略方法,保留下的唯一的重复剔除的占优均衡,就是纳什均衡. 3)纳什均衡,不会被重复剔除严格劣战略方法剔除掉(但弱劣战略剔除,可能会剔除纳什衡): 4)经重复剔除严格劣战略之后,有不唯一的多个哉略组合保留,其中有的战略组合不一定纳什均衡.即重复剔除严格劣战略方法,无法确保将所有非纳什均衡战略剔除,没有被剔的战略组合不一定是纳什均衡. 5)没有占优战略均衡的博弈,不能用重复剔除严格劣战略方法求解的博弈,可以有纳什均衡2,博弈的构成要素有哪些?并对其进行说明。 2、博弈一般由以下几个要素组成,包括:参与人、行动、信息,策略、得益、结果、均衡等.

什么是博弈论博弈论的思考

什么是博弈论博弈论的思考 博弈论原是数学运筹中的一个支系,其研究运用了种种数学工具,大量的数学模型成了博弈论和我们普通人的生活之间的一条难以逾 越的鸿沟。面对这条鸿沟,很多人的反应是耸耸肩膀走开,少数人会企图通过学习数学来渡过。但是这两种反应都忽略了一个很浅显的道理:如同一个不会编程的人照样可以成为电脑应用高手,没有高深的数学知识,我们同样通过博弈论的学习成为生活中的策略高手。孙膑没有学过高等数学,但是这并不影响他通过运用博弈策略来帮助田忌赢得赛马。 有时候,科学并不一定意味着繁琐的计算与测量,而是一种有浓 厚艺术气息的思维方式。比如书中所讲述的一报还一报策略。 美国密西根大学一位叫做罗伯特?爱克斯罗德组织了一场计算机 模拟竞赛:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,进行捉对博弈。他们每个人都要在合作与背叛之间做出选择。但与囚徒困境案例中有个不同之处:他们不只玩一遍这个游戏,而是以单循环赛的方式玩上200次。第一轮游戏有14个程序参加,其中包含了各种复杂的 策略。竞赛的桂冠属于一种被称为“一报还一报”的策略。这种神奇的一报还一报策略说起来很简单,简单到有些 __:第一步合作,此 后每一步都重复对方上一步的行为。如此简单的程序之所以反复获胜,

是因为它实行了以其人之道还治其人之身的原则,并且用如下特质使它能够最有效地鼓励其他程序同它长期合作:善良、可激怒、宽容、简单、不妒忌别人的成功。 在静态的群体中竞赛是这样一种状况,那么,在一个动态的进化 的群体中,这种合作策略能否产生、发展、生存下去呢?群体是会向合作的方向进化,还是向不合作的方向进化?如果大家开始都不合作,能否在进化过程中产生合作? 为了回答这些疑问,爱克斯罗德重新设计了一个实验,假设63个对策者中,谁在第一轮中的得分高,他在第二轮的群体中所占比例就越高,而且是他的得分的正函数。这样,群体的结构就会在进化过程中改变,由此可以看出群体是向什么方向进化的。 实验结果很有趣。一报还一报策略原来在群体中占1/63,经过1000代的进化,结构稳定下来时,它占了24%。因此,以合作系数来测量,群体是越来越合作的。这个结论还可以引申为:共同演化会使一报还一报的合作风格在充满背信弃义劣行的世界上蔚然成风。我 们可以用以上实验结果来对照一下商界的一句经典老话:商场如战场。商场如战场,就是说商业竞争的对手就是敌人,而对待敌人的办法在人类几千年来的历史上似乎只有一个,那就是把它干掉――或者通过消灭,或者通过吞并。胜利的定义是唯一的,那就是敌人必须一败涂

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论试题及答案

诚信考试沉着应考杜绝违纪 《博弈论》试卷 课堂周四(7/8) 院系专业万方电气系通信工程 学号 余数 0 姓名

河南理工大学2010–2011学年第1学期 《博弈论》课程期末考试试卷 开课学院:经济管理学院,考试形式:开卷,允许带___________入场 考试时间:2010年12月25日-12月25日, 所需时间:周 考生姓名:学号:专业: 题序一二三四五六七八总分得分 评卷人 1、第一题:(10分) (1)举一个你所经历情侣博弈的情形,在实际博弈中你采取什么行动让自己收益最大; 答:作为一个男生,我想很多机会都是把握在自己手中的,情侣博弈有二个“纳什均衡”,一次博弈的结局究竟落到哪一个“纳什均衡”,关键就是要看遇事时自己如何去选择了。 例如:周末和女朋友去逛商场,应该客观地按照需求去采购,在了解女朋友的爱好的前提下,想办法引导她去看性价比最高的商品,并给予一定建议。遇到她特别喜欢的衣服或饰物,只要价格合理,又能满足生活需要,在对方征求意见时应该支持购买并给予肯定答复;当遇到不合理的购买选择时,应简明扼要地说出其不适之处,并建议对方到其它她喜欢的物品处,挑选令其满意的商品。购物中间一旦遇到对方生气或者发火,可以宽容地对待对方,以显示出自己的城府,若对方为无理取闹,应该坦诚地向对方说明情况,让对方明白自己在为她考虑,说明都说清楚了事情也就简化了。另外,在购物结束前,可以给女朋友买些她喜欢的零食,或者一起去对方喜欢的餐饮店,休息的同时也可调节一下情调,让双方都能够感觉到两个人在一起的幸福与甜蜜。 总结一下,在这场情侣博弈中,要想让自己获得最大收益,必须努力做到认真、善意、宽容、强硬、简单明了各种措施相结合。 2、第二题:(20分) 请举例说明下列说法是否正确,构造博弈模型具体说明,阐述原因。 (1)判断分析“先下手为强” 答:“先下手为强”并不满足所有的情形。 博弈中,在有多个"纳什均衡"的情况下,常常是先动手的一方会占一些优势,这和课例中“囚徒困境”情形类似,有一个最佳策略,古代的很多例子也证明了此点,如:诸葛亮先下手为强,占据荆州要势;日本先下手为强,偷袭美国的珍珠港,不然就不会有第二次世界大战;三国曹操先下手为强,迎接汉献帝,后挟天子以令诸侯等。要指出的是,“动态博弈”中也是有很多后动优势的情形,一般是在方案已经制定,自身实力比较弱,需要选择决策的时候,主动放弃先发权利,变先动劣势为后动优势。如:三人参加选举,支持率分别为15%,35%,50%,这个时候,如果15%者先采取行动,可能会立刻被强敌灭掉,所以他必须保存实力,保持低调,不介入强者的争斗,由另两位先动手,争取灭掉一方后均分失败者的支持率,虽然这样扔处于劣势,但比最初情况要好很多。所以,在面对选择

博弈论——换一种方式思考问题

博弈论——换一种方式思考问题 花了一个月的时间研究了下博弈论,收获很多,于是又花了一个礼拜写了这篇算是读后感的日志,希望能激起大家对博弈论的兴趣,尤其是几个经典博弈,真的很有意思。 ? 博弈论的内涵 什么是博弈论?简单的说,就是“互动的决策论”,指在充分考虑对方的决策后做出的决策。“博弈论”的英文是“”,所以博弈论最贴切的直译是“游戏理论”。 现代博弈理论由匈牙利大数学家冯·诺伊曼于世纪年代开始创立,对于冯·诺伊曼我们更为熟知的头衔是“计算机之父”,其实,他还有另一个身份,就是“博弈论之父”。年,他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。诺伊曼与摩根斯特恩认为,博弈论就是运用数学的方法研究有利益冲突的双方在竞争性活动中制定最优化策略的理论。 但是诺伊曼所解决的只有二人零和博弈,年,岁的纳什写下一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法。这是整个现代博弈论中最重要的思想之一。相信很多人都知道纳什,因为那部经典的奥斯卡最佳影片《美丽心灵》,他传奇的人生,坚强的毅力,深深的打动了我。他在普林斯顿大学深造时,冯·诺伊曼正好在普林斯顿任教,那个时候的普林斯顿还聚集了众多著名的科学大师,包括罗伯特?奥本海默、诺曼·斯蒂恩罗德以及爱因斯坦,据说纳什曾经造访过爱因斯坦,向他讲述自己对于重力的看法。在一个小时的讨论之后,爱因斯坦对纳什说:“年轻人,你应该来学一点物理。” 年和年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。 表面上看,博弈论似乎是数学家玩的游戏,而事实上,博弈论首先是我们思考现实世界的一套逻辑,其次才是把这套逻辑严密化的数学形式,博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈论的分析过程,而在于赢得更好的结局。说到底,博弈论只是一个分析问题的工具,用这个工具来简化问题,使问题的分析清晰明了就够了。 ? 博弈论的基本概念 首先我们需要了解的是纳什均衡。在某个房地产开发中,假定市场需求有限,只能满足某种规模的开发量,、两个开发商都想开发这一规模的房地产,如果选择开发,则的最优策略是不开发,同样,如果选择开发,则的最优策略是不开发。这时无论对还是,都不存在一种策略优于另一种策略,也不存在严格劣策略(不论其它人采取的策略,某人采取对自己不利的策略)。研究这类问题的均衡解,需要引入纳什均衡。 在纳什均衡中,每个参与人都确信,在给定其它参与人的策略情况下,己方选择了最优策略。所以在纳什均衡点上,每个参与者的策略都是最好的,此时没人愿意先改变或主动改变自己的策略。 在博弈论中,博弈行为都可以分为两类,即零和博弈与非零和博弈。零和博弈是一种完全对抗,强烈竞争的对局。参与者的总收益为零,因此一个参与者的所得必然是另一个参与者的损失。而非零和博弈,是各参与者的目标不完全对立,参与者只按本身的厉害关系单方面做出决策,有时为了共同利益而合作,有时为了个人利益而对立,收益的总和是可变的,参与者可以同时有所得和有所失。 在博弈论中,最基本的假设之一就是:人是理性的。所谓理性人是指行动者具有推理能

博弈论三大经典案例

经典的囚徒困境 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ?若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ?若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ?若二人都互相检举(互相“背叛”),则二人同样判监2年。 用表格概述如下: 甲沉默(合作)甲认罪(背叛) 乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年 乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ?若对方沉默、背叛会让我获释,所以会选择背叛。 ?若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 由囚徒困境可以写出类似的员工困境: 一名经理,数名员工; 前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作 如果某人不听从吩咐,其他人听从吩咐,则此人下岗。其他人继续工作 如果所有人都不听从经理吩咐,则经理下岗 但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

博弈论中的几个经典问题精编版

博弈论中的几个经典问 题 集团企业公司编码:(LL3698-KKI1269-TM2483-LUI12689-ITT289-

几个博弈论中的经典问题博弈论(GameTheory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的 完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博 弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一 局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作 不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关 量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(NashEquilibrium):在一策略组合中,所有的参与者面临 这样一种情况,当其他人不改变策略时,他此时的策略是最好的。 也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B 也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因

相关文档
最新文档